MojAndroid
(x) hirdetés

Sajnos a magyar nyelv kissé el van hanyagolva a számítástechnikában és ez alól az Android sem kivétel. Itt nem elsősorban magára a rendszer nyelvének magyarítására gondolok, hanem sokkal inkább a szövegbeviteli lehetőségekre.

Én magam már többféle kütyüt birtokoltam és más-más tapasztalatokat szereztem az évek során.
A Palm esetében nagyon szerettem, hogy az ékezeteket viszonylag könnyen lehetett írni (Treo650). A WinMos rendszert nem szerettem, azon számomra semmi nem volt egyszerű, így az ékezetek gépelésének nehézsége szinte fel sem tűnt. A Blackberry alapjában véve jól átgondolt kezelőfelülettel rendelkezett, de az ékezetes karakterek bevitele még a sok billentyűs típusoknál is körülményes volt. Ez alól az érintőképernyős Storm volt kivétel.
Az Adroid vásárlásánál nálam külön szempont volt, – annak ellenére, hogy kitűnően beszélem az Android szülőapjának, Andy Rubin anyanyelvét – hogy saját anyanyelvemen tudjak könnyen és lehetőleg hibamentesen szöveget írni, megosztani másokkal.

Így jutottam oda, hogy a marketen megtalálható szövegbeviteli – nevezzük – rendszereket kipróbálva hamar kikristályosodott a számomra használható alkalmazás.

Elsők között volt elérhető az AnySoft magyar szótárral is rendelkező ingyenes változata, amit hamarjában én is feltelepítettem.
Alapjában véve jól működött, de volt két tulajdonsága, amivel nehezen tudtam megbarátkozni, mégpedig, hogy aprócska a billentyűzet, főleg 4 sorosban. A másik negatívuma a Linuxos iSpell projektből származó szószedet, ami alapjában véve egy helyesírási szótár és nem egy gyakorisági szótár.

Számos pötyögős billentyűzetet próbáltam már, de szinte mindről visított, hogy nem idegen ajkúaknak készült és ezáltal a kezelésük nehézkes volt (HTC IME_mod – a projektet nem fejlesztik tovább, a magyar nyelvet nem támogatja, felhasználói szótár max 800 szavas lehet. Eredeti HTC billentyűzettel a legfőbb baj, hogy a HTC a sztenderd androidtól eltérő szóadatbázist használ, így a marketen elérhető User Dictionary Managerrel nem lehet egyszerűen szószedetet feltölteni Sense-es kütyüre. Ha igazán maximalista akarok lenni, akkor be kell valjam, hogy ha sikerült is volna feltölteni a saját szószedetemet, ez esetben keveredtek volna a rendszer és a felhasználói szavak az ajánlati sorban.)
A SlideIt, Swype, SwiftKey, TouchPal és hasonló beviteli rendszerek nekem nem voltak kézre állóak, nem beszélve arról, hogy sok esetben nem sikerült ékezeteket varázsolni a karakterek tetejére. Ezek a rendszerek leginkább az angol nyelv sajátosságait használják ki jó gyakorisági szószedetekkel kombinálva.

A Palmról ismerős Graffiti for Android nemrégiben jelent meg, amivel egészen jó és pontos beviteli sebességet sikerült elérnem, de persze csak az angol és a japán nyelvet támogatja.

Végül lehorgonyoztam a Smart Keyboard Pro mellett, mert tetszett a testreszabhatósága, a magyar nyelv támogatottsága és az aktív fejlesztés. Külön tetszett, hogy a billentyűzet váltással az alapértelmezett szótár is változik, már amennyiben a szótár elérhető.

Az megfelelő billentyűzet megvolt, már csak a mefelelő szótárra volt hozzá szükségem. Átböngésztem a netet, de nem igazán bukkantam megfelelő gyakorisági szótárra, ami segített volna. Az egyik honlapon (http://mokk.bme.hu/resources/webcorpus) rábukkantam 100.000-es szószedetre, de aztán hamar kitűnt, hogy tele van szeméttel (különleges karakterek, angol és más idegen szavak stb.)

Majd arra gondoltam, hogy létrehozom a saját szógyűjteményemet és ehhez kerestem a megfelelő eszközt, amit végül itt találtam meg: http://neon.niederlandistik.fu-berlin.de/textstat/

Szabadon felhasználható inteligens szoftver, ami a beadott szövegek (doc, html, odg stb) alapján készíti el a gyakorisági szószedetet, ráadásul a leválogatás jól paraméterezhető.

Az alapanyag minősége nagyon fontos a használható szószedet szempontjából, ezért a MEK (http://mek.oszk.hu/) honlapjáról töltöttem le 20. századi írók műveit és azok alapján készítettem el 19 irodalmi mű felhasználásával (1.665.754 szó elemzéséből – 11.513.966 bytes) egy általános gyakorisági listát. Min 3-as ismétlődést állítottam be és a kis- és nagybetűket megkülönböztettem a nevek és helyiségnevek jó helyesírása miatt.
Ezek után a listából a duplikációkat el kellett távolítani és manuálisan szűrni kellett, ami szövegszerkesztőben helyesírás elemzővel történt. – mivel nem tudok programozni :-(.

Így állt össze a Smart Keyboard Pro-hoz használható magyar szótár első változata, ami 42.000 szót tartalmaz. Felkerült a Marketre is és várom a tapasztalatokat, javaslatokat.

Ha van igény és kapok valakitől programozói támogatást, akkor építhetünk egy komplex, vagy akár több speciális szóadatbázist is (orvosi, jogi stb).
A SKP fejlesztőjének tapasztalata szerint 30.000 a minimum, 50.000 körül az ideális, de 100.000 – 130.000-es szóadatbázist is könnyedén kezel a telefon, az pedig nagyon sok szó!!!

Várom a véleményeket!

-Endrus.

2010.11.02.

+