Marmor: mari számítógépes morfológiai elemző
Erről az oldalról letölthető a mari morfológiai elemző által
elemzett szöveg. A zip formátumba
csomagolt szöveg egyszerű szövegfájlként
nyitható, a magyar ékezetes betűkön kívül speciális karaktereket nem
tartalmaz (letöltési mérete kb. 132 kbyte, kicsomagolva kb. 703 kbyte).
A Marmor a Bakró-Nagy Marianne által vezetett Számítógépes Uráli
Nyelvészeti Adatbázis című NKFP-program keretein belül készült. Az
elemzőt Novák Attila (Morphologic Kft.) és Fejes László (MTA
Nyelvtudományi Intézet, Finnugor osztály) készítette, Novák Attila
elsősorban a technikai megvalósításon, Fejes László a nyelvleíráson
dolgozott, de a két terület között jelentős volt az átfedés.
Az elemzett szöveget a Marij
El c. újság egyik száma, ill. az ugyanezen a honlapon megtalálható
dalszövegek alkotják. A későbbiekben tervezzük további számok
feldolgozását is. Mindemellett kérjük, hogy mindazok, akik
rendelkeznek bármilyen elektronikus (de elsősorban .txt, .rtf, .doc, .tex,
.html) formátumú mari nyelvű szöveggel, azok ezeket bocsássák a
rendelkezésünkre. Szeretnénk az interneten minél terjedelmesebb
elemzett korpuszt publikálni. Hozzájárulásukat, megjegyzéseiket előre
is köszönjük!
(Az elemző részletesebb dokumentációját, az elemző letölthető
és/vagy online használható változatát terveink szerint 2005 első félévében publikáljuk.)
Vissza
|