Udmorf:
udmurt számítógépes morfológiai elemző

Erről az oldalról letölthető a udmurt morfológiai elemző által elemzett szöveg. A zip formátumba csomagolt szöveg egyszerű szövegfájlként nyitható, a magyar ékezetes betűkön kívül speciális karaktereket nem tartalmaz (letöltési mérete kb. 1,5 Mbyte, kicsomagolva kb. 8,7 Mbyte).

Az Udmorf a Bakró-Nagy Marianne által vezetett Számítógépes Uráli Nyelvészeti Adatbázis című NKFP-program keretein belül készült. Az elemző tőtára Kozmács István udmurt–magyar szótárára épül, neki külön is köszönjük, hogy művét rendelkezésünkre bocsátotta. Enélkül az elemző hatékonysága a jelenleginek csupán töredéke lehetne. Az elemzőt Novák Attila (Morphologic Kft.) és Fejes László (MTA Nyelvtudományi Intézet, Finnugor osztály) készítette, Novák Attila elsősorban a technikai megvalósításon, Fejes László a nyelvleíráson dolgozott, de a két terület között jelentős volt az átfedés.

Az elemzett szöveget a Kenyes c. irodalmi folyóirat egyik száma alkotja. A támogatásért külön köszönetet mondunk a Kenyes c. folyóiratnak, ill. más udmurt folyóiratoknak (Dzsecsbur, Invozso), továbbá az Udmurt Könyvkiadónak, hogy vállalkozásunkat elektronikus formájú szövegek átadásával segítették. A későbbiekben tervezzük további szövegek feldolgozását is. Mindemellett kérjük, hogy mindazok, akik rendelkeznek bármilyen elektronikus (de elsősorban .txt, .rtf, .doc, .tex, .html) formátumú udmurt nyelvű szöveggel, azok ezeket bocsássák a rendelkezésünkre. Szeretnénk az interneten minél terjedelmesebb elemzett korpuszt publikálni. Hozzájárulásukat, megjegyzéseiket előre is köszönjük!

(Az elemző részletesebb dokumentációját, az elemző letölthető és/vagy online használható változatát terveink szerint 2005 első félévében publikáljuk.)

Vissza