Udmorf: udmurt számítógépes morfológiai elemző
Erről az oldalról letölthető a udmurt morfológiai elemző által
elemzett szöveg. A zip formátumba
csomagolt szöveg egyszerű szövegfájlként
nyitható, a magyar ékezetes betűkön kívül speciális karaktereket nem
tartalmaz (letöltési mérete kb. 1,5 Mbyte, kicsomagolva kb. 8,7 Mbyte).
Az Udmorf a Bakró-Nagy Marianne által vezetett Számítógépes Uráli
Nyelvészeti Adatbázis című NKFP-program keretein belül készült. Az
elemző tőtára Kozmács István udmurtmagyar szótárára épül, neki
külön is köszönjük, hogy művét rendelkezésünkre bocsátotta. Enélkül az
elemző hatékonysága a jelenleginek csupán töredéke lehetne. Az
elemzőt Novák Attila (Morphologic Kft.) és Fejes László (MTA
Nyelvtudományi Intézet, Finnugor osztály) készítette, Novák Attila
elsősorban a technikai megvalósításon, Fejes László a nyelvleíráson
dolgozott, de a két terület között jelentős volt az átfedés.
Az elemzett szöveget a Kenyes c. irodalmi folyóirat egyik száma
alkotja. A támogatásért külön köszönetet mondunk a Kenyes
c. folyóiratnak, ill. más udmurt folyóiratoknak (Dzsecsbur, Invozso),
továbbá az Udmurt Könyvkiadónak, hogy vállalkozásunkat elektronikus
formájú szövegek átadásával segítették. A későbbiekben tervezzük
további szövegek
feldolgozását is. Mindemellett kérjük, hogy mindazok, akik
rendelkeznek bármilyen elektronikus (de elsősorban .txt, .rtf, .doc, .tex,
.html) formátumú udmurt nyelvű szöveggel, azok ezeket bocsássák a
rendelkezésünkre. Szeretnénk az interneten minél terjedelmesebb
elemzett korpuszt publikálni. Hozzájárulásukat, megjegyzéseiket előre
is köszönjük!
(Az elemző részletesebb dokumentációját, az elemző letölthető
és/vagy online használható változatát terveink szerint 2005 első
félévében publikáljuk.)
Vissza
|