Obi-ugor morfológiai elemzők és korpuszok
Támogató intézmény: OTKA
Vezető kutató: Fejes László
Ismeretes, hogy a kisebb uráli nyelvek veszélyeztetett nyelvek, ezért dokumentálásuk nemzetközi jelentőségű feladat. A nyelvek dokumentálásának egyik legfőbb eszköze a morfológiailag annotált korpuszok létrehozása: a jelen pályázatba foglaltak is ezt célozzák. A kutatás előzménye a NKFP-5/135/01-es pályázat, melynek során több kis uráli nyelv morfológiai elemzője készült el, a jelenleg is futó OTKA 048309-es pályázat keretében pedig a permi nyelvek elemzőinek fejlesztése folyik.
A projekt a két obi-ugor nyelv három nyelvjárását öleli fel, és négy fő modulra oszlik:
1. Vogul (manysi) északi nyelvjárás: Kálmán Béla gyűjtése
A Chrestomathia Vogulica korábban elemzett szövegeinek egyértelműsítése (kb. 3600 szó). A Wogulische Texte mit einem Glossar északi anyaga (kb. 19500 szó). Részben hangzóanyaggal (kb. 5-6 óra). A két gyűjtemény között átfedés van, de a transzkripcióban különbségek vannak.
2. Vogul (manysi) északi nyelvjárás: Munkácsi Bernát gyűjtése
A Vogul népköltési gyűjtemény északi anyaga (kb. 60000 szó).
3. Osztják (hanti) szinjai nyelvjárás: Ruttkay-Miklián Eszter gyűjtése
A korábban említett NKFP-pályázat keretében gyűjtött szövegek, ”értelmező szótár”, melyben az adatközlő Steinitz DEWOS-ában szereplő szavakat magyarázza (kb. 52 óra hangzóanyag).
4. Osztják (hanti) kazimi nyelvjárás: különböző gyűjtések
Szövegek Wolfgang Steinitz, Rédei Károly és Schmidt Éva gyűjtéséből (20000 szó).
A korpuszokat az interneten keresztül ingyenesen és szabadon elérhetővé szeretnénk tenni. A projekt keretében a korpuszok annotált, angolul glosszázott, részben egyértelműsített változatát szeretnénk elkészíteni.
Futamidő: 2008-2010