Obi-ugor morfológiai elemzők és korpuszok

Támogató intézményOTKA

AzonosítóOTKA NF-71707
LezártHazai pályázatIntézményi pályázat

Vezető kutató: Fejes László

Ismeretes, hogy a kisebb uráli nyelvek veszélyeztetett nyelvek, ezért dokumentálásuk nemzetközi jelentőségű feladat. A nyelvek dokumentálásának egyik legfőbb eszköze a morfológiailag annotált korpuszok létrehozása: a jelen pályázatba foglaltak is ezt célozzák. A kutatás előzménye a NKFP-5/135/01-es pályázat, melynek során több kis uráli nyelv morfológiai elemzője készült el, a jelenleg is futó OTKA 048309-es pályázat keretében pedig a permi nyelvek elemzőinek fejlesztése folyik.

A projekt a két obi-ugor nyelv három nyelvjárását öleli fel, és négy fő modulra oszlik:

1. Vogul (manysi) északi nyelvjárás: Kálmán Béla gyűjtése
A Chrestomathia Vogulica korábban elemzett szövegeinek egyértelműsítése (kb. 3600 szó). A Wogulische Texte mit einem Glossar északi anyaga (kb. 19500 szó). Részben hangzóanyaggal (kb. 5-6 óra). A két gyűjtemény között átfedés van, de a transzkripcióban különbségek vannak.

2. Vogul (manysi) északi nyelvjárás: Munkácsi Bernát gyűjtése
A Vogul népköltési gyűjtemény északi anyaga (kb. 60000 szó).

3. Osztják (hanti) szinjai nyelvjárás: Ruttkay-Miklián Eszter gyűjtése
A korábban említett NKFP-pályázat keretében gyűjtött szövegek, ”értelmező szótár”, melyben az adatközlő Steinitz DEWOS-ában szereplő szavakat magyarázza (kb. 52 óra hangzóanyag).

4. Osztják (hanti) kazimi nyelvjárás: különböző gyűjtések
Szövegek Wolfgang Steinitz, Rédei Károly és Schmidt Éva gyűjtéséből (20000 szó).

A korpuszokat az interneten keresztül ingyenesen és szabadon elérhetővé szeretnénk tenni. A projekt keretében a korpuszok annotált, angolul glosszázott, részben egyértelműsített változatát szeretnénk elkészíteni.

Futamidő: 2008-2010

Résztvevő kutatók

Fejes László
tudományos főmunkatárs