Central and South-East European Resources (CESAR)
Támogató intézmény: Európai Unió
MTA Nyelvtudományi Intézet, BME TMIT, Zágrábi Egyetem Bölcsészettudományi Kar, Lengyel Tudományos Akadémia Számítástudományi Intézet, Łódź-i Egyetem, Belgrádi Egyetem Matematikai Kar, Mihajlo Pupin Intézet (Szerbia), Prof. Lyubomir Andreychin Bolgár Nyelvtudományi Intézet, Szlovák Tudományos Akadémia Ľudovít Štúr Nyelvtudományi Intézet
A projekt célja hat közép-európai nyelv (bolgár, horvát, lengyel, magyar, szerb és szlovák) nyelvi erőforrásainak (írott és beszélt nyelvet feldolgozó korpuszok, szótárak, ontológiák), valamint eszközeinek (morfológiai, szintaktikai és egyéb nyelvi elemzők) feltérképezése, egységes színvonalra hozásuk, a köztük lévő szabványos átjárhatóság biztosítása és hozzáférhetőségük növelése. A magyar helyzetről a 2012-ben megjelent A magyar nyelv a digitális korban című kötet számol be.
A csatlakozott több mint 2000 erőforrás és eszköz – megfelelően kialakított licenszekkel – elérhető a META-SHARE repozitóriumban. Ez biztosítja, hogy – elsősorban a kutatók – hozzáférhetnek az eddig nehezen elérhető nyelvi erőforrásokhoz és eszközökhöz, melyek ezáltal szélesebb körben felhasználhatók, jobban kiaknázhatók nemcsak a nyelvtechnológia tudományterületén, hanem az ipari alkalmazásokban is.
Résztvevő kutatók
Oravecz Csaba
MTA Nyelvtudományi Intézet
Simon Eszter
MTA Nyelvtudományi Intézet
Miháltz Márton
MTA Nyelvtudományi Intézet
M. Pintér Tibor
MTA Nyelvtudományi Intézet
Mittelholcz Iván
MTA Nyelvtudományi Intézet
Beke András
Nyelvtudományi Intézet
Farkas Richárd
SZTE Informatikai Intézet
Vincze Veronika
SZTE Informatikai Intézet
Gutai Júlia Anett
Nyelvtudományi Intézet
Vargha Katalin
Nyelvtudományi Intézet
Nagy Ágoston
n/a
Silberztein Max
n/a
Lendvai Piroska
Nyelvtudományi intézet
Haader Lea
n/a
Zsibrita János
n/a