Central and South-East European Resources (CESAR)

Támogató intézmény: Európai Unió

Azonosító: 271022

LezártNemzetközi pályázatKonzorciális pályázat

MTA Nyelvtudományi Intézet, BME TMIT, Zágrábi Egyetem Bölcsészettudományi Kar, Lengyel Tudományos Akadémia Számítástudományi Intézet, Łódź-i Egyetem, Belgrádi Egyetem Matematikai Kar, Mihajlo Pupin Intézet (Szerbia), Prof. Lyubomir Andreychin Bolgár Nyelvtudományi Intézet, Szlovák Tudományos Akadémia Ľudovít Štúr Nyelvtudományi Intézet

A projekt célja hat közép-európai nyelv (bolgár, horvát, lengyel, magyar, szerb és szlovák) nyelvi erőforrásainak (írott és beszélt nyelvet feldolgozó korpuszok, szótárak, ontológiák), valamint eszközeinek (morfológiai, szintaktikai és egyéb nyelvi elemzők) feltérképezése, egységes színvonalra hozásuk, a köztük lévő szabványos átjárhatóság biztosítása és hozzáférhetőségük növelése. A magyar helyzetről a 2012-ben megjelent A magyar nyelv a digitális korban című kötet számol be.

A csatlakozott több mint 2000 erőforrás és eszköz – megfelelően kialakított licenszekkel – elérhető a META-SHARE repozitóriumban. Ez biztosítja, hogy – elsősorban a kutatók – hozzáférhetnek az eddig nehezen elérhető nyelvi erőforrásokhoz és eszközökhöz, melyek ezáltal szélesebb körben felhasználhatók, jobban kiaknázhatók nemcsak a nyelvtechnológia tudományterületén, hanem az ipari alkalmazásokban is.