CURLICAT: Curated Multilingual Language Resources for CEF AT

Támogató intézményInnovation and Networks Executive Agency

Azonosító2019-EU-IA-0034
LezártNemzetközi pályázatKonzorciális pályázat

A CURLICAT a konzorcium által megcélzott hét nyelven (bolgár, horvát, magyar, lengyel, román, szlovák és szlovén) összeállítja a kurált egynyelvű adatkészleteket az európai digitális szolgáltatási infrastruktúrák (DSI) szempontjából releváns területeken a CEF AT fejlesztése érdekében. Az elsődleges adatforrás a fent említett nyelvek nemzeti/referenciakorpusai.

Az akció legalább 14 millió mondatot fog közölni (a becslések szerint legalább 140 millió szót tartalmaz) olyan területekről, mint a tudomány, a kultúra, az egészségügy, a gazdaság és a pénzügy.

Ezen túlmenően a fellépés orvosolni fogja a gépi fordítási technológia hiányosságait, amely döntően attól függ, hogy ezekhez a közepesen erőforrásokkal rendelkező nyelvekhez biztosítják-e a tartományspecifikus minőségi nyelvi erőforrásokat.

Résztvevő kutatók

Váradi Tamás
főigazgatói tanácsadó, tudományos főmunkatárs
Héja Enikő
igazgató, tudományos munkatárs
Vadász Noémi
korábbi tudományos segédmunkatárs
Yang Zijian Győző
tudományos munkatárs
Ligeti-Nagy Noémi
kutatócsoport-vezető, tudományos munkatárs
Laki László János
korábbi tudományos munkatárs
Kalivoda Ágnes
tudományos munkatárs
Prószéky Gábor
főigazgató, tudományos tanácsadó
Halász Dávid

Halász Dávid

tudományos segédmunkatárs

Nyelvtudományi Intézet

Nyéki Bence

Nyéki Bence

tudományos segédmunkatárs

Nyelvtudományi Intézet

Közreműködő intézmények

Institute for Bulgarian Language "Prof. Lyubomir Andreychin"

Institute for Bulgarian Language "Prof. Lyubomir Andreychin"

University of Zagreb, Faculty of Humanities and Social Sciences

University of Zagreb, Faculty of Humanities and Social Sciences

Institute of Computer Science, Polish Academy of Sciences

Institute of Computer Science, Polish Academy of Sciences

Institutul de Cercetari pentru Inteligenta Artificiala, Academia Romana

Institutul de Cercetari pentru Inteligenta Artificiala, Academia Romana

Jazykovedný ústav Ľ. Štúra Slovenskej akadémie vied

Jazykovedný ústav Ľ. Štúra Slovenskej akadémie vied

"Jožef Stefan" Institute

"Jožef Stefan" Institute