Nyelvbányász: Önszervező tanulási módszereken alapuló természetes nyelvi modellek és hasznosításuk irodai környezetben

Támogató intézményNKFP

AzonosítóNKFP
LezártHazai pályázatKonzorciális pályázat

Vezető kutatók, Benczúr András (SZTAKI), Kálmán László, CSc

A szöveges e-dokumentumok elérhetővé tétele kritikus eleme a vállalatok hatékony működtetésének. A NYELVBÁNYÁSZ projekt célja, hogy megcélozza a világpiacon jelentkező ilyen irányú igények kielégítését egy a ma szokásostól radikálisan eltérő új megközelítésre építve, az önszervező tanulás segítségével felépített nyelvi rendszerek alkalmazásával. Szemben a korábbi megközelítésekkel, az önszervező módon tanult nyelvmodellek jóval kevesebb ad-hoc elemet tartalmaznak, s így általuk a korábbiaknál jobb eredmények érhetőek el. A projekt keretén belül a számítógépes nyelvészek, matematikusok, kognitív tudósok, fizikusok, adatbányászok, gépi tanulás szakemberek dolgoznak együtt – a multidiszciplináris megközelítéstől is várjuk a projekt újszerű, áttörést jelentő eredményeit. Szintén cél a tanult nyelvmodellekre szervesen ráépülő ipari igényeket kiszolgálni képes nyelvtechnológiák, illetve az ezekre épülő, tipikus vállalati problémákat megcélzó alkalmazás prototípusok kifejlesztése is. A munkába bevont ipari partnerek és végfelhasználók közreműködése biztosítja, hogy a hasznosításkor megjelenő felhasználói igények a projekt megvalósításának kezdetétől fogva reprezentálva legyenek.

Résztvevők:

MTA SZTAKI (Gépi tanulás és Adatbányászat és Webkeresés csoportok), ELTE (Számítógéptudományi Tanszék, Komplex Rendszerek Fizikája Tanszék), BME (Sztochasztikus Analízis Tanszék, Matematikai Intézet), MTA Nyelvtudományi Intézet, MTA SZFKI, Omega Consulting Kft., Pont Rendszerház Rt.

Futamidő: 2005-2008

Résztvevő kutatók

Kálmán László (1957-2021)
tudományos főmunkatárs
Goldberg, Jeffrey Paul

Goldberg, Jeffrey Paul

tudományos munkatárs

MTA Nyelvtudományi Intézet