A magyar nyelv digitális fenntarthatóságának támogatása
Támogató intézmény: Magyar Tudományos Akadémia
A jelen pályázat négy olyan alprojekt keretében végzett kutatásokra és fejlesztésekre irányul, amelyekben a Nyelvtudományi Kutatóközpont mint az MTA Kiváló Kutatóhelye elismerten élvonalbeli és egyedi szerepet tölt be. Ezek az alábbiak:
- Magyar Nemzeti Szövegtár 3.0
- Helyesírási tanácsadó portál 2.0
- A magyar nyelv nagyszótára archivális cédulagyűjteményének digitalizációja
- Obi-ugor nyelvek elemzett korpusza és tudásbázisa
Az NYTK eddig is küldetésének tekintette a magyar nyelv és nyelvhasználat korszerű technológiai eszközökkel történő támogatását. A Kutatóközpontban működő Nyelvtechnológiai Kutatócsoport az MTA támogatásával több olyan nyelvi erőforrást és digitális eszközt hozott létre, amelyek népszerűnek bizonyultak a szakmai kutatóközönség és az érdeklődő nagyközönség között egyaránt. Ezek között a jelen pályázat keretében a Magyar Nemzeti Szövegtár valamint a helyesiras.mta.hu címen működő helyesírási tanácsadó portál megújítását kívánjuk elvégezni.
A fent bemutatott két, korábban az NYTK-ban elkezdett munka mellett a projekt fontos részét képezi az archivális cédulagyűjtemény anyagának teljes digitalizálása, amely elsősorban kulturálisörökség-védelmet jelent. Emellett azonban lehetőség nyílna ennek segítségével további lexikológiai kutatások folytatására is. Az interneten való publikálást követően az archivális cédulagyűjtemény a laikus és szakmai közönség számára is elérhetővé válik, nem beszélve arról, hogy a nagyszótári projekten dolgozó lexikográfusok is könnyebben hozzáférnek az anyaghoz, mint eddig.
A negyedik alprojekt keretében nyelvek átfogó leírása: The Oxford Guide to the Uralic Languages (Bakró et al. 2022), amelyben az NYTK munkatársai mutatják be az obi-ugor nyelveket (lásd például Sipos 2022), ezzel biztos alapokat adva a nyelvi elemzők fejlesztéséhez.
Mind a négy alprojektet a Nyelvtudományi Kutatóközpont kutatóinak irányításával működő interdiszciplináris csapat végzi, amelyben a nyelvész és nyelvtechnológus szakértők mellett informatikusok, szoftver fejlesztők, webfejlesztők dolgoznak együtt az alábbi táblázatban tervezett ráfordítások mellett. A munkálatok tervezett futamideje összesen 48 hónap.