Ligeti-Nagy Noémi
PhD
kutatócsoport-vezető, tudományos munkatárs
Nyelvtechnológiai és Alkalmazott Nyelvészeti Intézet
neurális modellek kiértékelése; korpuszépítés; korpuszannotálás; korpuszalapú wsi. Elsősorban a neurális nyelvmodellek tesztelésére szolgáló adatbázisok tervezése, fejlesztése áll a kutatásaim fókuszában. Kiemelten foglalkozom a modellek kiértékelésének módszertanával, annak elméleti megalapozottságának vizsgálatával. Kutatásaim egyik legfontosabb terméke a HuLU, amely egy olyan, ú.n. benchmarkadatbázis-gyűjtemény, amellyel a nyelvmodellek magyarnyelv-tudása mérhető és összemérhető. A HuLU egy folyamatosan bővülő gyűjtemény, így rendszeresen újabb korpuszokkal egészítjük ki. Ezen kívül egyéb korpusztervezési, korpuszannotálási feladatokkal foglalkozom. A kutatócsoportban most készül a magyar nyelvű ParlaMint korpusz bővített, újraannotált, javított változata, illetve egy gold standard korpusz OCR-ező algoritmusok tesztelésére. Héja Enikővel egy gráfalapú megközelítéssel kísérletezünk, amellyel automatikusan nyerhetjük ki a szavak különböző jelentéseit, korpuszadatok alapján.
Ligeti-Nagy Noémi•Bemutatkozás
Ligeti-Nagy Noémi
•
Bemutatkozás
Magyar nyelv és irodalom, illetve történelem szakos tanári diplomáimat a Pázmány Péter Katolikus Egyetem Bölcsészettudományi Karán szereztem, ahogy a számítógépes szakirányú digitális bölcsész mesterdiplomámat is. Doktori disszertációmat Prószéky Gábor témavezetésével a magyar főnévi csoportok számítógépes feldolgozásának lehetőségeiről, korpuszvezérelt elemzésének eredményeiről írtam. PhD fokozatomat 2021-ben szereztem. 2021 májusa óta vagyok a Nyelvtechnológiai Kutatócsoport munkatársa.
Ligeti-Nagy Noémi•Publikációk
Ligeti-Nagy Noémi
•
Publikációk
Szűrők beállítása
Összes
42 találat
42 találat
Összes
42 találat
Héja Enikő, Gábor Kata, Győrffy András, Ligeti-Nagy Noémi, Simon László, Lipp Veronika. 2024. Melléknevek disztribúciós és szemantikai mintázatai. In: Lipp Veronika, Ligeti-Nagy Noémi, Simon László (szerk.) Prószéky Gábor 70: PG70 – ünnepi kötet. Budapest: HUN-REN Nyelvtudományi Kutatóközpont. 44–51. https://doi.org/10.18135/PG70.2024.7.
Ligeti-Nagy, Noémi, Gergő Ferenczi, Enikő Héja, László János Laki, Noémi Vadász, Zijian Győző Yang, and Tamás Váradi. 2024. HuLU: Hungarian Language Understanding Benchmark Kit. In: Calzolari Nicoletta, Kan Min-Yen, Hoste Veronique, Lenci Alessandro, Sakti Sakriani, Xue Nianwen (szerk.) Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024): Main Conference Proceedings. Online kiadás: European Language Resources Association (ELRA). 8360–8371.
Madarász, Gábor, Noémi Ligeti-Nagy, András Holl, and Tamás Váradi. 2024. OCR Cleaning of Scientific Texts with LLMs. In: Rehm Georg, Dietze Stefan, Schimmler Sonja, Krüger Frank (szerk.) Natural Scientific Language Processing and Research Knowledge Graphs: First International Workshop, NSLP 2024, Hersonissos, Crete, Greece, May 27, 2024, Proceedings. Cham: Springer Nature Switzerland. 49–58. Paper: Chapter 4. https://doi.org/10.1007/978-3-031-65794-8_4.
Yang Zijian Győző, Dodé Réka, Héja Enikő, Laki László János, Ligeti-Nagy Noémi, Madarász Gábor, Váradi Tamás. 2024. ParancsPULI: Az utasításkövető PULI-modell. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XX. Magyar Számítógépes Nyelvészeti Konferencia. online kiadás: Szegedi Tudományegyetem. 61–72.
Yang Zijian Győző, Szlávik Szilárd, Ligeti-Nagy Noémi. 2024. Magyar nyelvű utasításkövető korpusz építése Stanford Alpaca promptok fordításával és lokalizálásával. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XX. Magyar Számítógépes Nyelvészeti Konferencia. online kiadás: Szegedi Tudományegyetem. 243–255.
Zijian, Győző Yang, Réka Dodé, Gergő Ferenczi, Péter Hatvani, Enikő Héja, Gábor Madarász, Noémi Ligeti-Nagyet al.. 2024. The First Instruct-Following Large Language Models for Hungarian. In: András Hajdu 2024 IEEE 3rd Conference on Information Technology and Data Science (CITDS) Proceedings. Debrecen: Debreceni Egyetem. 247–252.
Héja Enikő, Ligeti-Nagy Noémi. 2023. Magyar melléknevek poliszém jelentéseinek automatikus kinyerése gráfokkal. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XIX. Magyar Számítógépes Nyelvészeti Konferencia, MSZNY-2023. Szeged: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 63–76.
Héja, Enikő, Noémi Ligeti-Nagy, László Simon, and Veronika Lipp. 2023. An Unsupervised Approach to Characterize the Adjectival Microstructure in a Hungarian Monolingual Explanatory Dictionary. In: Medveď M., Měchura M., Tiberius C., Kosem I., Kallas J., Jakubíček M., Krek S. (szerk.) Electronic lexicography in the 21st century (eLex 2023): Invisible Lexicography. Proceedings of the eLex 2023 conference. Brno, 27–29 June 2023. Brno: Lexical Computing. 150–167.
Laki, László János, Noémi Ligeti-Nagy, Noémi Vadász, and Zijian Győző Yang. 2023. Neural Morphological Generators for Hungarian. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XIX. Magyar Számítógépes Nyelvészeti Konferencia, MSZNY-2023. Szeged: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 331–340.
Ligeti-Nagy Noémi, Héja Enikő, Takács Dávid, Yang Zijian Győző, Váradi Tamás. 2023. Hát te mekkorát nőttél! – A HuLU első életéve új adatbázisokkal és webszolgáltatással. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XIX. Magyar Számítógépes Nyelvészeti Konferencia, MSZNY-2023. Szeged: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 217–230.
Ligeti-Nagy, Noémi, Réka Dodé, Kinga Jelencsik-Mátyus, Zsófia Varga, Enikő Héja, and Tamás Váradi. 2023. A new ParlaMint corpus for Hungarian 30m tokens of annotated parliamentary data. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XIX. Magyar Számítógépes Nyelvészeti Konferencia, MSZNY-2023. Szeged: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 433–446.
Yang Zijian Győző, Dodé Réka, Ferenczi Gergő, Héja Enikő, Kőrös Ádám, Laki László János, Ligeti-Nagy Noémi, Jelencsik-Mátyus Kinga, Vadász Noémi, Váradi Tamás. 2023. Jönnek a nagyok! BERTLarge, GPT-2 és GPT-3 nyelvmodellek magyar nyelvre. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XIX. Magyar Számítógépes Nyelvészeti Konferencia, MSZNY-2023. Szeged: Szegedi Tudományegyetem TTIK, Informatikai Intézet. 247–262.
Héja, Enikő, and Noémi Ligeti-Nagy. 2022. A Clique-based Graphical Approach to Detect Interpretable Adjectival Senses in Hungarian. In: Dmitry Ustalov, Yanjun Gao, Alexander Panchenko, Marco Valentino, Mokanarangan Thayaparan, Thien Huu Nguyen, Gerald Penn, Arti Ramesh, Abhik Jana (szerk.) Proceedings of TextGraphs-16: Graph-based Methods for Natural Language Processing. Stroudsburg (PA): Association for Computational Linguistics (ACL). 35–43.
Laki László János, Kőrös Ádám, Ligeti-Nagy Noémi, Nyéki Bence, Vadász Noémi, Yang Zijian Győző, Váradi Tamás. 2022. OCR-hibák javítása neurális technológiák segítségével. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XVIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2022. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 417–430.
Ligeti-Nagy Noémi, Ferenczi Gergő, Héja Enikő, Jelencsik-Mátyus Kinga, Laki László János, Vadász Noémi, Yang Zijian Győző, Váradi Tamás. 2022. HuLU: magyar nyelvű benchmark adatbázis kiépítése a neurális nyelvmodellek kiértékelése céljából. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XVIII. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2022. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 431–446.
Ligeti-Nagy Noémi, Novák Attila. 2019. Hol ugat a kutya? Örömében. Helyhatározói esetragos névszók pontosabb annotációja. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XV. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2019: Szeged, 2019. január 24–25. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 225–234.
Ligeti-Nagy, Noémi, Andrea Dömötör, and Noémi Vadász. 2019. What does the Nom say? An algorithm for case disambiguation in Hungarian. In: Anneli Vainumäe, Heiki-Jaan Kaalep IWCLUL 2019. The fifth International Workshop on Computational Linguistics for Uralic Languages: Proceedings of the Workshop. Tartu: University of Tartu. 27–41.
Novák Attila, Laki László János, Novák Borbála, Dömötör Andrea, Ligeti-Nagy Noémi, Kalivoda Ágnes. 2019. Egy magyar nyelvű kérdezőrendszer. In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.) XV. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2019: Szeged, 2019. január 24–25. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 83–95.
Novák, Attila, László Laki, Borbála Novák, Andrea Dömötör, Noémi Ligeti-Nagy, and Ágnes Kalivoda. 2019. Creation of a corpus with semantic role labels for Hungarian. In: Assoc Computat Linguist (szerk.) 13TH LINGUISTIC ANNOTATION WORKSHOP (LAW XIII). Stroudsburg (PA): Association for Computational Linguistics (ACL). 220–229.
Balázs, Indig, Simonyi András, and Ligeti-Nagy Noémi. 2018. What's Wrong, Python? -- A Visual Differ and Graph Library for NLP in Python. In: Nicoletta Calzolari, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Koiti Hasida, Hitoshi Isahara (szerk.)et al. Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Paris: European Language Resources Association (ELRA). 577–582.
Ligeti-Nagy Noémi, Vadász Noémi, Dömötör Andrea, Indig Balázs. 2018. Nulla vagy semmi? Esetegyértelműsítés az ablakban. In: Vincze Veronika (szerk.) XIV. Magyar Számítógépes Nyelvészeti Konferencia : MSZNY 2018: Szeged, 2018. január 18-19. Szeged: Szegedi Tudományegyetem, Informatikai Intézet. 25–37.
Ligeti-Nagy, Noémi. 2018. Corpus-driven Study on Hungarian Postpositions
Ligeti-Nagy Noémi. 2013. Kulturális különbségek a mentális lexikonban: Szóasszociációs vizsgálat és számítógépes klaszterelemzés. In: J Újváry Zsuzsanna (szerk.) Győzteseink szárnypróbálásai: A PPKE BTK bölcsészhallgatóinak győztes dolgozatai a XXXI. OTDK Humán Szekciójában. Piliscsaba: Pázmány Péter Katolikus Egyetem BTK. 183–206.
Oláh-Nagy Noémi. 2012. Kulturális különbségek a mentális lexikonban – szóasszociációs vizsgálat és számítógépes klaszterelemzés. In: Balázs Géza, Kovács László, Szőke Viktória (szerk.) Hálózatkutatás: interdiszciplináris megközelítések. Budapest: Eötvös Kiadó; Magyar Szemiotikai Társaság (MSZT); Inter Kht; Bolyai Műhely Alapítvány. 50–57.