2023. Nov. 30. 10:00
Nyelvtudományi Kutatóközpont (1068 Budapest, Benczúr u. 33.), fszt-i előadóterem és online

ParlaMint: parlamenti felszólalások korpuszai. Az európai projekt és a 30 millió szavas magyar alkorpusz bemutatása

Mintegy 30 európai ország kutatóinak közös munkája eredményeként  az európai országok nemzeti és regionális parlamentjeinek felszólalásaiból létrejött a több mint 1 milliárd szavas ParlaMint 3.1 korpusz. Ezzel kutathatóvá, sőt összehasonlíthatóvá váltak az európai országok parlamentjeinek szövegei. A 30 millió szavas magyar alkorpusz a parlament 2014. május 6. és 2023. július 31. közötti felszólalásait tartalmazza, metaadatokkal gazdagítva.

A ParlaMint a CLARIN kiemelt projektje, amely az európai államok parlamenti felszólalásaiból álló, összehasonlítható és egységesen annotált korpusz létrehozására összpontosít. A projekt első szakasza (ParlaMint I: 2020-2021) 17 korpusz összeállítását eredményezte, míg a második szakasz (ParlaMint II: 2022-2023) a korpuszok időbeli terjedelmének növelését, új országok és autonóm régiók korpuszainak hozzáadását, a korpuszok angolra történő (gépi) fordítását, illetve a korpuszok további metaadatokkal való bővítését célozta. 

Kutatócsoportunk a második szakaszban csatlakozott a projekthez, melynek eredményeképp előállt a 2014. május 6. és 2023. július 31. közötti felszólalásokat tartalmazó, gazdagon metaadatolt, 30 millió tokenes magyar korpusz. Az adatbázis hasznos kutatási alapként szolgálhat nyelvészek, politológusok és társadalomtudósok számára, és az érdeklődő laikusok is haszonnal forgathatják.

Workshopunk két részből épül fel. Az első rész célja a korpusz bemutatása, kitérve a keretprojektre, valamint a jelenlegi változat tartalmi és technikai részleteire.

A második, gyakorlati részben egy laptopos bemutatón keresztül ismertetjük, hogyan dolgozhatunk a ParlaMint korpuszokkal azok lekérdezőfelületén, a NoSketch Engine-ben, hogy később mindenki a saját céljaira, könnyen használhassa az adatbázist.

A rendezvényen a részvétel ingyenes, de regisztrációhoz kötött. 

Regisztrálni 2023. november 23-ig lehet ezen a linken.

Program:

9:30-10:00: Regisztráció

10:00-11:00: A ParlaMint projekt és a magyar alkorpusz bemutatása (Ligeti-Nagy Noémi)

11:00-11:20: Kávészünet

11:20-12:20: ParlaMint tutorial. BYOD (bring your own device) esemény. Gyakorlati feladatokkal, saját laptopon. Tablet vagy mobil is használható, de elképzelhető, hogy bizonyos funkciók azokon nem elérhetőek. 

A ParlaMint projektről ezen a linken tájékozódhat https://www.clarin.eu/parlamint

Amennyiben a rendezvénnyel kapcsolatos további kérdésük van, kérjük, forduljanak kollégánkhoz a
yvtrgv-antl.abrzv@alghq.uha-era.uh e-mail címen.

Szeretettel várjuk Önöket!

Contributors

Ligeti-Nagy Noémi
tudományos munkatárs

Hungarian Research Centre for Linguistics

Jelencsik-Mátyus Kinga
korábbi tudományos munkatárs

Hungarian Research Centre for Linguistics