Databases and corpora

19 results
19 results
Szoftveralkalmazás

Magyar nyelvű neurális modelleken alapuló megoldások

Fordító, kivonatoló, szentimentelemző, névelem-felismerő, címkéző, ékezet-visszaállító

Szoftveralkalmazás

PULI, az első teljesen magyar nyelvű GPT-3

Szövegkorpusz

Magyar Nemzeti Szövegtár

Célunk egy 100 millió szavas szövegkorpusz létrehozása volt, amely lehetőségeihez mérten reprezentatívan tartalmazza a mai magyar nyelv jellegzetes megnyilvánulásait.

Szövegkorpusz

Magyar történeti szövegtár (A magyar nyelv nagyszótárának korpusza)

Adatbázis

Uralonet

Uráli etimológiai adatbázis

Szövegkorpusz

A magyar nyelv nagyszótára

A magyar nyelv nagyszótára a magyar nyelvtudomány eddigi legnagyobb szótári vállalkozása. Történeti jellegű értelmező szótárként legfontosabb feladata a szavak jelentéstartalmának kibontása és e jelentések viszonyrendszerének ábrázolása. Műfajából következően nem csupán a mai nyelvállapot szókészletét tükrözi és elemzi a lexikográfia eszközeivel, hanem történeti dimenziót érvényesít, amikor az elmúlt csaknem 230 esztendő szókincséből merít.

Uralic Languages under the Influence Database (UraLUID)
Database

Uralic Languages under the Influence Database (UraLUID)

Adatbázis

Budapesti Szociolingvisztikai Adatbázis (BUSZI)

A BUSZI nagyszabású felmérés, amely megbízható adatokat és elemzéseket szolgáltat a magyar nyelv Budapesten beszélt változatairól.

Szövegkorpusz

Csángó korpusz

Adatbázis

E-Szókincs

Adatbázis

Mazsola – a magyar igei bővítményszerkezet vizsgálata

Megtudhatja, hogy adott ige melletti adott (esetrag vagy névutó által meghatározott) bővítményi pozícióban milyen jellegzetes szavak jelenhetnek meg, legyen az vonzat vagy szabad bővítmény vagy az igével idiomatikus szerkezetet alkotó szó.

Szövegkorpusz

Moldvai magyar nyelvjárási szövegek Tánczos Vilmos gyűjtéséből

Tánczos Vilmos moldvai gyűjtése páratlan kincs nemcsak a néprajztudomány, hanem a magyar nyelvészeti kutatások számára is, hiszen a magyar nyelvészet régi adóssága a moldvai magyar nyelvjárások kutatására alkalmas, megfelelő pontossággal lejegyezett szövegkorpusz létrehozása

Szövegkorpusz

Ó- és középmagyar történeti magánéleti korpusz

A Történeti magánéleti korpusz (TMK) az 1772 előtti magánlevelekből és peres eljárások jegyzőkönyveiből épül fel. Elsősorban a történeti morfológiai és szociolingvisztikai kutatásokhoz kínál anyagot, de segítséget nyújt a történeti mondattani, pragmatikai és lexikológiai vizsgálatokhoz is.

Szövegkorpusz

Ómagyar korpusz

Kutatásaink elsősorban a mondatszerkezet kulcselemeinek, az ún. funkcionális projekcióknak a vizsgálatára összpontosultak, így foglalkoztunk az igeidők és az aspektus rendszerének, a mondatbevezetőknek, a névutók és határozóragok rendszerének, valamint a determinánsok rendszerének az átalakulásával.

Szövegkorpusz

Orwell 1984: angol ‒ magyar párhuzamos korpusz

A rendszer bemutatja az angol kifejezés összes előfordulását, valamint azok magyar fordítását.

Adatbázis

Új magyar etimológiai szótár

25996 magyar szó eredete 9860 szócikkben 60223 adattal. A szótár szerkesztés alatt áll!

Adatbázis

Párhuzamos Bibliaolvasó

A projektek célja egyrészt a magyar nyelv történetét érintő mondattani változások rekonstruálása és leírása, másrészt az elméleti kutatást támogató nyelvtörténeti adatbázisok létrehozása.

Adatbázis

Szovjet táborok magyar foglyainak adatbázisa

Magyarország 2019-ben megkapta Oroszországtól a 682000 magyar hadifogoly és civil elhurcolt alapvető adatait tartalmazó kartonok szkennelt képét, melyből készült ez az adatbázis.

Egyéb

Nemzeti korpuszportál

Portálunk célja, hogy a korpuszhasználók megismerhessék az NKP tagjait.