MTA Nyelvtudományi Intézet

e-magyar.hu: digitális nyelvfeldolgozó rendszer

e-magyar.hu: digitális nyelvfeldolgozó rendszer

Az élményről

Az e-magyar rendszer az emberi intelligenciát igénylő szövegolvasási, szövegértési feladat alapvető, kezdeti lépéseit automatikusan valósítja meg: a szöveg nyelvi jellemzőit automatikus módon fedi fel, teszi explicitté. Egy tetszőleges szövegrészt feldolgozva megtudjuk az egyes szavak szófaját, szótövét, alaktani (morfológiai) elemzését, a mondatok kétféle mondattani (szintaktikai) elemzését, megkapjuk a főnévi csoportokat és a tulajdonneveket. Az online felületen ezek az elemzési szintek többféleképpen is vizualizálódnak.

Mit próbálj ki?

Az e-magyar.hu rendszer jelenleg az alábbi szövegfeldolgozási feladatokat valósítja meg: -szavakra és mondatokra bontás; -morfológiai elemzés; -szótövezés; -morfológiai egyértelműsítés; -függőségi mondatelemzés; -összetevős mondatelemzés; -főnévi csoportok felismerése; -tulajdonnév-felismerés. A feladatoknak ez a sorrendje a nyelv szintjeit, valamint a feldolgozás nehézségét is követi. A rendszer minden nyelvi egységhez képes elemzést adni, de vannak korlátai, így a nem szabványos nyelvi elemek esetében valószínűleg kevésbé pontos elemzést ad, mint például: -elírások, helyesírási hibák; -a közösségi médiában alkalmazott rövidítések, emotikonok; -régi(es) szövegek; -versek, dalszövegek.

Szükséges perifériák

Egér , Billentyűzet , Kijelző

A technológia magyarázata

A rendszer egybegyűjti, egy egységes láncba integrálja és közzéteszi az elemzési lépéseket megvalósító számítógépes magyar nyelvfeldolgozó eszközöket. Az eszközök közül néhány szabályalapú, de nagy részük gépi tanuláson alapul. Fontos szempont az interoperabilitás, vagyis az egyes eszközök közötti átjárhatóság megteremtése.

Mi ebben az MI?

Az elemzőláncba kötött eszközök közül néhány szabályalapú, de nagy részük gépi tanuláson alapul. A modellek a magyarra elérhető legnagyobb gold standard minőségű szöveghalmazokon lettek betanítva.

Kipróbálom

Technológia tulajdonosa

MTA Nyelvtudományi Intézet

Milyen típusú MI-t használ a technológia?

Természetes szöveg feldolgozás

Alkalmazott megoldás

Általános bemutató

Felhasználási terület

Szoftver és Internet

Közvetlen Felhasználási módok

Mindenféle magyasabb szintű szövegfeldolgozáshoz, illetve nyelvtechnológiai feladathoz ezek jelentik a kezdeti lépéseket. Ezenfelül használják még: -irodalmi, stilometriai kutatásokhoz; -jogi szövegek automatikus feldolgozásához; -menetrend- és utazástervező szolgáltatásokhoz.

Közvetetten

Minden olyan feladathoz, amiben szöveges bemenetet kell valamilyen szinten feldolgozni és a benne impliciten megtalálható információkat explicitté tenni, pl. információkinyerés, szövegbányászat, gépi fordítás stb.

Üzleti funkció

Kutatás és fejlesztés

Technológia létrehozásának időpontja

2016-11-01

Elakadt és segítségre van szüksége?

Nyugodtan keressen bennünket a +36 1 000 000 telefonszámon, vagy e-mailben a info@miagyakorlatban.hu címen.