Vektoros szóbeágyazások az NLP-ben

Időpont: 
2016. 12. 14. 10:15
Hely: 
H 306
Előadó: 
Előadó: Borbély Gábor

Bár a huszadik század közepétől kezdve kutatott terület,
csak a 2010-⁠es években terjedt el az címben szereplő technika.
A cél olyan leképezés (beágyazás) megtalálása, ami egy adott
nyelv (például angol) miden szavához egy lineáris tér egy-⁠egy
vektorát rendeli. Ezekkel aztán nyelvi kérdéseket, analógiákat
és egyéb feladatokat lehet lineáris algebrai eszközökkel
megválaszolni. 2013-⁠ban Tomas Mikolov publikálta azt a tanuló
algoritmust, ami ilyen vektorokat a gyakorlatban használható
minőségben és mennyiségben állít elő. Azóta több algoritmus is
született és széles körben elterjedt a használatuk.

Áttekintjük hogy hogyan lehet ilyen vektorokat előállítani és
hogy hol lehet őket sikerrel használni, valamint maguknak a
vektoroknak az előállítására vonatkozó új kutatásainkat.