2020. december 18.
Az utóbbi 6-8 évben a számítógépes nyelvészetet forradalmasították a szóbeágyazások, olyan leképezések amelyek az egyes szavakhoz n-dimenziós euklideszi tér vektorait rendelik. A fejlődés rohamos voltát mi sem jellemzi jobban, mint hogy amikor 2017-ben Prószéky Gábor ezekről beszélt, akkor még nem is léteztek az u.n. dinamikus beágyazások, amelyek ugyanahhoz a szóhoz különböző vektorokat rendelnek a szövegkörnyezet függvényében. Mára az első ilyen rendszerekre (ELMO, Peters et al 2018; BERT Devlin et al 2019) már több, mint tízennyolcezer cikkben hivatkoznak, és számtalan újabb, elveikben hasonló, de részleteikben lényegesen eltérő modell készült. Kornai András „Újabb fejlemények a szójelentés matematikájában” címmel a Magyar Tudomány Ünnepe 2020 rendezvényen tartott előadásában elsősorban azzal foglalkozik, hogy a tanítási folyamat sorát mit optimalizálunk, hogyan, és miért, de áttekinti az olyan hazai fejleményeket is, mint a SZTAKIban kifejlesztett huBERT (Nemeskey 2020).