Kornai András előadása a Magyar Tudomány Ünnepén

Az utóbbi 6-8 évben a számítógépes nyelvészetet forradalmasították a szóbeágyazások, olyan leképezések amelyek az egyes szavakhoz n-dimenziós euklideszi tér vektorait rendelik. A fejlődés rohamos voltát mi sem jellemzi jobban, mint hogy amikor 2017-ben Prószéky Gábor ezekről beszélt, akkor még nem is léteztek az u.n. dinamikus beágyazások, amelyek ugyanahhoz a szóhoz különböző vektorokat rendelnek a szövegkörnyezet függvényében.  Mára az első ilyen rendszerekre (ELMO, Peters et al 2018;  BERT Devlin et al 2019) már több, mint tízennyolcezer cikkben hivatkoznak, és számtalan újabb, elveikben hasonló, de részleteikben  lényegesen eltérő modell készült.  Kornai András „Újabb fejlemények a szójelentés matematikájában” címmel  a Magyar Tudomány Ünnepe 2020 rendezvényen tartott előadásában elsősorban azzal foglalkozik, hogy a tanítási folyamat sorát mit optimalizálunk, hogyan, és miért, de áttekinti az olyan hazai fejleményeket is, mint a SZTAKIban kifejlesztett huBERT (Nemeskey 2020).