Több mint 1 éves előkészítés után, sok száz ember lelkesedésének, jószándékának és akaratának köszönhetően 2025. február 3-án, hétfőn este felgördül a függöny a Corvin mozi Korda termében, és elkezdődik a filmszakma közös ünnepe.
Középpntban a nyelvi modellek és nyelvfeldolgozó eszközök.
Az Országos Széchényi Könyvtár (OSZK) és az Eötvös Loránd Kutatási Hálózat Nyelvtudományi Kutatóközpontja (NYTK) 2023. június 21-én aláírt megállapodása egy olyan, a mesterséges intelligencia fejlesztését célzó innovációs együttműködés kezdete, amely nagy nyelvi modellek építését és nyelvfeldolgozó eszközök létrehozását állítja a középpontba.
Az olvasásnak, mint mindenkor, a jövőben is meghatározó szerepe lesz az ismeretek, a műveltség megszerzésében és a kommunikációban; a könyvtári tevékenység fókuszában az írásban rögzített tudás rendelkezésre bocsátása marad. A megállapodás értelmében az OSZK a Nyelvtudományi Kutatóközpontnak átadja a Magyar Elektronikus Könyvtárban (MEK) és az Elektronikus Periodika Archívum és Adatbázisban (EPA) elérhető szöveges dokumentumokat, a webarchívumok szöveges állományait, valamint a dHUpla adatbázisban szereplő anyagokat.
A kutatóközpont ezeket a szövegeket felhasználva nagy nyelvi modelleket épít, amelyek finomhangolásával számos nyelvfeldolgozó eszközt lehet fejleszteni. (Ilyenek találhatók többek között a ChatGPT mögött is.) A kutatóközpontnak már van tapasztalata a nyelvi modellek fejlesztése terén; a nevéhez fűződik a Puli-GPT, amely csak magyar nyelvű szöveges anyagokon tanult, és a ChatGPT-hez hasonló funkcionalitással bír.
Az NYTK a nemzeti könyvtár szövegei alapján létrehozott eszközöket az OSZK számára is hozzáférhetővé teszi. A nyelvfeldolgozó eszközök segítségével egyebek mellett a nyelvfelismerés és a webarchiválási tevékenység keretében keletkezett hatalmas mennyiségű tartalom feldolgozása is automatizálhatóvá válik.
Emellett a nemzeti könyvtár és az NYTK kooperációban dolgozza fel és teszi elérhetővé a Magyar Nagylexikon tizenkilenc kötetének anyagát. A terjedelmes dokumentum egyrészt olvasható és kereshető lesz egy webes lekérdezőfelületen a felhasználók számára, másrészt származtatott erőforrások készülnek belőle, amelyeket a mesterségesintelligencia-kutatással foglalkozó szakemberek kiválóan tudnak majd hasznosítani egyéb eszközök fejlesztéséhez.