Gépi kézírásfelismerés segítségével készült el a Magyar Nemzeti Levéltár legnagyobb adatbázisa

A Magyar Nemzeti Levéltár szeptember 26-án adta át a nagyközönségnek legújabb adatbázisát, melynek létrehozásában a levéltárosok a mesterséges intelligenciát hívták segítségül.

Az 1828. évi országos összeírás az eddigi legnagyobb kézírásfelismeréssel feldolgozott gyűjtemény Magyarországon. Az 1828. évi országos összeírás teljes, 12.688 település adatait tartalmazó, indexelt képanyaga a Valenciai Műszaki Egyetem által fejlesztett algoritmus és mintegy 70 önkéntes munkájának eredményeként jött létre.

Dr. Mikó Zsuzsanna a Magyar Nemzeti Levéltár általános főigazgató-helyettese köszöntőbeszédében kiemelte, hogy számos jó nemzetközi gyakorlatot követve a Magyar Nemzeti Levéltár is nyitott a civilek bevonására az adatbázisainak fejlesztésében. A főigazgató-helyettes reményét fejezte ki, hogy az önkéntesek által feldolgozott iratanyag és adatbázisok száma egyre gyarapodni fog, és megköszönte az önkénteseket adó Magyar Családtörténet-kutató Egyesület segítségét a közösségi összefogással végzett munkában.

Szatucsek Zoltán az intézmény Informatikai és Innovációs Igazgatóságának vezetője európai szinten egyedülállónak nevezete az önkéntesek aktivitását, mivel a meghirdetett programra két nap alatt annyian jelentkeztek, hogy le kellett állítani a toborzást. Az átadott 1828. évi országos összeírás 196.724 oldalból áll, és tartalmazza a 19. század első feléből valamennyi adófizetési kötelezettség alá eső háztartás tulajdonosának, családfőjének az adatait. Az egyedülálló történeti forrásban 2.845.595 személynév szerepel a történeti Magyarország, Horvátország és Szlavónia teljes területéről – tette hozzá az igazgató.

A most közzétett irategyüttes elsősorban családtörténet-kutatási szempontból kivételesen értékes forrás, illeszkedve a Magyar Nemzeti Levéltár Adatbázisok Online felületén már régóta elérhető korábbi, 1715. és 1720. évi összeírások sorába. Az adatbázisban a kereshető személynevek mellett a vagyoni és társadalmi helyzetre vonatkozó adatok digitalizált képei is elérhetők a kutatók számára, szem előtt tartva, hogy az összeírás a korszak magyar társadalom- és gazdaságtörténete szempontjából pótolhatatlan forrásértékkel bír.

További információ itt. 

Hirdetés