O automatickej transkripcii rukopisných textov už desiatky rokov snívajú historici, lingvisti, archivári, knihovníci, dokumentaristi a všetci, ďalší, ktorí prichádzajú do styku s rukopisnými textami.
Postupne sa automatický prepis rukopisov stáva skutočnosťou. Je za tým mohutný medzinárodný základný výskum v oblasti neorónových sietí, umelej inteligencie, tisíce hodín práce…
Prinášam pre záujemcov výsledky mojej práce, ukážku, ako to vyzerá.
Copyright: prof. PhDr. Dušan Katuščák, PhD., 21. január 2019 Experiment: List: Kmeť _ Behunek List z 3. februára 1899. Ukážka experimentu obsahuje texty z automatickej transkripcie rukou písaného listu Andreja Kmeťa z roku 1899.
Výsledky transkripcie sú bez akýchkoľvek úprav a opráv. Použitý vlastný model transkripcie slevenčiny. Character Error Rate Train set: 1,01% Character Error Rate Test set: 2,78%
Automatická transkripcia (výsledok):
„Či u Vás alebo niekde na okolí nestavujú
Betlehemy a aké? U či by si z figuriek snáď
po
Vianociach nemohol zaopatriť pre museum?
Zajtra pochovávame Pietra, ako ti je to
už z novin alebo zo smrtnej ceduly znamo
Ja mám pontifikovať . Želieme za nim veľmi
lebo bude nenahraditeľne chýbať, poneváč on vede
vynsť i s maďarónmi a ctili ho všetci čomu
žiadon iny nemôže sa tešiť tuná. Proti nám
Slovákom bojuje takrečeno nebo i svet a bije
kynoží nás všetko. Trnieme čo urobili dnes
Jurigom, a čo za tresť namerali Hlinkovi Bože
však tí naši vrahovia len nemajú Boha, ani
hanby ani toľko, ako poriadni po
Halaša posiela Ti z oných knih de
sať kusov a šesť modlitebných knižniek pre
dietky
A ináč, ako že sa ty máš? Pánu Drovi Šim
kovi do Hlohovca písal som, ale i sám vyhľadávaj
veci, ktoré pomocou jeho poslal si museumu. Na
lepšie je presvedčiť sa
V
Zhováral som sa v Trnave s p. Urbánkom aj
o Tvojich rukopisoch. Vďačne a veľmi vďačne by
vydali, len ráč ich dať dobremu pisárovi prepísať,
lebo Tvoje písmo je tažko čítať, a tým ťažšie
Zdravstvuj
potom sadzacovi sádzať. Pá!
Tvoj brat
A. Kmeť“Originál listu Andreja Kmeťa