Izvorni znanstveni članak
https://doi.org/10.31745/s.72.5
Strojno prepoznavanje rukopisnog teksta za hrvatsku glagoljicu
Achim Rabus
orcid.org/0000-0002-5366-1430
; University of Freiburg
Sažetak
U radu se predstavljaju nedavni pomaci u tehnologiji prepoznavanja rukopisnoga teksta (HTR) namijenjenoj hrvatskoglagoljskim rukopisnim i ranim tiskanim knjigama. Nakon opisivanja općih načela strojne obuke HTR modela, iznose se značajke načela strojnoga učenja u platformi Transkribus, pogotovo modeli korištenja latinice u preslovljavanju glagoljskih tekstova. Pri tome se u većini slučajeva ispravno preslovljavaju ligature i razrješuju kratice. Dobivena čestota pogrešaka je manja od 6%, poput uobičajene čestote pogrešaka kada preslovljavanje provode stručne osobe. Primjena HTR modela u prvom stadiju preslovljavanja može uštedjeti puno vremena pri pripremi i uređivanju rukopisa za objavu, zahvaljujući pretraživanju (pretrazi po ključnim riječima), pa čak i neispravno HTR preslovljavanje može biti korišteno za različite raščlambe. Modeli su javno dostupni posredstvom platforme Transkribus. Potičemo sve znanstvenike koji obrađuju glagoljske rukopise i rane tiskane knjige da se njima koriste.
Ključne riječi
strojno prepoznavanje rukopisnoga teksta; glagoljica; digitalna humanistika; rukopisi; rane tiskane knjige
Hrčak ID:
269768
URI
Datum izdavanja:
31.12.2021.
Posjeta: 2.286 *