Skip to the main content

Original scientific paper

https://doi.org/10.31745/s.72.5

Strojno prepoznavanje rukopisnog teksta za hrvatsku glagoljicu

Achim Rabus orcid id orcid.org/0000-0002-5366-1430 ; University of Freiburg


Full text: croatian pdf 449 Kb

page 181-192

downloads: 423

cite

Full text: english pdf 449 Kb

page 181-192

downloads: 718

cite


Abstract

U radu se predstavljaju nedavni pomaci u tehnologiji prepoznavanja rukopisnoga teksta (HTR) namijenjenoj hrvatskoglagoljskim rukopisnim i ranim tiskanim knjigama. Nakon opisivanja općih načela strojne obuke HTR modela, iznose se značajke načela strojnoga učenja u platformi Transkribus, pogotovo modeli korištenja latinice u preslovljavanju glagoljskih tekstova. Pri tome se u većini slučajeva ispravno preslovljavaju ligature i razrješuju kratice. Dobivena čestota pogrešaka je manja od 6%, poput uobičajene čestote pogrešaka kada preslovljavanje provode stručne osobe. Primjena HTR modela u prvom stadiju preslovljavanja može uštedjeti puno vremena pri pripremi i uređivanju rukopisa za objavu, zahvaljujući pretraživanju (pretrazi po ključnim riječima), pa čak i neispravno HTR preslovljavanje može biti korišteno za različite raščlambe. Modeli su javno dostupni posredstvom platforme Transkribus. Potičemo sve znanstvenike koji obrađuju glagoljske rukopise i rane tiskane knjige da se njima koriste.

Keywords

strojno prepoznavanje rukopisnoga teksta; glagoljica; digitalna humanistika; rukopisi; rane tiskane knjige

Hrčak ID:

269768

URI

https://hrcak.srce.hr/269768

Publication date:

31.12.2021.

Article data in other languages: english

Visits: 2.286 *