Skoči na glavni sadržaj

Izvorni znanstveni članak

https://doi.org/10.31745/s.72.5

Strojno prepoznavanje rukopisnog teksta za hrvatsku glagoljicu

Achim Rabus orcid id orcid.org/0000-0002-5366-1430 ; University of Freiburg


Puni tekst: hrvatski pdf 449 Kb

str. 181-192

preuzimanja: 423

citiraj

Puni tekst: engleski pdf 449 Kb

str. 181-192

preuzimanja: 718

citiraj


Sažetak

U radu se predstavljaju nedavni pomaci u tehnologiji prepoznavanja rukopisnoga teksta (HTR) namijenjenoj hrvatskoglagoljskim rukopisnim i ranim tiskanim knjigama. Nakon opisivanja općih načela strojne obuke HTR modela, iznose se značajke načela strojnoga učenja u platformi Transkribus, pogotovo modeli korištenja latinice u preslovljavanju glagoljskih tekstova. Pri tome se u većini slučajeva ispravno preslovljavaju ligature i razrješuju kratice. Dobivena čestota pogrešaka je manja od 6%, poput uobičajene čestote pogrešaka kada preslovljavanje provode stručne osobe. Primjena HTR modela u prvom stadiju preslovljavanja može uštedjeti puno vremena pri pripremi i uređivanju rukopisa za objavu, zahvaljujući pretraživanju (pretrazi po ključnim riječima), pa čak i neispravno HTR preslovljavanje može biti korišteno za različite raščlambe. Modeli su javno dostupni posredstvom platforme Transkribus. Potičemo sve znanstvenike koji obrađuju glagoljske rukopise i rane tiskane knjige da se njima koriste.

Ključne riječi

strojno prepoznavanje rukopisnoga teksta; glagoljica; digitalna humanistika; rukopisi; rane tiskane knjige

Hrčak ID:

269768

URI

https://hrcak.srce.hr/269768

Datum izdavanja:

31.12.2021.

Podaci na drugim jezicima: engleski

Posjeta: 2.286 *