Govor, Vol. 32 No. 1, 2015.
Izvorni znanstveni članak
Postupak automatskoga slogovanja temeljem načela najvećega pristupa i statistika slogova za hrvatski jezik
Ana Meštrović
; Odjel za informatiku Sveučilišta u Rijeci, Hrvatska
Sanda Martinčić‐Ipšić
orcid.org/0000-0002-1900-5333
; Odjel za informatiku Sveučilišta u Rijeci, Hrvatska
Mihaela Matešić
orcid.org/0000-0002-4780-8512
; Filozofski fakultet Sveučilišta u Rijeci, Hrvatska
Sažetak
Analiza slogova kao osnovnih elemenata jezika važna je za različite postupke u domeni računalne analize prirodnog jezika i govornih tehnologija. Cilj je rada prikazati i evaluirati automatski postupak slogovanja (silabifikacije) za hrvatski jezik te prikazati statističke rezultate raspodjele slogova za hrvatski jezik. Statistička analiza slogova provedena je za dva različita korpusa: korpus RJEČNIK, koji obuhvaća popis hrvatskih leksema u tzv. kanonskom obliku, dobiven iz rječnika hrvatskoga jezika, te korpus SOBiR, koji sadrži popis svih oblika riječi hrvatskoga jezika. Statistički rezultati za opisani postupak uspoređeni su s rezultatima (distribucijama slogova) dobivenima za hrvatski jezik iz postojećih izvora. Provedena je usporedba utomatskog postupka s ručnim postupkom i prikazani su rezultati, u okviru čega je određena (aproksimativna) pogreška automatiziranog postupka slogovanja.
Ključne riječi
slog; slogovanje; silabifikacija; distribucija slogova; najveći pristup
Hrčak ID:
165991
URI
Datum izdavanja:
15.12.2015.
Posjeta: 8.491 *