Skoči na glavni sadržaj

Izvorni znanstveni članak

Postupak automatskoga slogovanja temeljem načela najvećega pristupa i statistika slogova za hrvatski jezik

Ana Meštrović ; Odjel za informatiku Sveučilišta u Rijeci, Hrvatska
Sanda Martinčić‐Ipšić orcid id orcid.org/0000-0002-1900-5333 ; Odjel za informatiku Sveučilišta u Rijeci, Hrvatska
Mihaela Matešić orcid id orcid.org/0000-0002-4780-8512 ; Filozofski fakultet Sveučilišta u Rijeci, Hrvatska


Puni tekst: hrvatski pdf 390 Kb

str. 3-34

preuzimanja: 6.840

citiraj


Sažetak

Analiza slogova kao osnovnih elemenata jezika važna je za različite postupke u domeni računalne analize prirodnog jezika i govornih tehnologija. Cilj je rada prikazati i evaluirati automatski postupak slogovanja (silabifikacije) za hrvatski jezik te prikazati statističke rezultate raspodjele slogova za hrvatski jezik. Statistička analiza slogova provedena je za dva različita korpusa: korpus RJEČNIK, koji obuhvaća popis hrvatskih leksema u tzv. kanonskom obliku, dobiven iz rječnika hrvatskoga jezika, te korpus SOBiR, koji sadrži popis svih oblika riječi hrvatskoga jezika. Statistički rezultati za opisani postupak uspoređeni su s rezultatima (distribucijama slogova) dobivenima za hrvatski jezik iz postojećih izvora. Provedena je usporedba utomatskog postupka s ručnim postupkom i prikazani su rezultati, u okviru čega je određena (aproksimativna) pogreška automatiziranog postupka slogovanja.

Ključne riječi

slog; slogovanje; silabifikacija; distribucija slogova; najveći pristup

Hrčak ID:

165991

URI

https://hrcak.srce.hr/165991

Datum izdavanja:

15.12.2015.

Posjeta: 7.653 *