Skip to the main content

Original scientific paper

Postupak automatskoga slogovanja temeljem načela najvećega pristupa i statistika slogova za hrvatski jezik

Ana Meštrović ; Odjel za informatiku Sveučilišta u Rijeci, Hrvatska
Sanda Martinčić‐Ipšić orcid id orcid.org/0000-0002-1900-5333 ; Odjel za informatiku Sveučilišta u Rijeci, Hrvatska
Mihaela Matešić orcid id orcid.org/0000-0002-4780-8512 ; Filozofski fakultet Sveučilišta u Rijeci, Hrvatska


Full text: croatian pdf 390 Kb

page 3-34

downloads: 7.317

cite


Abstract

Analiza slogova kao osnovnih elemenata jezika važna je za različite postupke u domeni računalne analize prirodnog jezika i govornih tehnologija. Cilj je rada prikazati i evaluirati automatski postupak slogovanja (silabifikacije) za hrvatski jezik te prikazati statističke rezultate raspodjele slogova za hrvatski jezik. Statistička analiza slogova provedena je za dva različita korpusa: korpus RJEČNIK, koji obuhvaća popis hrvatskih leksema u tzv. kanonskom obliku, dobiven iz rječnika hrvatskoga jezika, te korpus SOBiR, koji sadrži popis svih oblika riječi hrvatskoga jezika. Statistički rezultati za opisani postupak uspoređeni su s rezultatima (distribucijama slogova) dobivenima za hrvatski jezik iz postojećih izvora. Provedena je usporedba utomatskog postupka s ručnim postupkom i prikazani su rezultati, u okviru čega je određena (aproksimativna) pogreška automatiziranog postupka slogovanja.

Keywords

slog; slogovanje; silabifikacija; distribucija slogova; najveći pristup

Hrčak ID:

165991

URI

https://hrcak.srce.hr/165991

Publication date:

15.12.2015.

Visits: 8.491 *