Skip to the main content

Professional paper

KORPUS HRVATSKOGA GOVORA

Sanda Martinčić Ipšić ; Filozofski fakultet, Rijeka Hrvatska
Mihaela Matešić ; Filozofski fakultet, Rijeka Hrvatska
Ivo Ipšić ; Filozofski fakultet, Rijeka Hrvatska


Full text: croatian pdf 3.040 Kb

page 135-150

downloads: 404

cite


Abstract

U radu je predstavljen korpus Imotskoga govora Odsjeka za informatiku Filozofskoga fakulteta u Rijeci. Korpus se sastoji od triju dijelova: radijskih i telefonskih vremenskih prognoza te televizijskih vijesti. Prikupljen je govor 250 različitih govornika u ukupnom trajanju od gotovo 20 sati. Prikupljen je čitani i spontani govor. Prikazani su struktura korpusa, njegova organizacija i osnovni statistički parametri. Opisani su postupci snimanja govora i transkripcije. U radu su predstavljeni korišteni alati CSLU SpeecliView, Transcriher i HTK, rječnik, koji sadržava sve riječi govornoga korpusa i njihov fonetski zapis te postupak validacije govornoga korpusa. U zaključnom dijelu predstavljeni su rezultati automatske segmentacije na fonetskoj razini.

Keywords

govorni korpus; hrvatski govori; segmentacija govora; validacija govora

Hrčak ID:

173968

URI

https://hrcak.srce.hr/173968

Publication date:

1.9.2004.

Visits: 1.194 *