Skoči na glavni sadržaj

Stručni rad

KORPUS HRVATSKOGA GOVORA

Sanda Martinčić Ipšić ; Filozofski fakultet, Rijeka Hrvatska
Mihaela Matešić ; Filozofski fakultet, Rijeka Hrvatska
Ivo Ipšić ; Filozofski fakultet, Rijeka Hrvatska


Puni tekst: hrvatski pdf 3.040 Kb

str. 135-150

preuzimanja: 298

citiraj


Sažetak

U radu je predstavljen korpus Imotskoga govora Odsjeka za informatiku Filozofskoga fakulteta u Rijeci. Korpus se sastoji od triju dijelova: radijskih i telefonskih vremenskih prognoza te televizijskih vijesti. Prikupljen je govor 250 različitih govornika u ukupnom trajanju od gotovo 20 sati. Prikupljen je čitani i spontani govor. Prikazani su struktura korpusa, njegova organizacija i osnovni statistički parametri. Opisani su postupci snimanja govora i transkripcije. U radu su predstavljeni korišteni alati CSLU SpeecliView, Transcriher i HTK, rječnik, koji sadržava sve riječi govornoga korpusa i njihov fonetski zapis te postupak validacije govornoga korpusa. U zaključnom dijelu predstavljeni su rezultati automatske segmentacije na fonetskoj razini.

Ključne riječi

govorni korpus; hrvatski govori; segmentacija govora; validacija govora

Hrčak ID:

173968

URI

https://hrcak.srce.hr/173968

Datum izdavanja:

1.9.2004.

Posjeta: 808 *