Govor, Vol. 21 No. 2, 2004.
Professional paper
KORPUS HRVATSKOGA GOVORA
Sanda Martinčić Ipšić
; Filozofski fakultet, Rijeka Hrvatska
Mihaela Matešić
; Filozofski fakultet, Rijeka Hrvatska
Ivo Ipšić
; Filozofski fakultet, Rijeka Hrvatska
Abstract
U radu je predstavljen korpus Imotskoga govora Odsjeka za informatiku Filozofskoga fakulteta u Rijeci. Korpus se sastoji od triju dijelova: radijskih i telefonskih vremenskih prognoza te televizijskih vijesti. Prikupljen je govor 250 različitih govornika u ukupnom trajanju od gotovo 20 sati. Prikupljen je čitani i spontani govor. Prikazani su struktura korpusa, njegova organizacija i osnovni statistički parametri. Opisani su postupci snimanja govora i transkripcije. U radu su predstavljeni korišteni alati CSLU SpeecliView, Transcriher i HTK, rječnik, koji sadržava sve riječi govornoga korpusa i njihov fonetski zapis te postupak validacije govornoga korpusa. U zaključnom dijelu predstavljeni su rezultati automatske segmentacije na fonetskoj razini.
Keywords
govorni korpus; hrvatski govori; segmentacija govora; validacija govora
Hrčak ID:
173968
URI
Publication date:
1.9.2004.
Visits: 1.176 *