Skoči na glavni sadržaj

Izvorni znanstveni članak

Razvoj akustičkog modela hrvatskog jezika pomoću alata HTK

Branimir Dropuljić orcid id orcid.org/0000-0001-5748-2643 ; Department of Electric Machines, Drives and Automation, Faculty of Electrical Engineering and Computing, University of Zagreb, Zagreb, Croatia
Davor Petrinović orcid id orcid.org/0000-0003-3950-7864 ; Department of Electronic Systems and Information Processing, Faculty of Electrical Engineering and Computing, University of Zagreb, Zagreb, Croatia


Puni tekst: engleski pdf 207 Kb

str. 79-88

preuzimanja: 1.524

citiraj


Sažetak

Rad opisuje razvoj akustičkog modela hrvatskog jezika za potrebe sustava za automatsko prepoznavanje govora. Prepoznavanje prirodnog spojenog izgovora ostvaruje se korištenjem skrivenih Markovljevih modela (HMM) u okviru alata HTK. U svrhu prilagodbe ovog alata na hrvatski jezik razvijen je novi algoritam za automatsku fonetsku transkripciju hrvatskih riječi. Zasniva se na načelu fonetske asimilacije unutar izgovorenih riječi. Razvijen je i skup fonetskih pitanja koji se koristi za klasifikaciju prilikom udruživanja trifonskih modela sličnih glasova. Razvijena je automatizirana aplikacija za gradnju i evaluaciju akustičkih modela, integrirana s novo razvijenim grafičkim sučeljem. Primjene ovog sustava za prepoznavanje su trening s doziranim izlaganjem stresu (SIT) i terapija izlaganjem primjenom virtualne stvarnosti (VRET). Prilagodljivost akustičkog modela na zatvoren skup govornika vrlo je važna za takve primjene, pa se u radu istražuje primjenjivost alata HTK u tipičnim scenarijima. Robusnost alata na promjenu jezika istražuje se uparenim treniranjem i evaluacijom ekvivalentnog modela engleskog jezika u jednakim uvjetima. U eksperimentima je sudjelovalo deset izvornih hrvatskih govornika. Ostvareni rezultati za hrvatski jezik prikazani u radu pokazuju zadovoljavajuća svojstva razvijenog akustičkog modela hrvatskog jezika.

Ključne riječi

akustički model; automatsko prepoznavanje govora; hrvatski jezik; skriveni Markovljevi modeli; algoritam za fonetsku transkripciju; fonetska asimilacija; točnost prepoznavanja

Hrčak ID:

51368

URI

https://hrcak.srce.hr/51368

Datum izdavanja:

22.3.2010.

Podaci na drugim jezicima: engleski

Posjeta: 3.196 *