Skoči na glavni sadržaj

Izvorni znanstveni članak

https://doi.org/10.7305/automatika.2016.07.1084

Primjena automatskog međujezičnog akustičnog modeliranja na HMM sintezu govora za oskudne jezične baze

Tadej Justin ; Laboratory of Artificial Perception, Systems and Cybernetics (LUKS), Faculty of Electrical Engineering, University of Ljubljana, Tržaška 25, SI-1000 Ljubljana, Slovenia
France Mihelič ; Laboratory of Artificial Perception, Systems and Cybernetics (LUKS), Faculty of Electrical Engineering, University of Ljubljana, Tržaška 25, SI-1000 Ljubljana, Slovenia
Janez Žibert orcid id orcid.org/0000-0003-2312-5431 ; Faculty of Health Sciences, University of Ljubljana, Zdravstvena pot 5, SI-1000 Ljubljana, Slovenia


Puni tekst: engleski pdf 918 Kb

str. 268-281

preuzimanja: 625

citiraj


Sažetak

U današnje vrijeme interakcija čovjeka i računala (HCI) može se ostvariti i putem govornih sučelja (VUIs). Da bi se omogućila komunikacija uređaja i korisnika putem govora na vlastitom korisnikovom jeziku, često se raspravlja i analizira o jeftinom rješenju prijevoda govora na različite jezike. Jedan od vremenski najzahtjevnijih dijelova procesa prilagodbe jezika za aplikacije koje podržavaju VUI je prikupljanje govornih podataka za ciljani jezik. Ovakvi podaci dalje se koriste za razvoj VUI podsustava, posebice za prepoznavanje i produkciju govora. Primamljiva ideja za izbjegavanje dugotrajnog postupka prikupljanja podataka jeste razmatranje sinteze i razvoja automatskih algoritama koji su sposobni izvesti slična akustična svojstva za ciljani jezik iz postojećih baza različitih jezika.Ovaj rad fokusiran je na povezivanje međujezičnih fonema između oskudnih i bogatih jezičnih baza. Predložena je nova tehnika automatskog povezivanja fonema, usvojena i prilagođena iz područja govorne autentikacije. Ovakvo povezivanje fonema kasnije se koristi za razvoj sustava za sintezu govora zasnovanom na HMM-u za manje poznate jezike. Načinjene govorne izjave ocijenjene su subjektivnim pristupom kroz usporedbu međujezičnih metoda visoke razine poznavanja jezika u odnosu na sintezu govora načinjenu iz oskudne jezične baze. Rezultati otkrivaju da kombinacija oskudne i bogate baze jezika uz primjenu predložene tehnike povezivanja fonema može unaprijediti kvalitetu sinteze govora iz oskudne jezične baze.

Ključne riječi

Govorna korisnička sučelja; tehnologije ljudskog govora; HMM sinteza govora; međujezična sinteza; oskudna jezična baza; UBM-MAP-GMM povezivanje fonema

Hrčak ID:

165554

URI

https://hrcak.srce.hr/165554

Datum izdavanja:

1.9.2016.

Podaci na drugim jezicima: engleski

Posjeta: 1.701 *