Skoči na glavni sadržaj

Izvorni znanstveni članak

Prozodijski model za sintezu turskog teksta u govor na temelju pravila

Ibrahim Baran Uslu ; Atilim Universitesi Elektrik-Elektronik Muhendisligi Bolumu, Kizilcasar Mahallesi 06836 Incek Ankara, Turkey
Hakki Gokhan Ilk ; Ankara Universitesi Elektrik-Elektronik Muhendisligi Bolumu, 06100 Tandogan Ankara, Turkey
Asim Egemen Yilmaz ; Ankara Universitesi Elektrik-Elektronik Muhendisligi Bolumu, 06100 Tandogan Ankara, Turkey


Puni tekst: hrvatski pdf 879 Kb

str. 217-223

preuzimanja: 280

citiraj

Puni tekst: engleski pdf 879 Kb

str. 217-223

preuzimanja: 868

citiraj


Sažetak

Ovaj članak predstavlja naš novi prozodijski model u sustavu za sintezu turskog teksta u govor (TTS). Nakon razvijanja TTS sustava vođenog parametrijskim osobinama koje se sastoje od promjena trajanja, visine i jačine glasa, pokušavamo postaviti neka prozodijska pravila kako bi se povećala prirodnost našeg sintetizatora. Budući da u turskom jeziku glagoli koji se sprežu mogu biti samostalne rečenice uz sufikse koji im se dodaju, sastavljamo perceptualni prozodijski model definiranjem pravila o obrascima naglasaka kod sprezanja glagola. Sistematski su se proučavali potvrdni, negativni i upitni (i potvrdni i negativni) oblici mnogih glagola. Nisu se proučavali samo glagoli već, na isti način, i neke fraze kako bi se postigla ispravna prozodija. Prema rezultatima testova slušanja, definirana pravila zasnovana na promjenama trajanja, visine i jačine glasa, dovode do perceptualno bolje govorne sinteze, naime u prosjeku do 1,78/5,0 poboljšanja u CMSO testu (Comparative Mean Opinion Score). To poboljšanje predstavlja uspjeh našeg novog prozodijskog modela.

Ključne riječi

CMOS test; difon; prirodni govor; prozodija; PSOLA; sinteza teksta u govor (TTS); sprezanje glagola

Hrčak ID:

100155

URI

https://hrcak.srce.hr/100155

Datum izdavanja:

15.4.2013.

Podaci na drugim jezicima: engleski

Posjeta: 1.857 *