Tehnički vjesnik, Vol. 20 No. 2, 2013.
Izvorni znanstveni članak
Prozodijski model za sintezu turskog teksta u govor na temelju pravila
Ibrahim Baran Uslu
; Atilim Universitesi Elektrik-Elektronik Muhendisligi Bolumu, Kizilcasar Mahallesi 06836 Incek Ankara, Turkey
Hakki Gokhan Ilk
; Ankara Universitesi Elektrik-Elektronik Muhendisligi Bolumu, 06100 Tandogan Ankara, Turkey
Asim Egemen Yilmaz
; Ankara Universitesi Elektrik-Elektronik Muhendisligi Bolumu, 06100 Tandogan Ankara, Turkey
Sažetak
Ovaj članak predstavlja naš novi prozodijski model u sustavu za sintezu turskog teksta u govor (TTS). Nakon razvijanja TTS sustava vođenog parametrijskim osobinama koje se sastoje od promjena trajanja, visine i jačine glasa, pokušavamo postaviti neka prozodijska pravila kako bi se povećala prirodnost našeg sintetizatora. Budući da u turskom jeziku glagoli koji se sprežu mogu biti samostalne rečenice uz sufikse koji im se dodaju, sastavljamo perceptualni prozodijski model definiranjem pravila o obrascima naglasaka kod sprezanja glagola. Sistematski su se proučavali potvrdni, negativni i upitni (i potvrdni i negativni) oblici mnogih glagola. Nisu se proučavali samo glagoli već, na isti način, i neke fraze kako bi se postigla ispravna prozodija. Prema rezultatima testova slušanja, definirana pravila zasnovana na promjenama trajanja, visine i jačine glasa, dovode do perceptualno bolje govorne sinteze, naime u prosjeku do 1,78/5,0 poboljšanja u CMSO testu (Comparative Mean Opinion Score). To poboljšanje predstavlja uspjeh našeg novog prozodijskog modela.
Ključne riječi
CMOS test; difon; prirodni govor; prozodija; PSOLA; sinteza teksta u govor (TTS); sprezanje glagola
Hrčak ID:
100155
URI
Datum izdavanja:
15.4.2013.
Posjeta: 2.390 *