Technical gazette, Vol. 20 No. 2, 2013.
Original scientific paper
Prozodijski model za sintezu turskog teksta u govor na temelju pravila
Ibrahim Baran Uslu
; Atilim University, Faculty of Engineering, Electrical-Electronics Eng. Dept., Kizilcasar Mahallesi 06836 Incek Ankara, Turkey
Hakki Gokhan Ilk
; Ankara University, Faculty of Engineering, Electrical-Electronics Eng. Dept., 06100 Tandogan Ankara, Turkey
Asim Egemen Yilmaz
; Ankara University, Faculty of Engineering, Electrical-Electronics Eng. Dept., 06100 Tandogan Ankara, Turkey
Abstract
Ovaj članak predstavlja naš novi prozodijski model u sustavu za sintezu turskog teksta u govor (TTS). Nakon razvijanja TTS sustava vođenog parametrijskim osobinama koje se sastoje od promjena trajanja, visine i jačine glasa, pokušavamo postaviti neka prozodijska pravila kako bi se povećala prirodnost našeg sintetizatora. Budući da u turskom jeziku glagoli koji se sprežu mogu biti samostalne rečenice uz sufikse koji im se dodaju, sastavljamo perceptualni prozodijski model definiranjem pravila o obrascima naglasaka kod sprezanja glagola. Sistematski su se proučavali potvrdni, negativni i upitni (i potvrdni i negativni) oblici mnogih glagola. Nisu se proučavali samo glagoli već, na isti način, i neke fraze kako bi se postigla ispravna prozodija. Prema rezultatima testova slušanja, definirana pravila zasnovana na promjenama trajanja, visine i jačine glasa, dovode do perceptualno bolje govorne sinteze, naime u prosjeku do 1,78/5,0 poboljšanja u CMSO testu (Comparative Mean Opinion Score). To poboljšanje predstavlja uspjeh našeg novog prozodijskog modela.
Keywords
CMOS test; difon; prirodni govor; prozodija; PSOLA; sinteza teksta u govor (TTS); sprezanje glagola
Hrčak ID:
100155
URI
Publication date:
15.4.2013.
Visits: 2.390 *