Skip to the main content

Original scientific paper

Prozodijski model za sintezu turskog teksta u govor na temelju pravila

Ibrahim Baran Uslu ; Atilim University, Faculty of Engineering, Electrical-Electronics Eng. Dept., Kizilcasar Mahallesi 06836 Incek Ankara, Turkey
Hakki Gokhan Ilk ; Ankara University, Faculty of Engineering, Electrical-Electronics Eng. Dept., 06100 Tandogan Ankara, Turkey
Asim Egemen Yilmaz ; Ankara University, Faculty of Engineering, Electrical-Electronics Eng. Dept., 06100 Tandogan Ankara, Turkey


Full text: croatian pdf 879 Kb

page 217-223

downloads: 285

cite

Full text: english pdf 879 Kb

page 217-223

downloads: 876

cite


Abstract

Ovaj članak predstavlja naš novi prozodijski model u sustavu za sintezu turskog teksta u govor (TTS). Nakon razvijanja TTS sustava vođenog parametrijskim osobinama koje se sastoje od promjena trajanja, visine i jačine glasa, pokušavamo postaviti neka prozodijska pravila kako bi se povećala prirodnost našeg sintetizatora. Budući da u turskom jeziku glagoli koji se sprežu mogu biti samostalne rečenice uz sufikse koji im se dodaju, sastavljamo perceptualni prozodijski model definiranjem pravila o obrascima naglasaka kod sprezanja glagola. Sistematski su se proučavali potvrdni, negativni i upitni (i potvrdni i negativni) oblici mnogih glagola. Nisu se proučavali samo glagoli već, na isti način, i neke fraze kako bi se postigla ispravna prozodija. Prema rezultatima testova slušanja, definirana pravila zasnovana na promjenama trajanja, visine i jačine glasa, dovode do perceptualno bolje govorne sinteze, naime u prosjeku do 1,78/5,0 poboljšanja u CMSO testu (Comparative Mean Opinion Score). To poboljšanje predstavlja uspjeh našeg novog prozodijskog modela.

Keywords

CMOS test; difon; prirodni govor; prozodija; PSOLA; sinteza teksta u govor (TTS); sprezanje glagola

Hrčak ID:

100155

URI

https://hrcak.srce.hr/100155

Publication date:

15.4.2013.

Article data in other languages: english

Visits: 1.910 *