Politehnika i dizajn, Vol. 7 No. 1, 2019.
Izvorni znanstveni članak
https://doi.org/10.19279/TVZ.PD.2019-7-1-06
NEGATIVNA KLASIFIKACIJA DIGITALNE INFORMACIJE BOJE GLASA
Tomislav Jarimić
orcid.org/0000-0003-0470-3523
; Fakultet organizacije i informatike Varaždin, Sveučilište u Zagrebu, Varaždin
Sažetak
U tehničkom smislu ne postoji prepoznavanje
osobe po boji glasa na razini čovjeka.
Prepoznavanje glasa i prepoznavanje govora
su pojmovi koji su sadržajno potpuno različiti.
Svrha prepoznavanja govora je prepoznavanje
riječi govornika, dok se prepoznavanjem glasa
identificirao poznatu ili nepoznatu osobu.
Boja glasa osobe [1] ključan je uzorak u glasu
govornika. Može se promatrati kao subjektivni
osjet glasnoće, visine i boje zvuka te njegove
percepcije u prostoru. Cilj istraživanja je pronaći
u zvučnom zapisu govornika karakteristične
značajke kojima se može odrediti digitalna
informacija boja glasa. Digitalnom informacijom
boje glasa uz upotrebu informacijskokomunikacijske tehnologije[2] prepoznajemo
spol osobe, ciljanog govornika ili skupnu
govornika. Namjera je do sada neiskorištene
Walsh-Hadamardove koeficijente upotrijebiti za
određivanje karakterističnih značajke. U procesu
predprocesiranja izlučujemo karakteristične
značajke za digitalnu informaciju boje glasa
i to tako da se postupkom Kepstralne analize
određuje osnovna frekvenciju F0
za svaki
zvučni zapis, temeljem koje se izračunavaju
pripadajući harmonici. Dobivene uzorci
klasificiraju se po spolu. U slijedećem koraku
iz zvučnih zapisa izlučuju se Walsh-Hadamardovi koeficijenti, klasificiramo ih po spolu, te se
uspoređuju rezultati klasifikacija. U praksi model
se može koristiti za prepoznavanje unaprijed
preddefinirane klasu govornika, odnosno za brzu
eliminaciju ciljane skupine podataka.
Ključne riječi
digitalna informacija boje glasa; karakteristična značajka boje glasa; WalshHadamard-ovi koeficijenti
Hrčak ID:
220657
URI
Datum izdavanja:
30.4.2019.
Posjeta: 1.428 *