Izvorni znanstveni članak
https://doi.org/10.7305/automatika.2016.07.853
Lokalno diskriminantna projekcija difuzije i njena primjena za prepoznavanje emocionalnog stanja iz govornog signala
Xinzhou Xu
; Key Laboratory of Underwater Acoustic Signal Processing of Ministry of Education, Southeast University, Nanjing, China
Chengwei Huang
; School of Physical Science and Technology, Soochow University, Suzhou, China
Chen Wu
; Key Laboratory of Underwater Acoustic Signal Processing of Ministry of Education, Southeast University, Nanjing, China
Li Zhao
; Key Laboratory of Underwater Acoustic Signal Processing of Ministry of Education, Key Laboratory of Child Development and Learning Science of Ministry of Education, Soochow University, Nanjing, China
Sažetak
Postojeće metode mapiranja difuzije u uzorke podataka primjenjuju Markovljevu slučajnu šetnju. U ovom radu, kako bismo pružili općenito rješenje za mapiranje difuzije, prvo predlažemo generalizirano okruženje za difuziju jednog grafa, zasnovano na okruženju za primjenu grafova. Drugo, konstruirajući ugrađeni graf, predlažemo algoritam lokalno diskriminantne projekcije difuzije (LDDP) za prepoznavanje emocionalnog stanja iz govornog signala. Ovaj algoritam je projekcija poboljšane difuzijske mape koja uključuje diskriminantnu i lokalnu informaciju. Linearna ili jezgrovita formulacija LDDP-a (i.e., LLDDP ili KLDDP) koristi se u svrhu redukcije dimenzionalnosti originalnog skupa značajki za prepoznavanje emocionalnog stanja iz govornog signala. Predloženi algoritam testiran je nad dvama široko korištenim bazama podataka za prepoznavanje emocionalnog stanja iz govornog signala, EMO-DB i eNTERFACE'05. Eksperimentalni rezultati pokazuju kako predložena LDDP metoda, uključujući LLDDP i KLDDP, pokazuje bolje ponašanje od nekih drugih najsuvremenijih metoda redukcije dimenzionalnosti, zasnovanim na ugrađenim grafovima ili analizi diskriminantnosti.
Ključne riječi
mapa difuzije; okruženje s ugrađenim grafom; lokalno diskriminantna projekcija difuzije; prepoznavanje emocionalnog stanja iz govornog signala
Hrčak ID:
165487
URI
Datum izdavanja:
1.9.2016.
Posjeta: 1.658 *