Original scientific paper
Poboljšanje rezultata hijerarhijskog grupiranja podataka primjerenijim tretiranjem tipova podataka i prilagodbom mjere udaljenosti
Sofija Pinjušić Ćurić
; Private School of Economics and Computing, Budakova 1D, HR-10000, Zagreb, Croatia
Mihaela Vranić
orcid.org/0000-0003-0005-831X
; University of Zagreb, Faculty of Electrical Engineering and Computing, Department of Fundamentals of Electrical Engineering and Measurements, Unska 3, HR-10000, Zagreb, Croatia
Damir Pintar
orcid.org/0000-0001-9589-7890
; University of Zagreb, Faculty of Electrical Engineering and Computing, Department of Fundamentals of Electrical Engineering and Measurements, Unska 3, HR-10000, Zagreb, Croatia
Abstract
Hijerarhijsko grupiranje se koristi za grupiranje objekata promatranja u grupe koje se dalje pripajaju te tako tvore hijerarhijsku strukturu. Prema odabranoj mjeri udaljenosti instance koje pripadaju istoj grupi su ’blizu’ dok su instance koje pripadaju različitim grupama ’udaljenije’. U ovom članku prikazana je implementacija specifične mjere udaljenosti koja se koristi za izračun udaljenosti izme.u instanci koje su opisane atributima različitih tipova podataka. Alat za dubinsku analizu podataka ’Orange’ je odabran za implementaciju, testiranje, obradu podataka te vizualizaciju rezultata. članak uz opis specifikacije novih varijabli te mjere udaljenosti tako.er daje usporedbu rezultata dobivenih otprije poznatim modulom i novim modulom koji koristi nove tipove podataka i novu mjeru udaljenosti. Usporedba je napravljena nad različitim poznatim skupovima podataka.
Keywords
hijerarhijsko grupiranje; mjera udaljenosti; tipovi podataka; dendrogram
Hrčak ID:
78302
URI
Publication date:
6.3.2012.
Visits: 2.421 *