Tehnički vjesnik, Vol. 20 No. 2, 2013.
Izvorni znanstveni članak
Razvrstavanje podataka s nesigurnošću pomoću poboljšane simetralne metode i SDSA metode
Ivica Lukić
orcid.org/0000-0001-7867-3385
; J. J. Strossmayer University of Osijek, Faculty of Electrical Engineering, Cara Hadrijana bb, 31000 Osijek, Croatia
Ninoslav Slavek
; J. J. Strossmayer University of Osijek, Faculty of Electrical Engineering, Cara Hadrijana bb, 31000 Osijek, Croatia
Mirko Köhler
; J. J. Strossmayer University of Osijek, Faculty of Electrical Engineering, Cara Hadrijana bb, 31000 Osijek, Croatia
Sažetak
Razvrstavanje podataka s nesigurnošću je vrlo istraživano područje. Ovaj rad posvećen je razvrstavanju objekata koji imaju nesigurnost 2D položaja uzrokovanog gibanjem objekata. Položaj pokretnog objekta izvještava se periodički, i stoga položaj objekta sadrži nesigurnost i opisan je funkcijom gustoće razdiobe (PDF). Podaci o takvim objektima i njihovim položajima čuvaju se u distribuiranim bazama podataka. Broj objekata s nesigurnošću može biti jako velik i dobivanje kvalitetnog rezultata u razumnom vremenu je zahtijevan zadatak. Najjednostavnija metoda za razvrstavanje je UK-means, u kojoj se računaju sve očekivane udaljenosti (ED) od objekata do središta grozdova. Stoga je UK-means nedjelotvorna metoda. Kako bi se izbjeglo računanje očekivanih udaljenosti predstavljene su brojne metode za odbacivanje. U radu je dan pregled postojećih metoda i predložena kombinacija dviju metoda. Prva metoda je nazvana podjela područja skupa podataka (SDSA) i kombinirana je s poboljšanom simetralnom metodom kako bi se skratilo vrijeme razvrstavanja podataka s nesigurnošću. Pomoću SDSA metode područje skupa podataka je podijeljeno na mala pravokutna područja i promatraju se samo objekti koji se nalaze u tom području. Koristeći mala pravokutna područja nudi se mogućnost za paralelno procesiranje, jer su područja međusobno neovisna i mogu se računati na različitim jezgrama procesora. Provedeni su pokusi kako bi se pokazala uspješnost nove kombinirane metode.
Ključne riječi
očekivana udaljenost; podaci s nesigurnošću; paralelno procesiranje; razvrstavanje; rudarenje podataka
Hrčak ID:
100160
URI
Datum izdavanja:
15.4.2013.
Posjeta: 1.986 *