Skoči na glavni sadržaj

Izvorni znanstveni članak

https://doi.org/10.17559/TV-20141006121105

Distribuirana analiza zapisa na oblaku primjenom MapReduce

Galip Aydin ; Firat University, Faculty of Engineering, Computer Engineering Department, Elazig, Turkey
Ibrahim R. Hallac orcid id orcid.org/0000-0003-0568-3114 ; Firat University, Faculty of Engineering, Computer Engineering Department, Elazig, Turkey


Puni tekst: hrvatski pdf 982 Kb

str. 1011-1016

preuzimanja: 623

citiraj

Puni tekst: engleski pdf 982 Kb

str. 1011-1016

preuzimanja: 289

citiraj


Sažetak

U ovom članku opisujemo naš rad na projektiranju na mreži zasnovanog sustava analize distribuiranih podataka koji se zasniva na popularnom MapReduce okviru postavljenom na malom oblaku i razvijenom specijalno za analizu zapisa web poslužnika. Sustav analize zapisa sastoji se od nekoliko čvorova klastera, dijeli velike datoteke zapisa na distribuirani sustav datoteke i brzo ih obrađuje primjenom MapReduce modela programiranja. Klaster se stvara primjenom open source infrastrukture oblaka, čime nam je omogućeno jednostavno povećanje računalne snage dodavanjem dvaju čvorova. Time nam je data mogućnost da jednostavno promijenimo veličinu klastera u skladu s potrebama analize podataka. Primijenili smo MapReduce programe za potrebe osnovne analize zapisa poput frekvencijske analize, otkrivanja greške, otkrivanja prometnog sata (busy hour) itd. kao i za složenije analize za koje je potrebno nekoliko poslova. Sustav može automatski prepoznati i analizirati više vrsta zapisa web poslužnika kao što su Apache, IIS, Squid itd. Primijenjujemo open source projekte za kreiranje infrastrukture oblaka i obavljanje MapReduce poslova.

Ključne riječi

analiza zapisa; Hadoop; MapReduce; računarstvo u oblaku

Hrčak ID:

163745

URI

https://hrcak.srce.hr/163745

Datum izdavanja:

16.8.2016.

Podaci na drugim jezicima: engleski

Posjeta: 1.958 *