Stručni rad
https://doi.org/10.31784/zvr.11.1.15
Baza slika za strojno učenje modela za detekciju plivača
Ivan Šimac
; Veleučilište u Rijeci, Rijeka, Hrvatska
Milan Pobar
orcid.org/0000-0001-5604-2128
; Sveučilište u Rijeci, Odjel za informatiku, Rijeka, Hrvatska
Marina Ivašić-Kos
orcid.org/0000-0002-1940-5089
; Sveučilište u Rijeci, Odjel za informatiku, Rijeka, Hrvatska
Sažetak
Velika količina podataka koja se svaki dan kreira može se upotrijebiti za razvoj algoritama umjetne inteligencije u domeni računalnog vida koji rješavaju zadatke poput klasifikacije slika, detekcije osoba i raspoznavanja akcija. Ti skupovi podataka su najčešće izrađeni od videozapisa i slika preuzetih s televizijskih kanala ili s društvene mreže YouTube i prikupljeni su i pripremljeni za odgovarajući zadatak. Nas je zanimao zadatak detekcije plivača, kako bi se model mogao koristiti za raspoznavanje i unaprjeđenje plivačkih tehnika. Iako danas postoje ogromne otvorene baze slika poput COCO i
ImageNet, pripremljene za nadzirano strojno učenje te baze sportskih scena poput Olympic Sports Dataset, UCF Action Sport dataset ili Sport-1M koje uključuju slike popularnijih (gledanijih) sportova, nijedna od njih ne uključuje slike koje bi se mogle koristiti za izradu našeg modela za detekciju plivača. Stoga je u ovom radu opisan postupak snimanja i prikupljanja video materijala te priprema skupa slika UNIRI-SWM za detekciju plivača. Skup uključuje snimke plivača u realnim, situacijskim uvjetima treninga i natjecanja snimljenih akcijskim kamerama iz različitih kutova snimanja. U radu su dani rezultati detekcije plivača korištenjem dubokih konvolucijskih neuronskih mreža Mask R-CNN i Yolov3, naučenim na skupu općih slika prije i nakon učenja na skupu UNIRI-SWM. Rezultati pokazuju da se nakon prilagodbe modela na odgovarajućem skupu slika iz domene plivanja mogu postići jako dobri rezultati detekcije plivača.
Ključne riječi
detekcija osoba; konvolucijska neuronska mreža; skup podataka; plivanje
Hrčak ID:
302883
URI
Datum izdavanja:
31.5.2023.
Posjeta: 339 *