Original scientific paper
https://doi.org/10.22572/mi.28.2.3
Izgradnja jezičnog korpusa govora mržnje na hrvatskom medijskom prostoru društvenih mreža
Slobodan Hadžić
Artur Šilić
Tanja Grmuša
orcid.org/0000-0002-2675-0171
Abstract
Govor mržnje predstavlja neprihvatljiv oblik društveno štetnih komunikacijskih formi čija je raširenost u posljednje vrijeme u porastu. Razvojem digitalnih medija, a
posebice jačanjem uloge društvenih mreža u privatnoj i javnoj komunikaciji, otvoren je prostor za brojne javne virtualne forume koji su pasivnu publiku potaknuli na
aktivniju participaciju i komunikaciju. Sloboda govora i izražavanja kao temeljna demokratska načela s jedne strane suočavaju se s prostorom za toksičnu komunikaciju s druge strane, okupljajući istomišljenike u virtualnim zajednicama kojima su meta napada nerijetko akteri priloga, novinari, urednici, mediji, pa i drugi korisnici. Uzimajući u obzir neograničenost internetskog prostora čiji je sadržaj teško kontrolirati, postavlja se pitanje kako prepoznati društveno štetne komunikacijske forme u javnom prostoru, može li ih se spriječiti i kako zadržati postojeću publiku. Mogućnosti upotrebe proširuju se i na područje moderiranja neprimjerenih komentara korisnika oslanjanjem na softvere koji pružaju trenutne odgovore medijskim organizacijama, ali i koji također pokazuju kontinuiranu potrebu za samopoboljšanjima. Interes autora u ovom radu vezan je za detekciju govora mržnje prema etnicitetu na društvenim mrežama te istraživanju mogućnosti primjene jezičnih tehnologija u prepoznavanju i sprječavanju širenja govora mrženja. Kvantitativnom i kvalitativnom analizom sadržaja te primjenom niza softverskih rješenja temeljenih na jezičnim tehnologijama omogućena je učinkovita automatska i poluautomatska analiza velike količine korisnički generiranog sadržaja. Korišteni su: program WordFinder za brzi pronalazak riječi u velikim korpusima, alat CRONTIMENT za automatsku dodjelu sentimenta tekstovima na hrvatskom jeziku, aplikacija Text Marker za učinkovito ručno označavanje i izgradnju korpusa. U pojedinim studijama slučaja autori detektiraju promjene u vrstama i frekvencijama pojave govora mržnje u predmetu istraživanja te identificiraju glavne prednosti i nedostatke primjene jezičnih tehnologija, sugerirajući pri tome moguće smjerove razvoja.
Keywords
društveno štetne komunikacijske forme govor mržnje; digitalni mediji; publika; jezične tehnologije; komentari korisnika
Hrčak ID:
288546
URI
Publication date:
23.12.2022.
Visits: 1.393 *