UVOD
Zbog holističkog pogleda na interakciju korisnika s tehnologijom, privatnost se počela proučavati u sklopu područja interakcije čovjeka i računala (engl. human-computer interaction - HCI) (Iachello i Hong, 2007). Uočen je rastući globalni trend zaštite privatnosti posebice u aspektu rukovanja osjetljivim podacima prilikom stvaranja ili korištenja korisničkih profila (Tchuente, 2022). U današnjem dobu sve većeg razvoja tehnologije i generiranja golemih količina podataka (engl. big data) o korisnicima, transparentnost postaje sve važnija za online potrošače (Wang i sur., 2023). Globalno istraživanje provedeno zaključno sa siječnjem 2023. godine otkrilo je da je 70% ispitanika poduzelo određene mjere za zaštitu svog online identiteta, pri čemu je 30% koristilo višestruku autentifikaciju, 28% promijenilo zadane postavke na uređajima, dok 30% njih nije poduzelo nikakve mjere za zaštitu svojih osobnih podataka na internetu (Petrosyan, 2023).
S aspekta online marketinga mnoge tvrtke poduzimaju neetične radnje kako bi zadržale svoje kupce kao što je to praćenje korisnika bez traženja njihove izričite privole ili kolačića (engl. cookies) za obradu podataka (Papadogiannakis, Papadopoulos, Kourtellis i Markatos, 2021). Iako su postojeće zakonske odredbe za privatnost smanjile neetičko oglašavanje i praćenje korisnika još uvijek nisu svi kolačići implementirani na odgovarajući način (Zhang, Meng, Zhou i Ren, 2024). Istraživanje provedeno od strane francuskog tijela za zaštitu podataka (fr. Commission nationale de l'informatique et des libertés – CNIL) u lipnju 2022. godine pokazalo je da je još uvijek prisutno nepovjerenje u tehnologiju, pri čemu je 20% ispitanika izjavilo da im web stranice daju manje kontrole nad kolačićima nego prije godinu dana (CNIL, 2023).
Platforme društvenih mreža prikupljanjem i analizom podatka mogu stvoriti detaljne korisničke profile koji se kasnije mogu zloupotrijebiti (Hanlon i Jones, 2023). Prema anketi među korisnicima interneta provedenoj od veljače do ožujka 2023. godine, 50% korisnika iz Ujedinjenog Kraljevstva (UK) izjavilo je kako se osjeća praćenim online nakon razgovora o proizvodu ili televizijskom oglasu, 46% u Kanadi i 40% ispitanika u Sjedinjenim Američkim Državama (SAD) prijavilo je isti problem sa svojim povezanim uređajima (Ceci, 2023).
Zbog sve većih online prijetnji korisnici mijenjaju svoje ponašanje na društvenim mrežama pri čemu se njihova briga za privatnost reflektira na sadržaj koji stvaraju i dijele na društvenim mrežama (Gutierrez i sur., 2023). Na spremnost korisnika da dijele sadržaj na društvenim mrežama utječe njihova briga za privatnost posebice u vidu etičkog postupanja s podacima koji se prikupljaju o njima (Muhammad, Dey i Weerakkody, 2018).
Modeliranje profila korisnika kao dio područja interakcije čovjeka i računala, opisuje se kao proces izgradnje i konceptualnog razumijevanja korisnika (Fischer, 2001). Dok je model korisnika (engl. user model) podatkovna struktura koja se koristi za bilježenje karakteristika o pojedinačnom korisniku, profil korisnika (engl. user profile) je njegova stvarna reprezentacija (Piao i Breslin, 2018). Zbog sve veće personalizacije sustava s ciljem pružanja što bolje usluge, došlo je do neupitnog narušavanja privatnosti korisnika. Privatnost korisnika je jedno od temeljenih prava pojedinaca da kontroliraju kako se njihovi osobni podaci koriste, pokrivajući razna područja kao što je to očuvanje privatnosti prilikom prikupljanja podataka putem kolačića (Wang i sur., 2023), online praćenje korisnika za ciljano oglašavanje (Boerman, Kruikemeier i Zuiderveen Borgesius, 2021) kao i praćenje ponašanja korisnika na platformama društvenih medija (Saura, Palacios-Marqués i Ribeiro-Soriano, 2023).
Privatnost se općenito dijeli na fizičku privatnost (engl. physical privacy) i privatnost informacija (engl. information privacy), a u ovom radu naglasak je stavljen na privatnost informacija (Smith, Dinev i Xu, 2011). Privatnost informacija, koji se ponekad naziva i privatnost podataka (engl. data privacy), predstavlja brigu za podatke koji se dijele s drugima, uključujući upravljanje i kontrolu nad podacima (Raza, 2024). Svaka osoba trebala bi imati kontrolu nad svojim osobnim podacima, uključujući mogućnost odlučivanja o tome kako organizacije prikupljaju, pohranjuju i koriste njihove podatke (Solove, 2006).
Cilj bibliometrijske analize bio je dobiti presjek svih časopisa, konferencija, autora i međunarodnih udruga koji se bave temama privatnosti i modeliranja korisnika. U sklopu toga definirana su sljedeća istraživačka pitanja:
METODOLOGIJA ISTRAŽIVANJA
Za provedbu bibliometrijske analize korištene su WoS i Scopus baze podatake, dok je pri analizi podataka korišten paket bibliometrix iz R-alata (Aria i Cuccurullo, 2017). Strategija pretraživanja bila je usmjerena na kombinaciju privatnosti i HCI područja. Osim pojmova vezanih uz modeliranje i profiliranje korisnika pretrazi je dodan i pojam ponašanja korisnika (engl. user behaviour) kako ga je kod bibliometrijske analize o modeliranju i profiliranju korisnika uvrstio i Tchuente (2022) navodeći da se radilo o frekventno korištenom pojmu u mnogim pregledima literature o tom području.
U početnom koraku, odabrana je sljedeća strategija pretraživanja prema upitu: ("data privacy" OR "information privacy" OR "user privacy") AND ("user model" OR "user modelling" OR "user profiling" OR "user profile" OR "user behaviour" OR "user behavior" )). U pretragu su tako uključeni svi članci koji su u naslovu, sadržaju ili ključnim riječima sadržavali ključne riječi definirane upitom. Prilikom pretrage kao dodatni kriterij stavljeno je da radovi moraju pripadati kategoriji računalnih znanosti (engl. computer science) te su uzeti samo oni radovi koji se odnose na članke ili konferencijske radove. Iz pretrage su tako isključene potencijalne knjige, bilješke s predavanja i recenzentski radovi. Uzeti su svi članci koji su objavljeni na tu temu zaključno do 10.4.2024. godine. U drugom koraku, ekstrahirani su svi elementi te je napravljena analiza publikacija u R-alatu. U trećem koraku definirani su kriteriji izbora najznačajnijih časopisa, konferencija i znanstvenika.
Početni skup radova za analizu je definiran tako da je na temelju rezultata upita iz svake baze podataka (Scopus i WoS) izdvojeno po 10 najznačajnijih konferencija, časopisa i istraživača prema broju publikaciju. Kao dodatni kriterij uključivanja u obzir su uzeti samo oni časopisi i autori koji su imali objavljeno 5 ili više članaka, dok se zbog raspršenosti konferencija primjenjivao blaži kriterij tako da su uzete one s objavljena 3 ili više članka. Nadalje, iz analize su izuzete sve konferencije i časopisi koji nisu spadali u kategoriju HCI (prema Scopus-u) te nisu pripadali u Q1 ili Q2 kvartil (prema Scimago Journal Ranking-u).
Dodatno, kod konferencija provedeno je čišćenje podataka u kojem su posebno izdvojeni nazivi konferencija iz zbornika konferencija. Kod autora se kriterij isključivanja odnosio na relevantnost za odabrano područje istraživanja pri čemu su isključeni svi oni autori čiji se istraživački interes ne veže uz područje privatnosti ili šire područje interakcije čovjeka i računala (prema podacima iz Google znalca i ACM Digital Library). Putem paketa bibliometrix iz R-alata za određivanje najznačajnijih autora izračunat je lokalni h-indeks i ukupna citiranost radova isključivo na temelju ekstrahiranih dokumenata, čime su se htjeli dobiti relevantni podaci o tome koliko su autori uistinu značajni za postavljeno područje.
Kod autora je u obzir uzeto više kriterija među kojima su najznačajniji bili broj relevantnih projekata, općeniti h-indeks prema Google znalcu i broj publikacija. Kao glavni pokazatelj prilikom rangiranja časopisa i konferencija uzet je h-indeks zato što on uz samu produktivnost mjeri i utjecaj koji rad ima, a može se koristiti i za različite bibliometrijske jedinice (Aria i Cuccurullo, 2017). Kao nadopuna ostalim kriterijima prilikom rangiranja časopisa i konferencija korištene su metrike iz Scimago Journal Ranking-a. Najvažniji kriteriji bili su SJR (engl. SCImago Journal Rank) indikator koji je standardiziran u odnosu na kategoriju časopisa te SNIP (engl. Source Normalized Impact per Paper) kao glavni pokazatelj kvalitete citiranosti jer uzima u obzir i koliko su citirani časopisi koji ga citiraju. Za određivanje najznačajnijih udruga promatrane su udruge u kojima djeluju najznačajniji autori kao i udruge koje su sponzorirale najznačajnije konferencije.
Uz to, odnos između pojmova u literaturi ispitan je pomoću analize supojavljivanja ključnih riječi (engl. keyword co-occurrence analysis) kako bi se steklo dublje razumijevanje koncepta i odabranog područja istraživanja (Radhakrishnan, Erbis, Isaacs i Kamarthi, 2017). U odabranoj analizi čvorovi predstavljaju ključne riječi pronađene u radovima, a veze između njih pokazuju koji se izrazi ili ključne riječi pojavljuju zajedno kao tematski povezane cjeline. Ključne riječi se dalje mogu grupirati u klastere s obzirom na tematiku koju obrađuju, zbog čega su one prikazane drugačijim bojama na mreži. Korištenjem bibliometrijskog paketa iz alata R, ova je analiza provedena na publikacijama koje su odabrane u početnoj fazi selekcije članaka.
Na temelju zadane strategije pretraživanja ukupno je iz Scopus baze podataka pronađeno 1050 dokumenata (359 članaka i 691 konferencijskih radova) objavljenih između 1997. i 2024. godine, dok je u WoS- u pronađeno 135 dokumenata (75 članaka i 60 radova s konferencija) u razdoblju od 2002. do 2024 godine. Početni skup radova podvrgnut je deduplikaciji kako bi se uklonili svi duplikati iz Scopus-a i WoS-a s ciljem utvrđivanja jedinstvenog broja publikacija te obavljanje daljnjih analiza. Svi članci koji su ušli u analizu pronađeni su u Sopus bazi podataka tako da je ona poslužila kao jedini izvor članaka.
Slika 1. prikazuje ukupan broj znanstvenih članaka objavljenih kroz godine na temelju upita opisanom u metodologiji istraživanja. U početnoj strategiji pretraživanja nije definiran vremenski interval pretrage kako bi se mogle identificirati godine koje su bile značajne za razvoj ovog područja. Vidljivo je kako u odabranom području broj objavljenih članaka počinje sa značajnijim rastom od 2013. godine pri čemu se taj rast kroz godine više manje kontinuirano povećava. Može se zaključiti kako je analizirano područje postalo aktualno posebice u zadnje tri godine.
Slika 1. Broj članaka objavljenih u WoS-u i Scopus-u po godinama
Izvor: Autori članka
2.1. Najznačajniji znanstvenici
Kod izbora najznačajnijih znanstvenika i istraživačkih grupa prvotno su izdvojeni autori s najvećim brojem publikacija, zatim su izuzeti svi oni autori koji nisu bili relevantni prema prethodno definiranim kriterijima. Tablica 1.prikazuje pet najznačajnijih autora rangiranih prema broju relevantnih projekata i h-indeksu.
Tablica 1. Pet najznačajnijih autora prema rangiranih prema broju relevantnih projekata
Autor | Broj relevantnih projekata3 | H -indeks4 | H - indeks (lokalni)3 | Ukupna citiranost (lokalno)3 | Broj publikacija3 | Početna godina objave5 |
Kobsa, Alfred | 8 | 60 | 5 | 222 | 7 | 1997 |
Knijnenburg,Bart Piet | 6 | 38 | 5 | 672 | 5 | 2012 |
Sánchez, David | 2 | 49 | 4 | 118 | 7 | 2012 |
Castellà-Roca, Jordi | 2 | 22 | 5 | 169 | 7 | 2009 |
Viejo, Alexandre | 1 | 23 | 7 | 203 | 10 | 2009 |
Izvor: Autori članka
Pet najznačajnijih autora su: (1) Kobsa, Alfred (h-indeks 60), (5) Knijnenbur, Bart Piet (h-indeks 38), (2) Sánchez, David (h-indeks 49), (4) Castellà-Roca, Jordi (h-indeks 22) i (5) Viejo, Alexandre (h-indeks 23).
2.2. Najznačajniji časopisi
Tablica 2. prikazuje časopise rangirane prema h-indeksu radova. Dva časopisa koja su zadovoljila sve kriterije su: Computers in Human Behavior (h-indeks 5) i User Modeling and User-Adapted Interaction (h-indeks 4).
Tablica 2. Detaljni prikaz dva najznačajnija časopisa prema ostalim metrikama
Časopis | Godina4 | SJR (Q)6 | H indeks4 | CiteScore 20224 | SNIP 20224 | Broj publikacija3 |
Computers in human behavior | 1985-2023 | 2,464 (Q1) | 226 | 17,800 | 3,223 | 5 |
User modeling and user-adapted interaction | 1991-2022 |
1,231 (Q1) | 81 | 10,400 | 2,202 | 6 |
Najveći broj publikacija pronađen je u Lecture Notes, ACM i Ceur zbornicima konferencija iz kojih su posebno izdvojeni nazivi konferencija. Tablica 3. prikazuje tako pronađene najznačajnije konferencije rangirane prema broju publikacija. Među njima otkrivene su i udruge koje tamo djeluju od kojih su među značajnijima: ACM SIGCHI (engl. Special Interest Group on Computer-Human Interaction) i SIGWEB (engl. Special Interest Group on Hypertext, Hypermedia and Web).
Tablica 3. Detaljan prikaz najznačajnijih konferencija prema broju publikacija
Izvor: Autori članka
U Scopus-u je pronađena samo jedna hrvatska konferencija International Convention on Information, Communication and Electronic Technology kojoj je suorganizator hrvatska udruga MIPRO (puni naziv: Hrvatsko društvo za informacijsku i komunikacijsku tehnologiju, elektroniku i mikroelektroniku) (Mipro.hr, bez dat.).
2.4. Analiza supojavljivanja ključnih riječi
Slika 2. prikazuje analizu zajedničkog pojavljivanja pojmova provedenu u alatu R na 1050 članka pronađenih u Scopus bazi podataka. Pomoću analize supojavljivanja ključnih riječi može se vidjeti koje se ključne riječi često spominju zajedno u literaturi, što pruža uvid u razumijevanje povezanih tematika.
Slika 2. Mreža supojavljivanja ključnih riječi u R alatu
Izvor: Autori članka
Na slici 2. ključne riječi prikazane su čvorovima, učestalost njihovog pojavljivanja označena je veličinom čvora, dok boje označavaju različite klastere ključnih riječi. Ključne riječi grupirane su u dva primarna klastera: privatnost podataka (engl. data privacy) i bihevioralno istraživanje (engl. behavioral research).
Prisutnost ova dva klastera razumljiva je zbog odabrane strategije pretraživanja te kombinacije ova dva područja, zbog čega se između njih uočava i najjača povezanost. Zanimljivo je analizirati ključne riječi koje se vežu uz crveni klaster privatnosti podataka gdje se osim pojmova vezanih uz očuvanje privatnosti i osjetljivih podataka ističu društvene mreže i korisnički profili kao često obrađivane tematike vezane uz taj pojam. Plavi klaster vezan uz bihevioralna istraživanja uključuje riječi povezane s relevantnim pojmovima kao što je ponašanje korisnika. Vidljivo je da se često uz plavi klaster osim ponašanje korisnika, pojavljuju i pojmovi vezani uz sigurnost kao i razne metode zaštite podataka kao što je autentifikacija, kontrola pristupa i kriptografija.
DISKUSIJA
Na temelju zadane strategije pretraživanja provedena je bibliometrijska analiza kojom se odgovorilo na postavljena istraživačka pitanja. Najutjecajniji autor, s 8 relevantnih projekata i najvećim h-indeksom, je Dr. Alfred Kobsa profesor emeritus na Donald Bren Kalifornijskom sveučilištu u Irvine-u. Član je 4 društva, urednik je 8 časopisa i ima ukupno 28 projekata. Za razliku od ostalih Alfred Kobsa jedini je na listi bio osnivački urednik časopisa (User Modeling and User-Adapted Interaction - UMUAI) te predsjednik društva (User Modeling Inc.) (University of California, Irvine, bez dat.).
Drugi na toj listi, Bart Piet Knijnenburg, s 6 relevantnih projekata i najvećim brojem relevantnih citata (672), izvanredni je profesor na Sveučilištu Clemson koji se bavi razumijevanjem psiholoških principa vezanih uz odlučivanje o privatnosti. Član je uredništva časopisa UMUAI, suradnik urednika na časopisu Human-Computer Interaction Journal (HCI) te član dva ACM urednička odbora (Usabart.nl, bez dat.). Ostali autori djeluju na Sveučilištu Rovira i Virgili u Španjolskoj te su članovi istraživačke grupe CRISES usmjerene na razvoj tehnologija koje čuvaju privatnost i sigurnost organizacija, vlade i pojedinaca (Crises.com, bez dat). U sklopu spomenute grupe najaktivniji je Castellà-Roca, član IEEE udruge, s 15 projekta (1 aktualan), zatim Sanchez s 5 projekta (3 aktualna) te Vijeo s 2 projekta (1 aktualan) (Crises.com, bez dat). Svaki od pronađenih znanstvenika izdvaja se po nečemu, primjerice Sanchez svrstan je među 1% najbolje citiranih računalnih znanstvenika (Universitat Rovira i Virgili, bez dat.), Viejo je poznat po svojim istraživanjima o sigurnosti i privatnosti podataka (ACM.org, bez dat.), dok je Castella Roca koautor sedam patenata i sudjelovao je u 26 znanstvenih projekata (u osam ih je glavni istraživač) (Crises.com, bez dat). Unatoč nekoliko relevantnih projekata, ova skupina autora je previše tehnički orijentirana na samu zaštitu privatnosti i anonimizaciju podataka, a ne toliko na modeliranje profila korisnika. Kod Alfreda Kobse se uočava da je uistinu pionir u ovom području po njegovoj aktivnosti, relevantnosti i broju publikacija. Neki od njegovih relevantnijih projekata su: User-Tailored Approach to Privacy Decision Support (2014-18), User Errors in Security-Related Behavior (2012-2013), Privacy in Personalized Systems (2003-2007) i BGP-MS: User Modeling Shell (1992-96; 1998) (Ics.uci.edu, bez dat.).
Nadalje, u radu su pronađena dva najznačajnija časopisa, najutjecajniji među njima po svim promatranim pokazateljima je Computers in Human Behavior. Radi se o znanstvenom časopisu koji istražuje psihološki utjecaj upotrebe računala na pojedince, grupe i društvo (Sciencedirect.com, bez dat.). Drugi najznačajniji je interdisciplinarni časopis User Modeling and User-Adapted Interaction (UMUAI) koji se bavi istraživanjima o sustavima koji se prilagođavaju korisnicima (Springer.com, bez dat.). Oba pronađena časopisa spadaju u prvi kvartil te je po citiranosti, SJR i SNIP pokazateljima koji su veći od 1 vidljivo da su bolji od prosjeka kategorije. Kvaliteta časopisa vidljivo je i u provođenju procesa recenziranja. Naime, časopis Computers in Human Behavior ima obično dva kruga recenzija koje traju otprilike 4-6 mjeseci, dok UMUAI ima duže krugove recenzija do finalnog prihvaćanja rada zbog čega proces traje oko 16 mjeseci (Researcher.life, bez dat.).
Također, pronađene su dvije međunarodne i jedna hrvatska konferencija, uz napomenu da su neke od pronađenih konferencija prestale s radom. Dvije najznačajnije međunarodne konferencije su: Conference on Human Factors in Computing Systems (h-indeks 229) i ACM Conference on User Modeling, Adaptation and Personalizations (h-indeks 11). Najvažniji kriterij je bio SNIP rang, pri čemu je on u 2022. godini za Conference on Human Factors in Computing Systems iznosio 2.296 (Scimagojr.com, bez dat). Samim time, SNIP rang koji je dvostruko veći od prosjeka ukazuje na kvalitetu citiranosti tih radova. Iako za drugu konferenciju nisu bili dostupni podaci o SNIP rangu, uočeno je da obje konferencije provode stroži proces selekcije radova koji će ući u konferenciju kako je stopa prihvaćanja radova u 2019. godini za njih bila između 24 - 25% (ACM Digital Library, bez dat.). Što se tiče hrvatskih konferencija, pronađena je jedino konferencija International Convention on Information, Communication and Electronic Technology koja obrađuje interdisciplinarne teme u području informacijske i komunikacijske tehnologije (Mipro.hr, bez dat.).
Autori su većinom dugogodišnji članovi ACM (engl. Association for Computing Machinery) ili IEEE (engl. Institute of Electrical and Electronics Engineers) udruge, tako da se te udruge mogu smatrati najznačajnijim u tom području. Ipak izdaja se posebno ACM udruga koja je uočena kao najčešći sponzor pronađenih najznačajnijih konferencija. Radi se o najvećem svjetskom računalnom društvu koje ima 38 posebnih interesnih skupina (SIG) (ACM, 2023). Među njima za spomenuto područje istraživanja najrelevantnija je ACM SIGCHI koja se bavi istraživanjem i praksom u HCI području (Sigchi.org, bez dat.), dok je u Hrvatskoj najznačajnija već spomenuta MIPRO udruga.
Analiza supojavljivanja ključnih riječi potvrdila je kako je privatnost podataka uobičajena kada se radi o temama vezanih uz online zaštitu podataka i korisničkih profila na društvenim mrežama. Točnije, društvene platforme prikupljaju goleme količine osobnih podataka kako bi pružile personalizirano iskustvo i ponudile korisnicima željeni sadržaj, što bi moglo štetno utjecati na privatnost pojedinca. Treba obratiti pozornost na rukovanje osjetljivim podacima i spriječiti moguću zloupotrebu i manipulaciju korisničkih profila.
Što se tiče primjerenosti metoda, za autore su izračunati lokalni h-indeksi i ukupna citiranost radova, pritom su rezultati još dodatno uspoređeni s općenitim H-indeksom prema Google znalcu kako bi se potvrdila vjerodostojnost dobivenih rezultata. Dodatno su razmatrane i ostale metrike kao što su to SJR i SNIP rang te su detaljno proučene stranice autora za dobivanje šireg konteksta. Preuzeti podaci iz Scopus-a koriste puna prezimena autora i kratice njihovih imena što može dovesti do toga da autorima bude dodijeljen veći broj publikacija nego što im originalno pripada. Kako je uočen taj problem, korišteni su podaci o autorima s najvećim brojem publikacija sa Scopus web stranice, no čišćenjem imena autora možda su se mogla dobiti još neka značajnija imena putem R alata.
ZAKLJUČAK
Ovaj rad pruža osvrt na bibliometrijsku analizu područja privatnosti i primjene modeliranja profila korisnika. Uočeno je kako je relativno mali broj autora usko specijaliziran za kombinaciju tih dvaju područja. Samim time izdvojeno je tek nekoliko istraživača, časopisa i konferencija koji bi se mogle smatrati usko vezanih uz to područje. Ono što doprinosi tvrdnji da je Alfred Kobsa najznačajniji znanstvenik u tom području je činjenica da je osnivač časopisa User modeling and user-adapted interaction koji je identificiran kao jedan od dva najznačajnija časopisa u tom području. Također, osnivač je User modeling inc.-a koji danas u sklopu ACM-a financira konferencije koje su prestižne u tom području. Kao njegov nasljednik ističe se posebice B. Knijnenburg koji je sudjelovao s Kobsom na nekoliko projekta te je njegov najznačajniji suautor u pisanju publikacija (Ics.uci.edu, bez dat.).
Osim toga, Alfred Kobsa sudjelovao je na par konferencija koje su u ovom radu uočene kao najznačajnije u tom području. Samim time zbog međusobne povezanosti rezultata sve to doprinosi tvrdnji da su pronađene kvalitetne i relevantne konferencije i udruge za spomenuto područje. Zbog jačanja brzo rastućih tehnologija i globalnog trenda sve veće zabrinutosti za privatnost ovo područje moglo bi doživjeti značajan procvat.