Original scientific paper
https://doi.org/10.22210/suvlin.2022.093.03
Kako bojimo svijet riječima
Kristina Kocijan
orcid.org/0000-0001-9467-5313
; Faculty of Humanities and Social Sciences, University of Zagreb
Abstract
U radu je dan sveobuhvatan prikaz različitih obrazaca koji se koriste u terminologiji boja u hrvatskom
jeziku i koji su do sada opisani kroz objavljena istraživanja u ovom području. U fokusu je prikaz iz računalnog
pristupa automatskom otkrivanju leksičkih obrazaca. Svrha predstavljenog istraživanja je defi nirati
postojeće modele za izgradnju izraza o boji u hrvatskom jeziku, s posebnim naglaskom na složenice i
višerječne izraze te implementacija prepoznatih modela u računalnoj obradi jezika.
Analiza i defi niranje različitih modela na osnovu postojeće literature za boje u hrvatskom jeziku imala
je za cilj njihovu klasifi kaciju i pripremu za uporabu u računalnoj obradi jezika. U ovoj su fazi defi nirana
4 osnovna uzorka sa svojim pod–klasama. Ovako defi nirani leksikalizirani obrasci korišteni su unutar
NooJ alata za obradu jezika gdje su omogućili izradu (a) digitalnog rječnika s popisom osnovnih boja i
opisom njihovih derivacija te (b) računalnog algoritma za automatsko prepoznavanje i označavanje boja u
hrvatskom jeziku i pripadajućih oznaka klase.
U radu je dodatno predstavljena usporedna analiza različitih klasa izraza za boje pronađenih u korpusu
izgrađenom iz knjževnih djela namijenjenih mlađoj (CLC) i starijoj (ALC) populaciji kako bi se dobili dodatni
uvidi o korištenju određenog obrasca ovisno o uzorku teksta nad kojim se radi analiza. Podaci istraživanja
dani su i kroz tablični prikaz tri tipa izraza za boju u klasi višerječnih izraza. Pripremljeni resursi otvaraju
mogućnost dodatnih analiza tekstova iz drugih domena i s novim istraživačkim interesima koji uključuju
boje u računalnoj obradi jezika
Keywords
izrazi za boje; leksikalizirani obrasci; višerječni izrazi; računalna obrada prirodnog jezika; digitalna humanistika; hrvatski jezik; NooJ
Hrčak ID:
280907
URI
Publication date:
25.7.2022.
Visits: 1.384 *