Skoči na glavni sadržaj

Izvorni znanstveni članak

https://doi.org/10.22210/suvlin.2022.093.03

Kako bojimo svijet riječima

Kristina Kocijan orcid id orcid.org/0000-0001-9467-5313 ; Filozofski fakultet Sveučilišta u Zagrebu


Puni tekst: engleski pdf 1.536 Kb

str. 41-83

preuzimanja: 533

citiraj


Sažetak

U radu je dan sveobuhvatan prikaz različitih obrazaca koji se koriste u terminologiji boja u hrvatskom
jeziku i koji su do sada opisani kroz objavljena istraživanja u ovom području. U fokusu je prikaz iz računalnog
pristupa automatskom otkrivanju leksičkih obrazaca. Svrha predstavljenog istraživanja je defi nirati
postojeće modele za izgradnju izraza o boji u hrvatskom jeziku, s posebnim naglaskom na složenice i
višerječne izraze te implementacija prepoznatih modela u računalnoj obradi jezika.
Analiza i defi niranje različitih modela na osnovu postojeće literature za boje u hrvatskom jeziku imala
je za cilj njihovu klasifi kaciju i pripremu za uporabu u računalnoj obradi jezika. U ovoj su fazi defi nirana
4 osnovna uzorka sa svojim pod–klasama. Ovako defi nirani leksikalizirani obrasci korišteni su unutar
NooJ alata za obradu jezika gdje su omogućili izradu (a) digitalnog rječnika s popisom osnovnih boja i
opisom njihovih derivacija te (b) računalnog algoritma za automatsko prepoznavanje i označavanje boja u
hrvatskom jeziku i pripadajućih oznaka klase.
U radu je dodatno predstavljena usporedna analiza različitih klasa izraza za boje pronađenih u korpusu
izgrađenom iz knjževnih djela namijenjenih mlađoj (CLC) i starijoj (ALC) populaciji kako bi se dobili dodatni
uvidi o korištenju određenog obrasca ovisno o uzorku teksta nad kojim se radi analiza. Podaci istraživanja
dani su i kroz tablični prikaz tri tipa izraza za boju u klasi višerječnih izraza. Pripremljeni resursi otvaraju
mogućnost dodatnih analiza tekstova iz drugih domena i s novim istraživačkim interesima koji uključuju
boje u računalnoj obradi jezika

Ključne riječi

izrazi za boje; leksikalizirani obrasci; višerječni izrazi; računalna obrada prirodnog jezika; digitalna humanistika; hrvatski jezik; NooJ

Hrčak ID:

280907

URI

https://hrcak.srce.hr/280907

Datum izdavanja:

25.7.2022.

Podaci na drugim jezicima: engleski

Posjeta: 1.384 *