Skoči na glavni sadržaj

Izvorni znanstveni članak

Oblikovanje korjenovatelja za hrvatski jezik

Ivan Pandžić orcid id orcid.org/0000-0002-7741-8996 ; Institut za hrvatski jezik i jezikoslovlje Ulica Republike Austrije 16, HR-10000 Zagreb


Puni tekst: hrvatski pdf 816 Kb

str. 301-327

preuzimanja: 2.324

citiraj


Sažetak

U radu je prikazana izrada dvaju korjenovateljā za hrvatski jezik (k2 i k3) koji upotrebljavaju tvorbene nastavke imenica, pridjeva i glagola kako bi odredili osnove pojavnica. Pretpostavku da će navedeni korjenovatelji postići bolje rezultate od drugih sličnih korjenovatelja za hrvatski jezik provjerili smo usporedbom njihovih preciznosti, odziva i F1-mjera s istim vrijednostima početnoga korjenovatelja (k1). U tu svrhu upotrijebljen je ručno provjereni korpus od 9775 pojavnica s određenim lemama i morfosintaktičkim oznakama. U radu su također obrađeni problemi povezani s nazivljem koje se upotrebljava u području korjenovanja.

Ključne riječi

korjenovanje temeljeno na pravilima, računalna lingvistika, obrada prirodnoga jezika, hrvatski jezik

Hrčak ID:

150047

URI

https://hrcak.srce.hr/150047

Podaci na drugim jezicima: engleski

Posjeta: 3.154 *