Izvorni znanstveni članak
Oblikovanje korjenovatelja za hrvatski jezik
Ivan Pandžić
orcid.org/0000-0002-7741-8996
; Institut za hrvatski jezik i jezikoslovlje Ulica Republike Austrije 16, HR-10000 Zagreb
Sažetak
U radu je prikazana izrada dvaju korjenovateljā za hrvatski jezik (k2 i k3) koji upotrebljavaju tvorbene nastavke imenica, pridjeva i glagola kako bi odredili osnove pojavnica. Pretpostavku da će navedeni korjenovatelji postići bolje rezultate od drugih sličnih korjenovatelja za hrvatski jezik provjerili smo usporedbom njihovih preciznosti, odziva i F1-mjera s istim vrijednostima početnoga korjenovatelja (k1). U tu svrhu upotrijebljen je ručno provjereni korpus od 9775 pojavnica s određenim lemama i morfosintaktičkim oznakama. U radu su također obrađeni problemi povezani s nazivljem koje se upotrebljava u području korjenovanja.
Ključne riječi
korjenovanje temeljeno na pravilima; računalna lingvistika; obrada prirodnoga jezika; hrvatski jezik
Hrčak ID:
150047
URI
Datum izdavanja:
29.12.2015.
Posjeta: 4.557 *