Review article
Hrvatski čestotni rječnik dječjega jezika
Gordana Hržica
orcid.org/0000-0001-6067-9148
; University of Zagreb, Laboratory for Psycholinguistic Research - POLIN
Jelena Kuvač Kraljević
orcid.org/0000-0003-1452-0851
; University of Zagreb, Laboratory for Psycholinguistic Research - POLIN
Jan Šnajder
orcid.org/0000-0001-8942-5301
; University of Zagreb, Faculty of Electrical Engineering and Computing (FER)
Abstract
Jezični korpusi priznati su izvori jezičnih podataka. Međutim, dohvat tih podataka može biti složen i dugotrajan za krajnje korisnike. Hrvatski korpus dječjega jezika (HKDJ --- Kovačević 2002) jedini je hrvatski korpus govornoga jezika. Sastoji se od prijepisa uzoraka spontanoga govornoga jezika troje djece. Djeca su uzorkovana u pravilnim vremenskim razmacima, od progovaranja do treće godine. Uzorci su transkribirani u programskom paketu CLAN, u skladu s pravilima CHAT-a. Dostupni su u Svjetskoj bazi dječjega jezika CHILDES . Cilj je HKDJ-a pružiti podatke o leksičkom i gramatičkom razvoju u ranom jezičnom usvajanju. Kako bi se omogućio lakši i precizniji dohvat podataka dostupnih u HKDJ-u, pristupilo se izradi Hrvatskoga čestotnoga rječnika dječjega jezika (DjeČeR) čija je izrada još u tijeku. DjeČeR vjerodostojno odražava specifičnosti HKDJ-a (govorni korpus s razvojnom komponentom) te je sukladno strukturiran. U DjeČeRu je omogućen pregled natuknica triju potkorpusa HKDJ-a zasebno te unije i presjeka potkorpusa triju govornika. Pretražuje se prema čestotnosti, abecednom redu, vremenu pojave i vrsti riječi. U DjeČeRu su dostupni i podatci o morfosintaktičkom opisu natuknica* koje se pojavljuju u HKDJ-u te točan popis njihovih obličnica.
*Naziv natuknica različito se tretira u dvije različite tradicije u jezikoslovlju, leksikografskoj i psiholingvističkoj (Jelaska, 2005). Unutar leksikografske tradicije označava osnovu unosa u rječnik, to jest početak rječničkoga članka (u tom se značenju u engleskome osim naziva lemma upotrebljava i naziv headword), a u psiholingvistici označava apstraktni osnovni oblik riječi (eng. lemma), to jest jedinicu umnoga rječnika (Crystal 2003).
Keywords
Hrvatski korpus dječjega jezika; Hrvatski čestotni rječnik dječjega jezika; CHILDES; lematizacija; označavanje korpusa; struktura čestotnoga rječnika
Hrčak ID:
130044
URI
Publication date:
23.12.2013.
Visits: 4.550 *