Skip to the main content

Review article

Hrvatski čestotni rječnik dječjega jezika

Gordana Hržica orcid id orcid.org/0000-0001-6067-9148 ; University of Zagreb, Laboratory for Psycholinguistic Research - POLIN
Jelena Kuvač Kraljević orcid id orcid.org/0000-0003-1452-0851 ; University of Zagreb, Laboratory for Psycholinguistic Research - POLIN
Jan Šnajder orcid id orcid.org/0000-0001-8942-5301 ; University of Zagreb, Faculty of Electrical Engineering and Computing (FER)


Full text: croatian pdf 201 Kb

page 189-205

downloads: 1.642

cite


Abstract

Jezični korpusi priznati su izvori jezičnih podataka. Međutim, dohvat tih podataka može biti složen i dugotrajan za krajnje korisnike. Hrvatski korpus dječjega jezika (HKDJ --- Kovačević 2002) jedini je hrvatski korpus govornoga jezika. Sastoji se od prijepisa uzoraka spontanoga govornoga jezika troje djece. Djeca su uzorkovana u pravilnim vremenskim razmacima, od progovaranja do treće godine. Uzorci su transkribirani u programskom paketu CLAN, u skladu s pravilima CHAT-a. Dostupni su u Svjetskoj bazi dječjega jezika CHILDES . Cilj je HKDJ-a pružiti podatke o leksičkom i gramatičkom razvoju u ranom jezičnom usvajanju. Kako bi se omogućio lakši i precizniji dohvat podataka dostupnih u HKDJ-u, pristupilo se izradi Hrvatskoga čestotnoga rječnika dječjega jezika (DjeČeR) čija je izrada još u tijeku. DjeČeR vjerodostojno odražava specifičnosti HKDJ-a (govorni korpus s razvojnom komponentom) te je sukladno strukturiran. U DjeČeRu je omogućen pregled natuknica triju potkorpusa HKDJ-a zasebno te unije i presjeka potkorpusa triju govornika. Pretražuje se prema čestotnosti, abecednom redu, vremenu pojave i vrsti riječi. U DjeČeRu su dostupni i podatci o morfosintaktičkom opisu natuknica* koje se pojavljuju u HKDJ-u te točan popis njihovih obličnica.

*Naziv natuknica različito se tretira u dvije različite tradicije u jezikoslovlju, leksikografskoj i psiholingvističkoj (Jelaska, 2005). Unutar leksikografske tradicije označava osnovu unosa u rječnik, to jest početak rječničkoga članka (u tom se značenju u engleskome osim naziva lemma upotrebljava i naziv headword), a u psiholingvistici označava apstraktni osnovni oblik riječi (eng. lemma), to jest jedinicu umnoga rječnika (Crystal 2003).

Keywords

Hrvatski korpus dječjega jezika; Hrvatski čestotni rječnik dječjega jezika; CHILDES; lematizacija; označavanje korpusa; struktura čestotnoga rječnika

Hrčak ID:

130044

URI

https://hrcak.srce.hr/130044

Publication date:

23.12.2013.

Article data in other languages: english

Visits: 4.491 *