Skoči na glavni sadržaj

Pregledni rad

Hrvatski čestotni rječnik dječjega jezika

Gordana Hržica orcid id orcid.org/0000-0001-6067-9148 ; Sveučilište u Zagrebu, Laboratorij za psiholingvistička istraživanja
Jelena Kuvač Kraljević orcid id orcid.org/0000-0003-1452-0851 ; Sveučilište u Zagrebu, Laboratorij za psiholingvistička istraživanja
Jan Šnajder orcid id orcid.org/0000-0001-8942-5301 ; Sveučilište u Zagrebu, Fakultet elektrotehnike i računarstva


Puni tekst: hrvatski pdf 201 Kb

str. 189-205

preuzimanja: 1.656

citiraj


Sažetak

Jezični korpusi priznati su izvori jezičnih podataka. Međutim, dohvat tih podataka može biti složen i dugotrajan za krajnje korisnike. Hrvatski korpus dječjega jezika (HKDJ --- Kovačević 2002) jedini je hrvatski korpus govornoga jezika. Sastoji se od prijepisa uzoraka spontanoga govornoga jezika troje djece. Djeca su uzorkovana u pravilnim vremenskim razmacima, od progovaranja do treće godine. Uzorci su transkribirani u programskom paketu CLAN, u skladu s pravilima CHAT-a. Dostupni su u Svjetskoj bazi dječjega jezika CHILDES . Cilj je HKDJ-a pružiti podatke o leksičkom i gramatičkom razvoju u ranom jezičnom usvajanju. Kako bi se omogućio lakši i precizniji dohvat podataka dostupnih u HKDJ-u, pristupilo se izradi Hrvatskoga čestotnoga rječnika dječjega jezika (DjeČeR) čija je izrada još u tijeku. DjeČeR vjerodostojno odražava specifičnosti HKDJ-a (govorni korpus s razvojnom komponentom) te je sukladno strukturiran. U DjeČeRu je omogućen pregled natuknica triju potkorpusa HKDJ-a zasebno te unije i presjeka potkorpusa triju govornika. Pretražuje se prema čestotnosti, abecednom redu, vremenu pojave i vrsti riječi. U DjeČeRu su dostupni i podatci o morfosintaktičkom opisu natuknica* koje se pojavljuju u HKDJ-u te točan popis njihovih obličnica.

*Naziv natuknica različito se tretira u dvije različite tradicije u jezikoslovlju, leksikografskoj i psiholingvističkoj (Jelaska, 2005). Unutar leksikografske tradicije označava osnovu unosa u rječnik, to jest početak rječničkoga članka (u tom se značenju u engleskome osim naziva lemma upotrebljava i naziv headword), a u psiholingvistici označava apstraktni osnovni oblik riječi (eng. lemma), to jest jedinicu umnoga rječnika (Crystal 2003).

Ključne riječi

Hrvatski korpus dječjega jezika; Hrvatski čestotni rječnik dječjega jezika; CHILDES; lematizacija; označavanje korpusa; struktura čestotnoga rječnika

Hrčak ID:

130044

URI

https://hrcak.srce.hr/130044

Datum izdavanja:

23.12.2013.

Podaci na drugim jezicima: engleski

Posjeta: 4.550 *