Skip to the main content

Review article

HRVATSKI KORPUS GOVORNOG JEZIKA (HrAL)

Jelena Kuvač Kraljević orcid id orcid.org/0000-0003-1452-0851 ; Edukacijsko-rehabilitacijski fakultet, Zagreb
Gordana Hržica orcid id orcid.org/0000-0001-6067-9148 ; Edukacijsko-rehabilitacijski fakultet, Zagreb


Full text: english pdf 623 Kb

page 87-102

downloads: 947

cite


Abstract

Zanimanje za korpuse govornog jezika posljednja dva desetljeća raste, pri čemu nastaju i razvijaju se novi istovrsni korpusi koji omogućuju uvid u nove činjenice o govornom jeziku. Ova vrsta korpusa predstavlja najiscrpniji izvor podataka o jeziku prosječnoga govornika. Ti se korpusi temelje na spontanom i nestrukturiranom govorenju koje je određeno različitim stilovima, registrima i dijalektima.
Cilj je ovog rada predstaviti Hrvatski korpus govornog jezika odraslih (HrAL), njegovu strukturu i moguću primjenu u različitim lingvističkim granama. HrAL je oblikovan uzorkovanjem spontane konverzacije između 617 govornika iz svih hrvatskih županija i sadrži više od 250.000 pojavnica i više od 100.000 različnica. Podatci su prikupljani u tri vremenska razdoblja: od 2010. do 2011., od 2014. do 2015. te tijekom 2016. godine.
HrAL je danas dostupan u TalkBank-u, bazi korpusa govornih jezika prikupljenih u različitim jezicima (https://talkbank.org), i to u pododjeljku Conversational analyses corpora unutar Conversational Bank. Podatci su transkribirani, kodirani i segmentirani rabeći transkripcijske for¬ma¬te Codes for Human Analysis of Transcripts (CHAT) i Computerised Language Analysis (CLAN), iz niza programa TalkBank-a. Govorni nizovi segmentirani su na komunikacijske jedinice (C-jedinice) temeljene na sintaktičkom kriteriju. Većina je transkripata povezana sa svojim audiozapisom. TalkBank je javno dostupan, odnosno svi podatci pohranjeni u njemu mogu biti slobodno upotrijeb¬lje¬ni prema osnovnim pravilima TalkBank-a.
HrAL daje informacije o gramatici i leksikonu govornog jezika, diskursnim vještinama, proizve-denim pogreškama i produktivnosti općenito. Koristan je za sociolingvistička istraživanja kao i za istraživanja sinkronijskih jezičnih promjena u hrvatskom.

Keywords

Hrvatski korpus govornog jezika odraslih (HrAL); jezično uzorkovanje; korpus spontanoga govora

Hrčak ID:

174013

URI

https://hrcak.srce.hr/174013

Publication date:

26.1.2017.

Article data in other languages: english

Visits: 3.070 *