Review article
HRVATSKI KORPUS GOVORNOG JEZIKA (HrAL)
Jelena Kuvač Kraljević
orcid.org/0000-0003-1452-0851
; Edukacijsko-rehabilitacijski fakultet, Zagreb
Gordana Hržica
orcid.org/0000-0001-6067-9148
; Edukacijsko-rehabilitacijski fakultet, Zagreb
Abstract
Zanimanje za korpuse govornog jezika posljednja dva desetljeća raste, pri čemu nastaju i razvijaju se novi istovrsni korpusi koji omogućuju uvid u nove činjenice o govornom jeziku. Ova vrsta korpusa predstavlja najiscrpniji izvor podataka o jeziku prosječnoga govornika. Ti se korpusi temelje na spontanom i nestrukturiranom govorenju koje je određeno različitim stilovima, registrima i dijalektima.
Cilj je ovog rada predstaviti Hrvatski korpus govornog jezika odraslih (HrAL), njegovu strukturu i moguću primjenu u različitim lingvističkim granama. HrAL je oblikovan uzorkovanjem spontane konverzacije između 617 govornika iz svih hrvatskih županija i sadrži više od 250.000 pojavnica i više od 100.000 različnica. Podatci su prikupljani u tri vremenska razdoblja: od 2010. do 2011., od 2014. do 2015. te tijekom 2016. godine.
HrAL je danas dostupan u TalkBank-u, bazi korpusa govornih jezika prikupljenih u različitim jezicima (https://talkbank.org), i to u pododjeljku Conversational analyses corpora unutar Conversational Bank. Podatci su transkribirani, kodirani i segmentirani rabeći transkripcijske for¬ma¬te Codes for Human Analysis of Transcripts (CHAT) i Computerised Language Analysis (CLAN), iz niza programa TalkBank-a. Govorni nizovi segmentirani su na komunikacijske jedinice (C-jedinice) temeljene na sintaktičkom kriteriju. Većina je transkripata povezana sa svojim audiozapisom. TalkBank je javno dostupan, odnosno svi podatci pohranjeni u njemu mogu biti slobodno upotrijeb¬lje¬ni prema osnovnim pravilima TalkBank-a.
HrAL daje informacije o gramatici i leksikonu govornog jezika, diskursnim vještinama, proizve-denim pogreškama i produktivnosti općenito. Koristan je za sociolingvistička istraživanja kao i za istraživanja sinkronijskih jezičnih promjena u hrvatskom.
Keywords
Hrvatski korpus govornog jezika odraslih (HrAL); jezično uzorkovanje; korpus spontanoga govora
Hrčak ID:
174013
URI
Publication date:
26.1.2017.
Visits: 3.070 *