Skoči na glavni sadržaj

Izvorni znanstveni članak

https://doi.org/10.22210/suvlin.2025.099.02

Primjena Zipfova zakona na engleske riječi u hrvatskom jeziku: usporedba čestote i dužine riječi

Mirjana Borucinsky orcid id orcid.org/0000-0002-1132-9720 ; University of Rijeka, Faculty of Maritime Studies *
Irena Bogunović orcid id orcid.org/0000-0002-2956-7014 ; University of Rijeka, Faculty of Maritime Studies *
Jasmina Jelčić Čolakovac orcid id orcid.org/0000-0002-1241-1283 ; University of Rijeka, Faculty of Maritime Studies

* Dopisni autor.


Puni tekst: engleski pdf 403 Kb

str. 21-38

preuzimanja: 137

citiraj


Sažetak

Engleske riječi u hrvatskom jeziku proučavalo se iz različitih perspektiva, ponajviše sa stajališta kontaktne lingvistike, kontrastivne lingvistike, translatologije i leksikologije. No, u ovom radu engleske riječi promatramo iz nove perspektive, točnije pokušava se istražiti postoji li veza između čestote i dužine engleskih riječi u hrvatskom jeziku te koriste li se engleske riječi češće od svojih prijevodnih istovrijednica u hrvatskome upravo zato jer su kraće. U tu svrhu testirana je hipoteza da su češće riječi i kraće, a na kojoj se temelji Zipfov zakon (1936., 1949.). U nastojanju da se utvrdi imaju li riječi s većom čestotom tendenciju da budu kraće, provedeno je korpusno ispitivanje mrežnog korpusa engleskog jezika (enTenTen 21) i mrežnog korpusa hrvatskog jezika (MaCoCu Croatian Web v. 2 (2020.–2021.). Analiza je pokazala da se najčešće riječi u engleskom korpusu sastoje od jednog do tri znaka, a da najučestalije riječi u hrvatskom također slijede taj obrazac. Kako bismo vidjeli vrijedi li isto i za engleske riječi u hrvatskom, analizirali smo čestote iz Baze engleskih riječi i njihovih ekvivalenata u hrvatskom (Bogunović, Jelčić Čolakovac and Borucinsky,
2022). U sljedećem koraku ustanovili smo broj znakova (tj. duljinu niza) svake engleske riječi i svake hrvatske istovrijednice, podijelili engleske riječi u skupine (npr. riječ s tri niza, riječ s četiri niza, itd.) te zatim analizirali duljinu prijevodnih istovrijednica (ukoliko iste postoje u Bazi) za svaku pojedinu skupinu engleskih riječi. Rezultati su pokazali da je najčešća duljina niza engleskih riječi 4, 5, 6 i 7 znakova, što čini 65% svih riječi u skupu podataka. Što se tiče hrvatskih riječi, prijevodne istovrijednice se ponekad sastoje od dvije ili čak tri riječi (npr. ‘mrežni dnevnik’ za blog), što je rezultat morfosintaktičkih razlika između dvaju jezika. Podaci o duljini niza za hrvatske riječi sugeriraju da su hrvatske istovrijednice od 2 i 3 znaka prilično rijetke (samo 3%), dok riječi s 4 znaka čine 8% podataka, a većina ostalih riječi pripada kategoriji od 5 do 8 znakova (ukupno 53%). Nadalje, analiza prosječnih čestota istovrijednica u svakoj skupini ukazala je da su one znatno veće od prosječnih čestota engleskih riječi. S obzirom da je to očekivano u korpusu hrvatskih tekstova, smatramo da su za dokaz hipoteze potrebni i drugi kriteriji, poput semantičke kategorije i informativnosti. Zaključujemo da podaci prikupljeni analizom ukazuju na potrebu daljnjeg istraživanja fenomena engleskih riječi u hrvatskom jeziku, ali uz uključivanje semantičke komponente kao utjecajnog čimbenika.

Ključne riječi

Zipfov zakon; čestota; jezične univerzalije; posuđenice; engleske riječi; hrvatski jezik

Hrčak ID:

334024

URI

https://hrcak.srce.hr/334024

Datum izdavanja:

25.7.2025.

Podaci na drugim jezicima: engleski

Posjeta: 353 *