Skoči na glavni sadržaj

Izvorni znanstveni članak

https://doi.org/10.31724/rihjj.46.2.31

Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike

Irena Srdanović orcid id orcid.org/0000-0003-1281-176X ; Juraj Dobrila University of Pula


Puni tekst: hrvatski pdf 4.014 Kb

str. 1059-1083

preuzimanja: 448

citiraj


Sažetak

U ovom radu predstavljena su dva pristupa u stvaranju specijaliziranih mrežnih korpusa o hrvatskom turizmu na japanskome jeziku za potrebe izrade specijaliziranoga dvojezičnog japansko-hrvatskog rječnika za učenike japanskoga jezika. Oba pristupa koriste se tehnologijom WebBootCat unutar platforme Sketch Engine za automatsko stvaranje specijaliziranih mrežnih korpusa (Baroni i dr. 2006, Kilgarriff i dr. 2014). Prvi pristup stvara korpus iz odabranih riječi, odn. polaznih pojmova (eng. seed words) koje su najrelevantnije za temu. Drugi pristup skuplja brojne mrežne stranice sa sadržajima o turizmu u određenim regijama, gradovima i mjestima u Hrvatskoj napisanim na japanskome jeziku, koje se zatim upotrebljavaju za stvaranje mrežnih korpusa. Oba pristupa pružaju specijalizirane internetske korpuse koji su, bez obzira na malu veličinu, korisni za profiliranje leksika u određenome području, u ovome slučaju u području turizma. U procesu stvaranja rječnika drugi se pristup pokazao osobito korisnim za odabir natuknica, dok su se oba pristupa pokazala vrlo korisnim za istraživanje i odabir autentičnih primjera iz korpusa. Uočeni su i određeni nedostatci u jezičnoj obradi podataka na japanskome jeziku, npr. pogreške u lematizaciji nekih pojmova i naziva svojstvenih određenoj kulturi te je ukazano na potrebu za usavršavanjem postojećih alata za jezičnu obradu podataka na japanskome jeziku. Japansko-hrvatski dvojezični rječnik namijenjen učenicima japanskoga jezika trenutačno je u eksperimentalnoj fazi te se učenici i nastavnici njime koriste i grade ga s pomoću otvorene platforme za izradu mrežnih rječnika Lexonomy (Mechura 2017). Osim što je rad na dvojezičnome rječniku koristan kao sredstvo za stručnu obuku u analizi i opisu jezika s pomoću suvremenih tehnologija (npr. korpusa, platforma za pretraživanje korpusa i izradu rječnika), važnost rječnika vidi se i u izobrazbi novih stručnjaka osposobljenih za rad u turizmu na japanskome jeziku, što je izrazito potrebno. U budućnosti bi se mogao primijeniti isti pristup za stvaranje specijaliziranih korpusa i rječnika za japanski i druge jezične parove.

Ključne riječi

izgradnja korpusa; tehnologija BootCat; područje turizma; rječnik za neizvorne govornike; Sketch Engine; specijalizirani mrežni korpus o hrvatskome turizmu na japanskome jeziku

Hrčak ID:

245483

URI

https://hrcak.srce.hr/245483

Datum izdavanja:

30.10.2020.

Podaci na drugim jezicima: engleski

Posjeta: 1.217 *