Skoči na glavni sadržaj

Izvorni znanstveni članak

IDENTIFIKACIJA PRIJEVODNIH EKVIVALENATA U HRVATSKO-ENGLESKOM PARALELNOM KORPUSU

Marko Tadić ; Odsjek za lingvistiku Filozofski fakultet Sveučilišta u Zagrebu, Zagreb
Krešimir Šojat ; Zavod za lingvistiku Filozofski fakultet Sveučilišta u Zagrebu, Zagreb


Puni tekst: hrvatski pdf 6.749 Kb

str. 247-262

preuzimanja: 494

citiraj


Sažetak

U radu se ispituju mogućnosti identificiranja prijevodnih ekvivalenata u Hrvatsko-engleskom paralelnom korpusu sravnjenu na razini rečenica koji je sastavljen u Zavodu za lingvistiku Filozofskog fakulteta u Zagrebu.
Identifikacija prijevodnih ekvivalenata od po jedne riječi u svakom jeziku postignuta je generiranjem svih mogućih prijevodnih parova riječi unutar svake rečenice sravnjene u odnosu 1:1. Na te parove primijenjen je izračun statističke mjere 'uzajamne obavijesnosti (mutual information)' koja daje podatak o statistički relevantnim supojavljivanjima riječi u takvu paru. Parovi s visokom vrijednošću uzajamne obavijesnosti predstavljaju dobre kandidate za prijevodne ekvivalente. U nastavku rada provodi se identifikacija jedinica sastavljenih od vise riječi u izvornim tekstovima (hrvatskima) i traže se supojavljivanja parova riječi i u jeziku prijevoda (engleski). Tako se otkrivaju karakteristični prijevodni uzorci jer postoje parovi riječi u izvornom jeziku koji se redovito prevode istim parom riječi u ciljnome jeziku premda je u svakom jeziku vrijednost uzajamne obavijesnosti izrazito niska.
Korištenjem statističkih postupaka u paralelnim korpusima olakšava se pronalaženje kolokacija (mogućih višerječnih termina) i njihovih prijevoda. Istodobno se omogućuje uvid u odgovarajuće ko-tekstne primjere uporabe riječi u izvornom jeziku i u jeziku prijevoda. Tako priređena građa vrlo je korisna dvojezičnim leksikografima i prevoditeljima.

Ključne riječi

hrvatsko-engleski paralelni korpus; višerječne jedinice; prijevodni ekvivalenti; sravnjivanje riječi; uzajamna obavijesnost

Hrčak ID:

173315

URI

https://hrcak.srce.hr/173315

Datum izdavanja:

20.5.2002.

Podaci na drugim jezicima: engleski

Posjeta: 1.333 *