Filologija, No. 38-39, 2002.
Izvorni znanstveni članak
IDENTIFIKACIJA PRIJEVODNIH EKVIVALENATA U HRVATSKO-ENGLESKOM PARALELNOM KORPUSU
Marko Tadić
; Odsjek za lingvistiku Filozofski fakultet Sveučilišta u Zagrebu, Zagreb
Krešimir Šojat
; Zavod za lingvistiku Filozofski fakultet Sveučilišta u Zagrebu, Zagreb
Sažetak
U radu se ispituju mogućnosti identificiranja prijevodnih ekvivalenata u Hrvatsko-engleskom paralelnom korpusu sravnjenu na razini rečenica koji je sastavljen u Zavodu za lingvistiku Filozofskog fakulteta u Zagrebu.
Identifikacija prijevodnih ekvivalenata od po jedne riječi u svakom jeziku postignuta je generiranjem svih mogućih prijevodnih parova riječi unutar svake rečenice sravnjene u odnosu 1:1. Na te parove primijenjen je izračun statističke mjere 'uzajamne obavijesnosti (mutual information)' koja daje podatak o statistički relevantnim supojavljivanjima riječi u takvu paru. Parovi s visokom vrijednošću uzajamne obavijesnosti predstavljaju dobre kandidate za prijevodne ekvivalente. U nastavku rada provodi se identifikacija jedinica sastavljenih od vise riječi u izvornim tekstovima (hrvatskima) i traže se supojavljivanja parova riječi i u jeziku prijevoda (engleski). Tako se otkrivaju karakteristični prijevodni uzorci jer postoje parovi riječi u izvornom jeziku koji se redovito prevode istim parom riječi u ciljnome jeziku premda je u svakom jeziku vrijednost uzajamne obavijesnosti izrazito niska.
Korištenjem statističkih postupaka u paralelnim korpusima olakšava se pronalaženje kolokacija (mogućih višerječnih termina) i njihovih prijevoda. Istodobno se omogućuje uvid u odgovarajuće ko-tekstne primjere uporabe riječi u izvornom jeziku i u jeziku prijevoda. Tako priređena građa vrlo je korisna dvojezičnim leksikografima i prevoditeljima.
Ključne riječi
hrvatsko-engleski paralelni korpus; višerječne jedinice; prijevodni ekvivalenti; sravnjivanje riječi; uzajamna obavijesnost
Hrčak ID:
173315
URI
Datum izdavanja:
20.5.2002.
Posjeta: 1.699 *