Filologija, No. 58, 2012.
Pregledni rad
Problemi obilježavanja elemenata iz stranih jezika u okviru standarda TEI
Vuk-Tadija Barbarić
orcid.org/0000-0003-1001-437X
; Institut za hrvatski jezik i jezikoslovlje
Antun Halonja
; Institut za hrvatski jezik i jezikoslovlje
Sažetak
U radu su identificirani osnovni problemi te je dan širok i primjenjiv teorijski i praktični okvir za prepoznavanje i obilježavanje elemenata iz stranih jezika u Hrvatskome jezičnom korpusu. Posebna pozornost pridana je mogućnostima primjene oznake i globalnoga atributa XML:lang u okviru standarda TEI (»Text Encoding Initiative«). Takvo obilježavanje korpusa može pomoći pri izradbi rječnika, preciznije — jednojezičnoga rječnika, a može poslužiti i za mnoga druga, u prvome redu leksička istraživanja.
Ključne riječi
korpus; Hrvatski jezični korpus; elementi iz stranih jezika; standard TEI; obilježavanje
Hrčak ID:
98048
URI
Datum izdavanja:
28.1.2013.
Posjeta: 1.638 *