Skoči na glavni sadržaj

Pregledni rad

Problemi obilježavanja elemenata iz stranih jezika u okviru standarda TEI

Vuk-Tadija Barbarić orcid id orcid.org/0000-0003-1001-437X ; Institut za hrvatski jezik i jezikoslovlje
Antun Halonja ; Institut za hrvatski jezik i jezikoslovlje


Puni tekst: hrvatski pdf 213 Kb

str. 1-17

preuzimanja: 604

citiraj


Sažetak

U radu su identificirani osnovni problemi te je dan širok i primjenjiv teorijski i praktični okvir za prepoznavanje i obilježavanje elemenata iz stranih jezika u Hrvatskome jezičnom korpusu. Posebna pozornost pridana je mogućnostima primjene oznake i globalnoga atributa XML:lang u okviru standarda TEI (»Text Encoding Initiative«). Takvo obilježavanje korpusa može pomoći pri izradbi rječnika, preciznije — jednojezičnoga rječnika, a može poslužiti i za mnoga druga, u prvome redu leksička istraživanja.

Ključne riječi

korpus; Hrvatski jezični korpus; elementi iz stranih jezika; standard TEI; obilježavanje

Hrčak ID:

98048

URI

https://hrcak.srce.hr/98048

Datum izdavanja:

28.1.2013.

Podaci na drugim jezicima: engleski

Posjeta: 1.638 *