Skoči na glavni sadržaj

Izvorni znanstveni članak

https://doi.org/10.31724/rihjj.48.1.2

Naivno terminološko označivanje zakonskih tekstova u slovačkom – može li biti korisno?

Radovan Garabík orcid id orcid.org/0000-0003-1691-3157 ; Ľ. Štúr Institute of Linguistics, Slovak Academy of Sciences
Jana Levická ; Ľ. Štúr Institute of Linguistics, Slovak Academy of Sciences


Puni tekst: engleski pdf 1.030 Kb

str. 27-44

preuzimanja: 348

citiraj


Sažetak

Ispravna automatska terminološka anotacija tekstova u korpusu ponekad može biti izazovan zadatak, posebno za iznimno flektivne jezike s razmjerno slobodnim redoslijedom riječi. U članku istražujemo mogućnost jednostavne anotacije na temelju podudarnosti lematiziranih tekstova kako bi korpus slovačkoga jezika bio anotiran terminološkim zapisima IATE. Točnost anotacije višerječnih termina vrlo je dobra, dok se točnost jednorječnih termina može povisiti primjenom jednostavnih filtara na temelju duljine riječi i stavljanja na crnu listu najčešćih lažnih pozitivnih rezultata.

Ključne riječi

terminologija; korpus; slovački jezik; anotacija korpusa; IATE

Hrčak ID:

281027

URI

https://hrcak.srce.hr/281027

Datum izdavanja:

29.7.2022.

Podaci na drugim jezicima: engleski

Posjeta: 1.236 *