Original scientific paper
https://doi.org/10.31724/rihjj.48.1.2
Naivno terminološko označivanje zakonskih tekstova u slovačkom – može li biti korisno?
Radovan Garabík
orcid.org/0000-0003-1691-3157
; Ľ. Štúr Institute of Linguistics, Slovak Academy of Sciences
Jana Levická
; Ľ. Štúr Institute of Linguistics, Slovak Academy of Sciences
Abstract
Ispravna automatska terminološka anotacija tekstova u korpusu ponekad može biti izazovan zadatak, posebno za iznimno flektivne jezike s razmjerno slobodnim redoslijedom riječi. U članku istražujemo mogućnost jednostavne anotacije na temelju podudarnosti lematiziranih tekstova kako bi korpus slovačkoga jezika bio anotiran terminološkim zapisima IATE. Točnost anotacije višerječnih termina vrlo je dobra, dok se točnost jednorječnih termina može povisiti primjenom jednostavnih filtara na temelju duljine riječi i stavljanja na crnu listu najčešćih lažnih pozitivnih rezultata.
Keywords
terminologija; korpus; slovački jezik; anotacija korpusa; IATE
Hrčak ID:
281027
URI
Publication date:
29.7.2022.
Visits: 1.236 *