Skip to the main content

Original scientific paper

https://doi.org/10.31724/rihjj.48.1.2

Naivno terminološko označivanje zakonskih tekstova u slovačkom – može li biti korisno?

Radovan Garabík orcid id orcid.org/0000-0003-1691-3157 ; Ľ. Štúr Institute of Linguistics, Slovak Academy of Sciences
Jana Levická ; Ľ. Štúr Institute of Linguistics, Slovak Academy of Sciences


Full text: english pdf 1.030 Kb

page 27-44

downloads: 343

cite


Abstract

Ispravna automatska terminološka anotacija tekstova u korpusu ponekad može biti izazovan zadatak, posebno za iznimno flektivne jezike s razmjerno slobodnim redoslijedom riječi. U članku istražujemo mogućnost jednostavne anotacije na temelju podudarnosti lematiziranih tekstova kako bi korpus slovačkoga jezika bio anotiran terminološkim zapisima IATE. Točnost anotacije višerječnih termina vrlo je dobra, dok se točnost jednorječnih termina može povisiti primjenom jednostavnih filtara na temelju duljine riječi i stavljanja na crnu listu najčešćih lažnih pozitivnih rezultata.

Keywords

terminologija; korpus; slovački jezik; anotacija korpusa; IATE

Hrčak ID:

281027

URI

https://hrcak.srce.hr/281027

Publication date:

29.7.2022.

Article data in other languages: english

Visits: 1.202 *