Skip to the main content

Preliminary communication

https://doi.org/10.31724/rihjj.46.2.17

Izrada hrvatskoga medicinskog rječnika iz medicinskoga korpusa

Kristina Kocijan orcid id orcid.org/0000-0001-9467-5313 ; Faculty of Humanities and Social Sciences, University of Zagreb
Silvia Kurolt ; Faculty of Humanities and Social Sciences, University of Zagreb
Linda Mijić orcid id orcid.org/0000-0003-3246-7652 ; Department of Classical Philology, University of Zadar


Full text: english pdf 1.454 Kb

page 765-782

downloads: 642

cite


Abstract

Osnovni je cilj ovoga projekta definiranje leksičkih i sintaktičkih jezičnih modela koji se pojavljuju u području medicine, a ovisno o vrsti korpusa. U prvoj fazi projekta prikupljeni su tekstovi koji čine medicinski korpus A – MedCorA (2232 farmaceutske upute za lijekove dostupne u Hrvatskoj). Nazivlje je iz korpusa analizirano, a potom su definirane semantičke poddomene (anatomija, stanja, mikroorganizmi, kemija itd.) unutar medicinske domene. Semantičke su oznake dodane u rječnik, gdje su poslužile kao osnova za drugu fazu projekta u kojoj su izrađene i NooJ morfološke gramatike za prepoznavanje i označavanje latinizama kao i latinskih izraza koji se koriste hrvatskim padežnim nastavcima.
Pripremljeni resursi stavljaju se na raspolaganje široj znanstvenoj zajednici putem SketchEnginea za daljnja istraživanja u području obrade jezika i medicine, omogućujući pritom nova istraživanja i razvoj algoritama za, među ostalim, klasifikaciju medicinskih dokumenata, pronalaženje podataka u medicinskim tekstovima, prevođenje medicinske dokumentacije, a uzimajući u obzir kvalitetu i pouzdanost podataka, ali i terminološku varijabilnost.

Keywords

obrada jezika; semantičke oznake; medicinska domena; NooJ; hrvatski jezik

Hrčak ID:

245468

URI

https://hrcak.srce.hr/245468

Publication date:

30.10.2020.

Article data in other languages: english

Visits: 1.880 *