Prethodno priopćenje
https://doi.org/10.31724/rihjj.46.2.17
Izrada hrvatskoga medicinskog rječnika iz medicinskoga korpusa
Kristina Kocijan
orcid.org/0000-0001-9467-5313
; Faculty of Humanities and Social Sciences, University of Zagreb
Silvia Kurolt
; Faculty of Humanities and Social Sciences, University of Zagreb
Linda Mijić
orcid.org/0000-0003-3246-7652
; Department of Classical Philology, University of Zadar
Sažetak
Osnovni je cilj ovoga projekta definiranje leksičkih i sintaktičkih jezičnih modela koji se pojavljuju u području medicine, a ovisno o vrsti korpusa. U prvoj fazi projekta prikupljeni su tekstovi koji čine medicinski korpus A – MedCorA (2232 farmaceutske upute za lijekove dostupne u Hrvatskoj). Nazivlje je iz korpusa analizirano, a potom su definirane semantičke poddomene (anatomija, stanja, mikroorganizmi, kemija itd.) unutar medicinske domene. Semantičke su oznake dodane u rječnik, gdje su poslužile kao osnova za drugu fazu projekta u kojoj su izrađene i NooJ morfološke gramatike za prepoznavanje i označavanje latinizama kao i latinskih izraza koji se koriste hrvatskim padežnim nastavcima.
Pripremljeni resursi stavljaju se na raspolaganje široj znanstvenoj zajednici putem SketchEnginea za daljnja istraživanja u području obrade jezika i medicine, omogućujući pritom nova istraživanja i razvoj algoritama za, među ostalim, klasifikaciju medicinskih dokumenata, pronalaženje podataka u medicinskim tekstovima, prevođenje medicinske dokumentacije, a uzimajući u obzir kvalitetu i pouzdanost podataka, ali i terminološku varijabilnost.
Ključne riječi
obrada jezika; semantičke oznake; medicinska domena; NooJ; hrvatski jezik
Hrčak ID:
245468
URI
Datum izdavanja:
30.10.2020.
Posjeta: 2.737 *