Skoči na glavni sadržaj

Prethodno priopćenje

https://doi.org/10.31724/rihjj.46.2.17

Izrada hrvatskoga medicinskog rječnika iz medicinskoga korpusa

Kristina Kocijan orcid id orcid.org/0000-0001-9467-5313 ; Faculty of Humanities and Social Sciences, University of Zagreb
Silvia Kurolt ; Faculty of Humanities and Social Sciences, University of Zagreb
Linda Mijić orcid id orcid.org/0000-0003-3246-7652 ; Department of Classical Philology, University of Zadar


Puni tekst: engleski pdf 1.454 Kb

str. 765-782

preuzimanja: 857

citiraj


Sažetak

Osnovni je cilj ovoga projekta definiranje leksičkih i sintaktičkih jezičnih modela koji se pojavljuju u području medicine, a ovisno o vrsti korpusa. U prvoj fazi projekta prikupljeni su tekstovi koji čine medicinski korpus A – MedCorA (2232 farmaceutske upute za lijekove dostupne u Hrvatskoj). Nazivlje je iz korpusa analizirano, a potom su definirane semantičke poddomene (anatomija, stanja, mikroorganizmi, kemija itd.) unutar medicinske domene. Semantičke su oznake dodane u rječnik, gdje su poslužile kao osnova za drugu fazu projekta u kojoj su izrađene i NooJ morfološke gramatike za prepoznavanje i označavanje latinizama kao i latinskih izraza koji se koriste hrvatskim padežnim nastavcima.
Pripremljeni resursi stavljaju se na raspolaganje široj znanstvenoj zajednici putem SketchEnginea za daljnja istraživanja u području obrade jezika i medicine, omogućujući pritom nova istraživanja i razvoj algoritama za, među ostalim, klasifikaciju medicinskih dokumenata, pronalaženje podataka u medicinskim tekstovima, prevođenje medicinske dokumentacije, a uzimajući u obzir kvalitetu i pouzdanost podataka, ali i terminološku varijabilnost.

Ključne riječi

obrada jezika; semantičke oznake; medicinska domena; NooJ; hrvatski jezik

Hrčak ID:

245468

URI

https://hrcak.srce.hr/245468

Datum izdavanja:

30.10.2020.

Podaci na drugim jezicima: engleski

Posjeta: 2.737 *