Filologija, No. 68, 2017.
Pregledni rad
https://doi.org/10.21857/yrvgqtkj39
Dijakronijski korpus bugarskoga jezika: trenutno stanje i perspektive
Анна Марија Тотоманова
; Софийски университет «Св. Климент Охридски»
Sažetak
U članku se iznosi povijest stvaranja Dijakronijskoga korpusa bugarskoga jezika i digitalnih alata za obradu srednjovjekovnih crkvenoslavenskih tekstova potrebnih za izradu Povijesnoga rječnika bugarskoga jezika na svemrežju. Dijakronijski korpus uključuje tekstove različitih žanrova kojima je dokazano bugarsko podrijetlo. Korpus je zasnovan na vlastitom programu koji omogućuje primjereno komentiranje s paleografske, kodikološke i tekstološke točke gledišta. Tekstovi su digitalno tipizirani s pomoću posebno konstruiranih starocrkvenoslavenskih UTF fontova. Trenutno imamo na raspolaganju tri fonta i pretvarač koji prethodno tipizirane tekstove koji nisu u Unicodeu prenosi u dokumente u Unicodeu. Do sada je u korpusu objavljeno više od 130 tekstova, a još ih je u postupku pripreme za prijenos na mrežne stranice. Korpus se nalazi na: http://histdict.uni-sofia.bg. Svaki je tekst uveden rubrikom koja sadrži podatke o njegovu izvoru, dataciji, izdanju, autoru ili autorima itd. Mrežne stranice uključuju i potpuno digitaliziranu inačicu Starocrkvenoslavenskoga rječnika (bug. Старобългарски речник), učinjenoga u Institutu za bugarski jezik BAS-a. Oboje, korpus i rječnik, objavljeni su kao izvori u otvorenom pristupu, s tim da je korisnicima dopušteno vidjeti samo potpuno uređene tekstove.
Poseban je program stvoren za potrebe autora Povijesnoga rječnika bugarskoga jezika. S obzirom na činjenicu da je taj povijesni rječnik zasnovan na digitalnoj inačici Starocrkvenoslavenskoga rječnika, program omogućuje uređivanje postojećih natuknica i stvaranje novih. Također, izrađena je tražilica kojoj je svrha olakšati rad na novom rječniku. Nedavno smo se usredotočili na stvaranje morfološkoga označivača (eng. tagger), čiji je prototip također dostupan na mrežnim stranicama. Morfološki je označivač zasnovan na punom rasponu morfoloških oznaka te na gramatičkom rječniku srednjobugarskoga rječnika. Puni raspon morfoloških oznaka i gramatički rječnik također su dostupni na mrežnim stranicama, a zajednički daju potpuni opis svih oblika u srednjocrkvenoslavenskim tekstovima.
Ključne riječi
dijakronijski korpus bugarskoga jezika; tražilica; specijalizirani program za Povijesni rječnik bugarskoga jezika; morfološko označivanje; gramatički rječnik srednjovjekovnoga bugarskoga
Hrčak ID:
206462
URI
Datum izdavanja:
6.10.2018.
Posjeta: 1.559 *