Skip to the main content

Review article

https://doi.org/10.21857/yrvgqtkj39

Dijakronijski korpus bugarskoga jezika: trenutno stanje i perspektive

Анна Марија Тотоманова ; Софийски университет «Св. Климент Охридски»


Full text: russian pdf 2.136 Kb

page 223-242

downloads: 628

cite


Abstract

U članku se iznosi povijest stvaranja Dijakronijskoga korpusa bugarskoga jezika i digitalnih alata za obradu srednjovjekovnih crkvenoslavenskih tekstova potrebnih za izradu Povijesnoga rječnika bugarskoga jezika na svemrežju. Dijakronijski korpus uključuje tekstove različitih žanrova kojima je dokazano bugarsko podrijetlo. Korpus je zasnovan na vlastitom programu koji omogućuje primjereno komentiranje s paleografske, kodikološke i tekstološke točke gledišta. Tekstovi su digitalno tipizirani s pomoću posebno konstruiranih starocrkvenoslavenskih UTF fontova. Trenutno imamo na raspolaganju tri fonta i pretvarač koji prethodno tipizirane tekstove koji nisu u Unicodeu prenosi u dokumente u Unicodeu. Do sada je u korpusu objavljeno više od 130 tekstova, a još ih je u postupku pripreme za prijenos na mrežne stranice. Korpus se nalazi na: http://histdict.uni-sofia.bg. Svaki je tekst uveden rubrikom koja sadrži podatke o njegovu izvoru, dataciji, izdanju, autoru ili autorima itd. Mrežne stranice uključuju i potpuno digitaliziranu inačicu Starocrkvenoslavenskoga rječnika (bug. Старобългарски речник), učinjenoga u Institutu za bugarski jezik BAS-a. Oboje, korpus i rječnik, objavljeni su kao izvori u otvorenom pris­tupu, s tim da je korisnicima dopušteno vidjeti samo potpuno uređene teks­tove.
Poseban je program stvoren za potrebe autora Povijesnoga rječnika bugarskoga jezika. S obzirom na činjenicu da je taj povijesni rječnik zasnovan na digitalnoj inačici Starocrkvenoslavenskoga rječnika, program omogućuje uređivanje postojećih natuknica i stvaranje novih. Također, izrađena je tražilica kojoj je svrha olakšati rad na novom rječniku. Nedavno smo se usredotočili na stvaranje morfološkoga označivača (eng. tagger), čiji je prototip također dostupan na mrežnim stranicama. Morfološki je označivač zasnovan na punom rasponu morfoloških oznaka te na gramatičkom rječniku srednjobugarskoga rječnika. Puni raspon morfoloških oznaka i gramatički rječnik također su dostup­ni na mrežnim stranicama, a zajednički daju potpuni opis svih oblika u srednjocrkvenoslavenskim tekstovima.

Keywords

dijakronijski korpus bugarskoga jezika; tražilica; specijalizirani program za Povijesni rječnik bugarskoga jezika; morfološko označivanje; gramatički rječnik srednjovjekovnoga bugarskoga

Hrčak ID:

206462

URI

https://hrcak.srce.hr/206462

Publication date:

6.10.2018.

Article data in other languages: russian

Visits: 1.559 *