Skip to the main content

Review article

Mogućnost označiteljskih alata unutar mrežnog okvira za istraživanje hrvatske kulturne baštine

Mario Essert ; Faculty of Mechanical Engineering and Naval Architecture, University of Zagreb, Zagreb, Croatia


Full text: croatian pdf 1.314 Kb

versions

page 53-73

downloads: 235

cite


Abstract

U radu je predstavljen mrežni okvir za čuvanje i obradbu dokumenata iz različitih kategorija hrvatske kulturne baštine (književnost, slikarstvo, arhitektura i dr.) pohranjenih u različitim medijima (digitalizirani rukopisi, tekst, slike, zvučni atlasi, filmovi...). Okvir omogućuje postavljanje kategoriziranog digitalnog zapisa s različitim obilježjima u vremensko-prostorne koordinate i pretraživanje po različitim kriterijima. Tekstni dokumenti, osim klasičnih (bibliotekarskih) podataka, mogu se pretraživati i po riječima koje oni sadrže te prikazivati u vremenskim trajektorijima, što omogućuje praćenje željenih riječi kroz stoljeća, od njihova nastanka do (eventualnog) iščeznuća i novih pojavaka. Za sintaktično-semantička označivanja izgrađen je vizualni editor TEIMark, a za označivanja slika (npr. digitaliziranih rukopisa) načinjen je program DocMark. Oba editora omogućuju postavljanje vizualnih oznaka (tagova) iznad informacije (teksta ili slike) u nizu slojeva, koji se mogu po želji sakriti, prikazati ili spremiti u XML/TEIzapisu. Svaki dokument može imati svoj skup trojaca (triplets), koji se onda preko baze Virtuoso triplestore može pretraživati naredbama SparQL. Mrežni okvir prati i dodatni razvojni sustav za lingvističku obradu teksta, kao i program koji iz rečenica teksta izvlači s-p-o-informaciju prema korisnički definiranim uzorcima. Razvojni sustav omogućuje poluautomatsko stvaranje abecedarija i rječnika te njihovo povezivanje preko linked data unutar definicija i natuknica na postojeće online-rječnike. To je temelj budućeg ontologijskog povezivanja ovakvih podatka (LOD) u globalni mrežni oblak.

Keywords

alati za vizualno označivanje; semantički okviri; izvlačenje informacije; jezikoslovni i kulturološki povezani podaci

Hrčak ID:

164436

URI

https://hrcak.srce.hr/164436

Publication date:

1.12.2015.

Article data in other languages: english

Visits: 833 *