Pregledni rad
Mogućnost označiteljskih alata unutar mrežnog okvira za istraživanje hrvatske kulturne baštine
Mario Essert
; Fakultet strojarstva i brodogradnje Sveučilišta u Zagrebu
Sažetak
U radu je predstavljen mrežni okvir za čuvanje i obradbu dokumenata iz različitih kategorija hrvatske kulturne baštine (književnost, slikarstvo, arhitektura i dr.) pohranjenih u različitim medijima (digitalizirani rukopisi, tekst, slike, zvučni atlasi, filmovi...). Okvir omogućuje postavljanje kategoriziranog digitalnog zapisa s različitim obilježjima u vremensko-prostorne koordinate i pretraživanje po različitim kriterijima. Tekstni dokumenti, osim klasičnih (bibliotekarskih) podataka, mogu se pretraživati i po riječima koje oni sadrže te prikazivati u vremenskim trajektorijima, što omogućuje praćenje željenih riječi kroz stoljeća, od njihova nastanka do (eventualnog) iščeznuća i novih pojavaka. Za sintaktično-semantička označivanja izgrađen je vizualni editor TEIMark, a za označivanja slika (npr. digitaliziranih rukopisa) načinjen je program DocMark. Oba editora omogućuju postavljanje vizualnih oznaka (tagova) iznad informacije (teksta ili slike) u nizu slojeva, koji se mogu po želji sakriti, prikazati ili spremiti u XML/TEIzapisu. Svaki dokument može imati svoj skup trojaca (triplets), koji se onda preko baze Virtuoso triplestore može pretraživati naredbama SparQL. Mrežni okvir prati i dodatni razvojni sustav za lingvističku obradu teksta, kao i program koji iz rečenica teksta izvlači s-p-o-informaciju prema korisnički definiranim uzorcima. Razvojni sustav omogućuje poluautomatsko stvaranje abecedarija i rječnika te njihovo povezivanje preko linked data unutar definicija i natuknica na postojeće online-rječnike. To je temelj budućeg ontologijskog povezivanja ovakvih podatka (LOD) u globalni mrežni oblak.
Ključne riječi
alati za vizualno označivanje; semantički okviri; izvlačenje informacije; jezikoslovni i kulturološki povezani podaci
Hrčak ID:
164436
URI
Datum izdavanja:
1.12.2015.
Posjeta: 1.202 *