Skoči na glavni sadržaj

Pregledni rad

Mogućnost označiteljskih alata unutar mrežnog okvira za istraživanje hrvatske kulturne baštine

Mario Essert ; Fakultet strojarstva i brodogradnje Sveučilišta u Zagrebu


Puni tekst: hrvatski pdf 1.314 Kb

str. 53-73

preuzimanja: 224

citiraj


Sažetak

U radu je predstavljen mrežni okvir za čuvanje i obradbu dokumenata iz različitih kategorija hrvatske kulturne baštine (književnost, slikarstvo, arhitektura i dr.) pohranjenih u različitim medijima (digitalizirani rukopisi, tekst, slike, zvučni atlasi, filmovi...). Okvir omogućuje postavljanje kategoriziranog digitalnog zapisa s različitim obilježjima u vremensko-prostorne koordinate i pretraživanje po različitim kriterijima. Tekstni dokumenti, osim klasičnih (bibliotekarskih) podataka, mogu se pretraživati i po riječima koje oni sadrže te prikazivati u vremenskim trajektorijima, što omogućuje praćenje željenih riječi kroz stoljeća, od njihova nastanka do (eventualnog) iščeznuća i novih pojavaka. Za sintaktično-semantička označivanja izgrađen je vizualni editor TEIMark, a za označivanja slika (npr. digitaliziranih rukopisa) načinjen je program DocMark. Oba editora omogućuju postavljanje vizualnih oznaka (tagova) iznad informacije (teksta ili slike) u nizu slojeva, koji se mogu po želji sakriti, prikazati ili spremiti u XML/TEIzapisu. Svaki dokument može imati svoj skup trojaca (triplets), koji se onda preko baze Virtuoso triplestore može pretraživati naredbama SparQL. Mrežni okvir prati i dodatni razvojni sustav za lingvističku obradu teksta, kao i program koji iz rečenica teksta izvlači s-p-o-informaciju prema korisnički definiranim uzorcima. Razvojni sustav omogućuje poluautomatsko stvaranje abecedarija i rječnika te njihovo povezivanje preko linked data unutar definicija i natuknica na postojeće online-rječnike. To je temelj budućeg ontologijskog povezivanja ovakvih podatka (LOD) u globalni mrežni oblak.

Ključne riječi

alati za vizualno označivanje; semantički okviri; izvlačenje informacije; jezikoslovni i kulturološki povezani podaci

Hrčak ID:

164436

URI

https://hrcak.srce.hr/164436

Datum izdavanja:

1.12.2015.

Podaci na drugim jezicima: engleski

Posjeta: 800 *