Stručni rad
Poluautomatsko stvaranje priča/sadržaja za geografski poslužitelj
Rizwan Mehmood
; Graz University of Technology, Graz, Austria
Hermann Maurer
orcid.org/0000-0002-9956-2032
; Graz University of Technology, Graz, Austria
Sažetak
Većina postojećih poslužitelja koji nude geografske podatke sadrže brojčane podatke o različitim aspektima. Na rad na novom tipu geografskog poslužitelja potaknula su nas četiri glavna problema: (i) Kako se služiti brojkama kad različite baze podataka predstavljaju različite vrijednosti; (ii) Kako izgraditi velike zbirke slika s detaljnim opisima; (iii) Kako ažurirati informacije koje se brzo mijenjaju kao što su osobe na nekim važnim funkcijama te (iv) Kako opisati zemlje ne samo trivijalnim činjenicama, već tipičnim pričama za te zemlje. U prethodnim smo radovima raspravili i djelomično riješili probleme (i) i (ii). Odlučili smo riješiti (iii), regionalna ažuriranja, povezivanjem s međunarodnim konzorcijem čiji će članovi pomoći ili naći pojedince koji će to učiniti. Problemu (iv), kako stvoriti netrivijalne priče tipične za neku zemlju, pristupili smo ručno (konzorcij je do sada stvorio oko 200 priča) te razvijanjem tehnika za poluautomatsko stvaranje priča, što je tema ovoga rada. Osnovna je ideja bila prvo odrediti skupove pouzdanih poslužitelja koji se mogu razlikovati od regije do regije, izvući „zanimljive činjenice“ iz njih i spojiti ih u sirovu verziju izvještaja koja će se obraditi ručno (zato ga nazivamo poluautomatskim). Izdvajanje „zanimljivih činjenica“ s internetskih stranica može zvučati teško, no itekako je moguće odrediti heuristike koji će to učiniti, što nikad ne prelazi nekoliko redova za svrhu citiranja. Spomenimo kao primjer jedno vrlo jednostavno pravilo: Traži rečenice sa superlativima! Ako rečenica sadrži riječ kao što je „najveći“, „najviši“, „najimpresivniji“ i sl., ona vjerojatno sadrži neku zanimljivu činjenicu. S pomoću mašte uspjeli smo odrediti skup takvih pravila. Pokazat ćemo da priče mogu biti potpuno različite: u nekim zemljama dominiraju povijesne činjenice, u drugima ljepota krajolika, u trećima kulturna i ekonomska postignuća, u nekima neobične činjenice koje se odnose na dobitnike Nobelove nagrade, hranu, sport, druge aktivnosti, državne simbole, posebne zakone i sl. Dobiveni rezultati mogu se provjeriti traženjem bilo koje zemlje u kategoriji „Posebne informacije“ (Special Information) i „Iznenađujuće činjenice“ (Surprising Facts). Svi primjeri opisani u ovom radu uzeti su arbitrarno iz skupine od 190 primjera kako bi se prikazalo kako sustav radi. Važno je spomenuti još dvije stvari: (a) riječ je o radnoj verziji koja je već prilično upotrebljiva; (b) osnovne ideje mogu se primijeniti na bilo koje područje. Geografija je izabrana s obzirom na velik broj podataka i interesa za to područje. Ako su naši algoritmi previdjeli neku važu činjenicu, to je manje važno nego da smo primijenili metode na vrste liječenja ili slično tome.
Ključne riječi
stvaranje priča; geografski poslužitelj
Hrčak ID:
185928
URI
Datum izdavanja:
15.6.2017.
Posjeta: 1.885 *