Skoči na glavni sadržaj

Prethodno priopćenje

https://doi.org/10.31784/zvr.3.1.7

INTRODUCTION TO THE FORMALIZATION OF DATA MODELING METHOD

Sabrina Šuman orcid id orcid.org/0000-0003-3805-7435 ; Veleučilište u Rijeci,
Alen Jakupović orcid id orcid.org/0000-0003-0957-8143 ; Veleučilište u Rijeci,
Dijana Liverić ; Veleučilište u Rijeci,


Puni tekst: hrvatski pdf 274 Kb

str. 73-81

preuzimanja: 682

citiraj

Preuzmi JATS datoteku


Sažetak


This article provides an overview and a description of problem areas of an ongoing research. It will start with the
presentation of the complexity of the information systems development, the stages of its development, the participants
of the process and it will also provide an overview of known issues in this area. Stages that are closely related to this
research, a part of the analysis phase and phase design are discussed citing some of the class methods that result in a
certain artifact within the phase. Since one of the problems cited is a lack of formalized knowledge needed to create the
data model, the paper presents an overview of existing concepts of different methods of entities and links that can be
supplemented and modified by further research. The aim is to propose a possible selection of concepts of the given
methods which can be used to create a conceptual modeling grammar for the purpose of building a conceptual model and a
gradual evolution in the logical and physical model. The artifact which is particularly considered as a possible domain
and codomain of grammar action is the data dictionary.

Ključne riječi

data modeling; methods of entities; relationships; dictionary data; a conceptual model

Hrčak ID:

139707

URI

https://hrcak.srce.hr/139707

Datum izdavanja:

21.5.2015.

Podaci na drugim jezicima: hrvatski

Posjeta: 2.598 *




1. UVOD

Predmet istraživanja čiji je uvod zabilježen ovim radom jesu metode modeliranja podataka u fazi oblikovanja razvoja informacijskih sustava. Sljedeći problemi koji su uočeni u području razvoja informacijskih sustava, a tiču se faza analize i oblikovanja, ujedno su i motivacija za istraživanje koje je u tijeku:

• složenost procesa prevođenja modela procesa u model podataka

• značajna količina utrošenog vremena projektanta

• nedostatak formaliziranog znanja potrebnog za izradu modela podataka

• nepostojeća ili nedovoljna formalizacija znanja o izradi modela podataka neophodnog u računalno podržanom sustavu

• mogućnost izrade pogrešnog modela podataka

• moguća niska učinkovitost (vrijeme, novac i ostali resursi) prevođenja modela procesa u model podataka

• moguća niska djelotvornost (povećana varijabilnost) izrađenog modela podataka.

Na osnovi opaženih problematika postavljeno je niz istraživačkih pitanja na koja će se nastojati dati odgovor tijekom istraživanja:

• Kako povećati učinkovitost (vrijeme, novac i ostali resursi) prevođenja modela procesa u model podataka?

• Kako povećati djelotvornost i smanjiti varijabilnost izrađenog modela podataka?

• Kako da sustav pokaže da predloženi model podataka podržava procese iz modela procesa?

• Kako da sustav verificira/ validira gotov (projektantov) model podataka s obzirom na dani model procesa

• Što su sve ulazi u proces izrade modela podataka?

• Koja je metoda modeliranja podataka pogodna za formalizaciju znanja o načinu modeliranja podataka?

• Kako pojednostaviti proces prevođenja modela procesa u model podataka?

• Kako automatizirati taj prijelaz?

• Kako smanjiti vremensko trajanje (radni sati projektanta) prevođenja modela procesa u model podataka?

• Kako dostići određen stupanj formalizacije ulaza za izgradnju modela podataka?

Na temelju uočene problematike te postavljenih znanstvenih pitanja postavljaju se sljedeće hipoteze istraživanja:

• Moguće je izgraditi inteligentni sustav za podršku dizajnu informacijskoga sustava.

• Inteligentnim sustavom za podršku dizajnu informacijskih sustava moguće je povećati učinkovitost procesa dobivanja modela podataka iz modela procesa.

• Moguće je izgraditi formalni prikaz znanja koji će sustav koristiti u izradi modela podataka.

• Moguće je izraditi formalizirani ulaz u proces izrade modela podataka.

• Odabrana metoda modeliranja podataka pogodna je za formalizaciju znanja o načinu modeliranja podataka.

Kao svrha istraživanja navodi se predlaganje rješenja uočenih problema, a konačni cilj istraživanja je izgradnja inteligentnog sustava za podršku dizajnu informacijskog sustava (modeliraju podataka i/ili arhitekturi programskoga rješenja). Ovim se radom opisuje područje razvoja informacijskog sustava i procesa modeliranja podataka te se daje pravac nastavka istraživanja temeljen na formalnim jezicima. U prvom dijelu rada se daje pregled kompleksnosti razvoja informacijskih sustava, kroz navođenje faza i sudionika razvoja. Slijedi opisivanje modela procesa u fazi analize te ključnih aktivnosti u fazi oblikovanja. Od svih metoda modeliranja podataka pobliže je analizirana metoda entiteta i veza kroz pregled koncepata različitih autorskih varijanti te metode. Analiziran je artefakt rječnika podataka te opisana mogućnosti stvaranja gramatike konceptualnog modeliranja za izgradnju konceptualnog modela podataka te eventualnu evoluciju u logički i/ili fizički model. Na slici 1 je dan dijagram modela podataka koncepta metodologije istraživanja.

Slika 1. Model podataka koncepta metodologije istraživanja
zbornik-veleri-3-73-g1.png

Izvor: autori

2. PREGLED PODRUČJA RAZVOJA INFORMACIJSKIH SUSTAVA

U poimanju i ovladavanju kompleksnosti informacijskog sustava, ali općenito i bilo kojeg složenog inženjerskog proizvoda, može pomoći Zachmanov okvir arhitekture informacijskog sustava. Tijekom razvoja, arhitektura se informacijskog sustava opisuje skupom različitih artefakata kao što su modeli definicije, specifikacije, nacrti i ostala dokumentacija koja opisuje sustav, a nije sam sustav (Zachman, 1987). Artefakti se koriste prilikom razvoja i održavanja jer opisuju funkcionalne i fizičke karakteristike informacijskog sustava. Zachmanov okvir razmatra razvoj informacijskog sustava kroz dimenziju karakteristike informacijskog sustava i dimenziju uloge sudionika u razvoju sustava. U tablicama1 i2 istaknute su komponente tih dimenzija s prigodnim opisima.

Tablica 1. Karakteristike informacijskog sustava
Karakteristika proizvodaOpis za proizvod informacijski sustav
Struktura (statika)Poslovni objekti implementirani kao podaci u bazi podataka
Aktivnost (dinamika)Poslovni procesi implementirani kao računalni programi ili manualne procedure
Mjesto korištenjaMjesta pohrane ili obrade podataka
Korisnik proizvodaKorisnici informacijskog sustava
Vrijeme korištenjaPoslovni događaji koji pokreću poslovne procese
Motivacija za razvojOstvarenje nekog poslovnog cilja

Izvor: Panian, Ćurko (2010), obrada autora

Prva dimenzija opisuje karakteristike proizvoda - informacijskog sustava, a dobivena je odgovorima na pitanja što, kako, gdje, tko, kada i zašto.

Druga dimenzija opisuje uloge (perspektive) sudionika u razvoju informacijskog sustava, opisuje svrhu razvoja i navodi artefakte kojom uloge opisuju proizvod (tablica 2)

Svaka uloga odgovara jednoj fazi u razvoju proizvoda pa tako uloga planera odgovara fazi planiranja razvoja (zašto treba proizvod), uloga analitičara odgovara analizi potreba i definiranju zahtjeva koji se postavljaju pred proizvod (što treba biti proizvod), uloga dizajnera odgovara fazi dizajna, odnosno oblikovanja proizvoda (kako proizvod treba biti izveden), uloga izvođača i podizvođača odgovara fazi izrade proizvoda.

Tablica 2. Uloge sudionika tijekom razvoja informacijskog sustava
Uloga u razvoju/faza razvojaSvrha razvojaartefakti
Planer/planiranjeKoncept (ideja,svrha) proizvodaKoncept proizvoda (kontekstualni model)
Analitičar/analizaSpecifikacija proizvoda prema zahtjevima vlasnikaPoslovni model proizvoda (konceptualni model)
Dizajner/oblikovanjeOblikovanje (dizajn) proizvoda prema prethodnoj specifikacijiDizajnerski model sustava (logički model)
Izvođač/izradaProizvedeni proizvodTehnološki model (fizički) model
Podizvođač/izradaProizvedena komponenta proizvodaKomponentni model (fizički podmodel)

Izvor: Panian, Ćurko (2010), obrada autora

Planer, analitičar i dizajner i izvođač (programer) su stručnjaci koji s različitih perspektiva pristupaju problemu podataka informacijskog sustava. Dok planer propisuje glavne poslovne objekte u poslovnom sustavu o kojima će se u informacijskom sustavu bilježiti podaci, analitičar detaljno (i u suradnji s korisnikom) analizira poslovanje i utvrđuje koji entiteti (objekti), s kojim atributima i kojom strukturom najbolje opisuje poslovanje,dizajner oblikuje strukturu tablica u kojima će se pohraniti podaci entiteta koje je utvrdio analitičar, a izvođač (u ovom slučaju administrator baze podataka) razrađuje strukturu zapisa podataka u prostoru baze podataka. Kao što se može primijetiti, u početnim fazama planer i analitičar utvrđuju što će biti podaci, dizajner utvrđuje kako će podaci biti logički pohranjeni, a izvođač razrađuje kako će biti fizički pohranjeni. Ovo pokazuje da se kompleksan problem izrade baze podataka informacijskog sustava raščlanjuje na manje i logički odvojene probleme (problem prepoznavanja podataka, problem logičkog rasporeda podataka, problem fizičke pohrane podataka) koje je lakše pojedinačno rješavati.

Okvir za arhitekturu informacijskog sustava je opća klasifikacijska shema artefakata informacijskog sustava. On može poslužiti projektantima informacijskog sustava pri određivanju potrebnih artefakata kojima će opisati informacijski sustav tijekom njegova razvoja. Naime. ne postoji univerzalan popis artefakata informacijskog sustava jer je svaki informacijski sustav jedinstven (unikatan) i razlikuje se od drugih po opsegu, strategiji, ciljevima, djelatnosti unutar kojeg se gradi itd.

Okvir omogućuje da se sudionici razvoja informacijskih sustava usredotoče na pojedini aspekt sustava, a da pritom ne izgube iz vida cjelinu sustava. Prilikom razvoja previše je elemenata koje treba istovremeno pratiti, a pritom se nijedan element ne može promatrati i razvijati izolirano bez uvažavanja ostalih elemenata s kojima je povezan. Okvir pomaže da se uoči i svlada kompleksnost informacijskih sustava holističkim (cjelovitim) pogledom na sustav i da se pozornost u razvoju usredotoči na pojedini element. To olakšava razumijevanje sustava i komunikaciju među sudionicima razvoja sustava (Panian, Ćurko, 2010).

Budući da se istraživanje prvenstveno tiče faze oblikovanja i dijelom analize, ulogama analitičara i dizajnera navest će se osnovna podjela faza te definicije nekih bitnih pojmova. Proces razvoja informacijskog sustava sastoji se od mnogobrojnih aktivnosti koje se mogu grupirati u klase sličnih aktivnosti - faze, a tri su osnovne faze: projektiranje, izgradnja i održavanje. Pod projektiranjem (analizom, oblikovanjem - dizajnom) podrazumijevaju se sve misaone aktivnosti potrebne da se pristupi fizičkoj izgradnji (implementaciji) sustava na ICT. Cilj je projektiranja informacijskog sustava izgraditi modele (nacrte, zamisli, skice, vizije) na osnovi kojih će se razviti sustav.

Modeli razvoja su opće ideje o mogućim putovima razvoja informacijskog sustava. Metodologije su intelektualni proizvodi koji uključuju ideje iz više različitih modela i sadrže vlastite ideje o redoslijedu modeliranja te imaju detaljno razrađen i opisan postupak modeliranja informacijskog sustava. Metodologije detaljnije opisuju faze razvoja i aktivnosti pojedine faze na najnižoj potrebnoj razini detalja. Za svaku je aktivnost određena metoda ili postupak kojom se aktivnost izvodi, te kvaliteta izlazne dokumentacije (Pavlić, 2009).

3. MODELIRANJE PODATAKA

Tijekom faze analize korisnički zahtjevi se specificiraju (otkrivaju i zapisuju). U analizi se doznaje što treba poslovnoj organizaciji. Nakon analize slijedi oblikovanje (modeliranje podataka, engl. design) informacijskog sustava. Oblikovanje informacijskih sustava je proces pomoću kojega se na osnovi zahtjeva iz faze analize definiraju osnovni dijelovi informacijskih sustava i prikazuju detaljnije veze među dijelovima sustava na način neovisan o implementaciji. Faza oblikovanja sastoji se od: oblikovanja odnosa među podacima (semantika sustava), oblikovanja baze podataka, oblikovanja arhitekture programskog proizvoda. Prva dva oblikovanja nazivaju se i modeliranje podataka. Metoda za definiranje podataka je definirani postupak nalaženja i prikazivanja informacijskih objekata i njihova međusobnog odnosa.

Primjenom procesa modeliranja podataka zasnovanog na nekoj metodi kao rezultat se dobiva model podataka. Model podataka konstruiraju dizajneri (projektanti informacijskih sustava), a potvrdu njegove ispravnosti daju krajnji korisnici. Model podataka služi za prikaz dijelova sustava i njihovih odnosa. On je osnova za kreaciju sheme baze podataka i definiranje oblika arhitekture programskog proizvoda. Model podataka sadrži 3 važna koncepta: entitete, atribute (svojstva, karakteristike) entiteta i veze među entitetima (Pavlić, 2011).

Model podataka opisuje statičnu informacijsku strukturu preko entiteta i njihovih veza. Konceptualni, logički i fizički model tri su evolucijske etape modeliranja podataka od kojih svaka pojedina faza nadograđuje model podataka s određenim brojem detalja, optimizirajući ga za implementaciju. Ova struktura često je predstavljena grafički s dijagramom entiteta i veza ili UML dijagramom klasa (Merson, 2009).

3.1. Metoda entiteti - veze

Slijedi nakon faze analize i koristi DTP kao ulaz, prikazuje međusobno povezane podatke promatranog sustava, grafički prikazuje skupine podataka, semantički je bogata, raspolaže ljudski bliskim konceptima, prirodno opisuje poslovne organizacije, shema modela podataka laka je za razumijevanje, omogućuje komunikaciju projektanta i korisnika. EV se koristi u mnogim metodologijama kao što su CASE*Method, MIRIS, SSADM, IEM. Dijagram strukture modela podataka, odnosno shema baze podataka, načinjen metodom EV, naziva dijagram entiteti-veze, DEV (engl. entity-relationship Diagram, ERD), (Pavlić, 2009).

Dijagrami entiteta i veza osmišljeni su prvotno kao sredstvo brzog dobivanja ideje o strukturi baze podataka. Koriste se za planiranje i oblikovanje baze podataka i modeliranje podataka sustava. Budući da on implicira procese ali ih ne pojašnjava, zajedno s dijagramima toka podataka, EV model daje projektantu mogućnost alternativnog logičkog pogleda na sustav (Davis, Yen, 1998).

3.2. Relacijska metoda

Druga važna metoda za modeliranje podataka i organizaciju baze podataka je relacijska metoda. Metoda EV prikazuje poslovnu organizaciju, njezine dijelove, veze među dijelovima i atribute dijelova. Relacijska metoda prikazuje organizaciju podataka u datoteke na računalu. Ona je bliža računalima, a dalje od poslovne organizacije. Metoda EV je suprotna, bliža je opisu i prikazu znanja o poslovnoj organizaciji. Relacijska metoda (engl. Relational method, RM) ponekad se naziva i relacijski model podataka, metoda je za modeliranje podataka u skladu s pravilima organizacije relacijskih baza podataka. Relacijska (tablična) baza podataka je baza podataka koja se temelji na matematičkom pojmu relacije (engl. Relation), a sastavljena je od pravokutnih tablica od kojih svaka prikazuje određenu relaciju (Pavlić, 2009).

4. KONCEPTI RAZLIČITIH METODA ENTITETA I VEZA

Autori literature vezane uz područje razvoja softvera i oblikovanja baza podataka i Case alati koriste različite DEV notacije, što stvara poteškoće kod usvajanja znanja i vještina potrebnih projektantima početnicima. Iz istog je razloga otežan prijenos i razumljivost pojedinih DEV-a između autora, a moguće i članova dislociranih timova. Modeliranje nekom metodom koristeći postojeći CASE alat ovisno je o znanju i vještini projektanta, što izravno utječe na identificirane probleme istraživanja u uvodu ovoga rada.

Istraživanjem u radu Songa i koautora (Song et al., 1995) nakon analize 10 koncepata s notacijama ustanovilo se da se DEV notacije razlikuju po sljedećim točkama:

1) dopuštaju li se n-arne veze ili ne

2) način na koji se predstavljaju ograničenja kardinalnost i participacija, notacije minimuma i maksimuma

3) mjesto gdje se označavaju ograničenja („Look across“ i „Look Here“)

4) postoji li atribut veze

5) postojanje vanjskog ključa na DEV-u

6) kako se prikazuju preklapajući i disjunktni podtipovi entiteta

7) kako je prikazano ograničenje kompletna i parcijalna specijalizacija.

Između svih notacija koje su analizirane, Elmasri i Navathe notacija semantički je najbogatija (misli se na koncepte i ograničenja modeliranja). Cilj članka Song i koautori (1995) bio je sumiranje različitih korištenih DEV koncepata i notacija koncepata, kako bi se njihove značajke lakše usporedile, razumjele i omogućile konverziju EV dijagrama različitih notacija. U ovom smislu formalizacije metoda modeliranja podataka nastavit će se i započeto istraživanje.

5. RJEČNIK PODATAKA

Kroz faze modeliranja podataka potrebno je detaljno dokumentirati imena, definicije, opise, svojstva, veze, ključeve objekata u modelu, koristeći neki gotov alat za dokumentiranje ili stvaranje vlastitog obrasca, primjerice, tabličnog xls-a. Rječnik podataka (engl. Data dictionary) je tekstualni opis svih objekata i veza. Svrha rječnika podataka je potvrda o posjedovanju svih potrebnih podataka da se ispune zahtjevi i služi developerima baza podataka da stvore i održavaju sustave baza podataka (ttps://www.liberty.edu).

Na dijagramu toka podataka svaki podatkovni element, spremište podataka i tok podataka moraju biti spremljeni u rječnik podataka i svaki proces mora imati odgovarajući opis. U rječniku svaka logička podatkovna struktura mora odgovarati ili toku podatka ili spremištu podataka i svaki podatkovni element mora se pojaviti barem jedanput na dijagramu toka podatka. Pored toga, svaki se podatkovni element i svaka logička struktura podatka mora pojaviti na ulaznoj ili izlaznoj listi od barem jednog opisa procesa. Svaki podatkovni element koji ulazi ili izlazi iz procesa mora se zabilježiti u rječniku.

Rječnik podataka je kolekcija podataka o podacima. Svrha mu je iscrpno definirati svaki podatkovni element, strukturu podataka i transformaciju podataka. On pomaže poboljšati komunikaciju između analitičara i korisnika i između tehničkog osoblja ustanovljavajući skup konzistentnih definicija o podacima. Zajednički skup definicija o podacima pomaže izbjeći nesporazume ako se sustav povezuje ili komunicira s drugim sustavom. Ističući već postojeće podatkovne elemente pomaže projektantu da izbjegne redundanciju. Prvi korak u stvaranju rječnika podataka je identificirati podatkovne elemente i strukture, a to je i cilj u fazi prikupljanja informacija. Rječnik podataka bitna je dopuna nekih alata analize i oblikovanja, kao DTP-a ili DEV-a (Davis,Yen, 1998).

6. POJMOVI VEZANI ZA KONCEPTUALNO MODELIRANJE

Konceptualno modeliranje fokusira se na konceptualne aspekte neke domene i za razliku od modeliranja baze podataka izuzima razmatranja vezana uz oblikovanje i implementaciju. Autori Burton-Jones et al. (2009) naglašavaju aktualnost istraživanja vezanih uz evaluaciju gramatike konceptualnog modeliranja, kao npr. gramatika entiteta - veza ili notacije modeliranja poslovnih procesa (Siau, Rossi, 2009). Cilj članka Burton-Jonesa et al. (2009) je povećati utjecaj gramatike na stvaranje kvalitetnih skripti konceptualnog modeliranja. Pojmovi koji se pojavljuju u ovom pravcu istraživanja su: gramatika konceptualnog modeliranja, produkcijsko pravilo, skripte konceptualnog modeliranja, jezik konceptualnog modeliranja.

Vezano uz to, s gramatikom konceptualnog modeliranja istraživanje sintakse može uključivati ispitivanje valjanih načina na koji skripte mogu biti stvorene koristeći gramatiku ili ispitivanje alternativnih načina na koje individue formiraju skripte koristeći gramatiku (npr. ispitivanje efekta različitog raspoređivanja gramatičkih koncepata na dijagramu ili efekata korištenja imenica za označavanje entiteta i glagola za veze kad se kreira DEV). U ovom će se smjeru nastaviti istraživanje čiji je uvod ovaj rad.

7. ZAKLJUČAK

U ovom radu daje se uvod za izgradnju konceptualnog razvojnog okvira istraživanja metoda formalizacije koncepata modela podataka koji će omogućiti izgradnju sustava za potporu procesu modeliranja podataka. Definiran je predmet istraživanja, uočena je problematika na temelju koja su postavljena znanstvena pitanja te formulirane hipoteze, te je dana svrha i cilj istraživanja. Naveden je kontekst, područje povezano s predmetom istraživanja - razvoj informacijskih sustava, te pobliže faza oblikovanja - dizajna. Dan je opis klase metoda, najčešće korištenih za modeliranje podataka, metoda entiteta i veza te relacijska metoda. Kako je trenutno istraživanje u fazi nastojanja sistematiziranja -formaliziranja metoda modeliranja podataka, dan je postojeći pregled klase metoda (entiteti i veze) i njenih autorskih varijanti. Na kraju je dan pravac metodologije istraživanja, a kao dva bitna pojma ističu se rječnik podataka i gramatika konceptualnog modeliranja.

References

1 

Burton-Jones, A., Wand, Y., Weber, R. (2009) „Guidelines for Empirical Evaluations of ConceptualModeling Grammars“, Journal of the Association for Information 496 Systems, Volume 10, Issue 6, pp. 495-532 .

2 

Davis, W. S., Yen, D. C. (1998) The Information System Consultant's Handbook: Systems Analysis and Design, CRC Press, Boca Raton .

4 

Merson, P. (2009) Data Model as an Architectural View, technical note, Copyright Carnegie Mellon University,Hanscom, Massachusetts .

5 

Panian, Ž., Ćurko, K. (2010) Poslovni informacijski sustavi, Zagreb: Sveučilište u Zagrebu .

6 

Pavlić, M. (2011) Oblikovanje baza podataka, Rijeka: Odjel za informatiku Sveučilišta u Rijeci .

7 

Pavlić, M. (2009) Informacijski sustavi, Rijeka: Odjel za informatiku Sveučilišta u Rijeci .

8 

Siau, K., Rossi, M. (2011) „Evaluation techniques for systems analysis and design modelling methods – A review and comparative analysis“, Information Systems Journal, vol. 21, no. 3, pp. 249-268 .

9 

Song, I. Y., Evans, M., Park, E. K. (1995) „A Comparative Analysis of Entity-Relationship Diagrams“, Journal of Computer and Software Engineering, Vol. 3, No.4, pp. 427-459 .

10 

Zachman, J. A. (1987) „A framework for information system architecture“, IBM Systems Journal vol 26, No 3 .


This display is generated from NISO JATS XML with jats-html.xsl. The XSLT engine is libxslt.