SVEUĈILIŠTE U SPLITU EKONOMSKI FAKULTET DIPLOMSKI RAD „Implementacija „Business Intelligence“ sustava u Koncertnu dvoranu Vatroslava Lisinskog“ STUDENT: MENTORICA: Alen Stojanović dr. sc. Maja Ćukušić BROJ INDEKSA: 2112035 Split, kolovoz 2013. godine SADRŽAJ: 1. Uvod...............................................................................................................................3 1.1. Problem i predmet istraţivanja .................................................................................3 1.2. Istraţivaĉke hipoteze ................................................................................................5 1.3. Ciljevi istraţivanja ....................................................................................................6 1.4. Metoda istraţivanja ..................................................................................................7 1.5. Doprinos istraţivanja .............................................................................................. 11 1.6. Sadrţaj diplomskog rada......................................................................................... 12 2. Uloga BI sustava u kulturnim organizacijama ............................................................... 14 3. Predimplementacijska analiza ....................................................................................... 16 4. 3.1. Prikupljanje informacija ......................................................................................... 17 3.2. Analiza potreba korisnika ....................................................................................... 18 Odabir optimalne platforme za KDVL ..........................................................................19 4.1. Opis potencijalnih alata za provedbu projekata ....................................................... 19 4.1.1. JasperSoft BI suite........................................................................................... 19 4.1.2. MicroStrategy BI platform .............................................................................. 20 4.1.3. Pentaho BI platform ........................................................................................ 21 4.2. Rezultati višekriterijalne analize ............................................................................. 22 5. Projektne uloge ............................................................................................................. 26 6. Arhitektura sustava ....................................................................................................... 27 7. Razvoj i implementacija sustava ................................................................................... 28 7.1. Skladište podataka .................................................................................................. 28 7.1.1. Model skladišta podataka u KDVL .................................................................. 30 7.1.2. Ĉinjeniĉne tablice ............................................................................................ 32 7.1.3. Dimenzijske i pomoćne tablice ........................................................................ 34 1 7.2. 7.2.1. Izvori podataka................................................................................................ 38 7.2.2. Transformacija podataka ................................................................................. 41 7.2.3. Uĉitavanje podataka ........................................................................................ 43 7.3. 8. ETL upotrebom Kettle-a ......................................................................................... 37 Izvješćivanje ..........................................................................................................44 Zakljuĉak ...................................................................................................................... 46 8.1. Ograniĉenja i prepreke............................................................................................ 47 8.2. Koristi za menadţment ........................................................................................... 48 Literatura.............................................................................................................................. 49 Popis slika i tablica ............................................................................................................... 51 Saţetak ................................................................................................................................. 52 Summary .............................................................................................................................. 53 Zahvala ................................................................................................................................ 54 2 1. Uvod 1.1. Problem i predmet istraživanja Posljednja financijska kriza jedna je od najutjecajnijih faktora koji sprjeĉava organizacije da djeluju sukladno svojim ţeljama. Budući da se kriza razvijala sporo, i gospodarske su se aktivnosti istim tempom prilagoĊavale novonastalim uvjetima (Bokan, 2010).Budţeti unutar kojih se mora gospodariti sve su manji, a trţišni zahtjevi sve izazovniji. Ograniĉenja budţeta mogu predstavljati velike prepreke unaprjeĊenju poslovanja iz jednostavnog razloga koji se moţe opisati na naĉin da se sredstva predviĊena za investicije neprestano smanjuju, dok menadţment unutar neke organizacije oĉekuje ostvarenje zacrtanih ciljeva. Na opisani se naĉin kriza oĉituje u kompanijama koje se natjeĉu na trţištu i ostvaruju profite isto kao i u neprofitnim i kulturnim organizacijama poput Koncertne dvorane Vatroslava Lisinskog1. KDVL je neprofitna kulturna institucija smještena u Zagrebu, izgraĊena 1973. godine, koja se sastoji od više dvorana koje godišnje posjeti preko 700 000 posjetitelja, te kao takva zahtjeva kompleksno upravljanje s obzirom na svoju veliĉinu i ulogu u gradu Zagrebu (Lisiĉić, 1993). Budţeti s kojima ova dvorana raspolaţe većim se djelom financiraju iz gradskog proraĉuna a manjim djelom ostvarenjem vlastitih prihoda, meĊutim, bez obzira na znanje, trud i iskustvo menadţmenta dvorane, ti budţeti trenutno ne omogućuju kapitalne i dugoroĉne investicije u IT2infrastrukturu unutar dvorane već se budţetom na racionalni naĉin gospodari te se operativnom poslovanju pridjeljuju prioriteti. U ovakvoj se situaciji najĉešće smanjuju troškovi ostalih investicija, pa je o takvom sluĉaju i ovdje rijeĉ. Iako se s vremenom stvari polako mijenjaju, opće je poznato da su u IT industriji proizvodi i usluge relativno skuplji nego u ostalim industrijama što je, s obzirom na tehnološke zahtjeve i specifiĉna znanja ljudi koja ova industrija zahtjeva, logiĉno i razumno. Budući da implementacija sustava poslovne inteligencije u KDVL zahtjeva odreĊenu softversku podršku, KDVL kao neprofitna organizacija trenutno nije u mogućnosti plaćati skupe licence za komercijalne tehnologije koje se koriste u podruĉju poslovne inteligencije. Iz tog se razloga cijeli projekt mora orijentirati na besplatne i svima dostupne tehnologije. Ovakvo je 1 2 Termin Koncertna dvorana Vatroslav Lisinski će se radi jednostavnosti u daljnjem tekstu oznaĉavati kao KDVL Informacijske tehnologije 3 ponašanje u posljednje vrijeme sve popularnije i sve prihvatljivije u mnogim industrijama i poslovnim podruĉjima diljem svijeta. Na taj se naĉin besplatni alati sve više istiĉu kao kvalitetna opcija komercijalnim softverima. Javnosti su dostupni mnogi besplatni i „open source“ alati putem interneta. „Open source“ alati su softveri izraĊeni po modelu otvorenog koda, odnosno, izvorni programski kod alata je objavljen, besplatan i dostupan svim korisnicima softvera. Ovakvi alati najĉešće sa sobom povlaĉe i uvjete korištenja izvornog koda prema kojima se korisnicima dozvoljava njegova redistribucija i modifikacija prema ograniĉenjima koje je propisao sami proizvoĊaĉ (Hiong, 2005). U pogledu projekta implementacije „business intelligence“ sustava 3u KDVL u okvir potencijalnih besplatnih alata ušlo je njih tri koji su analizirani istraţivanjem. Prema gore navedenom, predmet ovog istraţivanja je da se kvalitetnom analizom usporede mogućnosti i funkcionalnosti besplatnih alata za integraciju podataka i izvještavanje. Ovakav skup mogućnosti nekog alata u praksi se ĉesto naziva platforma. Nakon istraţivanja dobit će se jasni rezultati prema kojima će se odluĉiti koja će se platforma koristiti na projektu implementacije BI sustava u KDVL. Isto tako do izraţaja će doći mogućnosti svakog pojedinog alata te njegova prilagodljivost temeljem koje će se zadovoljiti sve potrebe ovakvog sustava. 3 Termin „business intelligence“ sustav će se radi jednostavnosti u daljnjem tekstu oznaĉavati kao BI sustav 4 1.2. Istraživačke hipoteze Nakon utvrĊivanja poĉetnih faza istraţivanja kao što su predmet, problem i opseg istraţivanja, potrebno je utvrditi istraţivaĉku hipotezu. Hipoteza predstavlja predloţenu razumnu pretpostavku istraţivaĉa ili predloţeno objašnjenje fenomena, a temelji se na opaţanjima ili prethodnim saznanjima. Termin vuĉe korijene iz grĉkog jezika gdje rijeĉ hypotithenai znaĉi pretpostaviti (Zelenika, 1998). U ovom se istraţivanju koristi samo jedna hipoteza koju je cilj prihvatiti, odnosno dokazati. Ukoliko provedeno istraţivanje potvrdi da istraţivaĉka hipoteza nije istinita,daljnji se tijek projekta odvija u skladu sa rezultatima istraţivanja. Kao što je u prethodnom poglavlju opisano, predmet ovog istraţivanja je analiza besplatnih BI alata dostupnih putem interneta. Na temelju analize potrebno je dokazati sljedeću istraţivaĉku hipotezu: H0 . . . . . Pentaho Bi platform je besplatna platforma koja najbolje odgovara zahtjevima KDVL u implementaciji sustava poslovne inteligencije. Vidljivo je da istraţivanje sadrţi samo jednu hipotezu iz razloga što se kao rezultat istraţivanja oĉekuje upravo naziv alata kojeg je optimalno koristiti na projektu. Ovako postavljena hipoteza je jasno i jednoznaĉno predstavljena izjavnom reĉenicom te kao takva ne ostavlja prostora za nejasnoće u provedbi istraţivanja, odnosno, ova reĉenica istraţivanjem moţe biti potvrĊena ili odbaĉena. 5 1.3. Ciljevi istraživanja Svako istraţivanje provodi se sa jasnim ciljem. Općenito, ciljem istraţivanja smatra se odreĊeno definiranje, predviĊanje ili objašnjenje poĉetnih pretpostavki (Hale, 2011). Ukoliko se odmaknemo od širine pojma cilja i promatramo ga iz uţe perspektive ovog projekta, cilj ovog istraţivanja je sljedeći; iz mnoštva raznolikih besplatnih platformi potrebno je odabrati upravo onu koja u najvećoj mjeri zadovoljava potrebe KDVL i koja će se ujedno moći koristiti bez obzira na prethodna predznanja o tome alatu. Drugim rijeĉima, potrebno je izabrati alat s kojim je jednostavno rukovati, a da svojim funkcionalnostima ne odudara od komercijalnih alata. TakoĊer, kao cilj ovog istraţivanja moţe se smatrati i upotreba najboljih praksi u radu na projektima s besplatnim alatima, koje se uoĉe tokom analize i same provedbe istraţivanja. Promatrajući ovo istraţivanje iz šire perspektive, odmicanjem od samog projekta, ovo istraţivanje ima i dodatni znaĉaj. Rezultat ovog istraţivanja moţe se primijeniti i u ostalim kulturnim i neprofitnim organizacijama budući da je većina kriterija korištenih pri analizi karakteristika upravo takvih organizacija. 6 1.4. Metoda istraživanja Uzimajući u obzir karakteristike i oblik ovog rada, za provedbu istraţivanja koristi se višekriterijalna analiza provedena po metodi „analitiĉkog hijerarhijskog procesa“4. Višekriterijalna analiza se odnosi na situacije u kojima je potrebno donijeti odluku na temelju više razliĉitih kriterija koji su ponekad u konfliktu. Spoznaja da se meĊusobno konfliktni kriteriji mogu smisleno vrednovati, ovu metodu ĉini veoma realnom i povjerljivom. AHP metoda jedna je od najpopularnijih i najĉešće korištenih metoda za provedbu višekriterijalne analize. Nastala je na sveuĉilištu u Pensilavaniji i razvio ju je znanstvenik Thomas Saaty te je iz tog razloga takoĊer popularna pod nazivom „Saaty“ metoda (Coyle, 2004). Ova se metoda provodi na naĉin da istraţivaĉu dopušta definiranje prioriteta kriterija i davanju težine koju će odreĊeni kriteriji imati u konaĉnoj odluci. Prednost ovakvog pristupa je što se izbor stvara na temelju objektivnosti, znanja i iskustva što pridonosi najpovoljnijem rezultatu. AHP (Saaty, 1980) spada u najpoznatije i posljednjih dvadesetak godina najviše korištene metode za odluĉivanje kada se odluka (izbor neke od raspoloţivih alternativa ili njihovo rangiranje) temelji na više atributa koji se koriste kao kriteriji. Rješavanje sloţenih problema odluĉivanja pomoću ove metode temelji se na njihovoj dekompoziciji u hijerarhijsku strukturu ĉiji elementi su cilj, kriteriji (ukljuĉujući pod kriterije) i alternative. U samu analizu po AHP metodi u razmatranje su izabrane tri najpopularnije BI platforme koje su otvorenog koda i nude se besplatno na trţištu, a to su JasperSoft, MicroStrategy i Pentaho BI platform. U prethodnom je poglavlju definirana istraţivaĉka hipoteza koja pretpostavlja da je Pentaho BI platform najbolja opcija za organizaciju poput KDVL. Istraţivanje se vrši pomoću alata za provedbu višekriterijalne analize naziva „Make It Rational decision tool“. Alat je veoma vizualno uĉinkovit i jednostavan za upotrebu, a jedna od njegovih najvećih prednosti je ta što ga nije potrebno preuzimati na raĉunalo već u potpunosti radi kao serverska aplikacija te se njom upravlja kroz suĉelje internet preglednika. Za poĉetak rada sa ovim alatom potrebno se registrirati prilikom ĉega se dobija pravo korištenja na odreĊeni period, odnosno korištenje probne (engl.trial) verzije. Nakon isteka probnog roka za daljnje je 4 AHP – Analitiĉki hijerarhijski proces (engl.Analytic Hierarchy Process) 7 korištenje aplikacije potrebno vlasniku platiti odreĊeni simboliĉni iznos za licencu koja se prodaje na godišnjoj bazi. Prilikom definiranja kriterija i njihovog utjecaja na konaĉni rezultat, za potrebe ovog istraţivanja izvršene su konzultacije sa ekspertom, relevantnom osobom iz KDVL, struĉnjakom za informatiku i voditeljem iste, koji poznaje procese same organizacije i djeluje kao voditelj projekta sa strane KDVL. Na temelju preporuka, savjeta i iskustva eksperta utvrĊeni su kriteriji za provedbu analize. Ima ih ukupno osam i svaki od njih je naveden i objašnjen u nastavku ovog teksta. Instalacija – ocjenjuje se jednostavnost provedbe instalacijskog procesa za odreĊeni alat prilikom ĉega se teţi ka instalaciji koja ne zahtjeva napredna informatiĉka znanja, već je jasno i precizno voĊena upotrebom ĉarobnjaka, detaljnih smjernica ili sliĉnih pomagala. User friendly – ovaj kriterij predstavlja lakoću snalaţenja po suĉelju alata i mogućnost korištenja alata za poĉetnike. Teţi se alatu koji ima intuitivno i standardizirano korisniĉko suĉelje za razliku od specijaliziranih i nesvakidašnjih suĉelja i funkcionalnosti. MySQL friendly – podrazumijeva kompatibilnost sa MySQL serverom na kojemu će se izvoditi projekt i implementirati skladište podataka. Ovo je jedan od kljuĉnih kriterija budući da je MySQL takoĊer besplatna tehnologija koja će se koristiti kao podloga za izradu skladišta podataka, a shodno tome i svih izvještaja. Drill down/Drill up – ocjenjuju se mogućnosti alata i njegovih funkcionalnosti prilikom izvještavanja. Zahtjeva se drill funkcionalnost što podrazumijeva mogućnost prodiranja od viših razina detalja prema niţim (drill down) i mogućnost podizanja s niske razine detalja prema onim zbrojivim, saţetijim podacima na višim razinama (drill up). Postojeći predlošci – kriterij postojanja predloţaka ocjenjuje se na temelju postojanja i kvantitativnom opsegu pred definiranih predloţaka (engl. templates) izvješća. Sigurnost – ovaj kriterij podrazumijeva mogućnost ograniĉavanja dostupnosti podataka razliĉitim korisnicima unutar nekog alata. Uputstva – kriterij uputstva ocjenjuje se prema dostupnosti i postojanju uputa za rad s alatom u razliĉitim oblicima poput tekstualnih uputstava, video materijala i sliĉno. 8 Opći dojam – istraţivaĉ ocjenjuje alat na temelju općeg dojma dobivenog korištenjem i testiranjem alata. Kao što je iz prethodnog teksta vidljivo, postoji osom promatranih kriterija za koje je podruĉni ekspert zakljuĉio da su bitni kod utvrĊivanja optimalnog alata. Kriteriji su po svojoj definiciji mjere ili standardi koji se mogu ocijeniti, kvalitativni su ili kvantitativni, a imaju svrhu da potpomognu donošenju odluke. Vidljivo je da su svih osam postavljenih kriterija za provedbu ove analize, kvalitativne naravi te se svakog od njih ocjenjuje na temelju iskustva, dojma i relevantnosti, a prema procjeni istraţivaĉa. Nakon ovako utvrĊenih kriterija pristupa se postavljanju prioriteta i vrednovanju kriterija na naĉin da se usporeĊuju svi kriteriji u parovima, svaki sa svakim. Ovaj se korak takoĊer izvršava u suradnji sa podruĉnim ekspertom iz KDVL. Vrednovanjem kriterija u parovima dolazi se do popisa kriterija ĉije ocjene imaju razliĉiti utjecaj na konaĉni rezultat. U ovom je radu taj popis prikazan grafiĉki dok su prioriteti, odnosno utjecaj svakog od kriterija,izraţeni u relativnim vrijednostima radi lakšeg razumijevanja, što je prikazano na slici 1. Slika 1. Grafiĉki prikaz utjecaja pojedinog kriterija na konaĉni rezultat 9 Iz slike je vidljivo da najveći utjecaj na konaĉni rezultat ima MySQL friendly kriterij i to 26,71%. Ovaj je kriterij definiran na taj naĉin iz razloga što je MySQL platforma na kojoj će se bazirati skladište podataka. Iz tog razloga je izuzetno bitno da BI platforma bude kompatibilna s MySQL-om. Slijedi kriterij User friendly sa 20,51% koji je veoma bitan za korisnike is KDVL jer je interes da se prilagodba i znanje rada u novom alatu vremenski što kraće odvijaju kako bi se korisnici mogli posvetiti i ostalim poslovima. Dva navedena kriterija jedina imaju utjecaj veći od 20%, a slijede ga još dva kriterija koja imaju preko 10%. To su kriteriji postojanja uputstava za rad sa 13,32% i kriterij provedbe instalacijskog procesa od 12,93%. Ostali kriteriji nemaju veliki utjecaj na konaĉni rezultat, ali im se svejedno moţe utvrditi prioritet. Njihov je konaĉni redoslijed naveden u tablici 1. Kriterij Rang MySQL friendly 1 User friendly 2 Uputstva 3 Instalacija 4 Drill down/Drill up 5 Sigurnost 6 Postojeći predlošci 7 Opći dojam 8 Tablica 1. Popis kriterija i njihovih rangova 10 1.5. Doprinos istraživanja Svako uspješno provedeno istraţivanje sa sobom nosi odreĊeni doprinos. Doprinos od ovog istraţivanja je višestruki i oĉituje se prvenstveno kroz korist koja se pruţa za KDVL od njegove provedbe. KDVL je zahvaljujući istraţivanju dobio najbolju opciju koja je prilagoĊena internim potrebama i zahtjevima te se na temelju objektivne evaluacije i validacije odabire besplatni alat s kojim je optimalno vršiti provedbu projekta implementacije BI sustava. Kao što je navedeno i u prethodnim poglavljima, osim za KDVL, ovi se rezultati mogu primijeniti i na ostalim kulturnim organizacijama, što povećava doprinos provedenog istraţivanja na širu društvenu zajednicu. Prilikom ispitivanja i ocjenjivanja funkcionalnosti i kriterija definiranih u fazi analize, istraţivaĉ je bio u poziciji iz koje su se mogli utvrditi prednosti i nedostaci, kako izabranog alata, tako i ostalih analiziranih. Doprinos opisane situacije je u tome što se stjeĉe znanje koje je moguće koristiti u ostalim fazama projekta te svjesnost o eventualnim ograniĉenjima alata. 11 1.6. Sadržaj diplomskog rada Diplomski rad se sastoji od ukupno šest poglavlja nakon kojih slijede popis slika i tablica, literatura te saţetak rada na hrvatskom i engleskom jeziku. Prvo poglavlje rada je uvodno poglavlje u kojemu se razraĊuje prva faza projekta implementacije BI sustava u KDVL. Ovo poglavlje razraĊuje predmet i problem istraţivanja koje će se provesti s ciljem utvrĊivanja optimalnog alata za provedbu projekta, te definira ciljeve, metodu, rezultate i doprinos samog istraţivanja. Iza uvodnog i ujedno istraţivaĉkog djela rada, slijedi drugo poglavlje koje se temelji na teorijskoj podlozi o vaţnosti takvog sustava za kulturne organizacije kao što je KDVL. U ovom se poglavlju navode koristi koje organizacija dobiva implementacijom sustava te kako takav sustav u konaĉnici moţe utjecati na razvitak kulturnog stvaralaštva. Treće poglavlje se poĉinje baviti provedbom samog projekta i ovo poglavlje sadrţi opis i metode provedbe pred implementacijske analize. Kao što i sam naziv govori, ova analiza utvrĊuje zahtjeve korisnika o traţenim funkcionalnostima sustava, kako tehniĉkim tako i korisniĉkim. Zahtjevi se prikupljaju razliĉitim metodama poput anketiranja, intervjuiranja i organiziranjem radionica, što je detaljno objašnjeno u ovom poglavlju i to kroz dva potpoglavlja: prikupljanje informacija i analiza potreba korisnika. Prije poĉetka provedbe projekta, nuţno je provest istraţivanje ĉiji su temelji opisani u uvodu. Prema rezultatima o optimalnoj platformi provodit će se ostatak cijelog projekta, te je iz tog razloga ovo veoma bitan dio. U ĉetvrtom se poglavlju ukratko opisuje svaki od alata koji je obuhvaćen analizom te se navode osnovne znaĉajke istih. U drugom potpoglavlju se iznose rezultati samog istraţivanja na temelju kojih se donosi zakljuĉak o prihvaćanju ili odbacivanje poĉetne istraţivaĉke hipoteze iz prvog poglavlja. Poglavlje koje slijedi opisuje arhitekturu BI sustava. Nakon odabrane provedene analize potreba, utvrĊivanja stanja i odabira platforme, potrebno je odrediti arhitekturu na kojoj će sustav poĉivati. Dizajn i odabir arhitekture sustava i skladišta podataka ĉesto je ograniĉen prema mogućnostima naruĉitelja. Najĉešća ograniĉenja su ne postojanje infrastrukture, ne posjedovanje licenci ili ograniĉeni budţeti. 12 Šesto poglavlje prati metodologiju i razvoj samog skladišta podataka i implementaciju sustava za izvještavanje. Pod poglavlje pod nazivom „Skladište podataka“ sadrţi razvijeni logiĉki i fiziĉki model skladišta te popis, opis, i strukturu svih dimenzija i mjera koje se nalaze u dimenzijskim i ĉinjeniĉnim tablicama skladišta. Iduće pod poglavlje opisuje procese ekstrakcije podataka iz izvorišnih sustava, njihove transformacije i procese punjenja skladišta podataka. Ovakvi se procesi nazivaju ETL5 procesima te će se oni vršiti pomoću alata koji je sastavni dio Pentaho BI platforme i specijaliziran je za izvoĊenje ETL procesa, a nosi naziv Kettle. Zadnje pod poglavlje je opis alata za izvještavanje i prikaz odreĊenih izvještaja kao rezultata implementiranog sustava. Sedmo je ujedno i posljednje poglavlje diplomskog rada i u njemu je sadrţan zakljuĉak dobiven na temelju provedbe cijelog projekta. U ovom su poglavlju takoĊer navedena sva ograniĉenja i prepreke s kojima se susretalo prilikom implementacije sustava, kao i koristi koje je dobio menadţment KDVL. U posljednjem djelu rada se nalaze prilozi, popis slika, tablica, literatura i konaĉni saţetak na hrvatskom i engleskom jeziku sa nekoliko kljuĉnih rijeĉi. Saţetak pruţa kratki uvid u problematiku, metodu i svrhu provedbe ovakvog projekta. 5 ETL procesi– Extract Transform Load procesi kojima se vrše transformacije nad podacima iz razliĉitih izvora koji se potom spremaju u razliĉite destinacije 13 2. Uloga BI sustava u kulturnim organizacijama U kulturnim organizacijama meĊu kojima je i KDVL, konzumira se velika koliĉina podataka na relaciji gradskih vlasti i dvorane, dvorane i dobavljaĉa, dvorane i korisnika i ostalih strana. U takvom okruţenju prepoznata je potreba za uvoĊenjem sustava poslovne inteligencije koji ima za cilj organizirati podatke u iskoristivu cjelinu. Više je razloga za uvoĊenje sustava poslovne inteligencije, a najznaĉajniji od njih su: Dinamiĉna okolina – teţnja za stalnim unaprjeĊenjem i privlaĉenjem novih korisnika koji imaju mogućnosti izbora, te s druge strane promjene zakonskih regulativa i usklaĊivanje sa ne statiĉnim zahtjevima viših zakonskih tijela. Ograniĉeni resursi – resursi su uvijek ograniĉeni pa ih je potrebno optimizirati i posvetit vrijeme, kao glavni resurs, za poslovanje bitnim stvarima i stvaranju novih vrijednosti. Optimizacija lanca vrijednosti – M.E.Porter još je 1985. godine kroz lanac vrijednosti naglašavao potrebu usklaĊivanja funkcija organizacije (5 primarnih i 4 pomoćne funkcije) što dovodi do rasta profita (Hernaus, 2006). Kvaliteta i optimizacija navedenog osigurava se upotrebom Business Intelligence sustava kojeg predstavlja skup aplikacija, procedura i metodologija za upravljanje podatcima u obliku prikupljanja, pohrane, analize i prezentacije, a sa svrhom potpore procesima odluĉivanja. Takav sustav korisnicima omogućava napredno analiziranje podataka prikupljenih iz razliĉitih izvora te u kasnijim fazama upotrebe zasigurno osigurava veću produktivnost zaposlenika dvorane, optimizaciju resursa i samim time veće prihode i profite. Svaka organizacija pod okriljem grada Zagreba obavezna je podnositi mnogobrojna izvješća Gradu, bilo mjeseĉno, kvartalno, polugodišnje ili godišnje. KDVL kao takva je prepoznao prednosti implementacije ovakvog sustava te se odluĉio na njegovu realizaciju temeljenu na besplatnim tehnologijama. BI sustav biti će orijentiran na analizu povijesnih podataka i kao takav moţe ukazivati na probleme koji su se već desili te menadţmentu olakšati donošenje odluka o kojim ovisi budućnost. Sustavi za potporu odluĉivanju mogu se koristiti u razliĉitim oblicima kroz razliĉite faze odluĉivanja, od identifikacije problema pa do implementacijskog rješenja. U samom sustavu moguće je ugraditi planove te u odnosu na njih pratiti ostvarenje rezultata i uoĉiti i definirati problem zbog kojeg rezultati odudaraju od planiranog. 14 Neka od obiljeţja sustava koji se implementira u kulturne organizacije su: Nudi potporu svim upravljaĉkim i operativnim razinama, ane samo menadţment Korisnici sami pristupaju podacima, pretraţuju ih i kreiraju izvješće u strukturi koja im najbolje odgovara Podatcima je moguće pristupiti u bilo kojem trenutku Sustav je prilagodljiv i nadogradiv tokom vremena. S vremenom kako sazrijevaju korisnici i organizacija, tako se i sustav unaprjeĊuje na više i moćnije razine Da bi BI sustav bio prihvaćen u kulturnim organizacijama poput KDVL, on mora biti jednostavan, zanimljiv i funkcionalan. Shodno svemu prethodno navedenom, sustav koji se implementira u KDVL ima za viziju u skoroj budućnosti postaviti temelje poslovanja na standardiziran i uĉinkovit naĉin, koji će donijeti uštede u vremenskim, ljudskim i financijskim resursima. Kao takav, omogućit će menadţmentu bolje upravljanje, te biti obrazac uspješnog upravljanja podacima i ostalim organizacijama koje se bave kulturnim djelatnostima. 15 3. Predimplementacijska analiza Analiza, dizajn, razvoj i implementacija su osnovni koraci metodologije koju slijedi projekt uvoĊenja Bi sustava. Analiza kao prva od tih koraka ima poseban znaĉaj jer sa sobom nosi niz bitnih stavki koje se kasnije mogu odraziti na uspješnost cijelog projekta(Carly, 2004). Pred implementacijska analiza provodi se u suradnji sa krajnjim korisnicima i ona daje odgovore na sljedeća pitanja (Nikitović, 2009): Što se ĉini u samoj implementaciji? Koji su ciljevi projekta? Koje trenutne probleme sustav mora anulirati? Koji su potencijalni rizici i kako ih izbjeći? Što su obaveze i odgovornosti korisnika, a što implementatora? U okviru ovog projekta, pred implementacijska analiza provela se u dva koraka; prikupljanje informacija od korisnika, te analiza njihovih zahtjeva. 16 3.1. Prikupljanje informacija U okviru pred implementacijske analize potrebno prikupiti što je više moguće informacija od strane korisnika, kako krajnjih tako i onih kljuĉnih. Kljuĉni korisnici su oni korisnici sustava koji imaju naprednija tehniĉka znanja i posjeduju bolje poznavanje procesa i „pravila kuće“, te su oni kao takvi prva linija kontakta za krajnje korisnike sustava (Raoul-Abelin Choumin). Veća koliĉina informacija znaĉi i veću kvalitetu isporuĉenog proizvoda. Iz tog je razloga bitno prikupljati informacije na sustavan i uĉinkovit naĉin. Za prikupljanje informacija od strane korisnika na projektu implementacije BI sustava u KDVL, koristili su se pred definirani upitnici, prilagoĊeni upitnici, intervjui i radionice. Pred definirani upitnici su kratki upitnici u formi ankete koji sadrţavaju pitanja koja se mogu sistematizirati u ĉetiri velike skupine: Upoznavanje s poslovnim ciljevima tvrtke Procjena potreba za izvještavanjem i analizom Oĉekivanja od BI sustava, te skladišta podataka Zakljuĉak PrilagoĊeni upitnici su kratki upitnici koji sadrţe pitanja prilagoĊena okruţenju u koje se implementira sustav, odjelu, ispitaniku. Ovi upitnici takoĊer potiĉu korisnike na daljnja razmišljanja o svojim potrebama i oĉekivanja. Na taj se naĉin korisnici pripremaju i za radionice na kojima se raspravlja o njihovim odgovorima. S obzirom da se na korisniĉkoj strani u ovom projektu nalazi samo jedna osoba koja je kljuĉni korisnik, te ujedno i voditelj projekta sa strane korisnika, odrţan je i niz intervjua s ciljem što kvalitetnijeg i preciznijeg utvrĊivanja zahtjeva. Intervju je usmena komunikacija licem u lice sa jednim sugovornikom koja se moţe voditi prema unaprijed pripremljenim pitanjima, bez unaprijed pripremljenih pitanja, u formalnom i neformalnom obliku (Baturina, 2006). Sa grupom krajnjih korisnika organizirane su radionice na kojima je prisustvovalo od ĉetiri do sedam krajnjih korisnika. Na radionicama se iznose stavovi, potrebe, zahtjevi i ostale informacije bitne za konaĉno utvrĊivanje zahtjeva korisnika za koje oĉekuju da će biti ostvareni krajnjim BI sustavom. 17 3.2. Analiza potreba korisnika Provedba pred implementacijske analize podrazumijeva prikupljanje informacija i analizu potreba korisnika. Iz potreba korisnika moguće je utvrditi funkcionalnosti sustava, izgraditi plan provedbe projekta, te dizajnirati sustav na naĉin da se zadovolje utvrĊeni zahtjevi. S obzirom na okolnosti u kojima se ovaj projekt odvija, a prema informacijama koje su korisnici dostavili, izvršena je zakljuĉna analiza potreba u suradnji sa podruĉnim ekspertom odnosno, kljuĉnim korisnikom sustava. Potrebe korisnika se mogu sumirati u nekoliko grupa: Uvid u podatke – KDVL funkcionira na naĉin da je dio procesa poput upravljanje ITom, raĉunovodstvo i prodaja ulaznica dodijeljena na upravljanje vanjskim suradnicima (engl.outsourcing). Shodno tome, vanjski suradnici odrţavaju i baze podataka u kojima se nalaze podatci KDVL-a. Jedna od potreba korisnika je nesmetani i brzi uvid u takve podatke. Automatizacija izrade izvješća – s obzirom na specifiĉnost izvješća koje KDVL mora isporuĉivati Gradskom uredu za kulturu, korisnici zahtijevaju brzu, laku i automatiziranu izvedbu istih. Brzi pristup informacijama – menadţment KDVL-a kao zahtjev navodi i potrebu da na lak i efikasan naĉin ima uvid u kljuĉne pokazatelje poslovanja putem jednostavnog korisniĉkog suĉelja. Ovako strukturirani zahtjevi korisnika koji su proizašli iz pred implementacijske analize, temelj su za odreĊivanje opsega projekta i funkcionalnosti sustava. 18 4. Odabir optimalne platforme za KDVL 4.1. Opis potencijalnih alata za provedbu projekata 4.1.1. JasperSoft BI suite JasperSoft Bi suite je cjeloviti paket BI alata koji pruţa mogućnost izrade izvješća, analize i integracije podataka. Ovaj paket takoĊer ukljuĉuje i BI posluţitelja na temelju kojega je omogućena komunikacija izmeĊu razliĉitih alata iz skupine JasperSoft BI suita. Ova platforma moţe se koristiti u dva osnovna oblika, open source6 i Proffesional7. Funkcionalnosti koje JasperSoft pruţa mogu se svrstati u ĉetiri kategorije. Osnovne funkcionalnosti ukljuĉuju mogućnost prilagoĊavanja kroz otvoreni izvorni kod, sigurnosnu autorizaciju koja se temelji na ulogama (engl.roles) korisnika, razliĉita korisniĉka suĉelja i sl. Druga skupina funkcionalnosti podrazumijeva radnje nad izvješćima koja se prave putem grafiĉkog alata za razvoj izvješća. JasperSoft podrţava izvoz u razliĉite formate poput XML, XLS, CSV, PDF i mnoge druge, standardno korištene formate. Upravljanje izvješćima svrstano je u treću skupinu funkcionalnosti. Izvješća je moguće parametrizirati, mogu koristiti istovrsne dijelove putem zajedniĉkog repozitorija, moţe ih se pokretati po odreĊenom rasporedu i sliĉno. Posljednja skupina funkcionalnosti koje JasperSoft pruţa u svom BI suiteu jesu funkcionalnosti analize podataka. To ukljuĉuje drill-down, drill-up, „slice and dice“8, pivotiranje, vizualizaciju podataka i ostale oblike analize. Za podruĉje integracije podataka JasperSoft nudi JasperETL alat koji je intuitivan, grafiĉki orijentiran i moćan ETL alat. Dio je JasperSoft BI suita pa se temelji na otvorenom kodu. Ovaj alat najĉešće se koristi za prijenos podataka i izradu transformacija nad podatcima radi punjenja skladišta podataka (JasperSoft, 2007). 6 Platforma otvorenog izvornog koda koji je dostupan javnosti sa svrhom unaprjeĊivanja proizvoda Inaĉica jaspersoft BI suita koja se plaća i koristi se iskljuĉivo za naprednije funkcionalnosti u komercijalnom poslovanju 8 Općeprihvaćeni nazivi iz engleskog jezika koji opisuju metode pregleda podataka 7 19 4.1.2. MicroStrategy BI platform MicroStrategy je visokotehnološki orijentirana tvrta iz SAD-a. Njihova platforma za BI nema standardno rješenje za integraciju podataka već je naglasak platforme postavljen na vizualizaciju podataka. Ukoliko se koristi besplatna inaĉica MicroStrategy-a, tada je ograniĉenje licence na deset korisnika. TakoĊer postoji i „enterprise“ verzija koja ukljuĉuje mnoge dodatne module i funkcionalnosti. Najveći odmak MicroStrategy BI platforme u odnosu na ostala konkurentska rješenja vidljiv je na podruĉju izrade kontrolnih ploĉi ĉija je izrada veoma intuitivna. Sigurnost pristupa podacima riješen je korištenjem novih tehnologija koje se baziraju na više dimenzijskim zaštitama (MicroStrategy, 2013). MicroStrategy BI platform jedna je od vodećih platformi za podruĉje analitike i izvješćivanja. Istraţivaĉka organizacija Gartner u svom, ih magiĉnom kvadrantu (BIcortex, 2012)svrstava meĊu lidere na podruĉju analitike i mobilnog izvješćivanja, što dokazuje stalna ulaganja u to podruĉje od strane MicroStrategy-a. Prema Gartneru MicroStrategy se orijentira na prodaju svojih rješenja velikim kompanijama, te se iz tog razloga okreće inovacijama na podruĉju vizualizacije podataka, big-data9 i poslovne analitike. Isto tako pruţa najveći i najnapredniji set mobilnih rješenja za BI koji su bazirani na cloud10 tehnologiji što ih u budućnosti moţe izdvojiti od konkurencije. 9 Big-data je termin za veliku koliĉinu podataka koji brzo doalze iz mnogih razliĉitih sustava u strukturiranom ili nestrukturiranom obliku 10 Tehnologija kod koje se transfer i spremanje podataka vrši putem “oblaka”, bez fiziĉkih jedinica 20 4.1.3. Pentaho BI platform Pentaho je open source alat za Business Intelligence koji ukljuĉuje besplatnu i „enterprise“ 11 inaĉicu. Pentaho BI platform je zamišljena kao jedinstvena platforma koja zadovoljava sve korisniĉke potrebe za izgradnju sustava poput integracije podataka, OLAP-a, naprednog izvješćivanja i dashboard-a12 koji se intenzivno razvijaju od 2004. godine, te imaju veliku i jaku zajednicu (engl.community). Pentaho BI platform se u osnovi sastoji od naprednog izvješćivanja (Pentaho Report Designer), OLAP analize (Mondrian) i alata za integraciju podataka (Kettle). Kettle je jedan od najpopularnijih besplatnih alata sa otvorenim kodom koji stiţe iz paketa Pentaho BI platforme, a koristi se za integraciju podataka i izvoĊenje ETL procesa. Sami naziv Kettle jest rekurzivni akronim u kojemu poĉetna slova oznaĉavaju rijeĉi: Kettle Extraction Transportation Transformation Loading Enviroment. Podruĉje upotrebe Kettle-a je široko, a najĉešće se koristi za uĉitavanje podataka iz tekstualnih datoteka u baze podataka, izvoz podataka iz baza u druge baze, unaprjeĊenje informacija koristeći lookup-e13, ĉišćenje podataka, integracija aplikacija, punjenje skladišta i ostalo. Kettle je u mogućnosti u fazi ekstrakcije dohvatiti podatke iz više od 35 razliĉitih izvora od kojih su najznaĉajniji MySQL, PostgreSQL, Oracle, MS SQL Server, Text, XLS i MS Access. U fazi transformacije moguće je izvoditi razne radnje poput filtriranja podataka, kalkuliranja, skriptiranja (JavaScript, SQL, RegExp), mapiranja i ostalih, ĉijom se upotrebom podaci iz izvornih sustava spremaju za fazu uĉitavanja u destinacije. Od destinacija Kettle podrţava gotovo sve oblike baza podataka koje je moguće puniti i to u razliĉitim formatima poput particioniranog punjenja, inkrementalnog punjenja skladišta podataka i ostalih baza. Pentaho Reporting omogućava organizacijama jednostavan pristup, kreiranje i dijeljenje informacija zaposlenicima, klijentima i partnerima. Kroz Pentaho Report Designer se na jednostavan i intuitivan naĉin mogu stvarati, ureĊivati i dijeliti izvješća sa korisnicima. Nakon dizajna izvješća, moţe se napraviti izvoz na „Web“ kroz koji se mogu pregledavati i putem Pentaho BI posluţitelja, koji je sastavni dio platforme, dijeliti kroz zajedniĉki repozitorij (Pentaho, 2008). 11 Komercijalna verzija Pentaho BI platforme Kontrolne ploĉe za pregledavanje pokazatelja poslovanja 13 Uvid u drugu tablicu prema odreĊenom kljuĉu 12 21 4.2. Rezultati višekriterijalne analize Prethodno opisani alati ulaze u opseg istraţivanja radi utvrĊivanja koji od alata najbolje odgovora provedbi projekta implementacije BI sustava u KDVL. Provedbi analize alata i evaluaciji svakog pojedinog kriterija pristupa se prema AHP metodi koja je opisana u uvodnom poglavlju. Analiza se vršila testiranjem, prouĉavanjem i istraţivanjem na internetu, ĉitanjem po razliĉitim forumima, gledanjem video materijala i konzultiranjem s ostalim ĉlanovima zajednice (engl.community) nekog od alata. Svaki se od kriterija posebno ocjenjivao za svaki alat zasebno te se vršila usporedba izmeĊu svih alata po pojedinom kriteriju. S metodološkog aspekta, višekriterijska analiza pretpostavlja sustavni pristup, a time i metodološki najefikasniji i najfunkcionalniji pristup rješavanju problema. Kako se radi o višekriterijskom problemu, sustavni pristup njegova rješavanja zahtijeva primjenu metode višekriterijske analize poradi optimiziranja rješenja utvrĊenog problema i pronalaska optimalnog rezultata (Nikolić, 1996). Metodom analize u uvodnom su djelu definirani ciljevi koji se ţele postići analizom. Na temelju tako utvrĊenih ciljeva definirani su kriteriji i provedeno njihovo vrednovanje uz pomoć ekspertnih mišljenja i konkretne situacije u odnosu na postavljeni kriterij. „Make It Rational decision tool“ naziv je alata koji se koristi za provedbu analize. Funkcionalnosti ovog alata su veoma opširne i precizne te je svrstan meţu najbolje alate za provedbu analiza ovakvog tipa, što je dodatno osiguranje da će rezultati provedenog istraţivanja biti pouzdani i toĉni. 22 U pozadini alata „Make It Rational decision tool“, temeljem matematiĉke podloge AHP metode i njenih algoritama, vrše se izraĉuni koji u konaĉnici formiraju rezultat. Primjer usporedbe kriterija prikazan je na slici 2. i iz nje je vidljivo kako je ocijenjen odnos izmeĊu alata za kriterij MySQL friendly. Alat JasperSoft se neznatno bolje ponaša u suradnji sa MySQL-om od alata MicroStrategy, dok se Pentaho BI platform neznatno bolje ponaša u odnosu na JasperSoft. Logiĉno, razlika izmeĊu Pentaho BI platform i MicroStrategy alata je osjetna u korist prvoga. Slika 2. Usporedba alata po kriteriju MySQL friendly Po istom principu je izvršena evaluacija svih kriterija. Na temelju ovako provedene analize dolazi se do konaĉnih rezultata istraţivanja koji prikazuju korisnost svakog od alata. Budući da poĉetna istraţivaĉka hipoteza glasi: H0 . . . . . Pentaho Bi platform je besplatna platforma koja najbolje odgovara zahtjevima KDVL u implementaciji sustava poslovne inteligencije Promatrajući rezultate višekriterijalne analize moguće je pristupiti validaciji hipoteze. Konaĉni rezultati prikazani su na slici 3. Na slici je prikazan svaki alat drugom bojom i svaki kriterij naveden na vrhovima osmerokuta (jer ima osam kriterija). Vidljivo je da su svi alati jednako ocjenjeni po kriterijima; postojeći predlošci, sigurnost i uputstva dok se po svim 23 ostalim kriterijima razlikuju. TakoĊer je vidljivo da se alat Pentaho BI platform uvelike istiĉe nad alternativnim alatima po svim ostalim kriterijima, te ga je analiza po AHP metodi potvrdila kao platformu koja najbolje odgovara zahtjevima KDVL u implementaciji sustava poslovne inteligencije. Drugim rijeĉima, poĉetna istraţivaĉka hipoteza je potvrĊena. Pentaho Bi platforma je uistinu optimalna za ovaj projekt što je vidljivo iz dominacije nad ostalim alatima. Najveća prednost ove platforme jest njena laka dostupnost, puno materijala, zajednica, te velika mogućnost pronalaska rješenja za eventualne probleme za koje postoji rizik da će se pojaviti tokom projekta. TakoĊer, s obzirom na teţnju korištenja besplatnih tehnologija na projektu, bitan utjecaj ima i kriterij MySQL kompatibilnosti. Iako su JasperSoft BI suite i MicroStrategy BI platform veoma kvalitetni i dobro prihvaćeni od strane BI profesionalaca u svijetu, za ovakav projekt nisu optimalni. Najveća mana ovih platformi jest manjak besplatnih materijala koji se nalaze na internetu te zatvorenost njihovih zajednica. Takva situacija predstavlja veliki rizik gubitka vremena ukoliko se tokom provedbe projekta ustanovi da postoji neka prepreka u samom alatu. Promatrajući rezultate vidljivo je da je alat JasperSoft gotovo identiĉno ocjenjen kao i alat MicroStrategy. S obzirom na utjecaj kriterija MySQL friendly u kojemu je JasperSoft komatibilniji, drugo mjesto pripada njemu. Slika 3. Rezultati analize po AHP metodi 24 Isti rezultati mogu se prikazati i drugaĉijim grafiĉkim prikazom po kojemu je konaĉni poredak alata zornije prikazan, a to je vidljivo na slici 4. Slika 4. Konaĉni poredak alata i utjecaj kriterija na svaki od njih Dakle, izmeĊu više alternativa koje su se analizirale kao potencijalni alat za provedbu implementacije BI sustava, prema istraţivaĉevim ocjenama kriterija, najbolja je platforma koju je razvila tvrtka Pentaho. Na slici 4. je vidljivo da prevagu donose kriteriji oznaĉeni ţutom i crvenom bojom odnosno da je kriterij korisniĉkog doţivljaja korištenja ove platforme i kriterij kompatibilnosti sa MySQL bazama podataka najistaknutiji upravo kod Pentaho BI platforme. 25 5. Projektne uloge Projekt je aktivnost koja ima unaprijed utvrĊeni cilj koji je jasan i ostvariv, podrazumijeva odreĊenu kakvoću i koristi resurse kako bi se ostvario u odreĊenom vremenskom razdoblju. PMBOK14 definira projekt kao vremenski ograniĉeni pothvat poduzet radi stvaranja jedinstvenog proizvoda, usluge ili rezultata (PMI, 2008). Sudionici koji se pojavljuju na projektima mogu imati neku od sljedećih uloga: Naruĉitelj(i) projekta Sponzor(i) projekta Ulagaĉ(i) projekta Voditelj(i) projekta Projektni tim/ĉlan tima. U projektu implementacije BI sustava u KDVL, pojavljuju se neke od gore navedenih uloga, i to naruĉitelj, voditelji, sponzori i projektni tim. U ulozi naruĉitelja projekta pojavljuje se KDVL koja je prepoznala potrebu za ovakvim sustavom, te je za suradnju prilikom implementacije odabrala tvrtku Poslovna inteligencija d.o.o. iz Zagreba koja je jedna od vodećih tvrtki za implementaciju analitiĉkih sustava i strateški ICT15 konzalting u jugoistoĉnoj Europi (PI, 2013). Uloga sponzora projekta pojavljuje se dvostrano, sa strane naruĉitelja i sa strane implementatora. Sponzor je osoba koja svojim autoritetom i mogućnostima osigurava resurse i podupire projekt. Sa strane naruĉitelja projekt podupire gosp. Draţen Sirišĉević, ravnatelj Koncertne dvorane Vatroslava Lisinskog, a sa strane implementatora gosp. Draţen Orešĉanin, predsjednik uprave i jedan od osnivaĉa tvrtke Poslovna inteligencija d.o.o. Na projektu se još pojavljuju i voditelj projekta sa strane naruĉitelja, gosp. Zdravko Kunić iz tvrtke Art-print studio u ĉijoj je nadleţnosti cijeli IT KDVL-a, i voditelj projekta sa strane implementatora te ujedno i ĉlan tima, gosp. Nikica Ramljak, konzultant u Poslovnoj inteligenciji d.o.o. 14 15 Project Management Body of Knowledge Information and Communication Technology 26 6. Arhitektura sustava Pojam arhitekture iz pogleda IT terminologije oznaĉava strukturu koja spaja sve komponente jednog sustava. Promatrajući taj isit pojam iz pogleda BI sustava, moguće je razlikovati arhitekturu toka podataka (engl.data flow) i arhitekturu sustava. Arhitektura toka podataka govori o tome na koji su naĉin podruĉna spremišta ureĊena u samom skladištu podataka, i na koji naĉin podaci stiţu iz izvorišnih sustava do svojih destinacija u skladištu (Rainardi, 2008). Dizajniranje fiziĉke arhitekture skladišta podataka, ili jednostavnije arhitekture sustava, slijedi tek nakon optimizacije data flow-a. U praksi se arhitektura ĉesto prilagoĊava ograniĉenjima u infrastrukturi ili u budţetima naruĉitelja sustava, pa se u skladu s time definiraju posluţitelji (engl.server), mreţa, programska podrška (engl.software) i sliĉno. Prilikom implementacije BI sustava u KDVL koristila se arhitektura koja je saĉinjena od ukupno tri sloja, posluţitelja sa izvornim podacima, posluţitelja na kojem se vršio razvoj, testiranje i u konaĉnici produkcija, te posluţitelj sa sloja izvješćivanja. Osnovni operacijski ustav na kojem se vrši razvoj je Windows Server 2008 R2 Standard. Ovakva se jednostavna arhitektura najĉešće koristi s naglaskom na potrebu odvajanja razvojnog, testnog i produkcijskog posluţitelja, meĊutim s obzirom na ograniĉenja to ponekad nije moguće. Arhitektura BI sustava KDVL prikazana je na slici ispod. Slika 5. Fiziĉka arhitektura sustava 27 7. Razvoj i implementacija sustava 7.1. Skladište podataka Poslovanje u današnje doba provodi se veoma dinamiĉno, puno novih dogaĊanja, promjena u okruţenju, pa samim time i koliĉina raznovrsnih podataka raste velikom brzinom. Podaci kao takvi, najĉešće se pohranjuju u operativnim bazama podataka kroz transakcijske sustave. Transakcijski sustav je sustav koji je orijentiran na veliki broj istovremenih korisnika, te brzo zapisivanje, ĉitanje i izmjenu malih koliĉina podataka, koji su najĉešće zapisani u trećoj normalnoj formi kako bi se izbjegla redundantnost podataka (Orešĉanin, 2011). Većina tvrtki srednje i velike veliĉine prepoznala su ulogu skladištenja podataka i upotrebu istih sa svrhom pruţanja potpore procesima odluĉivanja i poboljšanja poslovnih procesa. Veliki broj poslovnih dogaĊaja rezultira i velikom koliĉinom podataka koji se moraju negdje spremiti. Ti se podaci najĉešće spremaju u operativnim bazama podataka koji pokazuju najnovije, stvarno stanje poslovanja. Izvještaji koji se dobivaju iz takvih baza najĉešće su na velikom broju stranica, izrada traje dugo, a dobivaju se selektiranim prepisivanjem potrebnih podataka. S druge strane, skladišta podataka posjeduju veliku koliĉinu povijesnih podataka koje sadrţe znanje. Ovakvo se upravljanje podacima osigurava izgradnjom skladišta podataka kao centralnog sustava za prikupljanje i arhiviranje podataka iz transakcijskih sustava, a u novije vrijeme i iz ostalih strukturiranih i nestrukturiranih izvora poput interneta ili nekih „flat“ datoteka. Tipiĉno skladište podataka u teoriji se sastoji od mjera i dimenzija koje su strukturirane u dimenzijske i ĉinjeniĉne tablice. Dimenzije sadrţe opisne podatke o nekom subjektu te u analizama odgovaraju na pitanja po ĉemu se nešto analizira. Mjere su najĉešće numeriĉki podatci koji se analiziraju i bit su svakog izvješća. Bez podataka spremljenih u skladište podataka do potrebnih informacije bi poslovodstvo tvrtke dolazilo daleko sporije, a ujedno bi i izrada izvještaja trajale puno duţe. Iz ove te prethodno navedenih spoznaja moţe se utvrditi uska povezanost skladišta podataka, sustava za potporu odluĉivanju te poslovne inteligencije. Tako uskladišteni podaci se mogu analizirati i modelirati ne bi li se dobile informacije potrebne za tako bitno poslovno odluĉivanje. Pomoću izvještavanja, OLAP-a i rudarenja podataka nastaju razliĉiti ad hoc izvještaji, posebni 28 i dubinski izvještaji. Poslovodstvo tvrtke ce takve izvještaje dobiti kada je za istima najveća potreba, te ce na taj naĉin moći efikasno upravljati tvrtkom (Crljenko Perković, 2009). Skladište podataka autori tumaĉe na razliĉite naĉine, a svako od tumaĉenja je ispravno. Pa tako Bill Inmon koji se smatram ocem skladištenja podataka, definirao kao: „...subjektno orijentirana, integrirana, vremenski ovisna i nepromjenjiva kolekcija podataka koji sluţe za podršku u procesu poslovnog odluĉivanja(Panian, 2003)“. Iz ovakve definicije skladišta podataka, moguće je izdvojiti ĉetiri kljuĉna dijela: Subjektna orijentiranost – definira skladište podataka kao oblik u kojemu se informacije spremaju vezano za pojedini subjektu ili entitet, a ne za pojedini dogaĊaj ili transakciju kao što je to u operativnim bazama Integriranost – u skladištu podataka nalaze se integrirani podaci iz razliĉitih izvornih sustava. To znaĉi da mora postojati konzistentnost izmeĊu naziva objekata, mjernih jedinica i sliĉno. Vremenska ovisnost – podaci koji se nalaze u skladištu su vremenski ovisni, te je svaki od njih definiran za odreĊeni vremenski period. Nepromjenjivost – podaci u skladištu podataka su povijesni iz razloga što se uĉitavaju u skladište u vremenskim intervalima i ostaju spremljeni u nepromjenjivom obliku kako bi se omogućilo dobivanje konzistentne slike poslovanja. S druge strane, Ralph Kimball 1994. godine daje novu, jednostavniju, a u potpunosti toĉnu definiciju skladišta podataka koja glasi: „Skladište podataka je kopija transakcijskih podataka specifiĉno strukturiranih za potrebe izvještavanja i analize (Data Warehouse Definition, 2013)“. U dijelu definicije istaknut je termin „specifiĉno strukturiranih“ koji opisuje svih ĉetiri elementa koje Inmon navodi u svojoj definiciji. Skladište podataka prema nekim autorima nije nuţno dio BI sustava (Howson, 2008), ali je u praksi najĉešće temelj istoga s obzirom na oblik podataka kakvi se u njemu nalaze, a oni su pogodni za analizu i izvješćivanje. 29 7.1.1. Model skladišta podataka u KDVL Skladište podataka za KDVL izraĊeno je u obliku MySQL baze i sastoji se od ukupno tri meĊusobno povezana podruĉja, odnosno data mart-ova. Data mart je izdvojeni funkcionalni dio skladišta podataka (spremište podataka) koji je orijentiran na manju jedinicu sa svrhom standardiziranog provoĊenja analiza i pojednostavljenog korištenja skladišta (Bonifati, 2001). Cijelo skladište podataka KDVL-a sastoji se od ukupno 23 tablice kreirane prema specifikacijama sustava, na temelju zahtjeva korisnika i potreba za izvješćivanjem. To ukljuĉuje slijedeće: 6 ĉinjeniĉnih (fakt) tablica 14 dimenzijskih tablica 3 pomoćne tablice Skladište podataka dizajnirano je u obliku pahuljaste (engl. snowflake) strukture. Ovakva se struktura koristi u situacijama kada je skladište, u odnosu na zvjezdastu (engl. star) strukturu, u višem stupnju normalizacije. Ovakva se struktura koristi u više sluĉajeva, a najpopularniji su sluĉajevi kada: Postoje atributi unutar dimenzija koji sadrţe NULL16 vrijednosti pa se takvi atributi izdvajaju u zasebne tablice, Atributi koji su dijelovi hijerarhije, a nad njima se vrše nezavisni upiti, izdvajaju se u zasebne tablice, Atributi sa niskim kardinalitetom nad kojima se vrše nezavisni upiti, izdvajaju se u posebne tablice. Izdvajanje dimenzija u pahuljastu strukturu moţe smanjiti performanse skladišta(Rouse, 2010), meĊutim, s obzirom na koliĉinu podataka u skladištu KDVL-a, gubitak performansi je neznatan. „Modeliranje je kljuĉni proces u postupku izrade skladišta podataka - njime definiramo strukturu baze podataka koja će zadovoljavati poslovne potrebe zbog kojih je projekt i nastao (Šaban, 2011).“ 16 Tip podataka koji opisuje ne postojanje ikakvog zapisa u ćeliji 30 Model skladišta podataka za KDVL prikazan je na slici ispod. Sa slike su uoĉljiva samo imena tablica, kojem podruĉnom dijelu pripadaju, koje kljuĉeve sadrţavaju te na koji su naĉin tablice meĊusobno povezane. Slika 6. Model skladišta podataka 31 7.1.2. Činjenične tablice U skladištima podataka modeliraju se ĉinjeniĉne, fakt, tablice koje u sebi sadrţe kljuĉne mjere i pokazatelje koji proizlaze iz poslovnih procesa. Fakt tablice nalaze se u središtu zvjezdaste ili pahuljaste strukture, te su okruţene dimenzijskim tablicama. Unutar ovih tablica u teoriji bi trebala postojati samo dva tipa kolona, kolone koje sadrţe mjere i kolone koje sadrţe strane kljuĉeve na dimenzijske tablice. MeĊutim, u praksi se radi jednostavnosti i de normalizacije, u fakt tablicama moţe ĉesto pronaći i neki atribut. Primarni kljuĉ ovakvih tablica obiĉno je sloţeni kljuĉ koji se sastoji od svih stranih kljuĉeva, što znaĉi da ne postoje dva zapisa u ĉinjeniĉnoj tablici koji imaju sve jednake strane kljuĉeve(Kimball, 2002). Kao što je prethodno spomenuto, u skladištu podataka KDVL-a nalazi se ukupno šest ĉinjeniĉnih tablica. Njihovi nazivi i opisi navedeni su u tablici ispod. Naziv tablice Opis Fakt tablica koja se koristi za izradu izvješća o odrţanim terminima financiranim od strane Gradskog ureda za kulturu. Ova tablica ima u odnosu na stage bazu 6 dodatnih kolona, a sve ukupno preko 110 kolona. f_priredbe U ovoj fakt tablici se nalaze mnogi kljuĉevi, obiljeţja te pojedini opisni atributi. Agregacijom, brojanjem, zbrajanjem i sliĉnim operacijama moguće je doći do raznih mjera, a najznaĉajnija mjera koja se nalazi u ovoj tablici je broj gledatelja. Sadrţi planirane iznose za nabavu pojedinih predmeta nabave. Iznosi koji se nalaze u ovoj tablici su oni iznosi koje su korisnici unijeli u svojim f_plan godišnjim planovima. Bit planova jest usporedba stvarnog raĉunovodstvenog stanja potrošnje za odreĊeni predmet nabave i prvotno isplaniranog iznosa. Mjera koja se nalazi u ovoj tablici je iznos. 32 Sadrţi podatke o koliĉini prodanih ulaznica te atribute da li su one prodane, besplatne ili otpremljene. Svaka od ulaznica ima svoj broj koji je f_ulaznice_d ujedno i jedinstveni kljuĉ, cijenu, datum i vrijeme prodaje, pa se agregiranjem mogu dobiti mjere poput koliĉine prodanih ulaznica i prihoda. Fakt tablica pretplata sadrţi podatke o svim pretplatnicima KDVL-a te kljuĉ na adresar u kojemu se nalaze njihovi opisni podaci. Ova je tablica f_pretplate_d zanimljiva jer sadrţi mjeru o broju pretplatnika po pojedinim ciklusima, godinama i sliĉno. Te omogućuje menadţmentu KDVL-a analizu pretplatnika te stvaranje strategije upravljanja istima. Glavna knjiga koja sadrţi sva konta i ukljuĉuje knjiţenja po istima. Tablica je sastavljena na naĉin da je u njoj već definirana hijerarhija koja f_glavnaknjiga osim najviše razine grupe konta, sadrţi i najniţi nivo granularnosti, odnosno krajnji konto na kojemu je knjiţenje izvršeno. Mjere su iznosi na dugovnoj i potraţnoj strani. Arhiva glavne knjige koja sadrţi sva konta i ukljuĉuje knjiţenja po istima za prethodne godine. Ova se tablici koristi u sluĉajevima kada je nuţno f_glavnaknjiga_arhiva dohvatiti podatke raĉunovodstva starije od 2 godine radi vršenja analiza i usporedba. Tablica arhive za glavnu knjigu je izdvojena kako bi se odrţale performanse tekućih godina, s obzirom na broj zapisa koji se u ovoj tablici nalaze. Mjere su iznosi na dugovnoj i potraţnoj strani. Tablica 2. Pregled fakt tablica u skladištu podataka 33 7.1.3. Dimenzijske i pomoćne tablice Dimenzijske tablice su tablice na koje se referira ĉinjeniĉna tablica. U njima su spremljeni opisi, odnosno atributi pojedinih objekata, te na taj naĉin daju odgovor na pitanje po ĉemu se nešto analizira. U skladištu podataka se svi opisni atributi spremaju u kolonama u dimenzijskim tablicama pa je njihova organiziranost veoma bitna za dohvaćanje kvalitetnih znaĉenja mjera, što u konaĉnici i jest svrha dimenzijskih tablica (Rouse, Search Data Management, 2012). Shodno tome, u skladištu podataka KDVL-a se nalazi ukupno 14 dimenzijskih tablica od kojih su neke dijeljenje, odnosno koriste se za razliĉite analize. Bitno je uoĉiti da meĊu tablicama ne postoji vremenska dimenzija koja daje bit skladištu podataka, meĊutim u ovoj situaciji ona nije potrebna budući da svaka od ĉinjeniĉnih tablica ima u atributima datum na koji se moţe referirati pojedini dogaĊaj. Dimenzije su ukratko predstavljene u idućoj tablici. Opis Naziv tablice d_ciklusi d_organizatori Sadrţi informacije i atribute o pojedinim ciklusima u obiku kakvog koristi KDVL. Sadrţi informacije i atribute o organizatorima priredbi. Opis prostorija unutar KDVL (velika dvorana, mala dvorana i sliĉno.) u d_prostori kojima se moţe odvijati priredba ili neka druga aktivnost na temelju kojih KDVL moţe ispostaviti fakturu (garderoba i sliĉno.). d_sluzbe Opisuje sve funkcijske jedinice, odnosno odjele (sluţbe) koji postoje u KDVL. Sadrţi informacije o pojedinim uslugama koje su pruţene za pojedini d_priredbesub termin. KDVL osim usluga iznajmljivanja prostora, svojim kupcima moţe nuditi i usluge iznajmljivanja glazbene i tehniĉke opreme, njihovu montaţu i sliĉno. d_status Status termina koji se ţeli iznajmiti. Svaka dvorana u odreĊenom terminu moţe poprimiti razliĉite statuse poput „rezervirano“, „iznajmljeno“ i sliĉno. 34 d_suorganizatori d_usluge d_uslugeveze d_vrstatermina d_priredbe_d d_ciklusi_d d_adresar Dimenzija koja govori tko su organizator i suorganizator priredbi koje su organizirane u suorganizaciji. Sadrţi opise i informacije o uslugama koje pruţa KDVL. Sadrţi (pod)usluge koje su ukljuĉene u uslugu više razine. Ova je dimenzija izdvojena u pahuljastu strukturu zbog svoje rijetke promjenjivosti. Sadrţi opise i informacije o vrstama odrţanih termina (priredba, pokus, proba i sliĉno), odnosno razlog zbog kojega je odreĊeni prostor iznajmljen. Sadrţi opisne podatke o pojedinim priredbama kakve koristi tvrtka Dekod telekom d.o.o. prilikom upravljanja prodajom ulaznica. Sadrţi informacije o pojedinim ciklusima u obiku kakvog koristi tvrtka Dekod telekom d.o.o. prilikom upravljanja prodajom ulaznica. Popis svih pretplatnika te opće informacije o njima poput kontakt podataka. Sadrţi vrijeme ulaska u dvoranu za svaku pojedinu kartu. Svaka otkucana d_ulasci karta na ulazu u dvoranu, biljeţi se u ovu tablicu na naĉin da zapis sadrţi šifru priredbe, broj ulaznice i vrijeme ulaska. Tablica 3. Pregled dimenzijskih tablica u skladištu podataka Osim dimenzijskih i ĉinjeniĉnih tablica, u skladištu se pojavljuju još tri tablice koje se opisuju kao „pomoćne“ tablice, te u svojoj naravi nemaju svojstva niti se ponašaju poput dimenzijskih ili fakt tablica. Stvaranje pomoćnih tablica unutar skladišta podataka nije preporuĉljivo radi smanjenja performansi samog skladišta, stvaranja dodatnih veza meĊu tablicama i ĉesto ne fleksibilnosti samog skladišta. Prilikom provedbe ovog projekta implementacije BI sustava u KDVL, bilo je nuţnoj utvrditi naĉin na koji će se zadovoljiti potrebe korisnika, te istovremeno postaviti temelje za funkcioniranje poslovnih procesa u budućnosti. Iz tog je razloga postavljanje pomoćnih tablica bilo jedino rješenje. Tablica koja se koristi za kreiranje izvješća za marketing je u potpunosti samostalna, niĉim povezana na ostale tablice, što se zorno moţe vidjeti na slici modela prikazanog u prethodnom poglavlju. 35 Opisi i svrha svake od njih mogu se pronaći u tablici ispod. Naziv tablice Opis Ova tablica korisit se za spajanje plana nabave i glavne knjige. Plan nabave se spaja na tablicu mapirajuca po nazivu predmeta nabave, a tablica mapirajuca mapirajuca se spaja na glavnu knjigu po kontu. Ovakva pomoćna tablica ĉesto se naziva i „vezna“ tablica jer je njena osnovna svrha povezivanja planova sa glavnom knjigom u kojoj se nalaze stvarni podaci potrošnje za svaki pojedini predmet nabave. Pomoćna tablica u kojoj su sadrţane informacijeo tome koja se konta odnose na marketing, koja na organizaciju i sl. Ova je tablica kreirana sa definicija_troskova svrhom oznaĉavanja konta jer je za izvješće koje se kreira za potrebe marketinga, bitno vidjeti kolika su sredstva uloţena u organizaciju pojedine priredbe, rastavljeno na razliĉite segmente kao što su troškovi pojedinih odjela. Pomoćna tablica koja sadrţi kolone kao one koje se pojavljuju na izvješću za marketing. Tablica je kreirana u skladu sa zahtjevima korisnika, te se puni inkrementalno za sve nove zapise. Novi su zapisi svi oni koji imaju datum veći od maksimalnog datuma u tablici za_marketing. Svrha ove za_marketing tablice je ubrzanje pokretanja izvješća budući da se podaci dobavljaju iz više razliĉitih tablica, upit bi se predugo izvofio. Iz tog se razloga ova tablica puni tokom noći kada ima dovoljno vremena da se tablica ispuni svim novim podacima, a prilikom pokretanja izvješća upit se spaja na tu pomoćnu tablicu. Tablica 4. Pregled pomoćnih tablica u skladištu podataka 36 7.2. ETL upotrebom Kettle-a ETL je akronim engleskih rijeĉi Extract, Transform, Load što znaĉi dohvaćanje, transformaciju i uĉitavanje podataka. ETL je skup akcija i procesa kojima se izvršavaju upravo prethodno navedene tri akcije uz pomoć specifiĉnog programskog rješenja. On omogućuje organizacijama konsolidaciju podataka koji u razliĉitim oblicima stiţu iz više izvora. Alati u kojima se modeliraju i provode ETL procesi najĉešće su grafiĉki orijentirani i koriste razliĉite ikone ili prethodno definirane procedure koje obavljaju specifiĉni dio posla koji se pojavljuje tijekom toka podataka od izvorišnih tablica do onih destinacijskih. Osim ove primarne funkcije (integracija podataka), ETL procesi se ĉesto koriste i za migraciju podataka, relacijskih baza i skladišta podataka na nove tehnologije, posluţitelje i sliĉno (WiseGEEK, 2009). Kettle je alat otvorenog izvornog koda koji je dio Pentaho BI platforme i specijaliziran je za provedbu ETL procesa. U ovom alatu moguće je razvijati tzv. transformacije (engl.transformations) i poslove (engl.jobs). Posao je širi pojam od transformacije i u njemu se odreĊuje tijek izvršavanja transformacija, odnosno cijelog ETL procesa. Transformacije su uţe i u njima se vrši konkretni prijenos podataka i vrše se odreĊene radnje nad njima. U Kettle grafiĉkom suĉelju logika se modelira koristeći ikone koje se spajaju meĊusobnim uvjetnim ili bezuvjetnim vezama (engl.hops). One su rasporeĊene u velike skupine od kojeg se najĉešće koriste: Ulaz (engl.input) – skupina koja sadrţi elemente za spajanje na izvore podataka. Izlaz (engl.output) – skupina koja sadrţi elemente za spajanje na destinacijske baze, odnosno na destinacijske tablice Obrada (engl.transform) – u ovoj se skupini nalaze elementi koji se postavljaju izmeĊu ulaza i izlaza u logici toka podataka. Ovi elementi vrše transformacije nad podacima te su kljuĉni dio ETL procesa. Na trţištu besplatnih alata za provedbu ETL-a Kettle se pozicionirao kao jedno od najboljih rješenja s obzirom na stalno unapreĊivanje funkcionalnosti, praćenje trendova, jak utjecaj zajednice i ostalo(Pentaho, 2013). 37 7.2.1. Izvori podataka Projekt implementacije BI sustava u KDVL ukljuĉuje dohvaćanje izvornih podataka sa ĉetiri razliĉitih sustava: MS Access Oracle DB 9g MS SQL Server MS Excel Svaki od izvora je detaljnije opisan u nastavku. „Kockice“ je naziv za bazu podataka koja se koristi kao jedan od izvora za DWH. Radi se o Microsoft Access bazi podataka u kojoj se evidentiraju podaci o svim terminima i priredbama koje se odrţavaju u KDVL. Baza je sastavljena od strane tvrtke Art-print studio u ĉijoj je nadleţnosti odrţavanje IT-a za KDVL. Ovaj izvor podataka sastoji se od ukupno jedanaest tablica ĉiji su nazivi i opisi navedeni u tablici ispod. Naziv tablice Opis Najveća i kljuĉna tablica u bazi. Sadrţi popis svih odrţanih termina u KDVL i njihove opise. Ova tablica sadrţi i kljuĉeve za povezivanje na ostale tablice. f Priredbe Sadrţi sve podatke vezane za pojedini dogaĊaj u dvorani, vrijeme odrţavanja, prostor, broj gledatelja, vrsta termina i sliĉno. Ova tablica sadrţi preko 100 kolona, a kolona PriredbaID je primarni kljuĉ. Ciklusi U ovoj tablici se nalazi popis svih ciklusa, njihove kratice i opisi. Primarni kljuĉ tablice je kolona CiklusID. Ova tablica sadrţi popis svih organizatora priredbi i njihove opise poput OIB- Organizatori a, adrese, kontakta, ţiro raĉuna i sliĉno. Primarni kljuĉ tablice je kolona OrganizatorID. U ovoj se tablici biljeţe usluge koje je KDVL isporuĉio za pojedinu priredbu. PriredbeSub Tablica ima strane kljuĉeve na tablice Priredbe (PriredbaID) i Usluge (UslugaID). Prostori U ovoj se tablici nalazi popis svih prostorija unutar dvorane, njihove kratice i opisi. Primarni kljuĉ tablice je kolona ProstorID. 38 Sluzbe Status Ova tablica sadrţi naziv, kraticu i opis sluţbi u KDVL. Primarni kljuĉ tablice je kolona SluzbaID. Tablica sadrţi naziv i opis statusa termina koji moţe bit rezerviran, zakljuĉan, potvrĊen, završen ili otkazan. Primarni kljuĉ tablice je kolona StatusID. Ova tablica prikazuje koji su organizatori u suorganizaciji za odreĊenu Suorganizatori priredbu. Tablica ima samo dvije kolone i one su strani kljuĉevi na tablice Priredbe (PriredbaID) i Organizatori (OrganizatorID). Usluge UslugeVeze U ovoj se tablici nalazi popis usluga koje KDVL isporuĉuje. Primarni kljuĉ tablice je kolona UslugaID. Tablica u kojoj se biljeţe pod usluge, a veţu se na tablicu Usluge putem stranog kljuĉa (UslugaID). U ovoj se tablici nalazi popis razliĉitih vrsta termina, njihove kratice i opisi. VrstaTermina Vrsta termina govori da li je termin pokus, generalna proba, priredba ili nešto drugo. Primarni kljuĉ tablice je kolona VrstaTerminaID. Tablica 5. Opis tablica sa izvora MS Access Financije je naziv za izvor podataka iz raĉunovodstvene baze. Radi se o MS SQL bazi podataka koja je sastavljena od strane tvrtke ZagrebData d.o.o. u ĉijoj je nadleţnosti odrţavanje raĉunovodstva za KDVL. Ovaj izvor podataka sastoji se od dvije tablice ĉiji su nazivi i opisi navedeni u tablici ispod. Naziv tablice Opis Ova tablica sadrţi sva knjiţenja i stanja po kontima za tekuću i prošlu f_glavnaknjiga godinu. Tablica ima kolone koje sadrţe nazive klasa, grupa, konta od sintetiĉke (grupirano, manja razina detalja) do analitiĉke razine (visoka razina detalja). Ova tablica sadrţi sva knjiţenja i stanja po kontima za sve povijesne f_glavnaknjiga_arhiva godine. Tablica ima kolone koje sadrţe nazive klasa, grupa, konta od sintetiĉke (grupirano, manja razina detalja) do analitiĉke razine (visoka razina detalja). Tablica 6. Opis tablica sa izvora MS SQL Server 39 Ulaznice je naziv za izvor podataka koji se nalazi u bazi prodanih ulaznica. Za punjenje DWH-a koristiti će se samo odreĊeni broj relevantnih tablica iz izvornog sustava. Radi se o Oracle bazi podataka koja je sastavljena od strane tvrtke Dekod telekom d.o.o. u ĉijoj je nadleţnosti prodaja ulaznica za dogaĊaje odrţane u KDVL. Ovaj izvor podataka sastoji se od pet tablica ĉiji su nazivi i opisi navedeni u tablici. Naziv tablice Opis Ova tablica sadrţi popis svih priredbi za koje su prodavane ulaznice, i njihove f Priredbe opise poput datuma, naziva, ciklusa i dvorane. Primarni kljuĉ u ovoj tablici je kolona Sifra. Ova tablica sadrţi sve relevantne podatke o prodanim i besplatnim ulaznicama f Ulaznice za pojedinu priredbu. Tablica takoĊer sadrţi i cijene ulaznica kao i kanal prodaje te ostale atribute. Ciklusi Pretplate Tablica koja sadrţi samo strane kljuĉeve na tablicu Priredbe. Ova tablica jasno pokazuje koja priredba spada u koji ciklus. Ova tablica sadrţi popis svih pretplata, te kojoj lokaciji one pripadaju (sektor, red, mjesto). Ova tablica sadrţi popis svih pretplatnika, te njihove opise. Pretplatnici su Adresar fiziĉke osobe pa se u tablici biljeţe osobni i kontakt podaci. Primarni kljuĉ tablice je kolona Sifra. Ulasci U tablici su zabiljeţene sve “otkucane” karte prilikom ulaska na pojedine priredbe. Tablica 7. Opis tablica sa izvora Oracle Izvor u obliku Excel file-ova koristi se za izvlaĉenje podataka o predmetu i vrijednosti nabave za izvješće Plan nabave te za definiciju troškova (koji konto je trošak marketinga, koji organizacije i sl.) za izvješće za marketing. TakoĊer, Excel se koristi za mapiranje konta iz glavne knjige sa predmetom nabave iz Excela. 40 7.2.2. Transformacija podataka Transformacija podataka vršila se prema pravilima i metodologijama izgradnje skladišta podataka. U prvom koraku su se podaci sa izvora u identiĉnom obliku prebacivali u tablice koje nose jednake nazive i imaju jednake kolone u privremenu ili prijelaznu bazu podatka koja se naziva „stage“ baza. Smisao stage baze jest rasterećenje izvornih sustava i sigurnost podatka koji se na izvornom sustavu nalaze iz razloga što se nad tim podacima moraju vršiti odreĊene radnje, obrade, transformacije pa je znatno sigurnije to vršiti nad podacima iz prijelazne baze. U drugom koraku transformacije dovlaĉe se podaci iz stage baze koji se spremaju za uĉitavanje u skladište podataka. Prethodno modelirano skladište podataka posjeduje tablice koje su nazvane i strukturirane prema pravilima izgradnje skladišta podataka. U okviru provedbe projekta implementacije BI sustava u KDVL većina je podataka s izvora bilo kvalitetno strukturirano te iz tog razloga nije bilo potrebe za mnogim transformacijama. Najviše se transformacija vršilo nad podacima koji se spremaju za punjenje fakt tablice f_priredbe gdje je bilo potrebno stvoriti pojedine kljuĉeve za povezivanje na dimenzijske tablice, pripremu kolona sa datumom i vremenom odrţavanja priredbi, te stvaranje kolona koje grupiraju odreĊene podatke u skupine. Upotrebom alata za izgradnju ETL procedura Kettle, stvoreno je ukupno 6 transformacija. Za svaki od izvora podataka koji se prebacuje u stage fazu po jedna transformacija: MS Access - Stage MS Excel - Stage MS SQL Server - Stage Oracle DB 9i - Stage Nakon što se napuni stage baza sa izvornim podacima, u jednoj se transformaciji oni obraĊuju i pune skladište podataka: Stage - Skladište podataka 41 Za izdvojenu pomoćnu tablicu koja se koristi za kreiranje izvješća za marketing kreirana je zasebna transformacija: Skladište podataka - pomoćna tablica Na slici ispod prikazano je suĉelje alta za provedbu ETL procedura. Na slici je vidljivo prebacivanje podataka i vršenje odreĊenih transformacija nad njima u fazi punjenja skladišta podataka. Za svaku tablicu u skladištu postoji njen ulaz, što je tablica iz stage baze, i njena destinacija, što je konaĉna tablica u skladištu podataka. Slika 7. Prikaz transformacije za punjenje skladišta podataka 42 7.2.3. Učitavanje podataka Nakon izraĊenih transformacija koje kupe podatke s izvora i spremaju ih u stage bazu, transformacija za obradu podataka i punjenje skladišta, te punjenje pomoćne tablice, one se logiĉki slaţu unutar jednog posla (engl.job) u Kettle alatu. Job je temeljna jedinica koja upravlja tokom aktivnosti i ĉini jednu cjelinu koja je sastavljena od transformacija, poredanih u logiĉan slijed provedbe, kao što je prikazano na slici. Slika 8. Kettle job koji upravlja procesom uĉitavanja podataka S obzirom na koliĉinu podataka koji se pojavljuju u okviru ovog projekta, i s obzirom na poslovne procese KDVL-a,cijeli model je sastavljen na naĉin da se svake noći, u 4:00 ujutro provodi cijeli proces i puni sve tablice skladišta podataka. Uĉitavanje traje oko 10 minuta, a u tom se periodu napuni 20 tablica, koje zajedno imaju preko 250 kolona i u testnoj fazi su zajedno imale preko 300 000 zapisa. 43 7.3. Izvješćivanje Skladište podataka u arhitekturi sustava koji je implementiran u KDVL temelj je za izradu izvješća i analiza. Pentaho BI platforma u svom portfelju ukljuĉuje i Pentaho Report Designer (PRD) alat za naprednu izradu izvješća. Mogućnosti PRD-a su veoma široke meĊu kojima se osim standardnih grafiĉkih mogućnosti mogu naći i predefinirani obrasci izvješća, mogućnost izrade pod izvješća i njihova povezivanja, pisanje razliĉitih proraĉunskih izraza i još mnogo toga . U skladu sa zahtjevima i potrebama korisnika BI sustava u KDVL, izraĊena su ukupno tri izvješća koja se temelje na podacima iz skladišta podataka. To su: Izvješće o terminima GUK-a17 Plan nabave Izvješće za marketing Svako od ova tri izvješća izraĊeno je putem Pentaho Report Designer-a. Izvješća su nakon izrade objavljena na Pentaho posluţitelj koji distribuira izvješća putem zajedniĉkog repozitorija. Njima je moguće pristupiti kroz internet pretraţivaĉ iz lokalne mreţe KDVL-a, a za to je potrebno u pretraţivaĉ upisati adresu posluţitelja te se spojiti na Pentaho User Consloe (PUC) sa svojim korisniĉkim imenom i lozinkom. PUC je prikazan na slici ispod. Slika 9. Suĉelje Pentaho User Console 17 GUK – Gradski ured za kulturu 44 Sama izvješća su izraĊena u naprednom obliku te su dinamiĉna. Svakodnevno prikazuju svjeţe podatke koji su tokom noći dospjeli u skladište, te imaju mogućnost odabira parametra što im daje dinamiĉnost. Prilikom pokretanja izvješća korisniku se prikazuje tzv. prompt18 na kojem se odabiru parametri izvješća. Na slikama niţe je prikazan primjer prompt-a za Izvješće marketinga, te izgled samog izvješća uz napomenu da su podaci vidljivu na izvješću testni i ne odgovaraju stvarnom stanju. Slika 10. Prompt za izvješće marketinga Slika 11. Izgled izvješća za marketing 18 Definirani prozor koji sadrţi parametre 45 8. Zaključak Sustavi za izvješćivanje, i sustavi poslovne inteligencije općenito, stvoreni su kako bi donositeljima odluka unutar neke organizacije pruţali potporu. Isto tako, sustavi poslovne inteligencije stvaraju informacije iz podataka koje, ukoliko su pruţene u pravom obliku i u pravo vrijeme, stvaraju dodatnu vrijednost za organizaciju što povećava konkurentnost na trţištu. Mnogi menadţeri u svijetu prepoznali su vaţnost pravilnog upravljanja podacima pa je stoga ova grana informacijskih tehnologija u konstantnom rastu. Tome u prilog govori i podatak da se u zadnjih nekoliko godina poĉela razvijat izdvojena grana znanosti koja se naziva znanost o podacima (engl. data sience) (Stanton, 2013). KDVL je zrela organizacija koja je svjesna mogućnosti unaprjeĊenja poslovnih procesa i prepoznala potrebu za implementacijom BI sustava. TakoĊer, orijentiranost besplatnim tehnologijama je sve popularnije bilo iz financijskih razloga, lake dostupnosti, ili iz nekog drugog razloga. U ovom projektu se izbor besplatne tehnologije, u obliku Pentaho BI platforme, pokazao kao pravilan potez iz razloga što je ova platforma dovoljno tehnološki funkcionalan da je mogla zadovoljiti sve faze razvoja i implementacije BI sustava u KDVL.¸ Implementirani Bi sustav u KDVL u potpunosti je izraĊen u skladu sa korisniĉkim zahtjevima i specifikacijom koja je definirana u pred implementacijskoj analizi. Iskorištena je postojeća infrastruktura te je razvijen sustav koji je skalabilan, nadogradiv, i posluţit će kao temelj u daljnjem razvoju upravljanja podataka unutar KDVl, na zadovoljstvo naruĉitelja i implementatora. 46 8.1. Ograničenja i prepreke Prilikom implementacije sustava uvijek je nuţno raĉunati na odreĊene rizike. Rizik je dogaĊaj za kojeg postoji vjerojatnost da će nastupiti u budućnosti i eventualno omesti proces razvoja ili implementacije sustava. Detaljnijim planiranjem izrade projekta moguće je predvidjeti rizike i utjecati na njihovo izbjegavanje. Tokom provedbe projekta implementacije BI sustava u KDVL, pojavila su se odreĊena ograniĉenja i prepreke: U poĉetku projekta nije bilo iskustva sa Pentaho BI platformom te je dio vremena izdvojen na prouĉavanje funkcionalnosti platforme sa ciljem kvalitetnije izvedbe projekta od strane implementatora. Infrastruktura KDVL u periodu implementacije bila je ograniĉena na samo jednog posluţitelja koji se koristio prilikom razvoja i testiranja te u konaĉnici kao produkcijski posluţitelj . Navedenim ograniĉenjima i preprekama se pristupilo sa visokom dozom opreza te je svaka od njih u konaĉnici uspješno savladana. U budućnosti se sustav moţe razvijati neovisno o njima što dovoljno govori o prilagodljivosti i fleksibilnosti, kako samog sustava tako i organizacije koja se njime koristi. 47 8.2. Koristi za menadžment Od implementiranog sustava koristi koje dobiva menadţment su višestruke. Bez visokih ulaganja KDVL je dobio jedan suvremeni sustav poslovne inteligencije koji je funkcionalan i omogućava zaposlenicima jednostavan i brz uvid u toĉne informacije, na dnevnoj razini. Na taj se naĉin štede resursi vremena pa menadţment moţe bolje optimizirati ostale resurse. TakoĊer, menadţment KDVL-a otvorio je novo poglavlje u razvoju internih poslovnih procesa u kojima zaposlenici prepoznaju snagu informacijskih tehnologija. U budućnosti moguće je postojeći sustav razviti do razine da se postave kljuĉni pokazatelji uspješnosti na visoku razinu što svakako pridonosi razvoju same organizacije, kulture, društava… 48 Literatura Baturina, D. (2006). Intervju. Split: Sveuĉilište u Splitu, Filozofski fakultet. BIcortex. (03 2012). Preuzeto 22. 07 2013 iz http://bicortex.com/2012-gartner-bi-magicquadrant-report/ Bokan, N. G. (2010). Utjecaj financijske krize i reakcija monterne politike u Hrvatskoj. Zagreb: Hrvatska Narodna Banka. Bonifati, A. e. (2001). Designing Data Marts for Data Warehouse. Milano: ACM Transactions on Software Engineering and Methodology. Carly, L. (2004). Project Management Primer. Bureau of Reclamation. Coyle, G. (2004). The Analytic Hierarchy Process (AHP). Open Access Material. Crljenko Perković, L. (2009). Važnost sustava za potporu odlučivanju na primjeru uporabe sustava poslovne inteligencije Cognos u poslovanju tvrtke. Rijeka: Sveuĉilište u Rijeci, Ekonomski fakultet. Data Warehouse Definition. (01 2013). Preuzeto 22. 07 2013 iz 1 key data: http://www.1keydata.com/datawarehousing/data-warehouse-definition.html Hale, J. (2011). Understanding Research Methodology 3: Goals of Scientific Research. Psych Central. Hernaus, T. (2006). transformacija klasične organizacije u organizaciju orijentiranu na poslovne procese. Zagreb: Sveuĉilište u Zagrebu, Ekonomski fakultet. Hiong, G. S. (2005). Open source and commercial software. Washington: Business Software Alliance. Howson, C. (2008). Successful Business Intelligence. New York: McGraw-Hill. JasperSoft. (2007). An Introduction to the JasperSoft Business Intelligence Suite. San Francisco: JasperSoft. Kimball, B. R. (2002). The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling. Wiley. Lisiĉić, L. (1993). 20 godina Kocertne dvorane Vatroslava Lisinskog. Zagreb: Koncertna dvorana Vatroslava Lisinskog. MicroStrategy. (01 2013). MicroStrategy. Preuzeto http://www.microstrategy.com/software/business-intelligence 22. 07 2013 iz Nikitović, M. (2009). Kritični faktori uspješnosti implementacije. Zagreb: VIDI.biz. 49 Nikolić, I. B. (1996). Višekriterijumska optimizacija: metode, primena u logistici, softver. Beograd: Centar vojnih škola VJ. Orešĉanin, D. (2011). Osiguranje kvalitete podataka u skladištima podataka. Zagreb: Sveuĉilište u Zagrebu, Fakultet elektrotehnike i raĉunarstva. Panian, Ţ. K. (2003). Poslovna inteligencija. Zagreb: Masmedia. Pentaho. (2013). Preuzeto 07. 22 2013 iz Pentaho Kettle project: http://kettle.pentaho.com/ Pentaho. (2008). Introducing the Pentaho BI Suite Community. Orlando: Pentaho. PI. (2013). Poslovna inteligencija d.o.o. Preuzeto http://www.inteligencija.com/index.php/hr/o-nama/tko-smo.html 18. 08 2013 iz PMI. (2008). A Guide to the Project Management Body of Knowledge. ennsylvania: Project Management Institute. Rainardi, V. (2008). Building a Data Warehouse with Example in SQL Server. Apress. Raoul-Abelin Choumin, N. User and Key-user concept after a software deployment. CADPLM Consultants. Rouse, M. (09 2010). Search Data Management. Preuzeto 20. 07 2013 iz Snowflaking: http://searchdatamanagement.techtarget.com/definition/snowflaking Rouse, M. (04 2012). Search Data Management. Preuzeto 20. 07 2013 iz Dimension table: http://searchdatamanagement.techtarget.com/definition/dimension-table Saaty, T. L. (1980). The Analytic Hierarchy Process. New York: McGraw-Hill. Stanton, J. (2013). An introduction to Data Sience. Syracuse : School of Information Studies. Šaban, J. (06 2011). BUG online. Preuzeto 20. 07 http://www.bug.hr/mreza/tekst/modeliranje-skladista-podataka/95521.aspx 2013 iz WiseGEEK. (2009). Preuzeto 07. 21 2013 iz http://www.wisegeek.com/what-is-etl.htm Zelenika, R. (1998). Metodologija i tehnologija izrade znanstvenog i stručnog djela. Rijeka: Ekonomski fakultet. 50 Popis slika i tablica Slika 1. Grafiĉki prikaz utjecaja pojedinog kriterija na konaĉni rezultat ..................................9 Slika 2. Usporedba alata po kriteriju MySQL friendly .......................................................... 23 Slika 3. Rezultati analize po AHP metodi ............................................................................. 24 Slika 4. Konaĉni poredak alata i utjecaj kriterija na svaki od njih ..........................................25 Slika 5. Fiziĉka arhitektura sustava ....................................................................................... 27 Slika 6. Model skladišta podataka ......................................................................................... 31 Slika 7. Prikaz transformacije za punjenje skladišta podataka ............................................... 42 Slika 8. Kettle job koji upravlja procesom uĉitavanja podataka ............................................. 43 Slika 9. Suĉelje Pentaho User Console .................................................................................. 44 Slika 10. Prompt za izvješće marketinga ............................................................................... 45 Slika 11. Izgled izvješća za marketing .................................................................................. 45 Tablica 1. Popis kriterija i njihovih rangova ..........................................................................10 Tablica 2. Pregled fakt tablica u skladištu podataka .............................................................. 33 Tablica 3. Pregled dimenzijskih tablica u skladištu podataka ................................................ 35 Tablica 4. Pregled pomoćnih tablica u skladištu podataka ..................................................... 36 Tablica 5. Opis tablica sa izvora MS Access ......................................................................... 39 Tablica 6. Opis tablica sa izvora MS SQL Server.................................................................. 39 Tablica 7. Opis tablica sa izvora Oracle ................................................................................ 40 51 Sažetak Poslovnom inteligencijom se prema odreĊenim metodologijama i pravilima, prikupljaju, analiziraju i distribuiraju informacije dobivene iz podataka. Vrijednost ovakvih sustava prepoznata je meĊu mnogim velikim organizacijama diljem svijeta, a prepoznala ju je i Koncertna dvorana Vatroslava Lisinskog. Upotrebom besplatne tehnologije, u ovu je dvoranu implementirano skladište podataka i sustav izvješćivanja koji poĉivaju na MySQL bazama i platformi za poslovnu inteligenciju Pentaho. Implementacijom skladišta, prikupljeni su podaci iz više razliĉitih izvora koji su strukturirani i transformirani u Kettle alatu za provedbu ETL procesa i uĉitani u skladište podataka, kako bi se u dvorani na jednom mjestu moglo pristupiti svim potrebnim podacima. Zahvaljujući razvoju tehnologija, izraĊeni sustav plasiran je na Internet putem svog servera, te svaki od korisnika sustava ima mogućnost izrade, pregledavanja i analize izvješća. Ovakav sustav stvara dodatnu vrijednost za menadţment KDVL-a što im osigurava kvalitetnije i produktivnije poslovanje u budućnosti, kao i temelj za unaprjeĊenje poslovnih procesa. KLJUČNE RIJEČI: Koncertna dvorana Vatroslava Lisinskog, Business Intelligence, poslovna inteligencijea, DWH, skladište podataka, ETL, Pentaho BI platform, Kettle 52 Summary Business intelligence is a system that uses several rules and methods for collecting, analyse and distributing information which are derived from various data. The value of systems like this one is recognized in many large companies worldwide as well as in cultural organization such as Vatroslav Lisinski concert hall. Using open source and free technology, business intelligence and Data Warehouse systems were implemented in this hall, based on MySQL data bases and Pentaho BI platform. With DWH implemented, data from various sources was structured and transformed with Pentaho Dana Integration tool Kettle which is used for ETL design, development and data loading, with purpose of gathering all of data in one place. Data stored like this, can be easily reached and maintained. Thanks to the technology development, BI system is published to web through Pentaho server, and now each user has opportunity for develop, deploy, analyze and read reports. Thanks to the technology development, BI system is published to web through Pentaho server, and now each user has opportunity for develop, deploy, analyze and read reports. From now on, Lisinski hall has reached new value and management of hall can optimize resources to be more productive in future, and has good base for improving business processes. KEY WORDS: Vatroslav Lisinski concert hall, Business Intelligence, poslovna inteligencijea, DWH, skladište podataka, ETL, Pentaho BI platform, Kettle 53 Zahvala Za uspješno napisani diplomski rad koji predstavlja završetak i krunu školovanja zahvaljujem se: Svojim roditeljima i bliţnjima na beskrajnoj podršci koju su mi pruţali tokom ĉitavog školovanja. Mentorici sa Ekonomskog fakulteta u Splitu, dr.sc. Maji Ćukušić na ukazanom povjerenju, strpljenju, savjetima i raspoloţivosti. Za sudjelovanje na uspješno provedenom projektu implementacije BI sustava u KDVL i iskustvu i znanju koje sam stekao zahvaljujem se: Tvrtki Poslovna inteligencija d.o.o. iz Zagreba, njenoj Upravi, ĉlanovima tima, voditelju projekta, i svim kolegama na ukazanom povjerenju i pruţenoj prilici za rad na ovakvom projektu. 54
© Copyright 2024 Paperzz