fbpx

Skladištenje podataka i planiranje resursa preduzeća | DWH i ERP

ARHIV PODACI CENTRAL: ISTORIJA ED EVOLUCIJE

Dvije dominantne teme korporativne tehnologije 90-ih bile su i skladište podataka i ERP. Dugo su vremena ove dvije moćne struje bile dio korporativne IT bez ikakvih ukrštanja. Bilo je gotovo kao da su materija i anti-materija. Ali rast oba fenomena neminovno je doveo do njihovog ukrštanja. Danas se kompanije suočavaju sa problemom šta da rade sa ERP i skladište podataka. Ovaj članak će opisati koji su problemi i kako ih kompanije rješavaju.

NA POČETKU…

U početku je bilo skladište podataka. Skladište podataka je kreiran kako bi se suprotstavio aplikacijskom sistemu za obradu transakcija. U prvim danima pamćenje dati trebalo je da bude samo kontrapunkt aplikacijama za obradu transakcija. Ali danas postoje mnogo sofisticiranije vizije onoga što a skladište podataka. U današnjem svijetu skladište podataka umeće se u strukturu koja se može nazvati Fabrika korporativnih informacija.

TVORNICA KORPORATIVNIH INFORMACIJA (CIF)

Fabrika korporativnih informacija ima standardne arhitektonske komponente: nivo transformacije i integracije koda koji integriše dati dok sam ja dati oni se kreću od okruženja aplikacije prema okruženju skladište podataka kompanije; a skladište podataka kompanije u kojoj i dati detaljne i integrisane istorije. The skladište podataka kompanije služi kao temelj na kojem se mogu graditi svi ostali dijelovi okruženja kompanije skladište podataka; skladište operativnih podataka (ODS). ODS je hibridna struktura koja sadrži neke aspekte skladište podataka i drugi aspekti OLTP okruženja; baza podataka, gdje različita odjeljenja mogu imati vlastitu verziju skladište podataka; a skladište podataka istraživanja u kojoj "filozofi" kompanije mogu poslati svoje upite u trajanju od 72 sata bez štetnog uticaja na skladište podataka; i memoriju blizu linije, u kojoj dati stari i dati veliki detalji se mogu jeftino pohraniti.

GDJE SE ERP kombinuje sa TVORNICA KORPORATIVNIH INFORMACIJA

ERP se spaja sa Fabrikom korporativnih informacija na dva mesta. Prvo kao osnovna aplikacija (osnovna linija) koja pruža i dati prijave na skladište podataka. U ovom slučaju i dati, generirani kao nusprodukt procesa transakcije, integrirani su i učitani u skladište podataka kompanije. Druga tačka spajanja ERP-a i CIF-a i ODS-a. Zapravo, u mnogim okruženjima ERP se koristi kao klasični ODS.

U slučaju da se ERP koristi kao osnovna aplikacija, isti ERP se može koristiti iu CIF-u kao ODS. U svakom slučaju, ako se ERP koristi u obje uloge, mora postojati jasna razlika između dva entiteta. Drugim riječima, kada ERP igra ulogu osnovne aplikacije i ODS-a, dva arhitektonska entiteta moraju se razlikovati. Ako jedna implementacija ERP-a pokuša da obavlja obje uloge istovremeno, neizbježno će doći do problema u dizajnu i implementaciji te strukture.

ODVOJENI ODS I OSNOVNE PRIMJENE

Mnogo je razloga koji dovode do podjele arhitektonskih komponenti. Možda najizrazitije pitanje za odvajanje različitih komponenti arhitekture je to što svaka komponenta arhitekture ima svoj pogled. Osnovna aplikacija služi drugačijoj svrsi od ODS-a. Pokušajte da se preklapate

osnovni pogled aplikacije na svijet ODS-a ili obrnuto nije pravi način rada.

Shodno tome, prvi problem ERP-a u CIF-u je provjeriti postoji li razlika između osnovnih aplikacija i ODS-a.

MODELI PODATAKA U KORPORACIJI FABRIKA INFORMACIJA

Da bi se postigla kohezija između različitih komponenti CIF arhitekture, mora postojati model dati. Modeli of dati oni služe kao veza između različitih komponenti arhitekture kao što su osnovne aplikacije i ODS. Modeli dati oni postaju “intelektualna mapa puta” kako bi dobili pravo značenje iz različitih arhitektonskih komponenti CIF-a.

Idući ruku pod ruku sa ovom idejom, ideja je da treba postojati jedan veliki i jedinstveni model dati. Očigledno da mora postojati model dati za svaku od komponenti, a takođe mora postojati razuman put koji povezuje različite modele. Svaka komponenta arhitekture – ODS, osnovne aplikacije, skladište podataka kompanije, i tako dalje.. – treba svoj model dati. I zato mora postojati precizna definicija kako ti modeli dati međusobno se povezuju.

MOVE I PODACI DATUM ERP-a SKLADIŠTVO

Ako je porijeklo dati je osnovna aplikacija i/ili ODS, kada ERP ubacuje i dati Nel skladište podataka, ovo umetanje se mora odvijati na najnižem nivou "granularnosti". Jednostavno sumirajte ili agregirajte i dati budući da izlaze iz ERP osnovne aplikacije ili ERP ODS nije prava stvar. THE dati detalji su potrebni u skladište podataka da čine osnovu DSS procesa. Takve dati će se na mnogo načina preoblikovati bazama podataka i istraživanjima skladište podataka.

Displacement of dati od osnovnog ERP okruženja aplikacije na skladište podataka kompanije se obavlja na razumno opušten način. Ovaj potez se dešava otprilike 24 sata nakon ažuriranja ili kreiranja u ERP-u. Činjenica da imate "lijeni" pokret dati Nel skladište podataka kompanije dozvoljava dati dolazi iz ERP-a na "depozit". Jednom i dati su pohranjeni u osnovnoj aplikaciji, onda možete sigurno premjestiti dati ERP-a u kompaniji. Još jedan cilj dostižan zahvaljujući "lijenjem" pokretu dati to je jasna granica između operativnih procesa i DSS. Sa "brzim" pokretom dati linija razdvajanja između DSS-a i operativnog ostaje nejasna.

Kretanje dati od ODS-a ERP-a do skladište podataka kompanije se vrši periodično, najčešće sedmično ili mjesečno. U ovom slučaju kretanje od dati zasniva se na potrebi da se "očisti" staro dati istoričari. Naravno, ODS sadrži i dati koji su mnogo noviji od dati istoričari pronašli u skladište podataka.

Displacement of dati Nel skladište podataka gotovo nikad se ne radi na "veliko" (na veleprodajni način). Kopirajte tabelu iz ERP okruženja u skladište podataka to nema smisla. Mnogo realniji pristup je premještanje odabranih jedinica dati. Samo dati koji su se promijenili od posljednjeg ažuriranja skladište podataka oni su ti koje treba preseliti u skladište podataka. Jedan od načina da saznate koje dati promijenili od posljednjeg ažuriranja je da pogledate vremenske oznake dati nalazi u ERP okruženju. Dizajner bira sve promjene koje su se dogodile od posljednjeg ažuriranja. Drugi pristup je korištenje tehnika hvatanja promjena dati. Ovim tehnikama analiziraju se dnevnici i trake dnevnika kako bi se utvrdilo koje dati moraju biti premješteni iz ERP okruženja u okruženje skladište podataka. Ove tehnike su najbolje jer se zapisnici i trake dnevnika mogu čitati iz ERP datoteka bez daljeg utjecaja na druge ERP resurse.

DRUGE KOMPLIKACIJE

Jedan od problema ERP-a u CIF-u je šta se dešava sa drugim izvorima aplikacija ili sa njima dati ODS-a koji mora doprinijeti skladište podataka ali nisu dio ERP okruženja. S obzirom na zatvorenu prirodu ERP-a, posebno SAP-a, pokušaj integracije ključeva iz eksternih izvora dati sa i dati koji dolaze iz ERP-a prilikom premještanja dati Nel skladište podataka, to je veliki izazov. I koje su tačno vjerovatnoće da i dati aplikacija ili ODS-ova izvan ERP okruženja će biti integrirani u skladište podataka? Šanse su zapravo vrlo visoke.

FIND PODACI ISTORIJAT IZ ERP

Još jedan problem sa dati ERP-a proizilazi iz potrebe da se ima dati istorijski unutar skladište podataka. Obično skladište podataka potrebe dati istoričari. A ERP tehnologija ih obično ne pohranjuje dati istorijski, barem ne do te mere da je to neophodno u skladište podataka. Kada je velika količina dati istorija počinje da se zbraja u ERP okruženju, to okruženje treba očistiti. Na primjer, pretpostavimo da je a skladište podataka mora biti opterećen sa pet godina dati historijske podatke, a ERP ih čuva najviše šest mjeseci dati. Sve dok je kompanija zadovoljna prikupljanjem serije dati istoričari kako vrijeme prolazi, onda nema problema u korištenju ERP-a kao izvora za skladište podataka. Ali kada je skladište podataka mora se vratiti u prošlost i dobiti bogove dati istorije koje ERP nije prethodno prikupio i sačuvao, tada ERP okruženje postaje neefikasno.

ERP I METADATAK

Još jedno razmatranje o ERP-u i skladište podataka je onaj o metapodacima koji postoje u ERP okruženju. Baš kao što metapodaci prelaze iz ERP okruženja u IT okruženje skladište podataka, metapodaci moraju biti premješteni na isti način. Nadalje, metapodaci se moraju transformirati u format i strukturu koje zahtijeva infrastruktura skladište podataka. Postoji velika razlika između operativnih metapodataka i DSS metapodataka. Operativni metapodaci su prvenstveno za programera i

programer. DSS metapodaci su prvenstveno za krajnjeg korisnika. Postojeći metapodaci u ERP aplikacijama ili ODS-ovima treba da se konvertuju, a ova konverzija nije uvek laka i jasna.

IZVORI ERP PODATAKA

Ako se ERP koristi kao provajder dati po il skladište podataka mora postojati čvrst interfejs koji pomera dati iz ERP okruženja u okruženje skladište podataka. Interfejs mora:

  • ▪  biti jednostavan za korištenje
  • ▪  dozvolite pristup dati ERP-a
  • ▪  dobiti značenje dati koji će uskoro biti preseljeni u skladište podataka
  • ▪  znati ERP ograničenja koja mogu nastati prilikom pristupa dati ERP-a:
  • ▪  referentni integritet
  • ▪  hijerarhijski odnosi
  • ▪  implicitne logičke relacije
  • ▪  konvencija o aplikaciji
  • ▪  sve strukture dati podržan od strane ERP-a i tako dalje...
  • ▪  biti efikasan u pristupu dati, pružanjem:
  • ▪  direktno kretanje dati
  • ▪  sticanje promjene dati
  • ▪  podrška blagovremenom pristupu dati
  • ▪  razumjeti format dati, i tako dalje… INTERFEJS SA SAP-om Interfejs može biti dva tipa, domaći ili komercijalni. Neki od glavnih trgovačkih interfejsa uključuju:
  • ▪ SAS
  • ▪ Prims Solutions
  • ▪  D2k, i tako dalje… VIŠE ERP TEHNOLOGIJA Tretiranje ERP okruženja kao da je jedna tehnologija je velika greška. Postoji mnogo ERP tehnologija, od kojih svaka ima svoje prednosti. Najpoznatiji prodavci na tržištu su:
  • ▪ SAP
  • ▪ Oracle Financials
  • ▪ PeopleSoft
  • ▪ JD Edwards
  • ▪ Baan SAP SAP je najveći i najkompletniji ERP softver. SAP aplikacije uključuju mnoge vrste aplikacija u mnogim područjima. SAP ima reputaciju kao:
  • ▪  veoma veliki
  • ▪  veoma teško i skupo za implementaciju
  • ▪  potrebno je mnogo ljudi i konsultanata za implementaciju
  • ▪  zahtijeva specijalizirane ljude za implementaciju
  • ▪  treba dosta vremena za implementaciju. Nadalje, SAP ima reputaciju po tome što pamti svoje dati vrlo pažljivo, što otežava pristup osobi izvan SAP područja. SAP-ova snaga je u tome što je sposoban uhvatiti i pohraniti veliku količinu dati. Nedavno je SAP najavio svoju namjeru da proširi svoje aplikacije na skladište podataka. Postoji mnogo prednosti i nedostataka korištenja SAP-a kao dobavljača skladište podataka. Prednost je što je SAP već instaliran i što većina konsultanata već poznaje SAP.
    Nedostaci SAP-a kao dobavljača skladište podataka ima ih mnogo: SAP nema iskustva u svijetu skladište podataka Ako je SAP dobavljač skladište podataka, potrebno je “vaditi” i dati od SAP al skladište podataka. datum SAP-ov rekord zatvorenog sistema, malo je vjerovatno da će biti lako uvesti i iz SAP-a u njega (???). Postoje mnoga naslijeđena okruženja koja pokreću SAP, kao što su IMS, VSAM, ADABAS, ORACLE, DB2 i tako dalje. SAP insistira na pristupu koji nije izmišljen. SAP ne želi da bude partner sa drugim dobavljačima da bi koristio ili kreirao skladište podataka. SAP insistira na tome da sam generiše sav svoj softver.

Iako je SAP velika i moćna kompanija, pokušava da prepravi tehnologiju ELT-a, OLAP-a, sistemske administracije, pa čak i core koda dbms to je jednostavno ludo. Umjesto da zauzme kooperativni stav sa dobavljačima skladište podataka dugogodišnji, SAP je slijedio pristup „oni znaju najbolje“. Ovakav stav koči uspjeh koji bi SAP mogao imati u ovoj oblasti skladište podataka.
SAP-ovo odbijanje da dozvoli eksternim dobavljačima da brzo i graciozno pristupe svojim dati. Sama suština korištenja a skladište podataka je lak pristup dati. Cijela historija SAP-a zasniva se na otežanju pristupa dati.
SAP-ov nedostatak iskustva u radu s velikim količinama dati; u oblasti skladište podataka postoje sveske dati nikad viđen od strane SAP-a i za upravljanje ovim velikim količinama dati morate imati odgovarajuću tehnologiju. SAP očito nije svjestan ove tehnološke barijere koja postoji da bi ušao u polje skladište podataka.
SAP-ova korporativna kultura: SAP je napravio posao od dobivanja dati iz sistema. Ali da biste to učinili, morate imati drugačiji mentalitet. Tradicionalno, softverske kompanije koje su bile dobre u unosu podataka u okruženje nisu bile dobre u tome da podaci idu drugim putem. Ako SAP uspije napraviti ovu vrstu prebacivanja, to će biti prva kompanija koja će to učiniti.

Ukratko, upitno je da li kompanija treba da izabere SAP za svog dobavljača skladište podataka. Postoje vrlo ozbiljni rizici s jedne strane i vrlo malo nagrada s druge strane. Ali postoji još jedan razlog koji obeshrabruje odabir SAP-a kao dobavljača skladište podataka. Jer svaka kompanija treba da ima isto skladište podataka od svih ostalih kompanija? The skladište podataka to je srce konkurentske prednosti. Kad bi svaka kompanija usvojila isto skladište podataka bilo bi teško, iako ne i nemoguće, postići konkurentsku prednost. Čini se da SAP misli da a skladište podataka može se posmatrati kao kolačić i to je još jedan znak njihovog mentaliteta aplikacija „uneti podatke“.

Nijedan drugi ERP dobavljač nije tako dominantan kao SAP. Nesumnjivo će biti kompanija koje će slijediti SAP-ov put za svoj skladište podataka ali vjerovatno ove skladište podataka SAP će biti velik, skup i dugotrajan za kreiranje.

Ova okruženja uključuju takve aktivnosti kao što su obrada bankovnog blagajnika, procesi rezervacija avio-kompanija, procesi potraživanja osiguranja itd. Što je transakcioni sistem bio efikasniji, to je bila očiglednija potreba za odvajanjem između operativnog procesa i DSS (sistema za podršku odlučivanju). Međutim, sa sistemima za ljudske resurse i kadrove, nikada se ne suočavate s velikim količinama transakcija. I, naravno, kada se osoba zaposli ili napusti kompaniju, to je zapis o transakciji. Ali u odnosu na druge sisteme, sistemi ljudskih resursa i personal jednostavno nemaju mnogo transakcija. Stoga, u HR i kadrovskim sistemima nije sasvim očigledno da postoji potreba za DataWarehouse. Na mnogo načina ovi sistemi predstavljaju amalgamaciju DSS sistema.

Ali postoji još jedan faktor koji morate uzeti u obzir ako imate posla sa skladištima podataka i PeopleSoft-om. U mnogim okruženjima, tj dati ljudski i lični resursi su sekundarni u odnosu na primarni posao kompanije. Većina kompanija se bavi proizvodnjom, prodajom, pružanjem usluga itd. Ljudski resursi i kadrovski sistemi su obično sekundarni u odnosu na (ili podržavaju) glavnu liniju poslovanja kompanije. Stoga je dvosmislen i nezgodan skladište podataka odvojeno za ljudske resurse i kadrovsku podršku.

PeopleSoft se u tom pogledu veoma razlikuje od SAP-a. Kod SAP-a je obavezno da postoji a skladište podataka. Sa PeopleSoft-om to nije tako jasno. Skladište podataka je opciono uz PeopleSoft.

Najbolja stvar koja se može reći za dati PeopleSoft je to skladište podataka može se koristiti za arhiviranje i dati koji se odnose na stare ljudske i lične resurse. Drugi razlog zašto bi kompanija željela koristiti a skladište podataka a

šteta za PeopleSoft okruženje je omogućavanje pristupa i slobodnog pristupa alatima za analizu, da dati by PeopleSoft. Ali izvan ovih razloga, mogu postojati slučajevi u kojima je poželjno da nemate skladište podataka dati PeopleSoft.

Ukratko

Postoji mnogo ideja u vezi sa izgradnjom a skladište podataka u okviru ERP softvera.
Neki od njih su:

  • ▪  Ima smisla imati a skladište podataka da li je slično bilo kome drugom u industriji?
  • ▪  Koliko je fleksibilan ERP skladište podataka softver?
  • ▪  ERP skladište podataka softver može da obradi veliki broj dati koji se nalazi u "skladište podataka arena"?
  • ▪  Šta je evidencija praćenja koju ERP dobavljač radi s obzirom na jednostavno i jeftino, u smislu vremena, dati? (kakvi su rezultati ERP dobavljača u isporuci jeftinih, na vrijeme, lako dostupnih podataka?)
  • ▪  Kako ERP dobavljač razumije arhitekturu DSS-a i fabriku korporativnih informacija?
  • ▪  ERP dobavljači razumiju kako to postići dati unutar okruženja, ali razumiju li i kako ih izvoziti?
  • ▪  Koliko je ERP dobavljač otvoren za alate za skladištenje podataka?
    Sva ova razmatranja moraju se uzeti u obzir pri određivanju gdje će se staviti skladište podataka koji će ugostiti i dati ERP i drugi dati. Općenito, osim ako ne postoji uvjerljiv razlog da se učini drugačije, preporučuje se izgradnja skladište podataka izvan okruženja ERP dobavljača. POGLAVLJE 1 Pregled ključnih tačaka BI organizacije:
    Repozitorijumi informacija rade obrnuto od arhitekture poslovne inteligencije (BI):
    Korporativna kultura i IT mogu ograničiti uspjeh u izgradnji BI organizacija.

Tehnologija više nije ograničavajući faktor za BI organizacije. Pitanje za arhitekte i planere projekata nije da li tehnologija postoji, već da li mogu efikasno implementirati dostupnu tehnologiju.

Za mnoge kompanije a skladište podataka to je nešto više od pasivnog depozita koji distribuira dati korisnicima kojima je to potrebno. THE dati oni se izvlače iz izvornih sistema i popunjavaju u ciljne strukture skladište podataka. ja dati mogu se i očistiti uz malo sreće. Međutim, nikakva dodatna vrijednost se ne dodaje niti prikuplja dati tokom ovog procesa.

U suštini, pasivni Dw, u najboljem slučaju, pruža samo i dati čista i operativna za korisnička udruženja. Kreiranje informacija i analitičko razumijevanje u potpunosti su na korisnicima. Procijenite da li je DW (Skladište podataka) je uspjeh subjektivan. Ako uspjeh procjenjujemo na osnovu sposobnosti efikasnog prikupljanja, integracije i čišćenja dati korporativni na predvidljivoj osnovi, onda da, DW je uspješan. S druge strane, ako posmatramo prikupljanje, konsolidaciju i eksploataciju informacija u organizaciji u cjelini, onda je DW promašaj. DW pruža malu ili nikakvu informacijsku vrijednost. Kao rezultat toga, korisnici su primorani da se snalaze, stvarajući silos informacija. Ovo poglavlje predstavlja sveobuhvatnu viziju za sumiranje BI (Business Intelligence) arhitekture kompanije. Počinjemo s opisom BI, a zatim prelazimo na rasprave o dizajnu i razvoju informacija, umjesto jednostavnog pružanja informacija. dati korisnicima. Diskusije se zatim fokusiraju na izračunavanje vrijednosti vaših BI napora. Zaključujemo definiranjem kako IBM rješava BI arhitektonske zahtjeve vaše organizacije.

Opis arhitekture organizacija BI

Moćni informacioni sistemi orijentisani na transakcije sada su uobičajeni u svakom velikom preduzeću, efektivno izjednačujući uslove za korporacije širom sveta.

Međutim, ostanak konkurentan sada zahtijeva analitički orijentirane sisteme koji mogu revolucionirati sposobnost kompanije da ponovo otkrije i koristi informacije koje već posjeduju. Ovi analitički sistemi proizilaze iz razumijevanja bogatstva dati dostupan. BI može poboljšati performanse u cijelom preduzeću. Kompanije mogu poboljšati odnose između kupaca i dobavljača, poboljšati profitabilnost proizvoda i usluga, generirati nove i bolje ponude, kontrolirati rizik i između mnogih drugih dobitaka dramatično smanjiti troškove. Sa BI vaša kompanija konačno počinje da koristi informacije o klijentima kao konkurentsku prednost zahvaljujući aplikacijama koje imaju tržišne ciljeve.

Posjedovanje pravih poslovnih alata znači imati konačne odgovore na ključna pitanja kao što su:

  • ▪  Koji od naših kupaca da li nas tjeraju da zarađujemo više ili nas tjeraju da gubimo novac?
  • ▪  Gdje naši najbolji žive kupaca u vezi sa prodavnica/ magacin koje često posjećuju?
  • ▪  Koji se naši proizvodi i usluge mogu najefikasnije prodati i kome?
  • ▪  Koji proizvodi se mogu najefikasnije prodati i kome?
  • ▪  Koja prodajna kampanja je najuspješnija i zašto?
  • ▪  Koji su kanali prodaje najefikasniji za koje proizvode?
  • ▪  Kako možemo poboljšati odnose sa našim najboljim ljudima kupaca? Većina kompanija ima dati grube načine da se odgovori na ova pitanja.
    Operativni sistemi generišu velike količine proizvoda, kupaca i dati tržište od prodajnih mjesta, rezervacija, korisničkih usluga i sistema tehničke podrške. Izazov je izdvojiti i iskoristiti ove informacije. Mnoge kompanije profitiraju samo od malih djelića svojih dati za strateške analize.
    I dati preostali, često spojeni sa i dati izvedeni iz vanjskih izvora kao što su vladini izvještaji i druge kupljene informacije, su rudnik zlata koji samo čeka da bude istražen, a dati samo ih treba precizirati u kontekstu informacija vaše organizacije.

Ovo znanje se može primijeniti na nekoliko načina, počevši od dizajniranja cjelokupne korporativne strategije do lične komunikacije sa dobavljačima, preko call centara, fakturisanja, Internet i druge tačke. Današnje poslovno okruženje nalaže da DW i srodna BI rješenja evoluiraju izvan vođenja tradicionalnih poslovnih struktura. dati koji i dati normalizovan na atomskom nivou i „farme zvezda/kocka“.

Ono što je potrebno da ostanemo konkurentni je fuzija tradicionalnih i naprednih tehnologija u nastojanju da se podrži ogroman analitički krajolik.
Da zaključimo, opće okruženje mora unaprijediti znanje kompanije u cjelini, osiguravajući da akcije koje se poduzimaju kao rezultat izvršenih analiza budu korisne kako bi svi imali koristi.

Na primjer, recimo da rangirate svoj kupaca u kategorije visokog ili niskog rizika.
Ako se ove informacije generiraju pomoću ekstraktora modela ili na neki drugi način, one se moraju staviti u DW i biti dostupne svima, pomoću bilo kojeg alata za pristup, kao što su statički izvještaji, proračunske tablice, tabele ili online analitička obrada (OLAP) .

Međutim, trenutno veliki dio ove vrste informacija ostaje u silosima dati pojedinaca ili odjela koji generiraju analizu. Organizacija, kao cjelina, ima malo ili nimalo vidljivosti za razumijevanje. Samo mešanjem ove vrste informacionog sadržaja u vaš poslovni DW možete eliminisati silose informacija i unaprediti svoje DW okruženje.
Postoje dvije velike prepreke za razvoj BI organizacije.
Prvo, imamo problem same organizacije i njene discipline.
Iako ne možemo pomoći u promjenama organizacijskih politika, možemo pomoći u razumijevanju komponenti BI organizacije, njene arhitekture i kako IBM tehnologija olakšava njen razvoj.
Druga prepreka koju treba prevazići je nedostatak integrisane tehnologije i znanja o metodi koja obuhvata ceo BI prostor za razliku od samo male komponente.

IBM se suočava s promjenama u tehnologiji integracije. Vaša je odgovornost da pružite promišljen dizajn. Ova arhitektura mora biti razvijena sa tehnologijom odabranom za neograničenu integraciju, ili u najmanju ruku, sa tehnologijom koja se pridržava otvorenih standarda. Štaviše, menadžment vaše kompanije mora osigurati da se BI poduhvat odvija prema planu i da ne dozvoli razvoj silosa informacija koji proizilaze iz vlastitih planova ili ciljeva.
To ne znači da BI okruženje nije osjetljivo na reagiranje na različite potrebe i zahtjeve različitih korisnika; umjesto toga, to znači da se implementacija tih individualnih potreba i zahtjeva vrši za dobrobit cijele BI organizacije.
Opis arhitekture BI organizacije može se naći na stranici 9 na slici 1.1. Arhitektura pokazuje bogat spoj tehnologija i tehnika.
Sa tradicionalnog pogleda, arhitektura uključuje sljedeće komponente skladišta

Atomic Layer.

Ovo je temelj, srce cjelokupnog DW-a i stoga strateškog izvještavanja.
I dati pohranjeni ovdje zadržat će historijski integritet, izvještaji o dati i uključuju izvedene metrike, kao i da budu očišćeni, integrisani i pohranjeni pomoću ekstrahovanih modela.
Sva naknadna upotreba ovih dati i povezane informacije su izvedene iz ove strukture. Ovo je odličan izvor za rudarenje dati i za izvještaje sa strukturiranim SQL upitima

Operativni depozit od dati ili bazu izvještaja o dati(Skladište operativnih podataka (ODS) ili izvještavanje baza podataka.)

Ovo je struktura od dati posebno dizajniran za tehničko izvještavanje.

I dati pohranjene i prijavljene iznad ove strukture mogu konačno propagirati u skladište preko scenskog prostora, gdje bi se mogle koristiti za stratešku signalizaciju.

Staging area.

Prva stanica za većinu dati Predviđeno za skladište skladišta je prostor organizacije.
Evo ja dati oni su integrisani, očišćeni i transformisani u dati profita koji će popuniti strukturu skladišta

Datum marts.

Ovaj dio arhitekture predstavlja strukturu dati koristi se posebno za OLAP. Prisustvo datamarta, ako i dati se pohranjuju u preklapajućim zvjezdanim šemama dati višedimenzionalni u relacionom okruženju, ili u fajlovima dati Povjerljivo koje koristi određena OLAP tehnologija, kao što je DB2 OLAP poslužitelj, nije relevantno.

Jedino ograničenje je da arhitektura olakšava upotrebu dati multidimenzionalni.
Arhitektura takođe uključuje kritične BI tehnologije i tehnike koje se ističu kao:

Prostorna analiza

Prostor je za analitičara neizbježna informacija i ključna je za kompletno rješavanje. Prostor može predstavljati informacije o ljudima koji žive na određenoj lokaciji, kao i informacije o tome gdje je ta lokacija fizički u odnosu na ostatak svijeta.

Da biste izvršili ovu analizu, morate početi tako što ćete svoje podatke povezati s koordinatama geografske širine i dužine. Ovo se naziva "geokodiranje" i mora biti dio procesa izdvajanja, transformacije i učitavanja (ETL) na atomskom nivou vašeg skladišta.

Data mining.

Ekstrakcija od dati omogućava našim kompanijama da povećaju broj kupaca, da predvidi prodajne trendove i omogući upravljanje odnosima sa kupaca (CRM), između ostalih BI inicijativa.

Ekstrakcija od dati stoga mora biti integrisan sa strukturama dati DWhouse-a i podržano skladišnim procesima kako bi se osigurala efektivna i efikasna upotreba tehnologije i srodnih tehnika.

Kao što je naznačeno u BI arhitekturi, atomski nivo Dwhouse, kao i datamarts, je odličan izvor dati za ekstrakciju. Ti isti objekti također moraju biti primaoci rezultata ekstrakcije kako bi se osigurala dostupnost najširoj publici.

Agenti.

Postoje različiti "agenti" za ispitivanje korisnika za svaku tačku, kao što su operativni sistemi kompanije i sami dw. Ovi agenti mogu biti napredne neuronske mreže obučene da uče o trendovima u svakoj tački, kao što su buduća potražnja za proizvodima zasnovana na promocijama prodaje, motori zasnovani na pravilima da reaguju na dato niz okolnosti, ili čak jednostavni agenti koji prijavljuju izuzetke „vrhunskim rukovodiocima“. Ovi procesi se uglavnom odvijaju u realnom vremenu i stoga moraju biti usko povezani sa njihovim kretanjem dati. Sve ove strukture dati, tehnologije i tehnike garantuju da nećete provesti noć stvarajući organizaciju svoje BI.

Ova aktivnost će se razvijati u postepenim koracima, za male tačke.
Svaki korak je nezavisan projektni napor i naziva se iteracijom u vašoj DW ili BI inicijativi. Iteracije mogu uključivati ​​implementaciju novih tehnologija, počevši od novih tehnika, dodavanje novih struktura dati , loading i dati dodatno, ili uz proširenje analize vašeg okruženja. Ovaj paragraf je detaljnije razmotren u 3. poglavlju.

Osim tradicionalnih DW struktura i BI alata, postoje i druge funkcije vaše BI organizacije za koje trebate dizajnirati, kao što su:

Dodirne tačke kupaca (dodir kupca bodova).

Kao i kod svake moderne organizacije, postoji niz dodirnih tačaka kupaca koje ukazuju na to kako da imate pozitivno iskustvo za svoje kupaca. Postoje tradicionalni kanali kao što su prodavci, operateri centrala, direktna pošta, multimedijalno i štampano oglašavanje, kao i aktuelniji kanali kao što su e-pošta i web, dati proizvodi sa nekom tačkom kontakta moraju biti nabavljeni, transportovani, očišćeni, prerađeni i potom popunjeni u objektima dati of BI.

Osnove of dati operativne i korisničke asocijacije (Operational

baze podataka i korisničke zajednice).
Na kraju kontaktnih tačaka kupaca naći ćete osnove dati primjena kompanije i korisničke zajednice. THE dati postojeći su dati tradicionalna koja se mora ponovo ujediniti i spojiti sa dati koje teku od kontaktnih tačaka kako bi zadovoljile potrebne informacije.

Analitičari. (Analitičari)

Primarni korisnik BI okruženja je analitičar. On je taj koji ima koristi od trenutnog vađenja dati operativan, integrisan sa različitim izvorima dati , dopunjen funkcijama kao što je geografska analiza (geokodiranje) i predstavljen u BI tehnologijama koje omogućavaju ekstrakciju, OLAP, napredno SQL izvještavanje i geografsku analizu. Primarni interfejs analitičara za okruženje za izveštavanje je BI portal.

Međutim, analitičar nije jedini koji ima koristi od BI arhitekture.
Rukovodioci, velika udruženja korisnika, pa čak i partneri, dobavljači i ja kupaca oni bi trebali pronaći prednosti u poslovnoj BI.

Petlja povratnog napajanja.

BI arhitektura je okruženje za učenje. Karakterističan princip razvoja je omogućavanje postojanih struktura dati da se ažurira BI tehnologijom koja se koristi i radnjama koje poduzima korisnik. Primjer je bodovanje kupaca.

Ako odjel prodaje modelira ocjene kupaca za korištenje nove usluge, onda odjel prodaje ne bi trebao biti jedina grupa koja ima koristi od usluge.

Umjesto toga, izdvajanje modela bi trebalo da se izvodi kao prirodni dio toka podataka unutar poduzeća, a rezultati kupaca bi trebali postati integrirani dio konteksta informacija o skladištu, vidljiv svim korisnicima. IBM-ov Bi-bI-centric Suite uključujući DB2 UDB, DB2 OLAP Server uključuje većinu glavnih tehnoloških komponenti, definiranih na slici 1.1.

Koristimo arhitekturu kako je prikazana na ovoj ilustraciji iz knjige kako bismo nam dali nivo kontinuiteta i pokazali kako se svaki IBM proizvod uklapa u cjelokupnu BI shemu.

Pružanje informativnog sadržaja (pružanje Informativni sadržaj)

Dizajniranje, razvoj i implementacija vašeg BI okruženja je zastrašujući zadatak. Dizajn mora obuhvatiti i trenutne i buduće poslovne zahtjeve. Arhitektonski crtež mora biti potpun kako bi uključio sve zaključke do kojih je došlo tokom faze projektovanja. Izvršenje mora ostati posvećeno jednoj svrsi: razvoju BI arhitekture kako je formalno predstavljena u dizajnu i utemeljena na poslovnim zahtjevima.

Posebno je teško tvrditi da će disciplina osigurati relativan uspjeh.
Ovo je jednostavno jer ne razvijate BI okruženje odjednom, već to radite u malim koracima tokom vremena.

Međutim, identificiranje BI komponenti vaše arhitekture važno je iz dva razloga: Vi ćete voditi sve kasnije odluke tehničke arhitekture.
Moći ćete svjesno planirati određenu upotrebu tehnologije iako vam tehnologija možda neće biti potrebna nekoliko mjeseci.

Razumijevanje vaših poslovnih zahtjeva u dovoljnoj mjeri će uticati na vrstu proizvoda koje ćete nabaviti za svoju arhitekturu.
Dizajniranje i razvoj vaše arhitekture osigurava da vaše skladište bude

nije slučajan događaj, već pažljivo konstruisan „dobro osmišljen”. opera umjetnosti kao mozaik mješovite tehnologije.

Dizajnirajte sadržaj informacija

Sav početni dizajn mora se fokusirati i identificirati ključne BI komponente koje će biti potrebne cjelokupnom okruženju sada i u budućnosti.
Poznavanje poslovnih zahtjeva je važno.

Čak i prije nego što započne bilo kakav formalni dizajn, planer projekta često može identificirati jednu ili dvije komponente odmah.
Međutim, balans komponenti koje mogu biti potrebne za vašu arhitekturu ne može se lako pronaći. Tokom faze projektovanja, glavni deo arhitekture povezuje sesiju razvoja aplikacije (JAD) sa istraživanjem kako bi se identifikovali poslovni zahtevi.

Ponekad se ovi zahtjevi mogu povjeriti alatima za upite i izvještavanje.
Na primjer, korisnici navode da ako žele automatizirati trenutni izvještaj, moraju ga ručno generirati integracijom dva trenutna izvještaja i dodavanjem proračuna izvedenih iz kombinacije dati.
Iako je ovaj zahtjev jednostavan, on definira određenu funkcionalnost funkcije koju morate uključiti kada kupujete alate za izvještavanje za svoju organizaciju.

Dizajner također mora slijediti dodatne zahtjeve kako bi dobio potpunu sliku. Da li se korisnici žele pretplatiti na ovaj izvještaj?
Da li se podskupovi izvještaja generiraju i šalju e-poštom raznim korisnicima? Da li žele vidjeti ovaj izvještaj na portalu kompanije? Svi ovi zahtjevi su dio jednostavne potrebe za zamjenom ručnog izvještaja na zahtjev korisnika. Prednost ovih vrsta zahtjeva je da svi, korisnici i dizajneri, imaju razumijevanje koncepta izvještaja.

Međutim, postoje i druge vrste poslovanja koje moramo planirati. Kada su poslovni zahtjevi navedeni u obliku strateških poslovnih pitanja, stručnom dizajneru je lako razlučiti zahtjeve mjera/činjenica i dimenzija.

Ako korisnici JAD-a ne znaju kako da izraze svoje zahtjeve u obliku poslovnog problema, dizajner će često pružiti primjere za brz početak sesije prikupljanja zahtjeva.
Stručni dizajner može pomoći korisnicima da shvate ne samo strateško trgovanje, već i kako ga formirati.
Pristup prikupljanja zahtjeva razmatran je u poglavlju 3; za sada samo želimo ukazati na potrebu dizajna za sve vrste BI zahtjeva.

Strateški poslovni problem nije samo poslovni zahtjev, već i dizajnerski trag. Ako morate odgovoriti na višedimenzionalno pitanje, onda morate zapamtiti, predstaviti i dati dimenzije, a ako trebate pohraniti i dati multidimenzionalno, morate odlučiti koju vrstu tehnologije ili tehnike ćete koristiti.

Da li implementirate rezerviranu kockastu zvijezdu shemu ili oboje? Kao što vidite, čak i jednostavan poslovni problem može značajno uticati na dizajn. Ali ove vrste poslovnih zahtjeva su uobičajene i razumljive, barem od strane dizajnera i planera s projektnim iskustvom.

Bilo je dovoljno diskusija o OLAP tehnologijama i podršci, a dostupan je i širok spektar rješenja. Do sada smo spomenuli potrebu da se jednostavno izvještavanje spoji sa zahtjevima poslovne dimenzije i kako ti zahtjevi utiču na tehničke arhitektonske odluke.

Ali koji su zahtjevi koje korisnici ili Dw tim ne razumiju? Hoće li vam ikada trebati prostorna analiza?
Modeli rudarenja dati da li će oni biti neophodan deo vaše budućnosti? Ko zna?

Važno je napomenuti da ove vrste tehnologija nisu dobro poznate zajednici općih korisnika i članovima Dw tima, dijelom, to može biti zbog toga što njima obično rukuju neki interni ili tehnički stručnjaci treće strane. To je ekstreman slučaj problema koje stvaraju ove vrste tehnologija. Ako korisnici ne mogu da opišu poslovne zahtjeve ili ih uokvire na način koji daju smjernice dizajnerima, mogu ostati neprimijećeni ili, još gore, jednostavno ignorirani.

Problem postaje kada dizajner i programer ne mogu prepoznati primjenu jedne od ovih naprednih, ali kritičnih tehnologija.
Kao što smo često čuli da dizajneri kažu, „pa, zašto to ne bismo ostavili po strani dok ne dobijemo ovu drugu stvar? “Da li ih zaista zanimaju prioriteti ili jednostavno izbjegavaju zahtjeve koje ne razumiju? Najvjerovatnije je to posljednja hipoteza. Recimo da je vaš prodajni tim saopštio poslovni zahtjev, kao što je navedeno na slici 1.3, kao što vidite, zahtjev je uokviren u obliku poslovnog problema. Razlika između ovog problema i tipičnog dimenzionalnog problema je udaljenost. U ovom slučaju, prodajni tim želi znati, na mjesečnoj bazi, ukupnu prodaju proizvoda, skladišta i trgovina kupaca koji žive u krugu od 5 milja od skladišta u kojem kupuju.

Nažalost, dizajneri ili arhitekti mogu jednostavno zanemariti prostornu komponentu govoreći: „mi imamo kupca, proizvod i dati depozita. Zadržimo distancu do druge iteracije.

"Pogrešan odgovor. Ova vrsta poslovnog problema se odnosi na BI. Predstavlja dublje razumijevanje našeg poslovanja i robustan analitički prostor za naše analitičare. BI je izvan jednostavnog upita ili standardnog izvještavanja, pa čak i OLAP-a. To ne znači da ove tehnologije nisu važne za vašu BI, ali same po sebi ne predstavljaju BI okruženje.

Dizajn za informacijski kontekst (Dizajn za informativni sadržaj)

Sada kada smo identifikovali poslovne zahtjeve koji razlikuju različite osnovne komponente, oni moraju biti uključeni u cjelokupni arhitektonski dizajn. Neke od BI komponenti dio su naših početnih napora, dok neke nećemo implementirati nekoliko mjeseci.

Međutim, svi poznati zahtjevi se odražavaju u dizajnu, tako da kada trebamo implementirati određenu tehnologiju, spremni smo to učiniti. Nešto o projektu odražavat će tradicionalno razmišljanje.

Ovaj set od dati koristi se za podršku kasnijoj upotrebi dati dimenzionalno vođeni poslovnim problemima koje smo identifikovali. Kako se generišu dodatni dokumenti, kao što je razvoj dizajna dati, počet ćemo formalizirati kako i dati šire se u okolinu. Utvrdili smo potrebu da zastupamo i dati na dimenzionalni način, dijeleći ih (prema specifičnim specifičnim potrebama) u podatkovne prodajne prodajne mreže.

Sljedeće pitanje na koje treba odgovoriti je: kako će se ove baze podataka izgraditi?
Gradite li zvijezde da podupiru kocke, ili samo kocke, ili samo zvijezde? (ili prave kocke, ili prave zvijezde). Generirajte arhitekturu za zavisne baze podataka koje zahtijevaju atomski sloj za sve dati aquisites? Dozvolite nezavisnim bazama podataka da pribave dati direktno sa operativnih sistema?

Koju tehnologiju kocke ćete pokušati standardizirati?

Imate ogromne količine bogova dati potrebno za dimenzionalnu analizu ili su vam potrebne kocke od vaše nacionalne prodajne snage na sedmičnoj bazi ili oboje? Gradite li nešto tako moćno kao DB2 OLAP Server za financije ili Cognos PowerPlay kocke za vašu prodajnu organizaciju, ili oboje? Ovo su velike odluke o arhitektonskom dizajnu koje će od sada nadalje utjecati na vaše BI okruženje. Da, ustanovili ste potrebu za OLAP-om. Kako ćete sada implementirati tu vrstu tehnike i tehnologije?

Kako neke od najnaprednijih tehnologija utiču na vaše dizajne? Pretpostavimo da ste identifikovali potrebu za prostorom u vašoj organizaciji. Sada morate da se setite izdanja arhitektonskih crteža čak i ako ne planirate da pravite prostorne komponente nekoliko meseci. Arhitekta mora dizajnirati danas na osnovu onoga što je potrebno. Predvidjeti potrebu za prostornom analitikom koja generiše, pohranjuje, izvodi i omogućava pristup dati prostorni. Ovo bi zauzvrat trebalo da služi kao ograničenje u pogledu vrste softverske tehnologije i specifikacija platforme koje trenutno možete uzeti u obzir. Na primjer, sistem administracije baza podataka relacijski sloj (RDBMS) koji izvodite za svoj atomski sloj mora imati dostupno robusno prostorno proširenje. Ovo bi osiguralo maksimalnu izvedbu pri korištenju geometrije i prostornih objekata u vašim analitičkim aplikacijama. Ako vaš RDBMS ne može podnijeti dati (prostorno-centrično) interno, tako da ćete morati uspostaviti a baza podataka (prostorno-centrično) eksterno. Ovo komplikuje upravljanje problemima i kompromituje vaš ukupni učinak, a da ne spominjemo dodatne probleme stvorene vašim DBA-ima, budući da oni vjerovatno imaju minimalno razumijevanje osnova dati prostorno takođe. S druge strane, ako vaš RDMBS motor rukuje svim prostornim komponentama i njegov optimizator je svjestan posebnih potreba (na primjer, indeksiranje) prostornih objekata, tada vaši DBA mogu lako upravljati problemima i možete maksimizirati performanse.

Dodatno, potrebno je da prilagodite scensko područje i sloj atomskog okruženja kako biste uključili čišćenje adrese (a

ključni element prostorne analize), kao i naknadnu uštedu svemirskih objekata. Slijed izdanja crteža nastavlja se sada kada smo uveli pojam jasnog smjera. Kao prvo, ova aplikacija će diktirati vrstu softvera potrebnog za vaš ETL napor.

Trebate li proizvode kao što je Trillium da biste mu pružili čistu adresu ili ETL dobavljača po vašem izboru koji će vam pružiti tu funkcionalnost?
Za sada je važno da cijenite nivo dizajna koji mora biti završen prije nego što počnete s implementacijom svog skladišta. Gore navedeni primjeri bi trebali pokazati mnoštvo dizajnerskih odluka koje moraju pratiti identifikaciju bilo kojeg posebnog poslovnog zahtjeva. Ako se donesu ispravno, ove dizajnerske odluke promovišu međuzavisnost između fizičkih struktura vašeg okruženja, odabira korištene tehnologije i toka širenja informacijskog sadržaja. Bez ove konvencionalne BI arhitekture, vaša organizacija će biti podložna haotičnoj mješavini postojećih tehnologija, u najboljem slučaju labavo spojenih kako bi se pružila prividna stabilnost.

Održavajte informativni sadržaj

Donošenje vrijednosti informacija vašoj organizaciji je vrlo težak zadatak. Bez dovoljno razumijevanja i iskustva, ili pravilnog planiranja i dizajna, čak i najbolji timovi neće uspjeti. S druge strane, ako imate odličnu intuiciju i detaljno planiranje, ali nemate disciplinu za izvršenje, samo ste uzalud potrošili novac i vrijeme jer je vaš trud osuđen na propast. Poruka bi trebala biti jasna: ako vam nedostaje jedna ili više ovih vještina, razumijevanja/iskustva ili discipline planiranja/dizajna ili implementacije, to će osakatiti ili uništiti zgradu BI organizacije.

Da li je vaš tim dovoljno pripremljen? Postoji li neko u vašem BI timu ko razumije ogroman analitički pejzaž dostupan u BI okruženjima, te tehnike i tehnologije potrebne za održavanje tog pejzaža? Postoji li neko u vašem timu ko može prepoznati razliku između naprednih aplikacija

statičko izvještavanje i OLAP, ili razlike između ROLAP-a i OLAP-a? Da li jedan od članova vašeg tima jasno prepoznaje kako ekstrahirati i kako to može uticati na skladište ili kako skladište može podržati performanse ekstrakcije? Član tima razumije vrijednost dati svemirska ili tehnologija bazirana na agentima? Da li imate nekoga ko cijeni jedinstvenu primjenu ETL alata u odnosu na tehnologiju brokera poruka? Ako ga nemate, nabavite ga. BI je mnogo veći od normaliziranog atomskog sloja, OLAP-a, zvjezdanih šema i ODS-a.

Posjedovanje razumijevanja i iskustva za prepoznavanje BI zahtjeva i njihovih rješenja ključno je za vašu sposobnost da pravilno formalizirate potrebe korisnika i dizajnirate i implementirate njihova rješenja. Ako vaša korisnička zajednica ima poteškoća s opisivanjem zahtjeva, posao skladišnog tima je da to razumije. Ali ako skladišni tim

ne prepoznaje specifičnu primjenu BI-ja - na primjer, rudarenje podataka - onda nije najbolja stvar što su BI okruženja često ograničena na pasivna spremišta. Međutim, ignorisanje ovih tehnologija ne umanjuje njihov značaj i efekat koji imaju na pojavu sposobnosti poslovne inteligencije vaše organizacije, kao i na informacijski pejzaž koji planirate da njegujete.

Planiranje mora uključivati ​​pojam crteža, a oba zahtijevaju kompetentnu osobu. Dodatno, projektovanje zahteva filozofiju timskog skladišta i poštovanje standarda. Na primjer, ako je vaša kompanija uspostavila standardnu ​​platformu ili je identificirala određeni RDBMS koji želite standardizirati na cijeloj platformi, odgovornost je na svima u timu da se pridržavaju tih standarda. Generalno, tim izlaže potrebu za standardizacijom (korisničkim zajednicama), ali sam tim nije voljan da se pridržava standarda uspostavljenih ni u drugim oblastima u kompaniji ili možda čak iu sličnim kompanijama. Ne samo da je ovo licemjerno, već potvrđuje da kompanija nije u stanju da eksploatiše postojeće resurse i investicije. To ne znači da ne postoje situacije koje opravdavaju nestandardiziranu platformu ili tehnologiju; međutim, skladištenje napora

trebali bi ljubomorno štititi standarde kompanije sve dok poslovni zahtjevi ne nalažu drugačije.

Treća ključna komponenta potrebna za izgradnju BI organizacije je disciplina.
Zavisi sveukupno, podjednako od pojedinaca i okoline. Planeri projekata, sponzori, arhitekte i korisnici moraju cijeniti disciplinu neophodnu za izgradnju informacione strukture kompanije. Dizajneri moraju usmjeriti svoje dizajnerske napore na način da nadopunjuju druge neophodne napore u društvu.

Na primjer, recimo da vaša kompanija gradi ERP aplikaciju koja ima komponentu skladišta.
Stoga je odgovornost ERP dizajnera da sarađuju sa timom za okruženje skladišta kako se ne bi takmičili ili duplirali već započeti posao.

Disciplina je takođe tema kojom se mora baviti cijela organizacija i obično se uspostavlja i povjerava izvršnom nivou.
Da li su menadžeri spremni da se pridržavaju osmišljenog pristupa? Pristup koji obećava stvaranje informativnog sadržaja koji će u konačnici donijeti vrijednost svim područjima poduzeća, ali možda kompromituje pojedinačne ili odjelne programe? Zapamtite izreku „Važnije je razmišljati o svemu nego samo o jednoj stvari“. Ova izreka važi za BI organizacije.

Nažalost, mnoga skladišta usmjeravaju svoje napore na pokušaj ciljanja i donošenja vrijednosti određenom odjelu ili određenim korisnicima, s malo pažnje na organizaciju u cjelini. Pretpostavimo da izvršna vlast traži pomoć od tima za buku. Tim odgovara 90-dnevnim naporom koji uključuje ne samo isporuku zahtjeva za obavještavanje koje je definirao menadžer, već i osiguravanje da svi dati baze se miješaju na atomskom nivou prije nego što se uvedu u predloženu tehnologiju kocke.
Ovaj inženjerski dodatak osigurava da će poduzeće za bunar imati koristi od toga dati potreban menadžeru.
Međutim, izvršni direktor je razgovarao sa vanjskim konsultantskim firmama koje su predložile sličnu aplikaciju sa isporukom za manje od 4 sedmice.

Pod pretpostavkom da je interni tim skladišta kompetentan, izvršni direktor ima izbor. Ko može podržati dodatnu inženjersku disciplinu potrebnu za kultiviranje poduzeća s informacijskim resursima ili može izabrati da brzo izgradi vlastito rješenje. Čini se da se ovo posljednje bira prečesto i služi samo za stvaranje kontejnera informacija od kojih koristi samo nekolicina ili pojedinac.

Kratkoročni i dugoročni ciljevi

Arhitekte i projektanti moraju formalizirati dugoročnu viziju cjelokupne arhitekture i planova za rast u BI organizaciji. Ova kombinacija kratkoročne dobiti i dugoročnog planiranja predstavlja dvije strane BI napora. Kratkoročni dobitak je aspekt BI koji je povezan s iteracijama vašeg skladišta.

Ovdje se planeri, arhitekti i sponzori fokusiraju na ispunjavanje specifičnih komercijalnih zahtjeva. Na ovom nivou se grade fizičke strukture, kupuje tehnologija i implementiraju tehnike. Oni nikako nisu napravljeni da bi odgovorili na specifične zahtjeve kako ih definiraju određene korisničke zajednice. Sve se radi kako bi se odgovorilo na specifične zahtjeve koje definiše određena zajednica.
Dugoročno planiranje je, međutim, drugi aspekt BI. Ovdje su planovi i dizajni osigurali da je izgrađena bilo koja fizička struktura, odabrane tehnologije i primijenjene tehnike urađene s pogledom prema preduzeću. Dugoročno planiranje je ono koje osigurava koheziju potrebnu kako bi se osiguralo da poslovne koristi proizlaze iz bilo koje pronađene kratkoročne dobiti.

Opravdajte svoj BI napor

Un skladište podataka samo po sebi nema inherentnu vrijednost. Drugim riječima, ne postoji inherentna vrijednost između tehnologije skladišta i tehnika implementacije.

Vrijednost svakog skladišnog napora nalazi se u radnjama koje se izvode kao rezultat skladišnog okruženja i informacijskog sadržaja koji se kultiviše tokom vremena. Ovo je kritična tačka koju treba razumjeti prije nego što pokušate procijeniti vrijednost bilo koje inicijative wherehouse.

Prečesto arhitekte i dizajneri pokušavaju primijeniti vrijednost na fizičke i tehničke komponente skladišta kada se zapravo vrijednost zasniva na poslovnim procesima na koje skladište i dobro stečene informacije pozitivno utiču.

U tome leži izazov uspostavljanja BI: Kako opravdati investiciju? Ako sama prostorija nema suštinsku vrednost, dizajneri projekta moraju istražiti, definisati i formalizovati prednosti koje postižu oni pojedinci koji će koristiti skladište za poboljšanje specifičnih poslovnih procesa ili vrednosti zaštićenih informacija, ili oboje.

Da stvari zakomplikuju, svaki poslovni proces na koji utječu napori na skladištenju mogao bi pružiti “značajne” ili “male” koristi. Značajne prednosti pružaju opipljivu metriku za mjerenje povrata ulaganja (ROI) – na primjer, okretanje zaliha dodatno vrijeme tokom određenog perioda ili za niže troškove transporta po pošiljci. Teže je definisati suptilne prednosti, kao što je bolji pristup informacijama, u smislu opipljive vrijednosti.

Povežite svoj projekat da biste saznali poslovne zahtjeve

Prečesto, projektanti pokušavaju da povežu vrednost skladišta sa amorfnim ciljevima preduzeća. Izjavom da je "vrijednost skladišta zasnovana na našoj sposobnosti da zadovoljimo strateške zahtjeve" otvaramo diskusiju na prijatan način. Ali samo to nije dovoljno da se utvrdi da li ulaganje u zalihe ima smisla. Najbolje je povezati iteracije skladišta sa specifičnim, poznatim poslovnim zahtjevima.

Izmjerite ROI

Izračunavanje ROI u skladištu može biti posebno teško. Posebno je teško ako je prednost

princip određenog ponavljanja je nešto što nije opipljivo ili lako izmjeriti. Jedno istraživanje je pokazalo da korisnici vide dvije glavne prednosti BI inicijativa:

  • ▪  Stvorite sposobnost kreiranja odluka
  • ▪  Kreirajte pristup informacijama
    Ove pogodnosti su meke (ili blage) koristi. Lako je vidjeti kako možemo izračunati ROI na osnovu teške (ili velike) koristi poput smanjenih troškova transporta, ali kako mjeriti sposobnost donošenja boljih odluka?
    Ovo je definitivno izazov za planere projekata kada pokušavaju uvjeriti kompaniju da investira u određeni skladišni napor. Povećanje prodaje ili smanjenje troškova više nisu centralne teme koje pokreću BI okruženje.
    Umjesto toga, gledate poslovne zahtjeve za bolji pristup informacijama kako bi određeno odjeljenje moglo brže donositi odluke. To su strateški pokretači koji su podjednako važni za poduzeće, ali su dvosmisleniji i teže ih je okarakterisati u opipljivoj metrici. U ovom slučaju, izračunavanje ROI može biti pogrešno, ako ne i irelevantno.
    Dizajneri projekta moraju biti u stanju da pokažu opipljivu vrijednost za rukovodioce kako bi odlučili da li se ulaganje u određenu iteraciju isplati. Međutim, nećemo predlagati novu metodu za izračunavanje ROI, niti ćemo iznositi bilo kakve argumente za ili protiv.
    Postoji mnogo dostupnih članaka i knjiga koji govore o osnovama izračunavanja ROI. Postoje posebne ponude vrijednosti kao što je vrijednost za ulaganje (VOI), koje nude grupe poput Gartnera, koje možete istražiti. Umjesto toga, fokusirat ćemo se na ključne aspekte bilo kojeg ROI ili drugih vrijednosnih prijedloga koje trebate uzeti u obzir. Primjena ROI Osim argumenta o „tvrdim“ prednostima u odnosu na „meke“ koristi povezane s BI naporima, postoje i druga pitanja koja treba razmotriti prilikom primjene ROI. Na primjer:

Pripišite previše uštede naporima DW-a koji bi ionako došli
Recimo da je vaša kompanija prešla sa arhitekture glavnog računala na distribuirano UNIX okruženje. Dakle, sve uštede koje se mogu (ili ne moraju) ostvariti iz tog napora ne treba pripisivati ​​isključivo skladištu, ako uopće (?).

Ne računati sve je skupo. I ima mnogo stvari koje treba uzeti u obzir. Razmotrite sljedeću listu:

  • ▪  Početni troškovi, uključujući izvodljivost.
  • ▪  Cijena namjenskog hardvera s povezanim pohranom i komunikacijama
  • ▪  Cijena softvera, uključujući upravljanje dati i ekstenzije klijent/server, ETL softver, DSS tehnologije, alati za vizualizaciju, aplikacije za planiranje i radni tok i softver za praćenje, .
  • ▪  Troškovi dizajna strukture dati, uz kreiranje i optimizaciju
  • ▪  Troškovi razvoja softvera direktno povezani sa BI naporima
  • ▪  Troškovi kućne podrške, uključujući optimizaciju performansi, uključujući kontrolu verzije softvera i operacije pomoći Primijenite “Big-Bang” ROI. Izgradnja skladišta kao jedinstvenog, ogromnog napora osuđena je na propast, pa čak i izračunajte ROI za inicijativu velikog preduzeća. Ponuda je iznenađujuća, a planeri nastavljaju sa slabim pokušajima da procijene vrijednost cjelokupnog truda. Zašto planeri pokušavaju da daju novčanu vrednost poslovnoj inicijativi ako je opšte poznato i prihvaćeno da je teško proceniti određena ponavljanja? Kako je to moguće? Nije moguće uz nekoliko izuzetaka. Ne radi to. Sada kada smo utvrdili šta ne treba raditi prilikom izračunavanja ROI, evo nekoliko tačaka koje će nam pomoći da uspostavimo pouzdan proces za procjenu vrijednosti vaših BI napora.

Dobijanje konsenzusa o ROI. Bez obzira na vaš izbor tehnike za procjenu vrijednosti vaših BI napora, moraju se složiti sve strane, uključujući dizajnere projekata, sponzore i poslovne rukovodioce.

Smanjite ROI na prepoznatljive dijelove. Neophodan korak ka razumnom izračunavanju ROI je fokusiranje tog izračuna na određeni projekat. Ovo vam onda omogućava da procijenite vrijednost na osnovu specifičnih poslovnih zahtjeva koji su ispunjeni

Definirajte troškove. Kao što je spomenuto, moraju se uzeti u obzir brojni troškovi. Nadalje, troškovi moraju uključivati ​​ne samo one koji su povezani s jednom iteracijom, već i troškove povezane s osiguravanjem usklađenosti sa standardima kompanije.

Definirajte beneficije. Jasnim povezivanjem ROI sa specifičnim poslovnim zahtjevima, trebali bismo biti u mogućnosti identificirati prednosti koje će dovesti do ispunjavanja zahtjeva.

Smanjite troškove i koristi u neminovnoj dobiti. To je najbolji način da svoje procene zasnivate na neto sadašnjoj vrednosti (NPV) za razliku od pokušaja da se predvidi buduća vrednost u budućim zaradama.

Smanjite vrijeme podjele vašeg ROI na minimum. Dobro je dokumentovan tokom dugog vremenskog perioda kada se koristi u vašem ROI.

Koristite više od jedne formule ROI. Postoje brojne metode za predviđanje ROI i trebali biste planirati da li ćete koristiti jednu ili više njih, uključujući neto sadašnju vrijednost, internu stopu povrata (IRR) i povrat.

Definirajte ponovljivi proces. Ovo je ključno za izračunavanje bilo koje dugoročne vrijednosti. Treba dokumentirati jedan ponovljivi proces za sve podsekvence projekta koje slijede.

Navedeni problemi su najčešći problemi koje su definisali stručnjaci za okruženje bunara. Insistiranje menadžmenta na ostvarivanju "Big-Bang" ROI je veoma dezorijentirajuće. Ako sve svoje proračune ROI-a započnete tako što ćete ih raščlaniti na prepoznatljive, opipljive dijelove, imate dobre šanse da procijenite tačnu ocjenu ROI-a.

Pitanja o prednostima povrata ulaganja

Koje god da su vaše prednosti, meke ili tvrde, možete koristiti neka osnovna pitanja da odredite njihovu vrijednost. Na primjer, koristeći jednostavan sistem skaliranja, od 1 do 10, možete izmjeriti učinak bilo kojeg napora koristeći sljedeća pitanja:

  • Kako biste ocijenili razumijevanje dati prati ovaj projekat Vaše kompanije?
  • Kako biste procijenili poboljšanja procesa kao rezultat ovog projekta?
  • Kako biste izmjerili uticaj novih uvida i zaključaka koji su sada dostupni ovom iteracijom
  • Kakav je bio uticaj novih računarskih okruženja visokih performansi kao rezultat naučenog? Ako je odgovora na ova pitanja malo, moguće je da kompanija nije vrijedna ulaganja. Pitanja sa visokim rezultatom ukazuju na značajne dobitke u vrijednosti i trebala bi poslužiti kao vodič za dalju istragu. Na primjer, visoka ocjena za poboljšanja procesa trebala bi navesti dizajnere da ispitaju kako su procesi poboljšani. Možda ćete otkriti da su neki ili svi ostvareni dobici opipljivi i stoga se može lako primijeniti novčana vrijednost. Izvlačenje maksimuma iz prve iteracije magacin Najveći rezultat napora vašeg preduzeća često je u prvih nekoliko iteracija. Ovi rani napori tradicionalno uspostavljaju najkorisniji informacioni sadržaj za javnost i pomažu u uspostavljanju tehnološke osnove za naredne BI aplikacije. Obično svaki sljedeći niz dati skladišni projekti donose sve manju dodatnu vrijednost kompaniji općenito. Ovo je posebno istinito ako iteracija ne dodaje nove teme ili zadovoljava potrebe nove korisničke zajednice.

Ova funkcija skladištenja se također primjenjuje na rastuće hrpe dati istoričari. Kako naknadni napori zahtijevaju više dati i kako više dati se vremenom ulivaju u skladište, većina dati postaje manje relevantan za korišćenu analizu. Ove dati često se nazivaju dati neaktivni i uvijek ih je skupo držati jer se gotovo nikad ne koriste.

Šta to znači za sponzore projekta? U suštini, rani sponzori dijele više od onoga što košta investicija. Ovo je primarno jer su oni podsticaj za uspostavljanje širokog tehnološkog okruženja i resursnog sloja skladišta, uključujući organski.

Ali ovi prvi koraci donose najveću vrijednost i stoga projektanti često moraju opravdati investiciju.
Projekti urađeni nakon vaše BI inicijative mogu imati niže (u poređenju sa prvim) i direktne troškove, ali donose manju vrijednost kompaniji.

I vlasnici organizacija moraju početi razmišljati o bacanju akumulacije dati i manje relevantne tehnologije.

Data Mining: Ekstrakcija dati

Brojne arhitektonske komponente zahtijevaju varijacije u tehnologijama i tehnikama rudarenja podataka—
na primjer, različiti "agenti" za ispitivanje tačaka interesa kupaca, operativnim sistemima kompanije i za sam dw. Ovi agenti mogu biti napredne neuronske mreže obučene za POT trendove, kao što su buduća potražnja za proizvodima na osnovu promocije prodaje; motori zasnovani na pravilima da reaguju na set dato okolnosti, na primjer, medicinska dijagnoza i preporuke za liječenje; ili čak jednostavni agenti sa ulogom prijavljivanja izuzetaka najvišim rukovodiocima. Generalno, ovi procesi ekstrakcije dati si

verifikovati u realnom vremenu; stoga moraju biti potpuno ujedinjeni sa pokretom dati sami.

Online analitička obrada

Online analitika

Sposobnost rezanja, kockice, kotrljanja, izvrtanja i izvođenja analize
šta ako je u okviru opsega, fokus IBM-ovog tehnološkog paketa. Na primjer, funkcije online analitičke obrade (OLAP) postoje za DB2 koje unose dimenzionalnu analizu u softverski stroj. baza podataka isto.

Funkcije dodaju dimenzionalnu korisnost SQL-u dok iskorištavaju sve prednosti prirodnog dijela DB2. Drugi primjer OLAP integracije je alat za ekstrakciju, DB2 OLAP Server Analyzer. Ova tehnologija omogućava da se kocke DB2 OLAP poslužitelja brzo i automatski analiziraju kako bi se locirali i izvijestili o vrijednostima vrijednosti dati neobično ili neočekivano u cijeloj kocki poslovnom analitičaru. I na kraju, karakteristike DW Centra pružaju sredstva za arhitekte za kontrolu, između ostalog, profila DB2 OLAP serverske kocke kao prirodnog dijela ETL procesa.

Prostorna analiza. Prostorna analiza

Prostor predstavlja polovinu analitičkih sidara (vodova) potrebnih za panoramu
široko analitičko (vrijeme predstavlja drugu polovinu). Atomski nivo skladišta, prikazan na slici 1.1, uključuje i vremenske i prostorne osnove. Vremenske oznake sidre analize po vremenu i adresne informacije sidre analize po prostoru. Vremenske oznake vrše analizu po vremenu, a informacije o adresi vrše analizu po prostoru. Dijagram prikazuje geokodiranje – proces pretvaranja adresa u tačke na mapi ili tačke u prostoru tako da se koncepti kao što su udaljenost i iznutra/spolja mogu koristiti u analizi – sprovedenoj na atomskom nivou i prostornoj analizi koja je dostupna analitičar. IBM obezbeđuje prostorna proširenja, razvijena sa Institutom za istraživanje sistema zaštite životne sredine (ESRI), za baza podataka DB2 tako da se prostorni objekti mogu pohraniti kao normalni dio baza podataka relacijski. db2

Spatial Extenderi, također pružaju sve SQL ekstenzije za iskorištavanje prostorne analize. Na primjer, SQL ekstenzije za upite
udaljenost između adresa ili da li je tačka unutar ili izvan definisane poligonalne oblasti, analitički su standard sa Spatial Extender-om. Pogledajte poglavlje 16 za više informacija.

baza podataka-Rezident Tools Tools baza podataka-Stanovnik

DB2 ima mnoge BI-rezidentne SQL karakteristike koje pomažu u akciji analize. To uključuje:

  • Funkcije rekurzije za obavljanje analize, kao što je „pronalaženje svih mogućih putanja leta od San Francisco a Njujork".
  • Analitičke funkcije za rangiranje, kumulativne funkcije, kocke i rollup za olakšavanje zadataka koji se obično javljaju samo s OLAP tehnologijom, sada su prirodni dio motora baza podataka
  • Mogućnost kreiranja tabela koje sadrže rezultate
    Prodavci od baza podataka lideri mešaju više BI sposobnosti u baza podataka isto.
    Glavni dobavljači baza podataka oni miješaju više BI mogućnosti u baza podataka isto.
    Ovo pruža bolje performanse i više mogućnosti izvršenja za BI rješenja.
    Karakteristike i funkcije DB2 V8 detaljno su razmotrene u sljedećim poglavljima:
    Osnove tehničke arhitekture i upravljanja podacima (poglavlje 5)
  • DB2 BI osnove (poglavlje 6)
  • DB2 materijalizirane tabele upita (poglavlje 7)
  • DB2 OLAP funkcije (poglavlje 13)
  • DB2 poboljšane BI karakteristike i funkcije (poglavlje 15) Pojednostavljeni sistem dostave podataka Sistem isporuke od dati pojednostavljeno

Arhitektura prikazana na slici 1.1 uključuje brojne strukture dati fizički. Jedno je skladište dati operativni. Općenito, ODS je subjektno orijentisan, integrisan i aktuelni objekat. Napravili biste ODS za podršku, na primjer, ureda prodaje. Prodaja ODS bi dopunila dati iz brojnih različitih sistema, ali bi zadržao samo, na primjer, današnje transakcije. ODS se također može ažurirati mnogo puta dnevno. Istovremeno, procesi potiskuju dati integrisan u druge aplikacije. Ova struktura je posebno dizajnirana za integraciju dati trenutni i dinamični i bio bi vjerojatni kandidat za podršku analitici u realnom vremenu, kao što je pružanje usluga agentima kupaca trenutne informacije o prodaji kupca izdvajanjem informacija o trendu prodaje iz samog skladišta. Druga struktura prikazana na slici 1.1 je formalno stanje za dw. Ne samo da je ovo mjesto za izvršenje neophodne integracije, kvaliteta datii transformacije dati ulaznog skladišta, ali je i pouzdan i privremeni skladišni prostor za dati replika koje se mogu koristiti u analizama u realnom vremenu. Ako odlučite da koristite ODS ili scensko područje, jedan od najboljih alata za naseljavanje ovih struktura dati korištenje različitih operativnih izvora je DB2 heterogeni distribuirani upit. Ovu sposobnost isporučuje opcijska DB2 funkcija koja se zove DB2 Relational Connect (samo upit) i kroz DB2 DataJoiner (zaseban proizvod koji isporučuje sposobnost upita, umetanja, ažuriranja i brisanja heterogenim distribuiranim RDBMS-ovima).

Ova tehnologija omogućava arhitektima da dati vezati dati proizvodnja sa analitičkim procesima. Ne samo da se tehnologija može prilagoditi gotovo svim zahtjevima replikacije koji se mogu pojaviti s analitikom u stvarnom vremenu, već se može povezati i sa širokim spektrom baza dati najpopularniji, uključujući DB2, Oracle, Sybase, SQL Server, Informix i druge. DB2 DataJoiner se može koristiti za popunjavanje strukture dati formalno kao ODS ili čak trajna tabela predstavljena u skladištu dizajnirana za brzi oporavak trenutnih ažuriranja ili za prodaju. Naravno, ove iste strukture dati može se popuniti pomoću

još jedna važna tehnologija dizajnirana za replikaciju dati, IBM DataPropagator Relational. (DataPropagator je poseban proizvod za centralne sisteme. DB2 UNIX, Linux, Windows i OS/2 uključuju usluge replikacije podataka dati kao standardna karakteristika).
Druga metoda za kretanje dati oko preduzeća je integrator poslovnih aplikacija inače poznat kao broker poruka.Ova jedinstvena tehnologija omogućava neuporedivu kontrolu za ciljanje i kretanje dati oko kompanije. IBM ima najčešće korištenog brokera poruka, MQSeries, ili varijaciju proizvoda koja uključuje zahtjeve e-commerce, IBM WebSphere MQ.
Per più discussione su come sfruttare MQ per sostenere un magazzino e un ambiente BI, visitare web stranica del libro. Per ora, è sufficiente dire che questa tecnologia è un mezzo eccellente per catturare e trasformare (utilizzando MQSeries Integrator) dati centrirani (ciljani) operateri angažovani za BI rješenja. MQ tehnologija je integrirana i upakirana u UDB V8, što znači da se redovima poruka sada može upravljati kao da su DB2 tablice. Koncept zavarivanja poruka u redu čekanja i univerzum baza podataka relacija ide prema moćnom okruženju isporuke dati.

Zero-Latency Nulto kašnjenje

Krajnji strateški cilj za IBM je analiza nulte latencije. Kako je definisano od strane
Gartner, BI sistem mora biti u stanju da zaključi, asimilira i pruži informacije analitičarima na zahtjev. Izazov je, naravno, kako miješati dati aktuelno i u realnom vremenu sa potrebnim istorijskim informacijama, kao što su i dati povezani obrazac/trend, ili izdvojeno razumevanje, kao što je profilisanje kupaca.

Takve informacije uključuju, na primjer, identifikaciju kupaca visok ili nizak rizik ili koji proizvodi i kupaca oni će najvjerovatnije kupiti ako već imaju sir u svojim kolicima za kupovinu.

Postizanje nulte latencije zapravo ovisi o dva osnovna mehanizma:

  • Potpuna unija dati koji se analiziraju uspostavljenim tehnikama i alatima koje kreira BI
  • Sistem isporuke od dati efikasna kako bi se osiguralo da je analitika u realnom vremenu zaista dostupna.Ovi preduslovi za nultu latenciju se ne razlikuju od dva cilja postavljena od strane IBM-a i opisana gore. Blisko spajanje dati To je dio IBM-ovog programa besprijekorne integracije. I stvoriti sistem isporuke dati efikasan u potpunosti zavisi od dostupne tehnologije koja pojednostavljuje proces isporuke dati. Kao rezultat, dva od tri IBM-ova cilja su kritična za realizaciju trećeg. IBM svjesno razvija svoju tehnologiju kako bi osigurao da nulta latencija bude realnost za napore skladišta. Sažetak / Sinteza BI organizacija pruža mapu puta za izgradnju vašeg okruženja
    iterativno. Mora biti prilagođen kako bi odražavao potrebe vašeg poslovanja, kako sadašnje tako i buduće. Bez široke arhitektonske vizije, iteracije skladišta su nešto više od slučajnih implementacija centralnog skladišta koje malo doprinose stvaranju širokog, informativnog preduzeća. Prva prepreka projekt menadžerima je kako opravdati ulaganja potrebna za razvoj BI organizacije. Iako je proračun ROI ostao glavni oslonac implementacije skladišta, postaje sve teže precizno predvidjeti. Ovo je dovelo do drugih metoda za utvrđivanje da li vam novac vrijedi. Vrijednost ulaganja2 (VOI), na primjer, promovira se kao rješenje. To je zaduženo za arhitekte dati a projektanti namjerno stvaraju i pružaju informacije korisničkim udruženjima, a ne samo da im pružaju uslugu dati. Postoji ogromna razlika između to dvoje. Informacije su nešto što čini razliku u procesima donošenja odluka i efikasnosti; relativno, tj dati oni su gradivni blokovi za izvođenje tih informacija.

Čak i ako je kritičan prema izvoru dati Da bi se odgovorilo na poslovne zahtjeve, BI okruženje bi trebalo da ima veću ulogu u kreiranju informacijskog sadržaja. Moramo poduzeti dodatne korake za čišćenje, integraciju, transformaciju ili na drugi način kreiranje informacijskog sadržaja na koji korisnici mogu djelovati, a zatim moramo osigurati da se te radnje i odluke, gdje je to razumno, odražavaju u BI okruženju. Ako prepustimo skladište samo da služi dati, osigurava se da će korisnička udruženja kreirati informativni sadržaj potreban za poduzimanje radnje. To osigurava da će njihova zajednica moći donositi bolje odluke, ali kompanija pati od nedostatka znanja koje su koristili. datum da arhitekte i projektanti započinju specifične projekte u BI okruženju, oni ostaju odgovorni preduzeću u celini. Jednostavan primjer ove dvostrane karakteristike BI iteracija nalazi se u izvoru dati. Sve dati primljeni za specifične poslovne zahtjeve moraju biti popunjeni u prvom atomskom sloju. Ovo osigurava razvoj poslovnog informacijskog sredstva, kao i upravljanje, adresiranje specifičnih korisničkih zahtjeva definiranih u iteraciji.

WhatisaDataWarehouse?

Skladište podataka on je srce arhitekture informacionih sistema od 1990. godine i podržava informacione procese nudeći solidnu integrisanu platformu dati istorijski podaci uzeti kao osnova za naknadne analize. THE skladište podataka oni nude lakoću integracije u svijetu nekompatibilnih aplikativnih sistema. Skladište podataka evoluirao je u trend. Skladište podataka organizirati i zapamtiti i dati neophodna za informacione i analitičke procese zasnovane na dugoj istorijskoj vremenskoj perspektivi. Sve to podrazumijeva značajnu i stalnu posvećenost u izgradnji i održavanju skladište podataka.

Dakle, šta je a skladište podataka? A skladište podataka i:

  • ▪  predmetno orijentisan
  • ▪  integrisani sistem
  • ▪  varijantno vrijeme
  • ▪  nepostojan (ne briše)

zbirka od dati koristi se za podršku menadžerskim odlukama u implementaciji procesa.
I dati umetnuto u skladište podataka u većini slučajeva proizilaze iz operativnih okruženja. The skladište podataka kreira ga jedinica za skladištenje, fizički odvojena od ostatka sistema koji sadrži dati prethodno transformisan aplikacijama koje rade na informacijama koje potiču iz operativnog okruženja.

Doslovna definicija a skladište podataka zaslužuje detaljno objašnjenje jer postoje važne motivacije i osnovna značenja koja opisuju karakteristike skladišta.

PREDMETNA ORIJENTACIJA ORIJENTACIJA TEMATSKI

Prva karakteristika a skladište podataka je da je orijentisan na glavne igrače u kompaniji. Vodič kroz suđenja dati to je u suprotnosti sa klasičnijom metodom koja uključuje orijentaciju aplikacija prema procesima i funkcijama, metodom koju uglavnom dijeli većina novijih sistema upravljanja.

Operativni svijet je dizajniran oko aplikacija i funkcija kao što su krediti, štednja, bankovne kartice i povjerenje za financijsku instituciju. Svijet dw-a organiziran je oko glavnih subjekata kao što su kupac, prodavac, proizvod i aktivnost. Usklađivanje oko tema utiče na dizajn i implementaciju dati pronađeno u dw. Što je još važnije, glavna tema utiče na najvažniji dio ključne strukture.

Na svijet aplikacije utječu i dizajn baze podataka i dizajn procesa. Svijet dw-a fokusiran je isključivo na modeling dati i o dizajnu baza podataka. Dizajn procesa (u svom klasičnom obliku) nije dio dw okruženja.

Razlike između izbora aplikacije procesa/funkcije i izbora predmeta također se otkrivaju kao razlike u sadržaju dati na detaljnom nivou. THE dati del dw ne uključuje i dati koji se neće koristiti za DSS proces tokom aplikacija

operativno orijentisan dati sadrže i dati da odmah zadovolji funkcionalne/procesne zahtjeve koji mogu ili ne moraju imati koristi za DSS analitičara.
Još jedan važan način na koji se operativno orijentirane aplikacije dati razlikovati od dati dw je u izvještajima dati. ja dati operacije održavaju kontinuirani odnos između dvije ili više tablica na osnovu poslovnog pravila koje je aktivno. THE dati od dw prelaze spektar vremena i veze koje se nalaze u dw su brojne. Mnoga pravila trgovanja (i shodno tome, mnogi odnosi dati ) su zastupljeni u zalihama dati između dva ili više stolova.

(Za detaljno objašnjenje kako su odnosi između dati obrađuju se u DW-u, pozivamo se na tehničku temu o tom pitanju.)
Iz bilo koje druge perspektive osim one fundamentalne razlike između izbora funkcionalne/procesne aplikacije i izbora predmeta, postoji li veća razlika između operativnih sistema i dati i DW.

INTEGRACIJA INTEGRACIJA

Najvažniji aspekt dw okruženja je da i dati koji se nalaze unutar dw lako se integriraju. UVIJEK. BEZ IZUZETKA. Sama suština dw okruženja je da i dati sadržane u granicama skladišta su integrisane.

Integracija se otkriva na mnogo različitih načina – u doslednim identifikovanim konvencijama, u doslednom merenju varijabli, u doslednim kodiranim strukturama, u fizičkim atributima dati dosljedan, i tako dalje.

Tokom godina, dizajneri različitih aplikacija donijeli su mnoge odluke o tome kako bi aplikacija trebala biti razvijena. Stil i individualizirane dizajnerske odluke dizajnerskih aplikacija otkrivaju se na stotinu načina: u razlikama u kodiranju, ključnoj strukturi, fizičkim karakteristikama, konvencijama identifikacije itd. Kolektivna sposobnost mnogih dizajnera aplikacija da kreiraju nedosljedne aplikacije je legendarna. Slika 3 prikazuje neke od najvažnijih razlika u načinu na koji su aplikacije dizajnirane.

Kodiranje: Kodiranje:

Dizajneri aplikacija su odabrali kodiranje polja – spola – na različite načine. Dizajner predstavlja seks kao “m” i “f”. Drugi dizajner predstavlja rod kao “1” i “0”. Drugi dizajner predstavlja seks kao “x” i “y”. Drugi dizajner predstavlja seks kao “muški” i “ženski”. Nije bitno kako seks ulazi u DW. „M“ i „Ž“ su verovatno dobre kao i cela predstava.

Ono što je važno jeste da iz kog god porekla potiče polno polje, to polje dolazi u DW u doslednom integrisanom stanju. Shodno tome, kada se polje učita u DW iz aplikacije u kojoj je predstavljeno u formatu "M" i "F", dati mora se konvertovati u DW format.

Measurement of Attributes: Measurement of Atributi:

Dizajneri aplikacija su tokom godina odabrali mjerenje cjevovoda na različite načine. Dizajner pohranjuje dati cjevovoda u centimetrima. Drugi dizajner aplikacija pohranjuje dati cjevovoda u inčima. Drugi dizajner aplikacija pohranjuje dati cjevovoda u milionima kubnih stopa u sekundi. A drugi dizajner pohranjuje informacije o cjevovodu u jardi. Bez obzira na izvor, kada informacije o cjevovodu stignu u DW, moraju se mjeriti na isti način.

Prema indikacijama na slici 3, problemi integracije utiču na gotovo svaki aspekt projekta – fizičke karakteristike dati, dilema da postoji više od jednog izvora dati, pitanje nedosljednih identificiranih uzoraka, formata dati nedosledno, i tako dalje.

Bez obzira na temu dizajna, rezultat je isti – tj dati moraju biti pohranjeni u DW na jedinstven i globalno prihvatljiv način čak i kada ih osnovni operativni sistemi drugačije pohranjuju dati.

Kada analitičar DSS-a pogleda DW, cilj analitičara bi trebao biti eksploatacija dati koji se nalaze u magacinu,

umjesto da se pitate o kredibilitetu ili dosljednosti dati.

VREMENSKA VARIJANCIJA

Sve sam dati u DW-u su tačni do nekog vremena. Ova osnovna karakteristika dati u DW se veoma razlikuje od dati nalazi u radnom okruženju. THE dati operativnog okruženja su precizne kao u trenutku pristupa. Drugim riječima, u operativnom okruženju kada se pristupa disku dati, očekuje se da će odražavati precizne vrijednosti u trenutku pristupa. Zato što ja dati u DW-u su precizni jer se u nekom trenutku (tj. ne "trenutno") kaže da ja dati koji se nalaze u DW su „vremenska varijansa“.
Vremenska varijacija od dati od strane DW-a se pominje na brojne načine.
Najjednostavniji način je da i dati DW predstavlja dati u dugom vremenskom horizontu – pet do deset godina. Vremenski horizont predstavljen za radno okruženje je mnogo kraći od današnjih trenutnih vrijednosti do šezdeset devedeset
Aplikacije koje moraju dobro funkcionirati i koje moraju biti dostupne za obradu transakcija moraju imati minimalni iznos dati ako dozvoljavaju bilo kakav stepen fleksibilnosti. Dakle, operativne aplikacije imaju kratak vremenski horizont, poput teme dizajna audio aplikacija.
Drugi način na koji se 'vremenska varijansa' pojavljuje u DW je u strukturi ključa. Svaka ključna struktura u DW sadrži, implicitno ili eksplicitno, vremenski element, kao što su dan, sedmica, mjesec, itd. Element vremena je gotovo uvijek na dnu spojenog ključa koji se nalazi u DW-u. U tim prilikama, element vremena će postojati implicitno, kao što je slučaj kada se cijeli fajl duplicira na kraju mjeseca ili kvartala.
Treći način na koji se prikazuje vremenska varijacija je da i dati DW-a, kada se jednom ispravno registrira, ne može se ažurirati. THE dati DW-a su, za sve praktične svrhe, duga serija snimaka. Naravno, ako su snimci pogrešno snimljeni, tada se snimci mogu mijenjati. Ali pod pretpostavkom da su snimci ispravno napravljeni, oni se ne mijenjaju čim se naprave. U nekim

U nekim slučajevima može biti neetično ili čak nevažeće da se snimci u DW-u mijenjaju. THE dati operativni, precizni u trenutku pristupa, mogu se ažurirati po potrebi.

NOT VOLATILE

Četvrta važna karakteristika DW-a je da je neisparljiv.
Ažuriranja, umetanja, brisanja i modifikacije se redovno vrše u operativnim okruženjima na osnovu evidencije po zapis. Ali osnovna manipulacija dati koje su potrebne u DW je mnogo jednostavnije. Postoje samo dvije vrste operacija koje se javljaju u DW-u – početno učitavanje dati i pristup dati. Nema ažuriranja dati (u opštem smislu ažuriranja) u DW-u kao normalna operacija obrade. Postoje neke vrlo snažne posljedice ove osnovne razlike između operativne obrade i DW obrade. Na nivou dizajna, potreba da se bude oprezan u pogledu anomalnog ažuriranja nije faktor u DW-u, budući da ažuriranje dati se ne sprovodi. To znači da se na nivou fizičkog dizajna može uzeti slobodu da se optimizira pristup dati, posebno u bavljenju temama fizičke normalizacije i denormalizacije. Još jedna posljedica jednostavnosti DW operacija je u osnovnoj tehnologiji koja se koristi za pokretanje DW okruženja. Podržavanje inline ažuriranja zapisa po zapis (kao što je često slučaj sa operativnom obradom) zahtijeva da tehnologija ima vrlo složenu osnovu ispod prividne jednostavnosti.
Tehnologija koja podržava backup i oporavak, transakcije i integritet dati a otkrivanje i otklanjanje stanja zastoja je prilično složeno i nije potrebno za DW obradu. Karakteristike DW, orijentacija dizajna, integracija dati unutar DW, vremenska varijacija i jednostavnost upravljanja dati, sve vodi u okruženje koje je vrlo, vrlo različito od klasičnog operativnog okruženja. Izvor skoro svih dati od DW-a su radno okruženje. Primamljivo je pomisliti da postoji veliki višak dati između dva okruženja.
U stvari, prvi utisak koji mnogi ljudi imaju je veliki višak dati između radnog okruženja i okruženja

DW. Takvo tumačenje je površno i pokazuje nedostatak razumijevanja onoga što se dešava u DW.
Zaista postoji minimum zaliha dati između operativnog okruženja i i dati od DW. Uzmite u obzir sljedeće: I dati oni su filtrirani dato koji prelazi iz radnog okruženja u DW okruženje. Mnogi dati nikada ne izlaze van radnog okruženja. Osim što i dati koji su neophodni za DSS obradu nalaze svoj pravac u okruženju

▪  vremenski horizont od dati veoma se razlikuje od sredine do sredine. THE dati u radnom okruženju su vrlo svježe. THE dati u DW-u su mnogo stariji. Samo iz perspektive vremenskog horizonta, postoji vrlo malo preklapanja između operativnog okruženja i DW-a.

▪  DW sadrži dati sažetak koji se nikada ne nalaze u okruženju

▪ I dati prolaze kroz fundamentalnu transformaciju dok prelaze na Slika 3 to najviše ilustruje dati značajno su modificirani pod uvjetom da su odabrani i premješteni u DW. Drugim rečima, većina dati fizički i radikalno se mijenja kako se premešta u DW. Sa stanovišta integracije oni nisu isti dati koji se nalaze u radnom okruženju. U svjetlu ovih faktora, redundantnost od dati između dva okruženja je rijedak događaj, koji dovodi do manje od 1% redundancije između dva okruženja. STRUKTURA SKLADIŠTA DW imaju posebnu strukturu. Postoje različiti nivoi sažetka i detalja koji razgraničavaju DW.
Različite komponente DW-a su:

  • Metadata
  • dati trenutni detalji
  • dati starih detalja
  • dati malo sažeto
  • dati visoko sažeto

Daleko glavna briga je za i dati trenutni detalji. To je glavna briga jer:

  • I dati aktualni detalji odražavaju najnovije događaje, koji su uvijek od velikog interesa i
  • i dati trenutnih detalja je obiman jer je pohranjen na najnižem nivou granularnosti i
  • i dati Trenutni detalji su gotovo uvijek pohranjeni na disk memoriji, kojoj je brzo pristupiti, ali je skupa i složena za korištenje dati detalja su stariji dati koji su pohranjeni u nekoj memoriji masa. Pristupa mu se sporadično i pohranjuje se na kompatibilnom nivou detalja dati trenutni detalji. Iako nije obavezno pohranjivanje na alternativni medij za pohranu, zbog velike količine dati u kombinaciji sa sporadičnim pristupom dati, medij za skladištenje dati stariji detalji se obično ne pohranjuju na disk. THE dati olako sažeto jesu dati koji se destiliraju od niskog nivoa detalja koji je pronađen do trenutnog nivoa detalja. Ovaj nivo DW-a je skoro uvek pohranjen na disku. Problemi dizajna koji se javljaju kod arhitekte dati u izgradnji ovog nivoa DW su:
  • Koja je jedinica vremena gore navedeni sažetak
  • Koji sadržaj, atributi će malo sumirati sadržaj dati Sledeći nivo dati pronađeno u DW je ono od dati visoko sažeto. THE dati vrlo sažeti su kompaktni i lako dostupni. THE dati visoko sažeti se ponekad nalaze u DW okruženju, au drugim slučajevima i dati visoko sažeti nalaze se izvan neposrednih zidova tehnologije u kojoj se nalazi DW. (u svakom slučaju, tj dati visoko sumirani su dio DW bez obzira gdje i dati su fizički smješteni). Konačna komponenta DW-a su metapodaci. U mnogim aspektima metapodaci se nalaze u drugačijoj dimenziji od ostalih dati DW-a, jer metapodaci ne sadrže nikakve dato preuzeti direktno iz operativnog okruženja. Metapodaci imaju posebnu i veoma važnu ulogu u DW. Metapodaci se koriste kao:
  • direktorij koji pomaže DSS analitičaru da identificira sadržaj DW-a,
  • vodič za mapiranje dati o tome kako ja dati transformisani su iz operativnog okruženja u DW okruženje,
  • vodič za algoritme koji se koriste za sumiranje između dati aktuelnih detalja i i dati malo sažeto, tj dati visoko sažeto, metapodaci igraju mnogo veću ulogu u DW okruženju nego što su ikada imali u operativnom okruženju STARI MEDIJ ZA SKLADIŠTENJE DETALJA Magnetna traka se može koristiti za čuvanje takve vrste dati. U stvari, postoji širok izbor medija za skladištenje koje treba uzeti u obzir za staro skladištenje dati detalja. U zavisnosti od obima dati, učestalost pristupa, trošak alata i tip pristupa, sasvim je vjerovatno da će drugim alatima biti potreban stari nivo detalja u DW-u. TOK PODATAKA Postoji normalan i predvidljiv tok dati u okviru DW.
    I dati unesite DW iz radnog okruženja. (NAPOMENA: Postoje neki vrlo zanimljivi izuzeci od ovog pravila. Međutim, skoro svi dati unesite DW iz radnog okruženja). datum da ja dati ući u DW iz operativnog okruženja, on se transformira kako je prije opisano. Pod uslovom ulaska u DW, tj dati unesite trenutni nivo detalja, kao što je prikazano. Tamo se nalazi i koristi se dok se ne dogodi jedan od tri događaja:
  • je pročišćen,
  • je sažet, i/ili ▪è Zastarjeli proces unutar DW-a se pomiče i dati trenutni detalji a dati detalja staro, prema starosti od dati. Proces

sažimanje koristi detalje o dati za izračunavanje dati blago sažeti i visoko sažeti nivoi dati. Postoje neki izuzeci od prikazanog toka (o tome će biti riječi kasnije). Međutim, obično za veliku većinu dati pronađen unutar DW, tok od dati to je kako je predstavljeno.

KORIŠĆENJE SKLADIŠTA PODATAKA

Nije iznenađujuće da su različiti nivoi dati u okviru DW-a ne dobijaju različite nivoe upotrebe. Po pravilu, što je viši nivo sažimanja, to je više i dati oni se koriste.
Mnoge upotrebe se javljaju u dati visoko sažeto, dok je staro dati detalja se gotovo nikada ne koriste. Postoji dobar razlog da se organizacija pomeri na paradigmu korišćenja resursa. Više sažeto i dati, to je brže i efikasnije doći do toga dati. Ako a prodavnica otkrije da obavlja mnoge procese na nivou detalja DW-a, tada se troši odgovarajuća velika količina mašinskih resursa. U svačijem je najboljem interesu da se što prije obradi što viši nivo sumiranja.

Za mnoge prodavnice koristio se DSS analitičar u okruženju pre DW dati na nivou detalja. U mnogim aspektima dolazak u dati detaljan sažetak liči na sigurnosno pokrivanje, čak i kada su dostupni drugi nivoi sažetka. Jedna od aktivnosti arhitekte dati je odvikavanje korisnika DSS-a od stalne upotrebe dati na najnižem nivou detalja. Postoje dvije motivacije dostupne arhitekti dati:

  • instaliranjem sistema povrata naplate, gdje krajnji korisnik plaća potrošene resurse e
  • što ukazuje da se vrlo dobro vrijeme odziva može postići kada se ponašanje sa i dati je na visokom nivou sažimanja, dok je slabo vrijeme odgovora rezultat ponašanja dati na niskom nivou OSTALI RAZMATRANJA Postoje i neka druga razmatranja izgradnje i upravljanja DW-om.
    Prvo razmatranje je indeks. THE dati na višim nivoima sažimanja mogu se slobodno indeksirati, dok i dati

na nižim nivoima detalja su toliko glomazni da se mogu štedljivo indeksirati. Iz istog tokena, tj dati na visokim nivoima detalja može se relativno lako restrukturirati, dok se obim dati na nižim nivoima je toliko velika da i dati ne mogu se lako renovirati. Shodno tome, model dati a formalni posao koji je obavio dizajn postavio je temelj za DW primijenjen gotovo isključivo na trenutnom nivou detalja. Drugim riječima, aktivnosti modeliranja dati oni se ne odnose na nivoe sumiranja, u skoro svakom slučaju. Još jedno strukturalno razmatranje je ono o podpodjelu dati od DW.

Particija se može izvršiti na dva nivoa – na nivou dbms i na nivou aplikacije. U diviziji na nivou dbmson dbms je obaviješten o odjeljenjima i u skladu s tim ih kontrolira. U slučaju podjele na nivou aplikacije, samo programer je obaviješten o podjelama i odgovornost za njihovu administraciju je prepuštena njemu

Ispod nivoa dbms, dosta posla se obavlja automatski. Puno je nefleksibilnosti povezano s automatskom administracijom odjeljenja. U slučaju podjela na nivou aplikacije dati del skladište podataka, mnogo posla opterećuje programera, ali krajnji rezultat je fleksibilnost u administraciji dati Nel skladište podataka

DRUGE ANOMALIJE

Dok su komponente skladište podataka Djeluju kako je opisano za skoro sve dati, postoje neki korisni izuzeci o kojima treba razgovarati. Izuzetak je onaj od dati javni zbirni podaci. Ovo su dati sažetaka koji su izračunati iz skladište podataka ali ih društvo koristi. THE dati javni sažetci se pohranjuju i upravljaju u skladište podataka, iako su kao što je već spomenuto izračunate. Računovođe rade na izradi takvih kvartalno dati kao što su prihodi, tromjesečni rashodi, kvartalni profit i tako dalje. Posao koji obavljaju računovođe je eksterni skladište podataka. Međutim, i dati se koriste „interno“ unutar kompanije – od marketing, prodaja itd. Još jedna anomalija, o kojoj nećemo govoriti, je ona od dati vanjski.

Još jedna izvanredna vrsta dati koji se može naći u a skladište podataka je taj trajnih detaljnih podataka. Ovo uzrokuje potrebu za trajnim skladištenjem dati na detaljnom nivou iz etičkih ili pravnih razloga. Ako kompanija izlaže svoje radnike opasnim supstancama, postoji potreba dati detaljno i trajno. Ako kompanija proizvodi proizvod koji uključuje javnu sigurnost, kao što su dijelovi za avione, postoji potreba za tim dati trajne podatke, kao i ako kompanija sklapa opasne ugovore.

Kompanija ne može sebi priuštiti da previdi detalje jer u narednih nekoliko godina u slučaju tužbe, opoziva, sporne građevinske greške itd. izloženost kompanije mogla bi biti velika. Kao rezultat toga postoji jedinstvena vrsta dati poznat kao trajni detaljni podaci.

SAŽETAK

Un skladište podataka je objektno orijentirana, integrirana, vremenska varijanta, zbirka dati nepostojan da podrži potrebe administracije u donošenju odluka. Svaka od istaknutih funkcija a skladište podataka ima svoje implikacije. Plus postoje četiri nivoa dati del skladište podataka:

  • Stari detalj
  • Trenutni detalj
  • dati blago rekapitulirano
  • dati visoko sažeti metapodaci su takođe važan deo skladište podataka. SAŽETAK Koncept skladištenja dati Nedavno je dobio veliku pažnju i postao je trend 90-ih. To je zahvaljujući sposobnosti skladište podataka da se prevaziđu ograničenja sistema podrške administraciji kao što su sistemi za podršku odlučivanju (DSS) i izvršni informacioni sistemi (EIS). Čak i ako koncept skladište podataka izgleda obećavajuće, implementirati i skladište podataka može biti problematično zbog velikih skladišnih procesa. Unatoč složenosti skladišnih projekata dati, mnogi dobavljači i konsultanti koji zalihe dati tvrde da je skladištenje dati struja ne stvara nikakve probleme. Međutim, na početku ovog istraživačkog projekta gotovo da nije sprovedeno nezavisno, rigorozno i ​​sistematično istraživanje. Kao rezultat toga, teško je reći šta se zapravo dešava u industriji kada se grade skladište podataka. Ova studija je istraživala praksu skladištenja dati savremenici koja ima za cilj da razvije bogatije razumevanje australijske prakse. Pregled literature pružio je kontekst i osnovu za empirijsko istraživanje. Postoje brojni nalazi iz ovog istraživanja. Prvo, ova studija je otkrila aktivnosti koje su nastale tokom razvoja skladište podataka. U mnogim oblastima, tj dati okupljeni su potvrdili praksu iznesenu u literaturi. Drugo, pitanja i problemi koji mogu uticati na razvoj skladište podataka identifikovani su ovom studijom. Konačno, prednosti koje su stekle australske organizacije povezane s korištenjem skladište podataka su otkriveni.

Poglavlje 1

Kontekst istraživanja

Koncept skladištenja podataka bio je široko izložen i postao je trend u nastajanju 90-ih (McFadden 1996, TDWI 1996, Shah i Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman i Oates 2000). To se može vidjeti iz sve većeg broja članaka o skladištenju podataka u trgovačkim publikacijama (Little i Gibson 1999). Mnogi članci (vidi, na primjer, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett i King 1996, Graham et al. 1996, Sakaguchi i Frolick 1996, Alvarez 1997, Brousell 1997. Edwards 1997, TDWI 1997) su prijavili značajne koristi koje su dobile organizacije koje implementiraju i skladište podataka. Oni su svoju teoriju podržali anegdotskim dokazima o uspješnim implementacijama, brojkama visokog povrata ulaganja (ROI) i, također, pružanjem smjernica ili metodologija za razvoj skladište podataka

(Shanks et al. 1997, Seddon i Benjamin 1998, Little i Gibson 1999). U ekstremnom slučaju, Graham et al. (1996) izvještavaju o prosječnom povratu trogodišnje investicije od 401%.

Veliki dio trenutne literature, međutim, zanemaruje složenost u poduzimanju takvih projekata. Projekti of skladište podataka obično su složeni i velikih razmera i stoga nose veliku verovatnoću neuspeha ako se ne kontrolišu pažljivo (Shah i Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs i Clymer 1998, Rao 1998). Oni zahtijevaju ogromne količine i ljudskih i finansijskih resursa, te vremena i truda za njihovu izgradnju (Hill 1998, Crofts 1998). Tipično potrebno vrijeme i finansijska sredstva su otprilike dvije godine odnosno dva do tri miliona dolara (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Ovo vrijeme i finansijska sredstva su potrebna za kontrolu i konsolidaciju mnogih različitih aspekata skladištenja podataka (Cafasso 1995, Hill 1998). Pored hardverskih i softverskih razmatranja, druge funkcije koje se razlikuju od ekstrakcije dati na procese utovara dati, kapacitet memorije za upravljanje ažuriranjima i meta dati za obuku korisnika, mora se uzeti u obzir.

U vrijeme kada je ovaj istraživački projekat započeo, bilo je vrlo malo akademskih istraživanja u oblasti skladištenja podataka, posebno u Australiji. To je bilo očito iz nedostatka objavljenih članaka o skladištenju podataka iz časopisa ili drugih akademskih spisa tog vremena. Mnogi od dostupnih akademskih spisa opisali su američko iskustvo. Nedostatak akademskog istraživanja u oblasti skladištenja podataka izazvao je pozive za rigorozna istraživanja i empirijska istraživanja (McFadden 1996, Shanks et al. 1997, Little i Gibson 1999). Konkretno, istraživačke studije o procesu implementacije skladište podataka potrebno je provesti kako bi se proširilo opće znanje o implementaciji skladište podataka i poslužiće kao osnova za buduću istraživačku studiju (Shanks et al. 1997, Little i Gibson 1999).

Stoga je svrha ove studije da prouči šta se zapravo dešava kada organizacije sprovode i koriste i skladište podataka u Australiji. Konkretno, ova studija će uključivati ​​analizu cjelokupnog procesa razvoja a skladište podataka, počevši od inicijacije i planiranja preko dizajna i implementacije i naknadne upotrebe unutar australskih organizacija. Osim toga, studija će također doprinijeti trenutnoj praksi identifikacijom oblasti u kojima se praksa može dodatno poboljšati, a neefikasnost i rizici mogu biti minimizirani ili izbjegnuti. Nadalje, poslužit će kao osnova za druge studije o skladište podataka u Australiji i popuniće prazninu koja trenutno postoji u literaturi.

Istraživačka pitanja

Cilj ovog istraživanja je proučavanje aktivnosti uključenih u implementaciju skladište podataka i njihovu upotrebu od strane australskih organizacija. Posebno se proučavaju elementi koji se tiču ​​planiranja projekta, razvoja, rada, upotrebe i uključenih rizika. Dakle, pitanje ovog istraživanja glasi:

“Kakva je sadašnja praksa skladište podataka u Australiji?"

Da bi se efikasno odgovorilo na ovo pitanje, potreban je niz pomoćnih istraživačkih pitanja. Konkretno, tri potpitanja su identifikovana iz literature, koja je predstavljena u poglavlju 2, koja bi vodila ovaj istraživački projekat: Kako su skladište podataka iz australijskih organizacija? Sa kojim problemima ste se susreli?

Koje su prednosti doživljene?
U odgovoru na ova pitanja korišten je istraživački dizajn koji koristi anketu. Kao istraživačka studija, odgovori na gornja pitanja nisu potpuni (Shanks et al. 1993, Denscombe 1998). U ovom slučaju potrebna je triangulacija da bi se poboljšali odgovori na ova pitanja. Međutim, istraga će pružiti solidnu osnovu za budući rad na ispitivanju ovih pitanja. Detaljna rasprava o opravdanosti i dizajnu istraživačkih metoda predstavljena je u Poglavlju 3.

Struktura istraživačkog projekta

Ovaj istraživački projekat podijeljen je u dva dijela: kontekstualno proučavanje koncepta skladištenja podataka i empirijsko istraživanje (vidi sliku 1.1), od kojih je svaki razmotren u nastavku.

Dio I: Kontekstualna studija

Prvi dio istraživanja sastojao se od pregleda postojeće literature o različitim vrstama skladišta podataka uključujući sisteme za podršku odlučivanju (DSS), izvršne informacione sisteme (EIS), studije slučaja skladište podataka i koncepti skladište podataka. Nadalje, rezultati foruma skladište podataka i grupe za sastanke stručnjaka i praktičara predvođene istraživačkim timom Monash DSS, doprinijele su ovoj fazi studije koja je imala za cilj da stekne uvid u praksu skladište podataka i da se identifikuju rizici povezani sa njihovim usvajanjem. Tokom ovog perioda kontekstualnog proučavanja uspostavljeno je razumijevanje problematične oblasti kako bi se obezbijedilo osnovno znanje za naredna empirijska istraživanja. Međutim, ovo je bio stalni proces tokom provođenja istraživačke studije.

Dio II: Empirijska istraživanja

Relativno novi koncept skladištenja podataka, posebno u Australiji, stvorio je potrebu za istraživanjem kako bi se dobila široka slika o korisničkom iskustvu. Ovaj dio je obavljen nakon što je kroz opsežnu literaturu utvrđena oblast problema. Koncept skladištenja podataka formiran tokom faze kontekstualne studije korišćen je kao ulaz za početni upitnik ove studije. Nakon toga, upitnik je pregledan. Vi ste stručnjaci za skladište podataka učestvovao u testiranju. Svrha testiranja inicijalnog upitnika bila je provjeriti kompletnost i tačnost pitanja. Na osnovu rezultata testiranja, upitnik je modifikovan i modifikovana verzija je poslata učesnicima ankete. Vraćeni upitnici su zatim analizirani za i dati u tabelama, dijagramima i drugim formatima. THE

rezultate analize dati oni čine snimak prakse skladištenja podataka u Australiji.

PREGLED SKLADIŠTA PODATAKA

Koncept skladištenja podataka je evoluirao sa poboljšanjima u kompjuterskoj tehnologiji.
Ima za cilj prevazilaženje problema sa kojima se suočavaju grupe za podršku aplikacijama kao što su Sistem za podršku odlučivanju (DSS) i Izvršni informacioni sistem (EIS).

U prošlosti je najveća prepreka ovih aplikacija bila nemogućnost ovih aplikacija da obezbede a baza podataka neophodno za analizu.
Ovo je uglavnom uzrokovano prirodom posla menadžmenta. Interesi menadžmenta kompanije konstantno variraju u zavisnosti od oblasti koju pokriva. Stoga i dati osnovne za ove primjene moraju biti u mogućnosti da se brzo mijenjaju ovisno o dijelu koji se tretira.
To znači da i dati moraju biti dostupni u odgovarajućem obliku za tražene analize. Zapravo, grupama za podršku aplikacijama je u prošlosti bilo vrlo teško prikupljati i integrirati dati iz složenih i raznovrsnih izvora.

Ostatak ovog odjeljka predstavlja pregled koncepta skladištenja podataka i razmatra kako skladište podataka može prevazići probleme grupa za podršku aplikacijama.
Izraz „Skladište podataka” popularizirao je William Inmon 1990. Njegova često citirana definicija vidi Skladište podataka kao kolekcija dati predmetno orijentisan, integrisan, nepromenljiv i promenljiv tokom vremena, kao podrška odlukama menadžmenta.

Koristeći ovu definiciju Inmon naglašava da i dati nastanjen u a skladište podataka moraju posjedovati sljedeće 4 karakteristike:

  • ▪  Predmetno orijentisan
  • ▪  Integrisano
  • ▪  Neisparljiv
  • ▪  Varijanta tokom vremena Prema subjektu orijentisanom Inmon znači da i dati Nel skladište podataka u najvećim organizacionim oblastima koje su bile

definisano u modelu dati. Na primjer sve dati u vezi i kupaca nalaze se u predmetnoj oblasti KUPCI. Isto tako sve dati koji se odnose na proizvode sadržani su u predmetnom području PROIZVODI.

Pod Integrated Inmon znači da i dati koji dolaze sa različitih platformi, sistema i lokacija se kombinuju i skladište na jednom mestu. Posljedično dati slični se moraju transformisati u konzistentne formate kako bi se lako dodavali i upoređivali.
Na primjer, muški i ženski rod su predstavljeni slovima M i F u jednom sistemu, a 1 i 0 u drugom. Da biste ih pravilno integrirali, jedan ili oba formata moraju biti transformirana tako da dva formata budu ista. U ovom slučaju možemo promijeniti M u 1 i F u 0 ili obrnuto. Predmetno orijentisane i Integrisane ukazuju na to da skladište podataka dizajniran je da pruži funkcionalnu i transverzalnu viziju dati od strane kompanije.

Pod Nehlapljivim on podrazumijeva da i dati Nel skladište podataka ostati dosljedan i ažurirati dati nije potrebno. Umjesto toga, svaka promjena u dati originali se dodaju u baza podataka del skladište podataka. To znači da istorijski dei dati je sadržan u skladište podataka.

Za varijable s vremenom Inmon označava da i dati Nel skladište podataka uvijek sadrže ei indikatore vremena dati obično prelaze određeni vremenski horizont. Na primjer a
skladište podataka može sadržavati 5 godina historijskih vrijednosti kupaca od 1993. do 1997. Dostupnost historije i vremenske serije dati omogućava vam da analizirate trendove.

Un skladište podataka može prikupiti svoje dati iz OLTP sistema, iz izvora dati eksterno u odnosu na organizaciju i/ili drugim projektima posebnog sistema zahvata dati.
I dati ekstrakti mogu proći kroz proces čišćenja, u ovom slučaju i dati se transformišu i integrišu prije nego što se pohrane u baza podataka del skladište podataka. Onda sam dati

stanovnika unutar baza podataka del skladište podataka su dostupni krajnjim korisnicima za prijavu i alate za oporavak. Koristeći ove alate krajnji korisnik može pristupiti integriranom prikazu organizacije dati.

I dati stanovnika unutar baza podataka del skladište podataka pohranjuju se iu detaljima iu sažetim formatima.
Nivo sažetka može zavisiti od prirode dati. ja dati detaljan može se sastojati od dati struja e dati istoričari
I dati tantijeme nisu uključene u skladište podataka do i dati Nel skladište podataka su ažurirani.
Pored skladištenja dati sebe, a skladište podataka može pohraniti i drugu vrstu dato pod nazivom METADATA koji opisuju dati stanovnika u njegovom baza podataka.
Postoje dvije vrste metapodataka: razvojni metapodaci i metapodaci analitike.
Razvojni metapodaci se koriste za upravljanje i automatizaciju procesa ekstrakcije, čišćenja, mapiranja i učitavanja dati Nel skladište podataka.
Informacije sadržane u razvojnim metapodacima mogu sadržavati detalje o operativnim sistemima, detalje o elementima koji se izdvajaju, modelu dati del skladište podataka i poslovna pravila za konverziju dati.

Drugi tip metapodataka, poznat kao metapodaci analitike, omogućava krajnjem korisniku da istraži sadržaj skladište podataka pronaći dati dostupni i njihovo značenje u jasnim, netehničkim terminima.

Stoga analitički metapodaci rade kao most između skladište podataka i aplikacije za krajnje korisnike. Ovi metapodaci mogu sadržavati poslovni model, opise dati koji odgovaraju poslovnom modelu, unaprijed definiranim upitima i izvještajima, informacijama za pristup korisnika i indeksu.

Metapodaci analize i razvoja moraju se kombinovati u jedinstvene integrisane metapodatke o zadržavanju da bi ispravno funkcionisali.

Nažalost, mnogi od postojećih alata imaju svoje metapodatke i trenutno ne postoje postojeći standardi za to

dozvoli alatima za skladištenje podataka da integrišu ove metapodatke. Da bi popravili ovu situaciju, mnogi trgovci glavnim alatima za skladištenje podataka formirali su Vijeće za Meta Data koji je kasnije postao Meta Data Coalition.

Cilj ove koalicije je da izgradi standardni skup metapodataka koji omogućava različitim alatima za skladištenje podataka da konvertuju metapodatke
Njihovi napori su rezultirali rođenjem Meta Data Interchange Specification (MDIS) koja će omogućiti razmjenu informacija između Microsoft arhiva i povezanih MDIS datoteka.

Postojanje dati i sažeto/indeksirano i detaljno daje korisniku mogućnost da izvrši BUŠENJE (bušenje) od dati indeksirano na detaljne i obrnuto. Postojanje dati detaljne istorije omogućavaju kreiranje analiza trenda tokom vremena. Dodatno, metapodaci analitike se mogu koristiti kao direktorij baza podataka del skladište podataka kako bi pomogli krajnjim korisnicima da lociraju dati potrebno.

U poređenju sa OLTP sistemima, sa njihovom sposobnošću da podrže analizu dati i izvještavanje, skladište podataka vidi se kao prikladniji sistem za informacione procese kao što je pravljenje i odgovaranje na upite i izrada izveštaja. Sledeći odeljak će detaljno istaći razlike ova dva sistema.

DATA WAREHOUSE PROTIV OLTP SISTEMA

Mnogi informacioni sistemi unutar organizacija namijenjeni su za podršku svakodnevnim operacijama. Ovi sistemi poznati kao OLTP SISTEMI, hvataju kontinuirano ažurirane dnevne transakcije.

I dati unutar ovih sistema često se mijenjaju, dodaju ili brišu. Na primjer, adresa kupca se mijenja čim se preseli s jednog mjesta na drugo. U tom slučaju nova adresa će biti registrovana modifikacijom polja za adresu baza podataka. Glavni cilj ovih sistema je smanjenje troškova transakcije i istovremeno smanjenje vremena obrade. Primjeri OLTP sistema uključuju kritične radnje kao što su unos narudžbe, obračun plaća, faktura, proizvodnja, korisnička služba kupaca.

Za razliku od OLTP sistema, koji su kreirani za procese zasnovane na transakcijama i događajima, tj skladište podataka stvoreni su da pruže podršku procesima zasnovanim na analitici dati i procesi donošenja odluka.

Ovo se obično postiže integracijom i dati iz različitih OLTP i eksternih sistema u jednom „kontejneru“ od dati, kao što je objašnjeno u prethodnom odeljku.

Monash model procesa skladištenja podataka

Model procesa za skladište podataka Monash su razvili istraživači Monash DSS Research Group, a baziran je na literaturi skladište podataka, o iskustvu u podršci razvoju sistemskih oblasti, o diskusijama sa dobavljačima aplikacija za upotrebu na skladište podataka, o grupi stručnjaka za upotrebu skladište podataka.

Faze su: početak, planiranje, razvoj, operacije i objašnjenja. Dijagram objašnjava iterativnu ili evolucijsku prirodu razvoja a skladište podataka proces pomoću dvosmjernih strelica postavljenih između različitih faza. U ovom kontekstu, “iterativni” i “evolutivni” znače da se, u svakom koraku procesa, aktivnosti implementacije uvijek mogu širiti unazad prema prethodnoj fazi. To je zbog prirode projekta skladište podataka u kojem se u svakom trenutku javljaju dodatni zahtjevi krajnjeg korisnika. Na primjer, tokom faze razvoja procesa skladište podataka, novu dimenziju ili predmetnu oblast zatraži krajnji korisnik, a koja nije bila dio originalnog plana, to se mora dodati sistemu. To uzrokuje promjenu u projektu. Rezultat je da dizajnerski tim mora promijeniti zahtjeve do sada kreiranih dokumenata tokom faze projektovanja. U mnogim slučajevima, trenutno stanje projekta mora se vratiti u fazu dizajna gdje se novi zahtjev mora dodati i dokumentirati. Krajnji korisnik mora biti u mogućnosti da vidi konkretnu dokumentaciju koja je pregledana i promjene koje su napravljene u fazi razvoja. Na kraju ovog razvojnog ciklusa projekat mora dobiti odlične povratne informacije i od razvojnog i od korisničkog tima. Povratne informacije se zatim ponovo koriste za poboljšanje budućeg projekta.

Planiranje kapaciteta
Dw imaju tendenciju da budu vrlo velike veličine i rastu vrlo brzo (Best 1995, Rudin 1997a) kao rezultat količine dati istorije koje zadržavaju od svog trajanja. Rast može biti uzrokovan i dati dodaci koje korisnici traže za povećanje vrijednosti dati koje već imaju. Shodno tome, zahtjevi za skladištenje za dati može biti značajno poboljšana (Eckerson 1997). Stoga je bitno osigurati, sprovođenjem planiranja kapaciteta, da sistem koji se gradi može rasti kako potrebe rastu (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Prilikom planiranja skalabilnosti baze podataka, mora se znati očekivani rast veličine skladišta, tipovi upita koji će se vjerovatno napraviti i broj podržanih krajnjih korisnika (Best 1995, Rudin 1997b, Foley 1997a). Izgradnja skalabilnih aplikacija zahtijeva kombinaciju skalabilnih serverskih tehnologija i skalabilnih tehnika dizajna aplikacija (Best 1995, Rudin 1997b. Obje su neophodne za izgradnju visoko skalabilne aplikacije. Skalabilne serverske tehnologije mogu učiniti lakim i korisnim dodavanje skladišta, memorije i CPU-a bez degradacije performans (Lang 1997, Telefonija 1997).

Postoje dvije glavne skalabilne serverske tehnologije: simetrična višestruka obrada (SMP) i masivno paralelna obrada (MPP) (IDC 1997, Humphries et al. 1999). SMP server obično ima više procesora koji dijele memoriju, sistemsku magistralu i druge resurse (IDC 1997, Humphries et al. 1999). Mogu se dodati dodatni procesori kako bi se povećao moć računski. Još jedna metoda za povećanje moć SMP servera, kombinuje brojne SMP mašine. Ova tehnika je poznata kao grupisanje (Humphries et al. 1999). MPP server, s druge strane, ima više procesora svaki sa svojom memorijom, sistemom magistrale i drugim resursima (IDC 1997, Humphries et al. 1999). Svaki procesor se naziva čvorom. Povećanje u moć može se postići računski

dodavanje dodatnih čvorova MPP serverima (Humphries et al. 1999).

Slabost SMP servera je u tome što previše ulazno-izlaznih (I/O) operacija može zagušiti sistemsku magistralu (IDC 1997). Ovaj problem se ne javlja unutar MPP servera jer svaki procesor ima svoj sistem magistrale. Međutim, međusobne veze između svakog čvora su generalno mnogo sporije od sistema SMP magistrale. Dodatno, MPP serveri mogu dodati dodatni nivo složenosti programerima aplikacija (IDC 1997). Dakle, na izbor između SMP i MPP servera može utjecati mnogo faktora, uključujući složenost aplikacija, omjer cijene i performansi, potrebni kapacitet obrade, spriječene dw aplikacije i povećanje veličine baza podataka dw i u broju krajnjih korisnika.

U planiranju kapaciteta mogu se koristiti brojne skalabilne tehnike dizajna aplikacija. Koristi se različite periode obavještavanja kao što su dani, sedmice, mjeseci i godine. Imajući različite periode obavještenja, baza podataka može se podijeliti na upravljivo grupisane dijelove (Inmon et al. 1997). Druga tehnika je korištenje zbirnih tabela koje se konstruiraju sumiranjem dati da dati detaljan. Dakle, ja dati sažeti su više kompaktni nego detaljni, što zahtijeva manje memorijskog prostora. Dakle dati detalji se mogu pohraniti u jeftiniju jedinicu za skladištenje, što štedi još više prostora za skladištenje. Iako korištenje tabela sa sažetkom može uštedjeti memorijski prostor, zahtijevaju puno truda kako bi bile ažurne i u skladu s poslovnim potrebama. Međutim, ova tehnika se široko koristi i često se koristi u kombinaciji s prethodnom tehnikom (Best 1995, Inmon 1996a, Chauduri i Dayal
1997).

definiranje Skladište podataka Tehničke arhitekture Definicija tehnika dw arhitekture

Rani oni koji su usvojili skladištenje podataka prvenstveno su zamišljali centralizovanu implementaciju dw-a u kojoj su svi dati, uključujući i dati eksterne, bile su integrisane u jednu,
fizičko skladištenje (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Glavna prednost ovog pristupa je u tome što krajnji korisnici mogu pristupiti pregledu cjelokupnog poduzeća dati organizacioni (Ovum 1998). Još jedna prednost je što nudi standardizaciju dati kroz organizaciju, što znači da postoji samo jedna verzija ili definicija za svaku terminologiju koja se koristi u dw repozitorijumu (metapodaci) (Flanagan i Safdie 1997, Ovum 1998). Nedostatak ovog pristupa je, s druge strane, to što je skup i težak za izgradnju (Flanagan i Safdie 1997, Ovum 1998, Inmon et al. 1998). Nedugo nakon arhitekture skladištenja dati centralizovan je postao popularan, koncept izdvajanja manjih podskupova evoluiranog dati da podrže potrebe specifičnih aplikacija (Varney 1996, IDC 1997, Berson i Smith 1997, paun 1998). Ovi mali sistemi su derivati ​​većeg skladište podataka centralizovano. Oni su imenovani skladište podataka zavisna odeljenja ili zavisna tržišta podataka. Arhitektura zavisne baze podataka poznata je kao troslojna arhitektura gdje se prvi sloj sastoji od skladište podataka centralizovan, drugi se sastoji od depozita dati odjela, a treći se sastoji od pristupa dati i pomoću alata za analizu (Demarest 1994, Inmon et al. 1997).

Satovi podataka se obično grade nakon skladište podataka centralizovan je izgrađen da zadovolji potrebe specifičnih jedinica (White 1995, Varney 1996).
Baza podataka pohranjuje dati veoma relevantno u vezi sa određenim jedinicama (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

Prednost ove metode je što neće biti dato nije integrisan i da i dati će biti manje redundantni unutar baza podataka jer sve dati dolaze iz skladišta dati integrisan. Još jedna prednost je što će postojati malo veza između svake baze podataka i njenih izvora dati jer svaka baza podataka ima samo jedan izvor dati. Osim toga, sa ovom arhitekturom na mjestu, krajnji korisnici i dalje mogu pristupiti pregledu dati

korporativne organizacije. Ova metoda je poznata kao metoda odozgo prema dolje, gdje se baze podataka grade nakon skladište podataka (paun 1998, Goff 1998).
Povećavajući potrebu za ranim pokazivanjem rezultata, neke organizacije su počele da grade nezavisne prodajne mreže podataka (Flanagan i Safdie 1997, White 2000). U ovom slučaju, vitrine podataka dobijaju svoje dati direktno od osnova dati OLTP a ne iz centralizovanog i integrisanog skladišta, čime se eliminiše potreba za centralnim skladištem na licu mesta.

Svako tržište podataka zahtijeva barem jednu vezu do svojih izvora dati. Nedostatak višestrukih konekcija za svako tržište podataka je taj što je, u poređenju s prethodne dvije arhitekture, prevelik broj dati značajno povećava.

Svaka baza podataka mora pohraniti sve dati potrebno lokalno da nema efekta na OLTP sisteme. Ovo uzrokuje da i dati pohranjeni su u različitim bazama podataka (Inmon et al. 1997). Još jedan nedostatak ove arhitekture je to što ona dovodi do stvaranja složenih međusobnih veza između baza podataka i njihovih izvora podataka. dati koje je teško provesti i kontrolisati (Inmon et al. 1997).

Još jedan nedostatak je što krajnji korisnici ne mogu pristupiti pregledu informacija o kompaniji jer i dati različita tržišta podataka nisu integrisana (Ovum 1998).
Još jedan nedostatak je to što može postojati više od jedne definicije za svaku terminologiju koja se koristi u bazama podataka, što stvara nedosljednosti dati u organizaciji (Ovum 1998).
Uprkos gore navedenim nedostacima, nezavisne prodajne mreže podataka i dalje privlače interesovanje mnogih organizacija (IDC 1997). Jedan od faktora koji ih čini privlačnima je da se brže razvijaju i zahtijevaju manje vremena i resursa (Bresnahan 1996, Berson i Smith 1997, Ovum 1998). Shodno tome, oni služe prvenstveno kao probni projekti koji se mogu koristiti za brzo identifikovanje prednosti i/ili nesavršenosti u projektu (Parsaye 1995, Braly 1995, Newing 1996). U ovom slučaju, dio koji će se implementirati u pilot projektu mora biti mali, ali važan za organizaciju (Newing 1996, Mansell-Lewis 1996).

Ispitivanjem prototipa krajnji korisnici i administracija mogu odlučiti da li da nastave ili zaustave projekat (Flanagan i Safdie 1997).
Ako se odluka nastavi, vitrine podataka za druge industrije treba graditi jednu po jednu. Postoje dvije opcije za krajnje korisnike na osnovu njihovih potreba u izgradnji nezavisnih matrica podataka: integrirana/udružena i neintegrirana (Ovum 1998.)

U prvoj metodi, svako novo tržište podataka treba izgraditi na osnovu trenutnih baza podataka i modela dati koju koristi kompanija (Varney 1996, Berson i Smith 1997, Peacock 1998). Potreba za korištenjem modela dati kompanije znači da se mora osigurati da postoji samo jedna definicija za svaku terminologiju koja se koristi u svim bazama podataka, također kako bi se osiguralo da se različita tržišta podataka mogu kombinirati kako bi se dao pregled informacija o kompaniji (Bresnahan 1996). Ova metoda se naziva odozdo prema gore i najbolja je kada postoji ograničenje finansijskih sredstava i vremena (Flanagan i Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). U drugoj metodi, izgrađene vitrine podataka mogu zadovoljiti samo potrebe određene jedinice. Varijanta federalnog tržišta podataka je skladište podataka distribuira u kojoj je baza podataka Međuoprema za Hub Server se koristi za spajanje mnogih baza podataka u jedno spremište dati distribuira (White 1995). U ovom slučaju, tj dati kompanije su raspoređene u nekoliko baza podataka. Zahtjevi krajnjeg korisnika se prenose na baza podataka server hub middleware, koji izdvaja sve dati zahtijevaju prodajna mjesta i vraća rezultate aplikacijama krajnjeg korisnika. Ova metoda pruža poslovne informacije krajnjim korisnicima. Međutim, problemi nezavisnih baza podataka još uvijek nisu otklonjeni. Postoji još jedna arhitektura koja se može koristiti, a koja se zove skladište podataka virtuelni (White 1995). Međutim, ova arhitektura, koja je opisana na slici 2.9, nije arhitektura za skladištenje podataka. dati realan jer ne premešta učitavanje sa OLTP sistema na skladište podataka (Demarest 1994).

Zapravo, zahtjevi od dati krajnji korisnici se prosljeđuju na OLTP sisteme koji vraćaju rezultate nakon obrade korisničkih zahtjeva. Iako ova arhitektura dozvoljava krajnjim korisnicima da generišu izveštaje i postavljaju zahteve, ne može da obezbedi

dati historijski i pregled informacija o kompaniji kao i dati iz različitih OLTP sistema nisu integrisani. Stoga ova arhitektura ne može zadovoljiti analizu dati kompleksa kao što su prognoze.

Izbor aplikacija za pristup i oporavak dati

Svrha izgradnje a skladište podataka je prenošenje informacija krajnjim korisnicima (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); jednu ili više aplikacija za pristup i oporavak dati mora biti obezbeđen. Do danas postoji veliki izbor ovih aplikacija od kojih korisnik može birati (Hammergren 1998, Humphries et al. 1999). Aplikacije koje odaberete određuju uspjeh vašeg skladišnog napora dati u organizaciji jer su aplikacije najvidljiviji dio skladište podataka do krajnjeg korisnika (Inmon et al 1997, Poe 1996). Biti uspješan a skladište podataka, mora biti u stanju da podrži aktivnosti analize dati krajnjeg korisnika (Poe 1996, Seddon i Benjamin 1998, Eckerson 1999). Stoga „nivo“ onoga što krajnji korisnik želi mora biti identificiran (Poe 1996, Mattison 1996, Inmon et al 1997, Humphries et al 1999).

Generalno, krajnji korisnici se mogu grupisati u tri kategorije: izvršni korisnici, poslovni analitičari i napredni korisnici (Poe 1996, Humphries et al. 1999). Izvršnim korisnicima je potreban lak pristup unapred definisanim skupovima izveštaja (Humphries et al. 1999). Ovim omjerima se može lako pristupiti navigacijom kroz meni (Poe 1996). Osim toga, izvještaji bi trebali predstavljati informacije koristeći grafički prikaz kao što su tabele i šabloni za brzo prenošenje informacija (Humphries et al. 1999). Poslovni analitičari, koji možda nemaju tehničke mogućnosti da sami razvijaju izvještaje od nule, moraju biti u mogućnosti da modificiraju tekuće izvještaje kako bi zadovoljili svoje specifične potrebe (Poe 1996, Humphries et al. 1999). Napredni korisnici, s druge strane, su tip krajnjih korisnika koji imaju mogućnost da generišu i pišu zahtjeve i izvještaje od nule (Poe 1996, Humphries et al. 1999). Oni su ti koji

oni razvijaju izvještaje za druge tipove korisnika (Poe 1996, Humphries et al. 1999).

Kada se odrede zahtjevi krajnjeg korisnika, mora se izvršiti odabir aplikacija za pristup i oporavak dati među svim dostupnim (Poe 1996, Inmon et al. 1997).
Pristup dati i alati za pronalaženje mogu se klasifikovati u 4 tipa: OLAP alati, EIS/DSS alati, alati za upite i izvještavanje i alati za rudarenje podataka.

OLAP alati omogućavaju korisnicima da kreiraju ad hoc upite kao i one napravljene na baza podataka del skladište podataka. Osim toga, ovi proizvodi omogućavaju korisnicima da se izvuku dati opšte do detaljnih.

EIS/DSS alati pružaju izvršno izvještavanje kao što je analiza „šta ako” i pristup izvještajima vođenim menijima. Izveštaji treba da budu unapred definisani i spojeni sa menijima radi lakše navigacije.
Alati za upite i izvještavanje omogućavaju korisnicima da proizvode unaprijed definirane i specifične izvještaje.

Alati za rudarenje podataka koriste se za identifikaciju odnosa koji bi mogli baciti novo svjetlo na zaboravljene operacije dati skladišta podataka.

Uz optimizaciju zahtjeva svake vrste korisnika, odabrani alati moraju biti intuitivni, efikasni i laki za korištenje. Oni takođe moraju biti kompatibilni sa drugim delovima arhitekture i sposobni da rade sa postojećim sistemima. Također se preporučuje da odaberete alate za pristup podacima i pronalaženje sa razumnim cijenama i performansama. Ostali kriterijumi koje treba razmotriti uključuju posvećenost dobavljača alata da podrži njihov proizvod i razvoj koji će isti imati u budućim izdanjima. Kako bi osigurao angažman korisnika u korištenju skladišta podataka, razvojni tim uključuje korisnike u proces odabira alata. U tom slučaju treba izvršiti praktičnu procjenu korisnika.

Kako bi poboljšao vrijednost skladišta podataka, razvojni tim također može omogućiti web pristup svom skladištu podataka. Web-omogućeno skladište podataka omogućava korisnicima pristup dati sa udaljenih mjesta ili tokom putovanja. Dodatne informacije mogu

obezbijediti po nižim troškovima kroz smanjenje troškova obuke.

2.4.3 Skladište podataka Operativna faza

Ova faza se sastoji od tri aktivnosti: definisanje strategija osvježavanja podataka, kontrola aktivnosti skladišta podataka i upravljanje sigurnošću skladišta podataka.

Definicija strategija osvježavanja podataka

Nakon početnog opterećenja, tj dati Nel baza podataka skladišta podataka moraju se periodično osvježavati kako bi se reproducirali promjene koje su na njima napravljene dati originali. Stoga morate odlučiti kada ćete osvježiti, koliko često treba zakazati osvježavanje i kako osvježiti podatke dati. Predlaže se osvježenje dati kada se sistem može isključiti. Učestalost osvježavanja određuje razvojni tim na osnovu zahtjeva korisnika. Postoje dva pristupa za osvježavanje skladišta podataka: potpuno osvježavanje i kontinuirano učitavanje promjena.

Prvi pristup, potpuno osvježenje, zahtijeva ponovno učitavanje dati od nule. To znači da sve dati potrebno mora biti ekstrahirano, očišćeno, transformirano i integrirano u svako osvježavanje. Ovaj pristup treba, koliko god je to moguće, izbjegavati jer zahtijeva mnogo vremena i sredstava.

Alternativni pristup je kontinuirano učitavanje promjena. Ovo dodaje i dati koji su promijenjeni od posljednjeg ciklusa osvježavanja skladišta podataka. Identifikacija novih ili izmijenjenih zapisa značajno smanjuje količinu dati koji se mora propagirati u skladište podataka u svakom ažuriranju od samo ovih dati će biti dodan u baza podataka skladišta podataka.

Postoji najmanje 5 pristupa koji se mogu koristiti za povlačenje i dati novo ili modificirano. Da biste dobili efikasnu strategiju osvježavanja podataka dati mješavina ovih pristupa koja obuhvata sve promjene u sistemu može biti korisna.

Prvi pristup, koji koristi vremenske oznake, pretpostavlja da su svi dodijeljeni dati uredili i ažurirali vremensku oznaku tako da možete lako sve identificirati dati modificirano i novo. Ovaj pristup, međutim, nije široko korišten u većini današnjih operativnih sistema.
Drugi pristup je korištenje delta datoteke koju generiše aplikacija koja sadrži samo promjene napravljene na dati. Korišćenje ove datoteke takođe pojačava ciklus ažuriranja. Međutim, čak ni ova metoda nije korištena u mnogim aplikacijama.
Treći pristup je skeniranje datoteke dnevnika, koja u osnovi sadrži informacije slične delta datoteci. Jedina razlika je u tome što se kreira log datoteka za proces oporavka i može biti teško razumjeti.
Četvrti pristup je izmjena koda aplikacije. Međutim, većina koda aplikacije je stara i krhka; stoga ovu tehniku ​​treba izbjegavati.
Posljednji pristup je poređenje dati izvori sa glavnim dei fajlom dati.

Kontrola aktivnosti skladišta podataka

Jednom kada je skladište podataka pušteno korisnicima, mora se pratiti tokom vremena. U ovom slučaju, administrator skladišta podataka može koristiti jedan ili više alata za upravljanje i kontrolu za praćenje korištenja skladišta podataka. Posebno se mogu prikupljati informacije o ljudima i vremenu u kojem pristupaju skladištu podataka. Hajde dati prikupljeni, može se kreirati profil obavljenog posla koji se može koristiti kao ulaz u implementaciji povrata plaćanja korisnika. Povrat naknade omogućava korisnicima da budu informisani o troškovima obrade skladišta podataka.

Nadalje, revizija skladišta podataka može se koristiti i za identifikaciju tipova upita, njihove veličine, broja upita po danu, vremena reakcije na upite, dosegnutih sektora i količine upita. dati obrađeno. Druga svrha revizije skladišta podataka je da se identifikuju dati koji nisu u upotrebi. Ove dati mogu se ukloniti iz skladišta podataka radi poboljšanja vremena

odgovora na izvršenje upita i prati rast dati koji borave unutar baza podataka skladišta podataka.

Upravljanje sigurnošću skladišta podataka

Skladište podataka sadrži dati integrirani, kritični, osjetljivi do kojih je lako doći. Iz tog razloga treba ga zaštititi od neovlaštenih korisnika. Jedan od načina za implementaciju sigurnosti je korištenje funkcije del DBMS dodijeliti različite privilegije različitim tipovima korisnika. Na ovaj način, pristupni profil se mora održavati za svaki tip korisnika. Drugi način da osigurate skladište podataka je da ga šifrirate kako je napisano u baza podataka skladišta podataka. Pristup dati a alati za pronalaženje moraju dešifrirati dati prije predstavljanja rezultata korisnicima.

2.4.4 Skladište podataka Faza implementacije

To je posljednja faza u ciklusu implementacije skladišta podataka. Aktivnosti koje će se provesti u ovoj fazi uključuju obuku korisnika za korištenje skladišta podataka i provođenje pregleda skladišta podataka.

Obuka korisnika

Obuku korisnika treba obaviti prije pristupa dati skladišta podataka i korištenje alata za pronalaženje. Općenito, sesije bi trebale početi uvodom u koncept skladištenja dati, sadržaj skladišta podataka, meta dati i osnovne karakteristike alata. Zatim bi napredniji korisnici mogli da proučavaju fizičke tabele i korisničke karakteristike alata za pristup podacima i pronalaženje.

Postoji mnogo pristupa obuci korisnika. Jedan od njih uključuje odabir velikog broja korisnika ili analitičara koji se biraju iz skupa korisnika, na osnovu njihovih liderskih i komunikacijskih vještina. Oni su lično obučeni o svemu što im je potrebno da bi se upoznali sa sistemom. Kada se obuka završi, vraćaju se svojim poslovima i počinju podučavati druge korisnike kako da koriste sistem. Na

Na osnovu onoga što su naučili, drugi korisnici mogu početi istraživati ​​skladište podataka.
Drugi pristup je obučavanje više korisnika u isto vrijeme, kao da pohađate tečaj u učionici. Ova metoda je prikladna kada postoji više korisnika koje je potrebno obučiti u isto vrijeme. Još jedna metoda je obučavanje svakog korisnika pojedinačno, jednog po jednog. Ova metoda je prikladna kada ima malo korisnika.

Svrha obuke korisnika je da vas upozna sa pristupom dati i alati za pronalaženje kao i sadržaj skladišta podataka. Međutim, neki korisnici mogu biti preopterećeni količinom informacija koje se pružaju tokom treninga. Stoga se mora provesti određeni broj sesija za osvježavanje kako bi se pružila stalna pomoć i odgovorili na konkretna pitanja. U nekim slučajevima se formira korisnička grupa koja pruža ovu vrstu podrške.

Prikupljanje povratnih informacija

Nakon što je skladište podataka uvedeno, korisnici mogu koristiti i dati koji se nalaze u skladištu podataka za različite svrhe. Uglavnom analitičari ili korisnici koriste i dati u skladištu podataka za:

  1. 1  Identifikujte trendove kompanije
  2. 2  Analizirajte profile kupovine kupaca
  3. 3  Podijelite i kupaca i od
  4. 4  Pružiti najbolje usluge za kupaca – prilagođavanje usluga
  5. 5  Formulirajte strategije marketing
  6. 6  Izradite konkurentne ponude za analizu troškova i pomoć u kontroli
  7. 7  Podržite strateško donošenje odluka
  8. 8  Identifikujte prilike da se istaknete
  9. 9  Poboljšajte kvalitet tekućih poslovnih procesa
  10. 10  Provjerite profit

Prateći smjer razvoja skladišta podataka, niz pregleda bi se mogao provesti u sistemu kako bi se dobile povratne informacije

kako od razvojnog tima tako i od zajednice krajnjih korisnika.
Dobijeni rezultati se mogu uzeti u obzir za sljedeći razvojni ciklus.

Budući da skladište podataka ima inkrementalni pristup, ključno je učiti iz uspjeha i grešaka prethodnih razvoja.

2.5 Sažetak

U ovom poglavlju razmatrani su pristupi prisutni u literaturi. U odeljku 1, razmatran je koncept skladišta podataka i njegova uloga u nauci o odlučivanju. Odjeljak 2 opisuje glavne razlike između skladišta podataka i OLTP sistema. U odeljku 3 raspravljali smo o Monash modelu skladišta podataka koji je korišćen u odeljku 4 da opiše aktivnosti uključene u proces razvoja skladišta podataka, ove teze nisu bile zasnovane na rigoroznom istraživanju. Ono što se dešava u stvarnosti može biti veoma različito od onoga što izvještava literatura, međutim ovi rezultati se mogu koristiti za stvaranje osnovne pozadine koja naglašava koncept skladišta podataka za ovo istraživanje.

Poglavlje 3

Metode istraživanja i projektovanja

Ovo poglavlje bavi se metodama istraživanja i dizajna za ovu studiju. U prvom dijelu prikazan je generički prikaz istraživačkih metoda dostupnih za pronalaženje informacija, te se razmatraju kriteriji za odabir najbolje metode za određenu studiju. U odeljku 2, zatim se razmatraju dve metode izabrane sa upravo izloženim kriterijumima; od njih će jedan biti izabran i usvojen sa razlozima navedenim u odjeljku 3 gdje su također navedeni razlozi za isključenje drugog kriterija. Poglavlje 4 predstavlja dizajn istraživanja, a dio 5 zaključke.

3.1 Istraživanje informacionih sistema

Istraživanje informacionih sistema nije ograničeno samo na tehnološko polje, već se mora proširiti i na bihevioralne i organizacione svrhe.
To dugujemo tezama različitih disciplina, od društvenih do prirodnih nauka; ovo dovodi do potrebe da se za informacione sisteme koristi određeni spektar istraživačkih metoda koje uključuju kvantitativne i kvalitativne metode.
Važne su sve dostupne istraživačke metode, zapravo nekoliko istraživača kao što su Jenkins (1985), Nunamaker et al. (1991) i Galliers (1992) tvrde da ne postoji specifična univerzalna metoda za sprovođenje istraživanja u različitim oblastima informacionih sistema; u stvari, metoda može biti prikladna za određeno istraživanje, ali ne i za druga. To nam dovodi do potrebe da odaberemo metodu koja je prikladna za naš konkretni istraživački projekat: za ovaj izbor Benbasat et al. (1987) navode da se priroda i svrha istraživanja moraju uzeti u obzir.

3.1.1 Priroda istraživanja

Različite metode zasnovane na prirodi istraživanja mogu se klasifikovati u tri tradicije široko poznate u informatičkoj nauci: pozitivističko, interpretativno i kritičko istraživanje.

3.1.1.1 Pozitivističko istraživanje

Pozitivističko istraživanje poznato je i kao naučna ili empirijska studija. Nastoji da: „objasni i predvidi šta će se dogoditi u društvenom svijetu gledajući pravilnosti i uzročno-posljedične veze između elemenata koji ga čine” (Shanks et al 1993).

Pozitivistička istraživanja karakteriziraju i ponovljivost, pojednostavljenja i opovrgavanja. Nadalje, pozitivistička istraživanja priznaju postojanje apriornih odnosa između proučavanih fenomena.
Prema Galliersu (1992.) taksonomija je istraživačka metoda uključena u pozitivističku paradigmu, koja međutim nije ograničena na ovo, u stvari postoje laboratorijski eksperimenti, terenski eksperimenti, studije slučaja, demonstracije teorema, predviđanja i simulacije. Koristeći ove metode, istraživači priznaju da se proučavani fenomeni mogu posmatrati objektivno i rigorozno.

3.1.1.2 Interpretativno istraživanje

Interpretativno istraživanje, koje se često naziva fenomenologijom ili antipozitivizmom, Neuman (1994) opisuje kao „sistematsku analizu društvenog značenja akcije kroz direktno i detaljno posmatranje ljudi u prirodnim situacijama, kako bi se došlo do razumijevanja i na interpretaciju kako ljudi stvaraju i održavaju svoj društveni svijet.” Interpretativne studije odbacuju pretpostavku da se posmatrani fenomeni mogu posmatrati objektivno. Oni su zapravo zasnovani na subjektivnim tumačenjima. Nadalje, interpretativni istraživači ne nameću a priori značenja fenomenima koje proučavaju.

Ova metoda uključuje subjektivne/argumentativne studije, akciono istraživanje, deskriptivne/interpretativne studije, buduća istraživanja i igranje uloga. Pored ovih anketa i studija slučaja mogu se uključiti u ovaj pristup jer se tiču ​​studija pojedinaca ili organizacija u složenim situacijama u stvarnom svijetu.

3.1.1.3 Kritičko istraživanje

Kritičko ispitivanje je najmanje poznat pristup u društvenim naukama, ali je nedavno dobio pažnju istraživača informacionih sistema. Filozofska pretpostavka da društvenu stvarnost historijski proizvode i reprodukuju ljudi, kao i društveni sistemi svojim djelovanjem i interakcijama. Njihova sposobnost je, međutim, posredovana brojnim društvenim, kulturnim i političkim razmatranjima.

Kao i interpretativno istraživanje, kritičko istraživanje tvrdi da pozitivističko istraživanje nema nikakve veze s društvenim kontekstom i zanemaruje njegov utjecaj na ljudske postupke.
Kritičko istraživanje, s druge strane, kritizira interpretativno istraživanje da je previše subjektivno i da nema za cilj pomoći ljudima da poboljšaju svoje živote. Najveća razlika između kritičkog istraživanja i druga dva pristupa je njegova evaluativna dimenzija. Dok je objektivnost pozitivističke i interpretativne tradicije predviđanje ili objašnjenje statusa quo ili društvene stvarnosti, kritičko istraživanje ima za cilj kritičku evaluaciju i transformaciju društvene stvarnosti koja se proučava.

Kritički se istraživači obično suprotstavljaju statusu quo kako bi uklonili društvene razlike i poboljšali društvene uslove. Kritičko istraživanje je posvećeno procesnom pogledu na fenomene od interesa i stoga je obično longitudinalno. Primjeri istraživačkih metoda su dugoročne historijske studije i etnografske studije. Kritičko istraživanje, međutim, nije bilo široko korišteno u istraživanju informacionih sistema

3.1.2 Svrha istraživanja

Uz prirodu istraživanja, njegova svrha može poslužiti kao usmjeravanje istraživača u odabiru određene istraživačke metode. Svrha istraživačkog projekta usko je povezana sa pozicijom istraživanja u odnosu na istraživački ciklus koji se sastoji od tri faze: izgradnja teorije, testiranje teorije i usavršavanje teorije. Dakle, na osnovu vremena istraživačkog ciklusa, istraživački projekat može imati eksplanatornu, deskriptivnu, istraživačku ili prediktivnu svrhu.

3.1.2.1 Eksploratorno istraživanje

Istraživačko istraživanje ima za cilj da istraži potpuno novu temu i formuliše pitanja i hipoteze za buduća istraživanja. Ova vrsta istraživanja se koristi u izgradnji teorije kako bi se dobile inicijalne reference u novoj oblasti. Obično se koriste kvalitativne metode istraživanja, kao što su studije slučaja ili fenomenološke studije.

Međutim, moguće je koristiti i kvantitativne tehnike kao što su istraživačke ankete ili eksperimenti.

3.1.3.3 Deskriptivno istraživanje

Deskriptivno istraživanje ima za cilj da analizira i detaljno opiše određenu organizacionu situaciju ili praksu. Ovo je prikladno za izgradnju teorija i također se može koristiti za potvrđivanje ili osporavanje hipoteza. Deskriptivno istraživanje obično uključuje korištenje mjera i uzoraka. Najprikladnije metode istraživanja uključuju ankete i analizu prethodnika.

3.1.2.3 Eksplanatorno istraživanje

Eksplanatorno istraživanje pokušava objasniti zašto se stvari dešavaju. Izgrađen je na činjenicama koje su već proučene i pokušava pronaći razloge za te činjenice.
Stoga se eksplanatorno istraživanje obično gradi na istraživačkom ili deskriptivnom istraživanju i pomoćno je testiranju i rafiniranju teorija. Eksplanatorno istraživanje obično koristi studije slučaja ili istraživačke metode zasnovane na anketama.

3.1.2.4 Preventivno istraživanje

Preventivno istraživanje ima za cilj da predvidi događaje i ponašanja koja se posmatraju i koja se proučavaju (Marshall i Rossman 1995). Predviđanje je standardni naučni test istine. Ova vrsta istraživanja uglavnom koristi ankete ili analizu dati istoričari. (Yin 1989.)

Gornja rasprava pokazuje da postoji niz mogućih istraživačkih metoda koje se mogu koristiti u određenoj studiji. Međutim, mora postojati jedna specifična metoda koja je prikladnija od ostalih za određenu vrstu istraživačkog projekta. (Galliers 1987, Yin 1989, De Vaus 1991). Stoga svaki istraživač treba pažljivo procijeniti prednosti i nedostatke različitih metoda, kako bi usvojio najprikladniji i najkompatibilniji istraživački metod sa istraživačkim projektom. (Jenkins 1985, Pervan i Klass 1992, Bonomia 1985, Yin 1989, Himilton i Ives 1992).

3.2. Moguće metode istraživanja

Cilj ovog projekta bio je proučavanje iskustva u australskim organizacijama sa i dati pohranjene sa razvojem od skladište podataka. datum da trenutno nedostaje istraživanja u oblasti skladištenja podataka u Australiji, ovaj istraživački projekat je još uvijek u teorijskoj fazi istraživačkog ciklusa i ima istraživačku svrhu. Istraživanje iskustva australijskih organizacija koje usvajaju skladištenje podataka zahtijeva tumačenje stvarnog društva. Shodno tome, filozofska pretpostavka na kojoj se temelji istraživački projekat slijedi tradicionalno tumačenje.

Nakon rigoroznog ispitivanja dostupnih metoda, identificirane su dvije moguće istraživačke metode: ankete i studije slučaja, koje se mogu koristiti za istraživačko istraživanje (Shanks et al. 1993). Galliers (1992) argumentira prikladnost ove dvije metode za ovu konkretnu studiju u svojoj revidiranoj taksonomiji govoreći da su pogodne za izgradnju teorije. Sljedeća dva pododjeljka detaljno razmatraju svaku metodu.

3.2.1 Metoda istraživanja ankete

Metoda anketnog istraživanja potiče od drevne metode popisa stanovništva. Popis se sastoji od prikupljanja informacija od cjelokupne populacije. Ova metoda je skupa i nepraktična, posebno ako je populacija velika. Dakle, u poređenju sa popisom, istraživanje se obično fokusira na prikupljanje informacija za mali broj, ili uzorak, predstavnika stanovništva (Fowler 1988, Neuman 1994). Uzorak odražava populaciju iz koje je izvučen, sa različitim nivoima tačnosti, u zavisnosti od strukture uzorka, veličine i metode selekcije koja se koristi (Fowler 1988, Babbie 1982, Neuman 1994).

Metoda ankete je definirana kao „snimci praksi, situacija ili pogleda u određenom trenutku, napravljeni korištenjem upitnika ili intervjua, iz kojih se mogu zaključiti
napravljeno” (Galliers 1992:153) [snimak praksi, situacija ili pogleda u određenom trenutku, napravljen korištenjem upitnika ili intervjua, iz kojih se mogu izvesti zaključci]. Ankete se bave prikupljanjem informacija o nekom aspektu studije, od određenog broja učesnika, postavljanjem pitanja (Fowler 1988). Ovi upitnici i intervjui, koji uključuju telefonske intervjue licem u lice i strukturirane, također su tehnike prikupljanja dati koji se najčešće koriste u istraživanjima (Blalock 1970, Nachmias and Nachmias 1976, Fowler 1988), mogu se koristiti zapažanja i analize (Gable 1994). Od svih ovih metoda prikupljanja dati, korištenje upitnika je najpopularnija tehnika, jer osigurava da i dati

prikupljeni su strukturirani i formatirani, te stoga olakšavaju klasifikaciju informacija (Hwang 1987, de Vaus 1991).

Prilikom analize i dati, strategija istraživanja često koristi kvantitativne tehnike, kao što je statistička analiza, ali se mogu koristiti i kvalitativne tehnike (Galliers 1992, Pervan

i Klass 1992, Gable 1994). Normalno, i dati prikupljeni se koriste za analizu distribucija i obrazaca asocijacija (Fowler 1988).

Dok su ankete općenito prikladne za upite koji se odnose ili proizlaze iz pitanja 'šta?', kao što su 'koliko' i 'koliko', mogu se postaviti putem pitanja 'zašto' (Sonquist i Dunkelberg 1977, Yin 1989) . Prema Sonquistu i Dunkelbergu (1977), istraživanje istraživanja ima za cilj osporavanje hipoteza, evaluaciju programa, opisivanje populacije i razvoj modela ljudskog ponašanja. Nadalje, ankete se mogu koristiti za proučavanje mišljenja određene populacije, stanja, mišljenja, karakteristika, očekivanja, pa čak i prošlih ili sadašnjih ponašanja (Neuman 1994).

Ankete omogućavaju istraživaču da otkrije odnose među populacijom i rezultati su obično opštiji od drugih metoda (Sonquist i Dunkelberg 1977, Gable 1994). Istraživanja omogućavaju istraživačima da pokriju veće geografsko područje i dosegnu mnoge ispitanike (Blalock 1970, Sonquist i Dunkelberg 1977, Hwang i Lin 1987, Gable 1994, Neuman 1994). Konačno, ankete mogu pružiti informacije koje nisu dostupne drugdje ili u obliku potrebnom za analize (Fowler 1988).

Međutim, postoje neka ograničenja u sprovođenju ankete. Nedostatak je što istraživač ne može dobiti mnogo informacija o predmetu koji se proučava. To je zbog činjenice da se ankete provode samo u određeno vrijeme i stoga postoji ograničen broj varijabli i ljudi koje istraživač može

studija (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Još jedan nedostatak je to što sprovođenje ankete može biti veoma skupo u smislu vremena i resursa, posebno ako uključuje intervjue licem u lice (Fowler 1988).

3.2.2. Metoda istraživanja istraživanja

Metoda istraživanja istraživanja uključuje dubinsko proučavanje određene situacije unutar njenog stvarnog konteksta tokom određenog vremenskog perioda, bez ikakve intervencije od strane istraživača (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Ova metoda se uglavnom koristi za opisivanje odnosa između varijabli koje se proučavaju u određenoj situaciji (Galliers 1992). Istrage mogu uključivati ​​jedan ili više slučajeva, u zavisnosti od analiziranog fenomena (Franz i Robey 1987, Eisenhardt 1989, Yin 1989).

Metoda istraživanja istraživanja je definirana kao „empirijsko istraživanje koje proučava savremeni fenomen unutar njegovog stvarnog konteksta, koristeći više izvora prikupljenih od jednog ili više entiteta kao što su ljudi, grupe ili organizacije” (Yin 1989). Ne postoji jasno razdvajanje između fenomena i njegovog konteksta i ne postoji eksperimentalna kontrola ili manipulacija varijablama (Yin 1989, Benbasat et al. 1987).

Postoji niz tehnika za prikupljanje bogova dati koji se mogu koristiti u metodi istraživanja, što uključuje direktna zapažanja, preglede arhivskih zapisa, upitnike, pregled dokumentacije i strukturirane intervjue. Posjedovanje raznolikog spektra tehnika berbe dati, istraživanja omogućavaju istraživačima da se bave i jednim i drugim dati kvalitativno i kvantitativno u isto vrijeme (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Kao što je slučaj sa metodom istraživanja, istraživač-istraživač služi kao posmatrač ili istraživač, a ne kao aktivni učesnik u organizaciji koja se proučava.

Benbasat i saradnici (1987) tvrde da je metoda istraživanja posebno pogodna za izgradnju teorije istraživanja, koja počinje istraživačkim pitanjem i nastavlja se obrazovanjem.

teorije tokom procesa prikupljanja dati. Pogodan i za scenu

izgradnje teorije, Franz i Robey (1987) sugeriraju da se metoda istraživanja može koristiti i za fazu složene teorije. U ovom slučaju, na osnovu prikupljenih dokaza, data teorija ili hipoteza se provjerava ili opovrgava. Osim toga, anketa je također pogodna za istraživanje koje se bavi pitanjima „kako“ ili „zašto“ (Yin 1989).

U poređenju sa drugim metodama, ankete omogućavaju istraživaču da sakupi bitne informacije detaljnije (Galliers 1992, Shanks et al. 1993). Nadalje, ankete omogućavaju istraživaču da razumije prirodu i složenost proučavanih procesa (Benbasat et al. 1987).

Postoje četiri glavna nedostatka povezana sa metodom anketiranja. Prvi je nedostatak kontrolisanih odbitaka. Subjektivnost istraživača može promijeniti rezultate i zaključke studije (Yin 1989). Drugi nedostatak je nedostatak kontrolisanog posmatranja. Za razliku od eksperimentalnih metoda, istraživač istraživanja ne može kontrolisati proučavane fenomene jer se oni ispituju u njihovom prirodnom kontekstu (Gable 1994). Treći nedostatak je nedostatak replikacije. To je zato što je malo vjerovatno da će istraživač promatrati iste događaje i ne može provjeriti rezultate određene studije (Lee 1989). Konačno, kao posljedica neponovljivosti, teško je generalizirati rezultate dobijene iz jednog ili više istraživanja (Galliers 1992, Shanks et al. 1993). Svi ovi problemi, međutim, nisu nepremostivi i istraživač ih, zapravo, može minimizirati primjenom odgovarajućih radnji (Lee 1989).

3.3. Obrazložite metodologiju istraživanja usvojeno

Od dvije moguće metode istraživanja za ovu studiju, anketna metoda se smatra najpogodnijom. Istraga je odbačena nakon pažljivog razmatranja relevantnih

zaslugama i slabostima. O prikladnosti ili neprikladnosti svake metode za ovu studiju raspravlja se u nastavku.

3.3.1. Neprikladnost metode istraživanja istrage

Metoda istraživanja zahtijeva dubinsko proučavanje određene situacije unutar jedne ili više organizacija tokom određenog vremenskog perioda (Eisenhardt 1989). U tom slučaju, period može premašiti vremenski okvir koji je dat za ovu studiju. Drugi razlog za neprihvaćanje metode anketiranja je taj što rezultati mogu patiti zbog nedostatka strogosti (Yin 1989). Subjektivnost istraživača može uticati na rezultate i zaključke. Drugi razlog je taj što je ova metoda pogodnija za istraživanje pitanja tipa 'kako' ili 'zašto' (Yin 1989), dok je istraživačko pitanje za ovu studiju tipa 'šta'. Na kraju, ali ne i najmanje važno, teško je generalizirati nalaze iz samo jednog ili nekoliko istraživanja (Galliers 1992, Shanks et al. 1993). Na osnovu ovog obrazloženja, metod anketnog istraživanja nije odabran jer nije bio pogodan za ovu studiju.

3.3.2. Pogodnost metode pretraživanja istraga

Kada je ovo istraživanje sprovedeno, praksa skladištenja podataka nije bila široko prihvaćena od strane australijskih organizacija. Dakle, nije bilo mnogo informacija o njihovoj implementaciji unutar australijskih organizacija. Dostupne informacije dolaze od organizacija koje su implementirale ili koristile a skladište podataka. U ovom slučaju, metod anketnog istraživanja je najpogodniji jer omogućava dobijanje informacija koje nisu dostupne drugde ili u formi potrebnoj za analizu (Fowler 1988). Osim toga, metod istraživanja ankete omogućava istraživaču da stekne dobar uvid u praksu, situacije ili poglede u određenom trenutku (Galliers 1992, Denscombe 1998). Potreban je pregled kako bi se povećalo znanje o australskom iskustvu skladištenja podataka.

Nadalje, Sonquist i Dunkelberg (1977) navode da su rezultati anketnog istraživanja opštiji od drugih metoda.

3.4. Dizajn istraživanja istraživanja

Istraživanje o praksama skladištenja podataka sprovedeno je 1999. godine. Ciljnu populaciju činile su australske organizacije zainteresovane za studije skladištenja podataka, jer su verovatno već bile obaveštene o dati koje pohranjuju i stoga mogu pružiti korisne informacije za ovu studiju. Ciljna populacija je identificirana inicijalnim istraživanjem svih australijskih članova The Data Warehousing Institute (Tdwi-aap). Ovaj odjeljak govori o dizajnu faze empirijskog istraživanja ove studije.

3.4.1. Tehnika berbe dati

Od tri tehnike koje se obično koriste u istraživanju anketa (tj. upitnik putem pošte, telefonski intervju i lični intervju) (Nachmias 1976, Fowler 1988, de Vaus 1991), upitnik putem pošte je usvojen za ovu studiju. Prvi razlog za usvajanje potonjeg je taj što može doseći geografski raspršenu populaciju (Blalock 1970, Nachmias i Nachmias 1976, Hwang i Lin 1987, de Vaus 1991, Gable 1994). Drugo, upitnik poštom je pogodan za visokoobrazovane učesnike (Fowler 1988). Upitnik poštom za ovu studiju bio je upućen sponzorima projekta skladištenja podataka, direktorima i/ili projekt menadžerima. Treće, upitnici za slanje putem pošte su prikladni kada je dostupna bezbedna mejling lista (Salant i Dilman 1994). TDWI, u ovom slučaju, pouzdano udruženje za skladištenje podataka dalo je mailing listu svojih australijskih članova. Još jedna prednost upitnika putem pošte u odnosu na telefonski upitnik ili lične intervjue je ta što omogućava ispitanicima da tačnije odgovore, posebno kada ispitanici moraju konsultovati bilješke ili razgovarati o pitanjima s drugim ljudima (Fowler 1988).

Potencijalni nedostatak može biti vrijeme potrebno za provođenje upitnika poštom. Obično se anketa putem pošte provodi ovim redoslijedom: šalju pisma, čekaju odgovore i šalju potvrdu (Fowler 1988, Bainbridge 1989). Dakle, ukupno vrijeme može biti duže od vremena potrebnog za lične ili telefonske intervjue. Međutim, ukupno vrijeme može biti poznato unaprijed (Fowler 1988, Denscombe 1998). Vrijeme provedeno u vođenju ličnih intervjua ne može se znati unaprijed jer varira od intervjua do intervjua (Fowler 1988). Telefonski intervjui mogu biti brži od upitnika putem pošte i ličnih intervjua, ali mogu imati visoku stopu neodgovora zbog nedostupnosti nekih ljudi (Fowler 1988). Uz to, telefonski intervjui su općenito ograničeni na relativno kratke liste pitanja (Bainbridge 1989).

Još jedna slabost upitnika putem pošte je visoka stopa neodgovora (Fowler 1988, Bainbridge 1989, Neuman 1994). Međutim, poduzete su protumjere povezivanjem ove studije sa pouzdanom institucijom za skladištenje podataka (tj. TDWI) (Bainbridge 1989, Neuman 1994), koja šalje dva pisma podsjetnika onima koji nisu odgovorili (Fowler 1988, Neuman 1994) i također uključuje dodatno pismo objašnjavajući svrhu studije (Neuman 1994).

3.4.2. Jedinica analize

Svrha ove studije je da dobije informacije o implementaciji skladištenja podataka i njegovoj upotrebi u australskim organizacijama. Ciljnu populaciju čine sve australijske organizacije koje su implementirale, ili provode, tj skladište podataka. Pojedinačne organizacije se tada registruju na ime. Upitnik je poslat poštom organizacijama zainteresovanim za usvajanje skladište podataka. Ova metoda osigurava da prikupljene informacije dolaze iz najprikladnijih resursa svake organizacije koja učestvuje.

3.4.3. Uzorak ankete

„Mejling lista“ učesnika ankete dobijena je od TDWI. Sa ove liste, 3000 australijskih organizacija odabrano je kao osnova za uzorkovanje. Uzorku je poslano dodatno pismo u kojem se objašnjava projekat i svrha ankete, zajedno sa listom za odgovore i unaprijed plaćenom kovertom za vraćanje popunjenog upitnika. Od 3000 organizacija, 198 se složilo da učestvuje u studiji. Očekivao se tako mali broj odgovora dato veliki broj australskih organizacija koje su tada prihvatile ili su prihvatile strategiju skladištenja podataka u okviru svojih organizacija. Dakle, ciljnu populaciju za ovu studiju čini samo 198 organizacija.

3.4.4. Sadržaj upitnika

Struktura upitnika zasnovana je na Monash modelu skladištenja podataka (o kome je već bilo riječi u dijelu 2.3). Sadržaj upitnika zasnovan je na analizi literature koja je predstavljena u poglavlju 2. Kopija upitnika poslanog učesnicima istraživanja nalazi se u Dodatku B. Upitnik se sastoji od šest dijelova, koji prate faze obuhvaćenog modela. Sljedećih šest pasusa ukratko sumira sadržaj svakog odjeljka.

Odjeljak A: Osnovne informacije o organizaciji
Ovaj odjeljak sadrži pitanja koja se odnose na profil organizacija koje učestvuju. Dodatno, neka od pitanja se odnose na status učesnika u projektu skladištenja podataka. Povjerljive informacije kao što je naziv organizacije nisu otkrivene u analizi ankete.

Odjeljak B: Početak
Pitanja u ovom dijelu odnose se na aktivnost pokretanja skladišta podataka. Postavljena su pitanja u vezi sa inicijatorima projekta, garantima, potrebnim vještinama i znanjima, ciljevima razvoja skladišta podataka i očekivanjima krajnjih korisnika.

Odjeljak C: Dizajn
Ovaj odjeljak sadrži pitanja vezana za aktivnosti planiranja skladište podataka. Posebno su se postavljala pitanja o obimu izvršenja, trajanju projekta, troškovima projekta i analizi troškova i koristi.

Odjeljak D: Razvoj
U dijelu razvoja nalaze se pitanja koja se odnose na razvojne aktivnosti skladište podataka: zbirka zahtjeva krajnjih korisnika, izvori dati, logički model dati, prototipovi, planiranje kapaciteta, tehničke arhitekture i izbor alata za razvoj skladišta podataka.

Odjeljak E: Operacija
Operativna pitanja vezana za rad i proširivost skladište podataka, kako se razvija u sljedećoj fazi razvoja. Tamo kvaliteta podataka, strategije osvježavanja dati, granularnost dati, skalabilnost od skladište podataka i bezbednosna pitanja skladište podataka bili su među vrstama postavljenih pitanja.

Odjeljak F: Razvoj
Ovaj odjeljak sadrži pitanja u vezi s korištenjem skladište podataka od strane krajnjih korisnika. Istraživača je zanimala svrha i korisnost skladište podataka, usvojene strategije pregleda i obuke i strategija kontrole skladište podataka usvojeno.

3.4.5. Stopa odgovora

Iako se ankete putem pošte kritikuju zbog niske stope odgovora, poduzete su mjere za povećanje stope povrata (kao što je prethodno razmotreno u dijelu 3.4.1). Termin 'stopa odgovora' se odnosi na procenat ljudi u određenom uzorku istraživanja koji odgovaraju na upitnik (Denscombe 1998). Za izračunavanje stope odgovora za ovu studiju korištena je sljedeća formula:

Broj ljudi koji su odgovorili
Stopa odgovora = —————————————————————————— X 100 Ukupan broj poslanih upitnika

3.4.6. Pilot Test

Prije nego što je upitnik poslat uzorku, pitanja su ispitana izvođenjem pilot testova, kako su predložili Luck i Rubin (1987), Jackson (1988) i de Vaus (1991). Svrha pilot testova je da otkriju sve neugodne, dvosmislene izraze i pitanja koja je teško protumačiti, razjasniti sve korišćene definicije i termine i utvrditi približno vrijeme potrebno za popunjavanje upitnika (Warwick i Lininger 1975, Jackson 1988, Salant i Dilman 1994). Pilot testovi su provedeni odabirom subjekata sa karakteristikama sličnim onima završnih subjekata, kako je predložio Davis e. Cosenza (1993). U ovoj studiji, šest stručnjaka za skladištenje podataka odabrano je kao pilot subjekt. Nakon svakog pilot testiranja urađene su potrebne korekcije. Iz sprovedenih pilot testova, učesnici su doprineli preoblikovanju i resetovanju konačne verzije upitnika.

3.4.7. Metode analize By dati

I dati ankete prikupljene iz zatvorenih upitnika analizirane su pomoću statističkog programskog paketa pod nazivom SPSS. Mnogi odgovori su analizirani korištenjem deskriptivne statistike. Jedan broj upitnika vraćen je nepotpun. S njima se postupalo s većom pažnjom kako bi se osiguralo da i dati nedostaci nisu bili posljedica grešaka u unosu podataka, već zato što pitanja nisu bila prikladna za registranta ili je registrant odlučio da ne odgovori na jedno ili više konkretnih pitanja. Ovi nedostajući odgovori su zanemareni tokom analize dati i bili su kodirani kao '- 9' kako bi se osiguralo njihovo isključenje iz procesa analize.

Prilikom pripreme upitnika, zatvorena pitanja su unaprijed kodirana dodjeljivanjem broja svakoj opciji. Broj je zatim korišten za pripremu dati tokom analize (Denscombe 1998, Sapsford i Jupp 1996). Na primjer, bilo je šest opcija navedenih u pitanju 1 odjeljka B: odbor direktora, viši izvršni direktor, IT odjel, poslovna jedinica, konsultanti i ostalo. U fajlu dati SPSS-a, generirana je varijabla koja označava 'pokretača projekta', sa šest oznaka vrijednosti: '1' za 'bord direktora', '2' za 'viši izvršni direktor' i tako dalje. Upotreba Likertinove skale u nekim od zatvorenih pitanja također je omogućila identifikaciju bez napora s obzirom na korištenje odgovarajućih numeričkih vrijednosti unesenih u SPSS. Za pitanja sa neiscrpnim odgovorima, koji se međusobno ne isključuju, svaka opcija je tretirana kao jedna varijabla s dvije oznake vrijednosti: '1' za 'označeno' i '2' za 'neoznačeno'.

Otvorena pitanja tretirana su drugačije od zatvorenih pitanja. Odgovori na ova pitanja nisu uneti u SPSS. Umjesto toga, analizirani su ručno. Upotreba ove vrste pitanja nam omogućava da dobijemo informacije o slobodno izraženim idejama i ličnim iskustvima ispitanika (Bainbridge 1989, Denscombe 1998). Gdje je bilo moguće, izvršena je kategorizacija odgovora.

Za analizu dati, koriste se jednostavne metode statističke analize, kao što su frekvencija odgovora, srednja vrijednost, standardna devijacija i medijan (Argyrous 1996, Denscombe 1998).
Gama test je bio dobar za dobijanje kvantitativnih mera veza između dati redni brojevi (Norusis 1983, Argyrous 1996). Ovi testovi su bili prikladni jer korištene ordinalne skale nisu imale mnogo kategorija i mogle su se prikazati u tabeli (Norusis 1983).

3.5 Sažetak

U ovom poglavlju razmatrana je metodologija istraživanja i dizajn koji je usvojen za ovu studiju.

Odabir najprikladnije istraživačke metode za određenu studiju uzima u obzir
razmatranje niza pravila, uključujući prirodu i vrstu istraživanja, kao i prednosti i slabosti svake moguće metode (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, yin 1989, Hamilton i ives 1992, Galliers 1992, Neuman 1994). S obzirom na nedostatak postojećeg znanja i teorije u vezi sa usvajanjem skladišta podataka u Australiji, ova istraživačka studija zahtijeva interpretativnu istraživačku metodu sa istraživačkom sposobnošću da se istraže iskustva australskih organizacija. Odabrana metoda istraživanja odabrana je za prikupljanje informacija o usvajanju koncepta skladištenja podataka od strane australskih organizacija. Kao tehnika prikupljanja odabran je poštanski upitnik dati. Opravdanja metode istraživanja i tehnike prikupljanja dati odabrani će biti navedeni u ovom poglavlju. Nadalje, prezentovana je diskusija o jedinici analize, korištenom uzorku, procentima odgovora, sadržaju upitnika, prettestiranju upitnika i načinu analize rezultata. dati.

Projektovanje a Skladište podataka:

Kombinacija odnosa entiteta i dimenzionalnog modeliranja

ABSTRACT
Čuvanje i dati je glavno aktuelno pitanje za mnoge organizacije. Ključno pitanje u razvoju skladištenja hrane dati to je njegov dizajn.
Dizajn mora podržavati otkrivanje koncepata u skladište podataka na naslijeđeni sistem i druge izvore dati kao i lako razumevanje i efikasnost u implementaciji skladište podataka.
Velik dio literature o skladištenju dati preporučuje korištenje modeliranja odnosa entiteta ili dimenzionalnog modeliranja za predstavljanje dizajna skladište podataka.
U ovom radu pokazujemo kako se oba prikaza mogu kombinovati u jednom pristupu crtanju skladište podataka. Pristup koji se koristi je sistematičan

ispitan u studiji slučaja i identifikovan je u nizu važnih implikacija sa praktičarima.

DATA WAREHOUSING

Un skladište podataka obično se definiše kao „predmetno orijentisana, integrisana, vremenski varijantna i nepromenljiva zbirka podataka kao podrška odlukama menadžmenta“ (Inmon i Hackathorn, 1994). Predmetno orijentisana i integrisana ukazuje da je skladište podataka je dizajniran da pređe funkcionalne granice Legaci sistema kako bi ponudio integrisanu perspektivu dati.
Vremenska varijanta utiče na istorijsku prirodu ili prirodu vremenske serije dati in un skladište podataka, što omogućava analizu trendova. Neisparljiv označava da je skladište podataka ne ažurira se kontinuirano kao a baza podataka of OLTP. Umjesto toga, periodično se ažurira sa dati dolaze iz internih i eksternih izvora. The skladište podataka posebno je dizajniran za pretraživanje umjesto ažuriranja integriteta i performansi operacija.
Ideja pohranjivanja i dati nije novo, to je bila jedna od svrha upravljanja dati od šezdesetih (The Martin, 1982).
I skladište podataka nude infrastrukturu dati za sisteme podrške menadžmentu. Sistemi za podršku menadžmentu uključuju sisteme za podršku odlučivanju (DSS) i izvršne informacione sisteme (EIS). DSS je kompjuterski baziran informacioni sistem koji je dizajniran da poboljša ljudsko donošenje odluka. EIS je tipično sistem isporuke dati što omogućava poslovnim liderima da lako pristupe pogledu dati.
Opća arhitektura a skladište podataka ističe ulogu skladište podataka u podršci menadžmentu. Pored ponude infrastrukture dati za EIS i DSS, al skladište podataka može se pristupiti direktno putem upita. THE dati uključeno u a skladište podataka zasnivaju se na analizi zahtjeva za upravljačkim informacijama i dobijaju se iz tri izvora: internih naslijeđenih sistema, sistema za prikupljanje podataka posebne namjene i eksternih izvora podataka. THE dati u internim naslijeđenim sistemima oni su često suvišni, nedosljedni, niske kvalitete i pohranjeni u različitim formatima tako da se moraju uskladiti i očistiti prije nego što se mogu učitati u

skladište podataka (Inmon, 1992; McFadden, 1996). THE dati koji dolaze iz sistema za skladištenje dati ad hoc i iz izvora dati eksterni se često koriste za povećanje (ažuriranje, zamjena) i dati iz naslijeđenih sistema.

Postoji mnogo uvjerljivih razloga za razvoj a skladište podataka, koji uključuju poboljšano donošenje odluka kroz efektivnu upotrebu više informacija (Ives 1995), podršku za fokusiranje na čitave poslove (Graham 1996) i smanjenje dati za EIS i DSS (Graham 1996, McFadden 1996).

Nedavna empirijska studija je pokazala, u prosjeku, povrat ulaganja za skladište podataka za 401% nakon tri godine (Graham, 1996). Međutim, druge empirijske studije o skladište podataka utvrdili značajne probleme uključujući poteškoće u mjerenju i dodjeli beneficija, nedostatak jasne svrhe, potcjenjivanje svrhe i složenost procesa pohranjivanja beneficija dati, posebno u pogledu izvora i čistoće dati. Čuvanje i dati može se smatrati rješenjem problema upravljanja dati između organizacija. Manipulacija sa dati kao društveni resurs ostaje jedan od ključnih problema u upravljanju informacionim sistemima širom svijeta dugi niz godina (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Popularan pristup upravljanju dati osamdesetih je to bio razvoj modela dati društveni. Model dati Social je dizajniran da ponudi stabilnu osnovu za razvoj novih aplikativnih sistema i baza podataka i rekonstrukcija i integracija naslijeđenih sistema (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kim i Everest 1994). Međutim, postoje mnogi problemi s ovim pristupom, posebno složenost i cijena svakog zadatka, te dugo vrijeme potrebno za postizanje opipljivih rezultata (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il skladište podataka to je zasebna baza podataka koja koegzistira sa naslijeđenim bazama podataka umjesto da ih zamjenjuje. Stoga vam omogućava da usmjerite upravljanje dati i izbjeći skupu rekonstrukciju naslijeđenih sistema.

POSTOJEĆI PRISTUPI DIZAJNU PODATAKA

SKLADIŠTVO

Proces izgradnje i usavršavanja a skladište podataka treba ga shvatiti više kao evolucijski proces, a ne kao razvojni životni ciklus tradicionalnih sistema (Desire, 1995, Shanks, O'Donnell i Arnott 1997a). Mnogo je procesa uključenih u projekat skladište podataka kao što su inicijalizacija, planiranje; informacije dobijene iz zahtjeva koji se traže od menadžera kompanije; izvori, transformacije, čišćenje dati i sinhronizaciju sa naslijeđenih sistema i drugih izvora dati; sistemi isporuke u razvoju; praćenje skladište podataka; i besmislenost evolucionog procesa i konstrukcije a skladište podataka (Stinchi, O'Donnell i Arnott 1997b). U ovom časopisu fokusiramo se na to kako nacrtati dati pohranjene u kontekstu ovih drugih procesa. Postoji niz predloženih pristupa arhitekturi skladište podataka u književnosti (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Svaka od ovih metodologija ima kratak pregled sa analizom njihovih snaga i slabosti.

Inmonov (1994) pristup za Skladište podataka dizajn

Inmon (1994) je predložio četiri iterativna koraka za dizajn a skladište podataka (vidi sliku 2). Prvi korak je dizajn šablona dati društveni da razumem kako ja dati mogu se integrirati u funkcionalne oblasti unutar organizacije podjelom dati skladištiti u područjima. Model dati napravljen je za skladištenje dati koji se odnose na donošenje odluka, uključujući dati istoričari, uključujući dati oduzeti i agregirani. Drugi korak je identifikovanje predmetnih oblasti za implementaciju. One se zasnivaju na prioritetima koje odredi određena organizacija. Treći korak uključuje crtanje a baza podataka za predmetnu oblast, obratite posebnu pažnju na uključivanje odgovarajućih nivoa granularnosti. Inmon preporučuje korištenje modela entiteta i odnosa. Četvrti korak je identifikacija izvornih sistema dati potrebno i razviti procese transformacije za snimanje, čišćenje i formatiranje i dati.

Snage Inmonovog pristupa su taj model dati društveno nudi osnovu za integraciju dati u okviru organizacije i planiranja podrške za iterativni razvoj skladište podataka. Njegove mane su poteškoće i cijena u dizajniranju modela dati društveni, teškoća u razumijevanju modela entiteta i odnosa koji se koriste u oba modela, to dati društveni i onaj od dati pohranjene po predmetnoj oblasti i prikladnost dati crteža skladište podataka za realizaciju baza podataka relacijski, ali ne i za baza podataka višedimenzionalni.

Ivesov (1995) pristup Skladište podataka dizajn

Ives (1995) predlaže pristup u četiri koraka dizajniranju informacionog sistema za koji vjeruje da je primjenjiv na dizajn skladište podataka (vidi sliku 3). Pristup je u velikoj mjeri zasnovan na informacionom inženjeringu za razvoj informacionih sistema (Martin 1990). Prvi korak je određivanje ciljeva, kritičnih faktora i faktora uspjeha i ključnih indikatora učinka. Ključni poslovni procesi i potrebne informacije su modelirane da nas dovedu do modela dati društveni. Drugi korak uključuje razvoj definirajuće arhitekture dati pohranjeno po oblastima, baza podataka di skladište podataka, tehnološke komponente koje su potrebne, skup organizacijske podrške potrebne za implementaciju i rad skladište podataka. Treći korak uključuje odabir potrebnih softverskih paketa i alata. Četvrti korak je detaljno projektovanje i izgradnja objekta skladište podataka. Ives napominje da se čuva dati to je ograničen iterativni proces.

Snaga Ives pristupa je upotreba specifičnih tehnika za određivanje zahtjeva za informacijama, korištenje strukturiranog procesa koji podržava integraciju skladište podataka, odabir odgovarajućeg hardvera i softvera, te korištenje višestrukih tehnika predstavljanja za skladište podataka. Njegove mane su inherentne složenosti. Drugi uključuju poteškoće u razvoju mnogih nivoa baza podataka all'interno del skladište podataka u razumnim rokovima i troškovima.

Kimballov (1994) pristup Skladište podataka dizajn

Kimball (1994) je predložio pet iterativnih koraka za dizajn a skladište podataka (vidi slike 4). Njegov pristup posebno je posvećen dizajnu solo skladište podataka i o upotrebi dimenzionalnih modela u odnosu na modele entiteta i odnosa. Kimball analizira te dimenzionalne modele jer je poslovnim liderima lakše razumjeti poslovanje, efikasnije je kada se bave složenim konsultacijama i dizajnom baza podataka fizički je efikasniji (Kimball 1994). Kimball prepoznaje da je razvoj a skladište podataka to je iterativno, i to skladište podataka odvojene tabele se mogu integrisati podelom na tabele zajedničkih dimenzija.

Prvi korak je identifikovanje određene predmetne oblasti koju treba usavršiti. Drugi i treći korak tiču ​​se dimenzionalnog modeliranja. U drugom koraku mjerenja identifikuju stvari od interesa u predmetnoj oblasti i grupišu ih u tabelu činjenica. Na primjer, u prodajnom predmetu mjere interesa mogu uključivati ​​količinu prodatih artikala i dolar kao prodajnu valutu. Treći korak uključuje identifikaciju dimenzija koje su načini na koje se činjenice mogu grupirati. U prodajnom predmetu, relevantne dimenzije mogu uključivati ​​stavku, lokaciju i vremenski period. Tabela činjenica ima višedijelni ključ za povezivanje sa svakom od tablica dimenzija i obično sadrži vrlo veliki broj činjenica. Nasuprot tome, tabele dimenzija sadrže deskriptivne informacije o dimenzijama i drugim atributima koji se mogu koristiti za grupisanje činjenica. Povezana predložena tabela činjenica i dimenzija formira ono što se zbog svog oblika naziva šema zvijezda. Četvrti korak uključuje izgradnju a baza podataka višedimenzionalni da biste usavršili uzorak zvijezde. Poslednji korak je identifikacija izvornih sistema dati potrebno i razviti procese transformacije za snimanje, čišćenje i formatiranje i dati.

Jake strane Kimballovog pristupa uključuju upotrebu dimenzionalnih modela za predstavljanje dati pohranjeni što ga čini lakim za razumijevanje i dovodi do efikasnog fizičkog dizajna. Dimenzionalni model koji također lako koristi oba sistema baza podataka relacijski mogu biti usavršeni ili sistemi baza podataka multidimenzionalni. Njegove mane uključuju nedostatak nekih tehnika koje bi olakšale planiranje ili integraciju mnogih zvjezdanih obrazaca unutar a skladište podataka i poteškoće projektovanja od ekstremno denormalizovane strukture u dimenzionalni model dati u naslijeđenom sistemu.

McFadden-ov (1996) pristup podacima Dizajn skladišta

McFadden (1996) predlaže pristup u pet koraka dizajniranju a skladište podataka (vidi sliku 5).
Njegov pristup zasniva se na sintezi ideja iz literature i fokusiran je na dizajn singla skladište podataka. Prvi korak uključuje analizu zahtjeva. Iako tehničke specifikacije nisu propisane, McFaddenove napomene identifikuju entitete dati specifikacije i njihove atribute, a odnosi se na Watson i Frolick (1993) čitaoce za hvatanje zahtjeva.
U drugom koraku dizajniran je model odnosa entiteta skladište podataka a zatim potvrđen od strane rukovodilaca kompanije. Treći korak uključuje određivanje mapiranja iz naslijeđenih sistema i eksternih izvora skladište podataka. Četvrti korak uključuje procese u razvoju, implementaciji i sinhronizaciji dati Nel skladište podataka. U završnom koraku razvija se isporuka sistema sa posebnim naglaskom na korisničkom interfejsu. McFadden napominje da je proces crtanja generalno iterativan.

Jake strane McFaddenovog pristupa ukazuju na učešće poslovnih lidera u određivanju zahteva, ali i na važnost resursa dati, njihovo čišćenje i sakupljanje. Njegove mane uključuju nedostatak procesa za razbijanje velikog projekta skladište podataka u mnogim integrisanim fazama, i

poteškoće u razumijevanju modela entiteta i odnosa koji se koriste u dizajnu skladište podataka.

Ne biraju nas samo oni koji su nam bliski.

    0/5 (0 recenzija)
    0/5 (0 recenzija)
    0/5 (0 recenzija)

    Saznajte više od Online Web Agencije

    Pretplatite se da primate najnovije članke putem e-pošte.

    avatar autora
    admin CEO
    👍Online web agencija | Stručnjak za web agencije za digitalni marketing i SEO. Web Agency Online je web agencija. Za Agenzia Web Online uspjeh u digitalnoj transformaciji zasniva se na osnovama Iron SEO verzije 3. Specijalnosti: sistemska integracija, integracija poslovnih aplikacija, servisno orijentirana arhitektura, računalstvo u oblaku, skladište podataka, poslovna inteligencija, veliki podaci, portali, intraneti, web aplikacije Dizajn i upravljanje relacionim i višedimenzionalnim bazama podataka Dizajniranje interfejsa za digitalne medije: upotrebljivost i grafika. Online web agencija nudi kompanijama sljedeće usluge: -SEO na Google, Amazon, Bing, Yandex; -Web analitika: Google Analytics, Google Tag Manager, Yandex Metrica; -Konverzije korisnika: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM na Google, Bing, Amazon Ads; - Marketing na društvenim mrežama (Facebook, Linkedin, Youtube, Instagram).
    Moja agilna privatnost
    Ova stranica koristi tehničke kolačiće i kolačiće za profiliranje. Klikom na prihvatiti odobravate sve kolačiće za profilisanje. Klikom na odbij ili X, svi kolačići za profilisanje se odbijaju. Klikom na prilagodite moguće je odabrati koje kolačiće za profiliranje želite aktivirati.
    Ova stranica je u skladu sa Zakonom o zaštiti podataka (LPD), švicarskim saveznim zakonom od 25. septembra 2020. i GDPR, Uredbom EU 2016/679, koja se odnosi na zaštitu ličnih podataka kao i slobodno kretanje takvih podataka.