https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

Skladištenje podataka i planiranje resursa poduzeća | DWH i ERP

ARHIV PODACI SREDIŠNJE: IZD. POVIJEST EVOLUCIJE

Dvije dominantne teme korporativne tehnologije 90-ih bile su i skladište podataka i ERP. Dugo su vremena ove dvije moćne struje bile dijelovi korporativnog IT-a bez ikakvih križanja. Bilo je gotovo kao da su materija i antimaterija. No rast obaju fenomena neizbježno je doveo do njihova križanja. Danas se tvrtke suočavaju s problemom što učiniti s ERP-om i skladište podataka. Ovaj članak će opisati koji su problemi i kako ih tvrtke rješavaju.

NA POČETKU…

U početku je bilo skladište podataka. Skladište podataka je stvoren kako bi se suprotstavio aplikacijskom sustavu za obradu transakcija. U ranim danima pamćenje od podaci trebao je biti samo kontrapunkt aplikacijama za obradu transakcija. Ali danas postoje mnogo sofisticiranije vizije o tome što a skladište podataka. U današnjem svijetu skladište podataka umetnut je unutar strukture koja se može nazvati Tvornica korporativnih informacija.

TVORNICA KORPORATIVNIH INFORMACIJA (CIF)

Tvornica korporativnih informacija ima standardne arhitektonske komponente: razinu transformacije i integracije koda koja integrira podaci dok ja podaci kreću se od okoline aplikacije prema okolini skladište podataka tvrtke; a skladište podataka tvrtke u kojoj je podaci detaljne i integrirane povijesti. The skladište podataka poduzeća služi kao temelj na kojem se mogu graditi svi ostali dijelovi okruženja poduzeća skladište podataka; skladište operativnih podataka (ODS). ODS je hibridna struktura koja sadrži neke aspekte skladište podataka i drugi aspekti OLTP okruženja; data marts, gdje različiti odjeli mogu imati vlastitu verziju skladište podataka; a skladište podataka istraživanja u kojem tvrtkini "filozofi" mogu podnijeti svoje 72-satne upite bez štetnog utjecaja na skladište podataka; i memorija blizu linije, u kojoj podaci stari i podaci skupni detalji mogu se jeftino pohraniti.

GDJE SE ERP SPAJA S LA TVORNICA KORPORATIVNIH INFORMACIJA

ERP se spaja s Corporate Information Factory na dva mjesta. Prvo kao osnovna aplikacija (osnovna linija) koja pruža i podaci prijave za skladište podataka. U ovom slučaju i podaci, generirani kao nusprodukt transakcijskog procesa, integrirani su i učitani u skladište podataka tvrtke. Druga točka spoja između ERP-a i CIF-a i ODS-a. Zapravo, u mnogim okruženjima ERP se koristi kao klasični ODS.

U slučaju da se kao osnovna aplikacija koristi ERP, isti se ERP može koristiti i u CIF-u kao ODS. U svakom slučaju, ako se ERP koristi u obje uloge, mora postojati jasna razlika između ta dva entiteta. Drugim riječima, kada ERP igra ulogu osnovne aplikacije i ODS-a, moraju se razlikovati dva arhitektonska entiteta. Ako jedna implementacija ERP-a pokuša obavljati obje uloge istovremeno, neizbježno će doći do problema u dizajnu i implementaciji te strukture.

ODVOJENI ODS I OSNOVNE PRIMJENE

Mnogo je razloga koji dovode do podjele arhitektonskih sastavnica. Možda je ono što najviše govori za odvajanje različitih komponenti arhitekture to što svaka komponenta arhitekture ima svoj vlastiti pogled. Osnovna aplikacija ima drugu svrhu od ODS-a. Pokušajte se preklapati

pogled osnovne aplikacije na svijet ODS-a ili obrnuto nije pravi način rada.

Posljedično, prvi problem ERP-a u CIF-u je provjeriti postoji li razlika između osnovnih aplikacija i ODS-a.

PODATKOVNI MODELI U KORPORACIJI TVORNICA INFORMACIJA

Kako bi se postigla kohezija između različitih komponenti CIF arhitekture, mora postojati model podaci. Modeli od podaci oni služe kao veza između različitih komponenti arhitekture kao što su osnovne aplikacije i ODS. Modeli od podaci oni postaju "intelektualni putokaz" za dobivanje pravog značenja iz različitih arhitektonskih komponenti CIF-a.

Idući ruku pod ruku s ovim pojmom, ideja je da treba postojati jedan veliki i jedinstveni model podaci. Očito mora postojati model podaci za svaku komponentu, a mora postojati i razuman put koji povezuje različite modele. Svaka komponenta arhitekture – ODS, osnovne aplikacije, skladište podataka tvrtke, i tako dalje.. – treba vlastiti model podaci. Stoga mora postojati precizna definicija kako ti modeli podaci sučeljavaju se međusobno.

PREMJESTI I PODACI ERP IN DATA SKLADIŠTE

Ako je podrijetlo podaci je osnovna aplikacija i/ili ODS, kada ERP umeće i podaci u skladište podataka, ovo umetanje mora se odvijati na najnižoj razini "granularnosti". Jednostavno sažeti ili agregirati i podaci budući da izlaze iz ERP osnovne aplikacije ili ERP ODS nije prava stvar. THE podaci detalji su potrebni u skladište podataka da čine osnovu DSS procesa. Takav podaci će se na mnogo načina preoblikovati burzama podataka i istraživanjima skladište podataka.

Pomicanje od podaci od osnovnog aplikacijskog okruženja ERP-a do skladište podataka tvrtke obavlja se na razumno opušten način. Ovo se premještanje događa otprilike 24 sata nakon ažuriranja ili stvaranja u ERP-u. Činjenica da imate "lijeni" pokret podaci u skladište podataka tvrtke dopušta podaci dolazi iz ERP-a na "depozit". jednom ja podaci su pohranjeni u osnovnoj aplikaciji, tada ih možete sigurno premjestiti podaci ERP-a u tvrtki. Još jedan cilj dostižan zahvaljujući "lijenom" pokretu podaci to je jasno razgraničenje između operativnih procesa i DSS-a. S "brzim" pokretom podaci crta podjele između DSS-a i operativnog ostaje nejasna.

Kretanje podaci od ERP ODS do skladište podataka tvrtke obavlja se periodički, obično tjedno ili mjesečno. U ovom slučaju kretanje od podaci temelji se na potrebi »čišćenja« starog podaci povjesničari. Naravno, ODS sadrži i podaci koji su mnogo noviji od podaci povjesničari pronašli u skladište podataka.

Pomicanje od podaci u skladište podataka gotovo nikad se ne radi "na veliko" (na veleprodajni način). Kopiraj tablicu iz ERP okruženja u skladište podataka to nema smisla. Puno realističniji pristup je premještanje odabranih jedinica podaci. Samo podaci koji su se promijenili od posljednjeg ažuriranja skladište podataka oni su ti koje treba preseliti u skladište podataka. Jedan način da saznate koje podaci promijenili od zadnjeg ažuriranja je pogledati vremenske oznake podaci nalaze u ERP okruženju. Dizajner odabire sve promjene koje su se dogodile od posljednjeg ažuriranja. Drugi pristup je korištenje tehnika hvatanja promjena podaci. Ovim se tehnikama analiziraju dnevnici i vrpce dnevnika kako bi se utvrdilo koje podaci mora se premjestiti iz ERP okruženja u ono skladište podataka. Ove su tehnike najbolje jer se dnevnici i trake dnevnika mogu čitati iz ERP datoteka bez daljnjeg utjecaja na druge ERP resurse.

OSTALE KOMPLIKACIJE

Jedno od pitanja ERP-a u CIF-u je što se događa s drugim izvorima aplikacija ili s podaci ODS-a kojem moraju pridonijeti skladište podataka ali nisu dio ERP okruženja. S obzirom na zatvorenu prirodu ERP-a, posebice SAP-a, pokušaj integriranja ključeva iz vanjskih izvora podaci s i podaci koji dolaze iz ERP-a prilikom premještanja podaci u skladište podataka, to je veliki izazov. I točno kolike su vjerojatnosti da i podaci aplikacija ili ODS-ova izvan ERP okruženja bit će integrirani u skladište podataka? Izgledi su zapravo vrlo visoki.

PRONAĆI PODACI POVIJESNI IZ ERP

Još jedan problem s i podaci ERP-a je ono što proizlazi iz potrebe da se ima podaci povjesničari unutar skladište podataka. Obično se skladište podataka potrebe podaci povjesničari. A ERP tehnologija ih obično ne pohranjuje podaci povijesni, barem ne do točke u kojoj je to potrebno u skladište podataka. Kada velika količina podaci povijest se počinje zbrajati u ERP okruženju, to okruženje treba očistiti. Na primjer, pretpostavimo da a skladište podataka mora biti napunjen s pet godina podaci povijesne podatke, dok ih ERP čuva najviše šest mjeseci podaci. Sve dok je tvrtka zadovoljna prikupljanjem niza podaci povjesničari kako vrijeme prolazi, tada nema problema u korištenju ERP-a kao izvora za skladište podataka. Ali kada je skladište podataka mora se vratiti u prošlost i dobiti bogove podaci povijesti koje ERP prethodno nije prikupio i spremio, tada ERP okruženje postaje neučinkovito.

ERP I METODATCI

Još jedno razmatranje o ERP-u e skladište podataka je onaj o metapodacima koji postoje u ERP okruženju. Kao što metapodaci prelaze iz ERP okruženja u IT okruženje skladište podataka, metapodaci se moraju premjestiti na isti način. Nadalje, metapodaci se moraju transformirati u format i strukturu koju zahtijeva infrastruktura skladište podataka. Postoji velika razlika između operativnih metapodataka i DSS metapodataka. Operativni metapodaci prvenstveno su za programera i

programer. DSS metapodaci prvenstveno su za krajnjeg korisnika. Postojeći metapodaci u ERP aplikacijama ili ODS-ovima moraju se pretvoriti, a ta konverzija nije uvijek jednostavna i jednostavna.

IZVOR ERP PODATAKA

Ako se ERP koristi kao pružatelj podaci za skladište podataka mora postojati čvrsto sučelje koje pomiče podaci iz ERP okruženja u okruženje skladište podataka. Sučelje mora:

▪ biti jednostavan za korištenje
▪ dopusti pristup podaci ERP-a
▪ shvatite značenje podaci koji se spremaju preseliti u skladište podataka
▪ znajte ERP ograničenja koja bi mogla nastati prilikom pristupanja podaci ERP-a:
▪ referencijalni integritet
▪ hijerarhijski odnosi
▪ implicitne logičke relacije
▪ konvencija o primjeni
▪ sve strukture od podaci podržava ERP, i tako dalje...
▪ biti učinkovit u pristupu podaci, pružajući:
▪ izravno kretanje podaci
▪ stjecanje kusura podaci
▪ podržati pravovremeni pristup podaci
▪ razumjeti format podaci, i tako dalje… SUČELJE SA SAP Sučelje može biti dvije vrste, domaće ili komercijalno. Neka od glavnih sučelja za trgovanje uključuju:

▪ SAS
▪ Prims rješenja
▪ D2k, i tako dalje... VIŠE ERP TEHNOLOGIJA Tretiranje ERP okruženja kao da se radi o jednoj tehnologiji je velika pogreška. Postoje mnoge ERP tehnologije, svaka sa svojim prednostima. Najpoznatiji dobavljači na tržištu su:

▪ SAP
▪ Oracle Financije
▪ PeopleSoft
▪ JD Edwards
▪ Baan SAP SAP je najveći i najpotpuniji ERP softver. SAP aplikacije uključuju mnoge vrste aplikacija u mnogim područjima. SAP ima reputaciju da je:

▪ vrlo velik
▪ vrlo teško i skupo za implementaciju
▪ potrebno je mnogo ljudi i konzultanata za implementaciju
▪ zahtijeva specijalizirane ljude za implementaciju
▪ treba dugo vremena za implementaciju. Nadalje, SAP ima reputaciju da pamti svoje podaci vrlo pažljivo, što otežava pristup osobama izvan SAP područja. SAP-ova snaga je u tome što je sposoban uhvatiti i pohraniti veliku količinu podaci. Nedavno je SAP objavio svoju namjeru da proširi svoje aplikacije na skladište podataka. Postoje mnoge prednosti i mane korištenja SAP-a kao dobavljača skladište podataka. Prednost je što je SAP već instaliran i što većina konzultanata već poznaje SAP.
Nedostaci SAP-a kao dobavljača skladište podataka ima ih mnogo: SAP nema iskustva u svijetu skladište podataka Ako je SAP dobavljač skladište podataka, potrebno je “izvaditi” i podaci od SAP-a do skladište podataka. Dato SAP-ova evidencija zatvorenih sustava, malo je vjerojatno da će biti lako uvesti i iz SAP-a u njega (???). Postoje mnoga naslijeđena okruženja koja pokreću SAP, kao što su IMS, VSAM, ADABAS, ORACLE, DB2 i tako dalje. SAP inzistira na pristupu "nije ovdje izmišljeno". SAP ne želi surađivati s drugim dobavljačima za korištenje ili stvaranje skladište podataka. SAP inzistira na tome da sam generira sav svoj softver.

Iako je SAP velika i moćna tvrtka, pokušava ponovno napisati tehnologiju ELT-a, OLAP-a, administracije sustava, pa čak i temeljni kod dbms to je jednostavno ludo. Umjesto zauzimanja stava suradnje s dobavljačima skladište podataka Dugotrajno, SAP je slijedio pristup "oni znaju najbolje". Ovakav stav koči uspjeh koji bi SAP mogao postići u području skladište podataka.
SAP-ovo odbijanje da vanjskim dobavljačima omogući brz i elegantan pristup njihovim podaci. Sama bit korištenja a skladište podataka je lak pristup podaci. Cijela SAP-ova povijest temelji se na otežavanju pristupa podaci.
SAP-ov nedostatak iskustva u radu s velikim količinama podaci; u polju skladište podataka postoje svesci podaci nikada nije vidio SAP i upravljati ovim velikim količinama podaci morate imati odgovarajuću tehnologiju. SAP očito nije svjestan ove tehnološke barijere koja postoji za ulazak u polje skladište podataka.
SAP-ova korporativna kultura: SAP je napravio posao od dobivanja podaci iz sustava. Ali za to morate imati drugačiji mentalitet. Tradicionalno, softverske tvrtke koje su bile dobre u dopremanju podataka u okruženje nisu bile dobre u dovođenju podataka u drugu stranu. Ako SAP uspije napraviti ovu vrstu prebacivanja, bit će prva tvrtka koja je to učinila.

Ukratko, upitno je treba li tvrtka izabrati SAP za dobavljača skladište podataka. S jedne strane postoje vrlo ozbiljni rizici, a s druge vrlo malo nagrada. Ali postoji još jedan razlog koji obeshrabruje odabir SAP-a kao dobavljača skladište podataka. Jer svaka tvrtka treba imati isto skladište podataka nego sve druge tvrtke? The skladište podataka to je srce konkurentske prednosti. Kad bi svaka tvrtka usvojila isto skladište podataka bilo bi teško, iako ne nemoguće, postići konkurentsku prednost. Čini se da SAP misli da a skladište podataka može se smatrati kolačićem i to je daljnji znak njihovog mentaliteta aplikacija "ubaci podatke".

Nijedan drugi ERP dobavljač nije tako dominantan kao SAP. Bez sumnje će postojati tvrtke koje će slijediti SAP-ov put za svoj skladište podataka ali po svoj prilici ove skladište podataka SAP će biti velik, skup i dugotrajan za izradu.

Ova okruženja uključuju takve aktivnosti kao što su obrada bankovnih šaltera, procesi rezervacija zrakoplovnih linija, procesi osiguravajućih zahtjeva i tako dalje. Što je transakcijski sustav bio učinkovitiji, to je očitija bila potreba za odvajanjem između operativnog procesa i DSS-a (Decision Support System). Međutim, s ljudskim i kadrovskim sustavima nikada se ne suočavate s velikim količinama transakcija. I, naravno, kada se osoba zaposli ili napusti tvrtku, to je zapis transakcije. Ali u odnosu na druge sustave, sustavi ljudskih resursa i osoblja jednostavno nemaju mnogo transakcija. Stoga u sustavima upravljanja ljudskim resursima i kadrovskim sustavima nije posve očito da postoji potreba za DataWarehouseom. Na mnoge načine ovi sustavi predstavljaju amalgam DSS sustava.

Ali postoji još jedan faktor koji morate uzeti u obzir ako imate posla sa skladištima podataka i PeopleSoftom. U mnogim sredinama, tj podaci ljudskih i osobnih resursa sekundarni su u odnosu na primarnu djelatnost tvrtke. Većina tvrtki bavi se proizvodnjom, prodajom, pružanjem usluga i tako dalje. Ljudski resursi i sustavi osoblja obično su sekundarni u odnosu na glavnu djelatnost tvrtke (ili je podrška). Stoga je dvosmislen i nezgodan skladište podataka odvojeno za ljudske resurse i kadrovsku podršku.

PeopleSoft se po tom pitanju jako razlikuje od SAP-a. Sa SAP-om je obavezno da postoji skladište podataka. S PeopleSoftom to nije tako jasno. Skladište podataka nije obavezno uz PeopleSoft.

Najbolje što se može reći za i podaci PeopleSoft je to skladište podataka može se koristiti za arhiviranje i podaci koji se odnose na stare ljudske i osobne resurse. Drugi razlog zašto bi tvrtka željela koristiti a skladište podataka a

Šteta okruženja PeopleSoft je omogućiti pristup i slobodan pristup alatima za analizu podaci od strane PeopleSoft-a. Ali osim ovih razloga, mogu postojati slučajevi u kojima je poželjno da nemate skladište podataka podaci PeopleSoft.

u sažetku

Postoje mnoge ideje o izgradnji a skladište podataka unutar ERP softvera.
Neki od njih su:

▪ Ima smisla imati skladište podataka koji je sličan bilo kome drugom u industriji?
▪ Koliko je ERP fleksibilan skladište podataka softver?
▪ ERP skladište podataka softver može obraditi količinu od podaci koji se nalazi u askladište podataka arena"?
▪ Koje je snimanje tragova koje ERP dobavljač radi usprkos jednostavnom i jeftinom, u smislu vremena, podaci? (kakvi su dobavljači ERP-a u isporuci jeftinih, pravovremenih podataka kojima je lako pristupiti?)
▪ Koje je ERP dobavljač razumijevanja DSS arhitekture i tvornice korporativnih informacija?
▪ ERP dobavljači razumiju kako postići podaci unutar okruženja, ali razumiju li i kako ih izvoziti?
▪ Koliko je ERP dobavljač otvoren za alate za skladištenje podataka?
Sva ova razmatranja moraju se uzeti u obzir pri određivanju mjesta postavljanja skladište podataka koji će ugostiti i podaci ERP-a i drugi podaci. Općenito, osim ako ne postoji uvjerljiv razlog da se učini drugačije, preporučuje se gradnja skladište podataka izvan okruženja ERP dobavljača. POGLAVLJE 1 Pregled BI organizacije Ključne točke:
Spremišta informacija rade obrnuto od arhitekture poslovne inteligencije (BI):
Korporativna kultura i IT mogu ograničiti uspjeh u izgradnji BI organizacija.

Tehnologija više nije ograničavajući faktor za BI organizacije. Pitanje za arhitekte i planere projekata nije postoji li tehnologija, već mogu li učinkovito implementirati dostupnu tehnologiju.

Za mnoge tvrtke a skladište podataka to je nešto više od pasivnog depozita koji distribuira podaci korisnicima kojima je to potrebno. THE podaci ekstrahiraju se iz izvornih sustava i popunjavaju u ciljne strukture skladište podataka. Ja podaci mogu se i očistiti uz malo sreće. Međutim, ne dodaje se niti prikuplja nikakva dodatna vrijednost podaci tijekom ovog procesa.

U biti, pasivni Dw, u najboljem slučaju, pruža samo i podaci čist i operativan udrugama korisnika. Stvaranje informacija i analitičko razumijevanje u potpunosti su na korisnicima. Procijenite je li DW (Skladište podataka) uspjeh je subjektivan. Ako uspjeh procjenjujemo na temelju sposobnosti učinkovitog prikupljanja, integracije i čišćenja podaci korporativni na predvidljivoj osnovi, onda da, DW je uspjeh. S druge strane, ako promatramo prikupljanje, konsolidaciju i iskorištavanje informacija u organizaciji kao cjelini, onda je DW neuspjeh. DW pruža malu ili nikakvu informacijsku vrijednost. Kao rezultat toga, korisnici su prisiljeni snalaziti se, stvarajući silose informacija. Ovo poglavlje predstavlja sveobuhvatnu viziju kojom se sažima BI (Business Intelligence) arhitektura tvrtke. Počinjemo s opisom BI-a, a zatim prelazimo na rasprave o dizajnu i razvoju informacija, za razliku od jednostavnog pružanja informacija. podaci korisnicima. Rasprave se zatim usredotočuju na izračun vrijednosti vaših BI napora. Zaključujemo definiranjem načina na koji IBM rješava BI arhitektonske zahtjeve vaše organizacije.

Opis arhitekture grada BI organizacija

Snažni informacijski sustavi orijentirani na transakcije sada su uobičajena pojava u svakom velikom poduzeću, čime se učinkovito izjednačavaju uvjeti poslovanja za korporacije diljem svijeta.

Međutim, da bi ostali konkurentni, sada su potrebni analitički orijentirani sustavi koji mogu revolucionirati sposobnost tvrtke da ponovno otkrije i koristi informacije koje već posjeduje. Ovi analitički sustavi proizlaze iz razumijevanja bogatstva podaci dostupno. BI može poboljšati performanse u cijeloj tvrtki. Tvrtke mogu poboljšati odnose između kupaca i dobavljača, poboljšati profitabilnost proizvoda i usluga, generirati nove i bolje ponude, kontrolirati rizik i među mnogim drugim dobicima dramatično smanjiti troškove. Uz BI vaše poduzeće konačno počinje koristiti informacije o kupcima kao konkurentsku prednost zahvaljujući aplikacijama koje imaju tržišne ciljeve.

Imati prave poslovne alate znači imati konačne odgovore na ključna pitanja kao što su:

▪ Koji od naših klijenti tjeraju li nas da zaradimo više ili nas tjeraju da gubimo novac?
▪ Gdje žive naši najbolji klijenti u vezi sa dućan/ skladište koje posjećuju?
▪ Koji se naši proizvodi i usluge mogu najučinkovitije prodati i kome?
▪ Koji se proizvodi mogu najučinkovitije prodati i kome?
▪ Koja je prodajna kampanja najuspješnija i zašto?
▪ Koji su prodajni kanali najučinkovitiji za koje proizvode?
▪ Kako možemo poboljšati odnose s našim najboljim ljudima klijenti? Većina tvrtki ima podaci grubi načini odgovora na ova pitanja.
Operativni sustavi generiraju velike količine proizvoda, kupaca i podaci tržište od prodajnih mjesta, rezervacija, korisničke službe i sustava tehničke podrške. Izazov je izvući i iskoristiti te informacije. Mnoge tvrtke profitiraju samo od svojih malih dijelova podaci za strateške analize.
I podaci preostali, često spojeni s i podaci izvedeni iz vanjskih izvora kao što su vladina izvješća i druge kupljene informacije, zlatni su rudnik koji samo čeka da bude istražen, a podaci samo ih treba pročistiti unutar informacijskog konteksta vaše organizacije.

Ovo znanje može se primijeniti na više načina, od osmišljavanja cjelokupne korporativne strategije do osobne komunikacije s dobavljačima, preko pozivnih centara, fakturiranja, Internet i druge točke. Današnje poslovno okruženje diktira da se DW i srodna BI rješenja razviju izvan vođenja tradicionalnih poslovnih struktura. podaci koji ja podaci normalizirana na atomskoj razini i “farme zvijezda/kocka”.

Ono što je potrebno da bismo ostali konkurentni je spoj tradicionalnih i naprednih tehnologija u nastojanju da se podrži golemi analitički krajolik.
Da zaključimo, opće okruženje mora poboljšati znanje tvrtke u cjelini, osiguravajući da radnje poduzete kao rezultat provedenih analiza budu korisne kako bi svi imali koristi.

Na primjer, recimo da klasificirate svoje klijenti u kategorije visokog ili niskog rizika.
Ako su ove informacije generirane pomoću alata za izdvajanje modela ili na neki drugi način, moraju se staviti u DW i biti dostupne svima, pomoću bilo kojeg alata za pristup, kao što su statička izvješća, proračunske tablice, tablice ili online analitička obrada (OLAP). .

Međutim, trenutno većina ove vrste informacija ostaje u silosima podaci pojedinaca ili odjela koji generiraju analizu. Organizacija, kao cjelina, ima malo ili nimalo vidljivosti za razumijevanje. Samo spajanjem ove vrste informacijskog sadržaja u vaš poslovni DW možete eliminirati informacijske silose i poboljšati svoje DW okruženje.
Dvije su glavne prepreke razvoju BI organizacije.
Prvo, imamo problem same organizacije i njene discipline.
Iako ne možemo pomoći s promjenama organizacijske politike, možemo pomoći u razumijevanju komponenti organizacijske poslovne inteligencije, njezine arhitekture i načina na koji IBM tehnologija olakšava njezin razvoj.
Druga prepreka koju treba prevladati je nedostatak integrirane tehnologije i znanja o metodi koja obuhvaća cijeli BI prostor za razliku od samo male komponente.

IBM se suočava s promjenama u tehnologiji integracije. Vaša je odgovornost osigurati promišljen dizajn. Ova arhitektura mora biti razvijena s tehnologijom odabranom za neograničenu integraciju ili u najmanju ruku s tehnologijom koja se pridržava otvorenih standarda. Nadalje, uprava vaše tvrtke mora osigurati da se BI poduhvat provodi prema planu i da ne dopusti razvoj informacijskih silosa koji proizlaze iz sebičnih agendi ili ciljeva.
To ne znači da BI okruženje nije osjetljivo na reagiranje na različite potrebe i zahtjeve različitih korisnika; umjesto toga, to znači da se implementacija tih pojedinačnih potreba i zahtjeva vrši za dobrobit cijele BI organizacije.
Opis BI organizacijske arhitekture može se pronaći na stranici 9 na slici 1.1. Arhitektura pokazuje bogatu mješavinu tehnologija i tehnika.
S tradicionalnog gledišta, arhitektura uključuje sljedeće komponente skladišta

Atomski sloj.

Ovo je temelj, srce cijelog DW-a, a time i strateškog izvještavanja.
I podaci pohranjeni ovdje zadržat će povijesni integritet, odnose podaci i uključuju izvedene metrike, kao i čišćenje, integriranje i pohranu korištenjem ekstrahiranih modela.
Sva naknadna uporaba ovih podaci a povezane informacije su izvedene iz ove strukture. Ovo je izvrstan izvor za rudarenje podaci i za izvješća sa strukturiranim SQL upitima

Operativno skladište podaci ili izvješće na temelju podaci(Spremanje operativnih podataka (ODS) ili izvješćivanje baza podataka.)

Ovo je struktura od podaci posebno dizajniran za tehničko izvješćivanje.

I podaci pohranjeno i prijavljeno iznad ovih struktura može konačno propagirati u skladište preko odlagališta, gdje bi se moglo koristiti za stratešku signalizaciju.

Pozorište.

Prva stanica za većinu podaci namijenjen skladišnom okruženju je prostor organizacije.
ovdje ja podaci integriraju se, čiste i transformiraju u podaci profita koji će popuniti strukturu skladišta

Trgovine podacima.

Ovaj dio arhitekture predstavlja strukturu podaci koristi posebno za OLAP. Prisutnost datamartova, ako i podaci pohranjuju se u zvjezdane sheme koje se preklapaju podaci višedimenzionalni u relacijskom okruženju ili u datotekama podaci Povjerljivo koje koristi specifična OLAP tehnologija, kao što je DB2 OLAP poslužitelj, nije relevantno.

Jedino ograničenje je da arhitektura olakšava korištenje podaci višedimenzionalni.
Arhitektura također uključuje kritične BI tehnologije i tehnike koje se ističu kao:

Analiza prostora

Prostor je informacijska dobit za analitičara i ključan je za potpuno rješenje. Prostor može predstavljati informacije o ljudima koji žive na određenoj lokaciji, kao i informacije o tome gdje se ta lokacija fizički nalazi u odnosu na ostatak svijeta.

Da biste izvršili ovu analizu, morate započeti povezivanjem svojih informacija s koordinatama zemljopisne širine i dužine. To se naziva "geokodiranje" i mora biti dio procesa izdvajanja, transformiranja i učitavanja (ETL) na atomskoj razini vašeg skladišta.

Rudarenje podataka.

Vađenje podaci omogućuje našim tvrtkama povećanje broja klijenti, predvidjeti trendove prodaje i omogućiti upravljanje odnosima s klijenti (CRM), između ostalih BI inicijativa.

Vađenje podaci stoga se mora integrirati sa strukturama podaci DWhousea i uz podršku skladišnih procesa kako bi se osigurala djelotvorna i učinkovita upotreba tehnologije i povezanih tehnika.

Kao što je naznačeno u BI arhitekturi, atomska razina Dwhousea, kao i datamarts, izvrstan je izvor podaci za ekstrakciju. Ti isti objekti također moraju biti primatelji rezultata ekstrakcije kako bi se osigurala dostupnost najširoj publici.

Agenti.

Postoje razni "agenti" koji ispituju kupca za svaku točku, kao što su operativni sustavi tvrtke i sam dw. Ti agenti mogu biti napredne neuronske mreže obučene da uče o trendovima u svakoj točki, kao što je buduća potražnja proizvoda temeljena na promocijama prodaje, motori temeljeni na pravilima da reagiraju na Dato splet okolnosti, ili čak jednostavni agenti koji prijavljuju iznimke "najvišim rukovoditeljima". Ti se procesi općenito odvijaju u stvarnom vremenu i stoga moraju biti usko povezani s njihovim kretanjem podaci. Sve ove strukture od podaci, tehnologije i tehnike jamče da nećete provesti noć generirajući organizaciju svog BI-a.

Ova će se aktivnost razvijati u postupnim koracima, za male točke.
Svaki je korak neovisni projektni napor i naziva se iteracija u vašoj DW ili BI inicijativi. Iteracije mogu uključivati implementaciju novih tehnologija, počevši s novim tehnikama, dodavanjem novih struktura podaci , učitavanje i podaci dodatno, ili uz proširenje analize vašeg okruženja. O ovom paragrafu se detaljnije raspravlja u 3. poglavlju.

Uz tradicionalne DW strukture i BI alate, postoje i druge funkcije vaše BI organizacije za koje trebate dizajnirati, kao što su:

Dodirne točke kupaca (Dodir kupaca točke).

Kao i kod svake moderne organizacije, postoji niz dodirnih točaka kupaca koje pokazuju kako imati pozitivno iskustvo za svoje klijenti. Postoje tradicionalni kanali kao što su trgovci na malo, operateri centrala, izravna pošta, multimedijsko i tiskano oglašavanje, kao i aktualniji kanali kao što su e-pošta i web, podaci proizvodi s nekom dodirnom točkom moraju se nabaviti, transportirati, očistiti, preraditi i potom smjestiti u objekte podaci od BI.

Osnove od podaci operativne i korisničke udruge (Operational

baze podataka i korisničke zajednice).
Na kraju kontaktnih točaka klijenti nalaze se temelji od podaci aplikacije tvrtke i zajednice korisnika. THE podaci postojeći su podaci tradicionalno koje se mora spojiti i stopiti s podaci koji teku iz kontaktnih točaka kako bi zadovoljili potrebne informacije.

Analitičari. (Analitičari)

Primarni korisnik BI okruženja je analitičar. On je taj koji ima koristi od trenutnog vađenja podaci operativni, integrirani s različitim izvorima podaci , proširen značajkama kao što je geografska analiza (geokodiranje) i predstavljen u BI tehnologijama koje omogućuju ekstrakciju, OLAP, napredno SQL izvješćivanje i geografsku analizu. Primarno analitičarsko sučelje za okruženje za izvještavanje je BI portal.

Međutim, analitičar nije jedini koji ima koristi od BI arhitekture.
Menadžeri, velika udruženja korisnika, pa čak i članovi, dobavljači i klijenti trebali bi pronaći prednosti u poslovnom BI-u.

Povratna petlja.

BI arhitektura je okruženje za učenje. Karakteristično načelo razvoja je omogućiti postojane strukture podaci ažurirati korištenom BI tehnologijom i radnjama koje poduzima korisnik. Primjer je bodovanje kupaca.

Ako odjel prodaje modelira rezultate kupaca za korištenje nove usluge, tada odjel prodaje ne bi trebao biti jedina grupa koja ima koristi od usluge.

Umjesto toga, izdvajanje modela trebalo bi se izvoditi kao prirodni dio protoka podataka unutar poduzeća, a rezultati kupaca trebali bi postati integrirani dio konteksta informacija o skladištu, vidljiv svim korisnicima. IBM-ov Bi-bI-centric Suite uključujući DB2 UDB, DB2 OLAP poslužitelj uključuje većinu glavnih tehnoloških komponenti, definiranih na slici 1.1.

Koristimo arhitekturu kako se pojavljuje na ovoj ilustraciji iz knjige kako bismo dobili razinu kontinuiteta i pokazali kako se svaki IBM-ov proizvod uklapa u cjelokupnu BI shemu.

Pružanje informativnog sadržaja (Pružanje Sadržaj informacija)

Dizajniranje, razvoj i implementacija vašeg BI okruženja je zastrašujući zadatak. Dizajn mora obuhvatiti i sadašnje i buduće poslovne zahtjeve. Arhitektonski crtež mora biti potpun kako bi uključio sve zaključke do kojih se došlo tijekom faze projektiranja. Izvršenje mora ostati posvećeno jednoj svrsi: razvoju BI arhitekture kako je formalno predstavljeno u dizajnu i utemeljeno na poslovnim zahtjevima.

Posebno je teško tvrditi da će disciplina osigurati relativni uspjeh.
Ovo je jednostavno jer ne razvijate BI okruženje odjednom, već to radite u malim koracima tijekom vremena.

Međutim, identificiranje BI komponenti vaše arhitekture važno je iz dva razloga: Vi ćete voditi sve kasnije tehničke odluke o arhitekturi.
Moći ćete svjesno planirati određenu upotrebu tehnologije čak i ako vam tehnologija ne treba ponoviti nekoliko mjeseci.

Dovoljno razumijevanje vaših poslovnih zahtjeva utjecat će na vrstu proizvoda koje nabavite za svoju arhitekturu.
Dizajniranje i razvoj vaše arhitekture osigurava da vaše skladište bude

nije slučajan događaj, već pomno konstruiran “dobro promišljen”. raditi umjetnosti kao mozaika mješovite tehnologije.

Dizajnirajte informacijski sadržaj

Sav početni dizajn mora se usredotočiti i identificirati ključne BI komponente koje će biti potrebne ukupnom okruženju sada iu budućnosti.
Poznavanje poslovnih zahtjeva je važno.

Čak i prije početka formalnog dizajna, planer projekta često može identificirati jednu ili dvije komponente odmah.
Međutim, ravnotežu komponenti koje bi mogle biti potrebne za vašu arhitekturu nije lako pronaći. Tijekom faze dizajna, glavni dio arhitekture povezuje sesiju razvoja aplikacije (JAD) s istraživanjem kako bi se identificirali poslovni zahtjevi.

Ponekad se ti zahtjevi mogu povjeriti alatima za upite i izvješća.
Na primjer, korisnici navode da ako žele automatizirati trenutno izvješće moraju ga ručno generirati integracijom dvaju trenutnih izvješća i dodavanjem izračuna izvedenih iz kombinacije podaci.
Iako je ovaj zahtjev jednostavan, on definira određenu funkcionalnost značajke koju morate uključiti prilikom kupnje alata za izvješćivanje za svoju organizaciju.

Dizajner također mora slijediti dodatne zahtjeve kako bi dobio potpunu sliku. Žele li se korisnici pretplatiti na ovo izvješće?
Jesu li podskupovi izvješća generirani i poslani e-poštom različitim korisnicima? Žele li vidjeti ovo izvješće na portalu tvrtke? Svi ovi zahtjevi dio su jednostavne potrebe za zamjenom ručnog izvješća na zahtjev korisnika. Prednost ove vrste zahtjeva je da svi, korisnici i dizajneri, razumiju koncept izvješća.

Međutim, postoje i druge vrste poslovanja koje moramo planirati. Kada su poslovni zahtjevi navedeni u obliku strateških poslovnih pitanja, stručnom dizajneru je lako razlučiti mjere/činjenice i dimenzionalne zahtjeve.

Ako korisnici JAD-a ne znaju kako navesti svoje zahtjeve u obliku poslovnog problema, dizajner će često pružiti primjere za brzi početak sesije prikupljanja zahtjeva.
Stručni dizajner može pomoći korisnicima da razumiju ne samo strateško trgovanje, već i kako ga oblikovati.
O pristupu prikupljanja zahtjeva raspravlja se u 3. poglavlju; za sada samo želimo istaknuti potrebu za dizajnom za sve vrste BI zahtjeva.

Strateški poslovni problem nije samo poslovni zahtjev, već i trag dizajna. Ako morate odgovoriti na višedimenzionalno pitanje, onda morate zapamtiti, predstaviti i podaci dimenzijski, i ako trebate pohraniti podaci višedimenzionalni, morate odlučiti koju vrstu tehnologije ili tehnike ćete koristiti.

Implementirate li shemu rezervirane kockaste zvijezde ili oboje? Kao što vidite, čak i jednostavan poslovni problem može značajno utjecati na dizajn. Ali ove vrste poslovnih zahtjeva su uobičajene i razumljive, barem dizajnerima i planerima s projektnim iskustvom.

Bilo je dovoljno rasprava o OLAP tehnologijama i podršci, a dostupan je širok raspon rješenja. Do sada smo spomenuli potrebu spajanja jednostavnog izvješćivanja sa zahtjevima poslovne dimenzije i kako ti zahtjevi utječu na tehničke arhitektonske odluke.

Ali koji su zahtjevi koje korisnici ili Dw tim ne razumiju lako? Hoće li vam ikada trebati prostorna analiza?
Izdvajanje modela podaci hoće li oni biti nužan dio vaše budućnosti? Tko zna?

Važno je napomenuti da ove vrste tehnologija nisu dobro poznate općim zajednicama korisnika i članovima Dw tima, dijelom to može biti zato što njima obično rukuju neki interni ili treći tehnički stručnjaci. To je ekstremni slučaj problema koje ove vrste tehnologija stvaraju. Ako korisnici ne mogu opisati poslovne zahtjeve ili ih oblikovati na način koji daje smjernice dizajnerima, mogu proći nezapaženo ili, još gore, jednostavno ignorirani.

Problematičnije postaje kada dizajner i programer ne mogu prepoznati primjenu jedne od ovih naprednih, ali kritičnih tehnologija.
Kao što smo često čuli dizajnere kako kažu, “pa, zašto to ne ostavimo sa strane dok ne nabavimo ovo drugo? “Jesu li oni stvarno zainteresirani za prioritete ili jednostavno izbjegavaju zahtjeve koje ne razumiju? Najvjerojatnije je to zadnja hipoteza. Recimo da je vaš prodajni tim priopćio poslovni zahtjev, kao što je navedeno na slici 1.3, kao što vidite, zahtjev je uokviren u obliku poslovnog problema. Razlika između ovog problema i tipičnog dimenzionalnog problema je udaljenost. U ovom slučaju, prodajni tim želi znati, na mjesečnoj bazi, ukupnu prodaju od proizvoda, skladišta i trgovina klijenti koji žive unutar 5 milja od skladišta u kojem kupuju.

Nažalost, dizajneri ili arhitekti mogu jednostavno zanemariti prostornu komponentu govoreći: "Mi imamo kupca, proizvod i podaci depozita. Držimo distancu do sljedećeg ponavljanja.

"Krivi odgovor. Ova vrsta poslovnog problema odnosi se isključivo na BI. Predstavlja dublje razumijevanje našeg poslovanja i snažan analitički prostor za naše analitičare. BI je izvan jednostavnog postavljanja upita ili standardnog izvješćivanja, pa čak i OLAP-a. To ne znači da te tehnologije nisu važne za vaš BI, ali one same po sebi ne predstavljaju BI okruženje.

Dizajn za informacijski kontekst (Projektiranje informativnog sadržaja)

Sada kada smo identificirali poslovne zahtjeve koji razlikuju različite temeljne komponente, oni moraju biti uključeni u cjelokupni arhitektonski dizajn. Neke od BI komponenti dio su naših početnih napora, dok neke neće biti implementirane još nekoliko mjeseci.

Međutim, svi poznati zahtjevi odražavaju se u dizajnu tako da kada trebamo implementirati određenu tehnologiju, spremni smo to učiniti. Nešto u vezi s projektom odražavat će tradicionalno razmišljanje.

Ovaj set od podaci koristi se za podršku kasnijim upotrebama podaci dimenzionalno vođeni poslovnim problemima koje smo identificirali. Kako se generiraju dodatni dokumenti, kao što je razvoj dizajna podaci, počet ćemo formalizirati kako i podaci šire se u okolini. Utvrdili smo potrebu predstavljanja i podaci na dimenzionalni način, dijeleći ih (prema specifičnim specifičnim potrebama) u podatkovne marte.

Sljedeće pitanje na koje treba odgovoriti je: kako će se izgraditi ove marte podataka?
Gradite li zvijezde da podupiru kocke, ili samo kocke, ili samo zvijezde? (ili desno kocke, ili desno zvjezdice). Generirajte arhitekturu za ovisne marte podataka koji zahtijevaju atomski sloj za sve podaci stečena? Omogućite neovisnim bazama podataka da dobiju i podaci izravno iz operativnih sustava?

Koju Cube tehnologiju ćete pokušati standardizirati?

Imate ogromne količine podaci potrebne za dimenzionalnu analizu ili su vam potrebne kocke od vaše nacionalne prodajne jedinice na tjednoj bazi ili oboje? Gradite li nešto moćno kao što je DB2 OLAP poslužitelj za financije ili Cognos PowerPlay kocke za vašu prodajnu organizaciju, ili oboje? Ovo su velike odluke arhitektonskog dizajna koje će od sada pa nadalje utjecati na vaše BI okruženje. Da, utvrdili ste potrebu za OLAP-om. Sada, kako ćete izvesti tu vrstu tehnike i tehnologije?

Kako neke od najnaprednijih tehnologija utječu na vaš dizajn? Pretpostavimo da ste identificirali potrebu za prostorom u svojoj organizaciji. Sada se morate prisjetiti izdanja arhitektonskih crteža čak i ako ne planirate izraditi prostorne komponente nekoliko mjeseci. Arhitekt danas mora projektirati na temelju onoga što je potrebno. Predvidite potrebu za prostornom analitikom koja generira, pohranjuje, izvodi i omogućuje pristup podaci prostorni. To bi zauzvrat trebalo poslužiti kao ograničenje u vezi s vrstom softverske tehnologije i specifikacijama platforme koje trenutno možete uzeti u obzir. Na primjer, sustav administracije baza podataka relacijski sloj (RDBMS) koji izvodite za svoj atomski sloj mora imati dostupno robusno prostorno proširenje. Ovo bi osiguralo maksimalnu izvedbu pri korištenju geometrije i prostornih objekata u vašim analitičkim aplikacijama. Ako vaš RDBMS ne može podnijeti podaci (prostorno-centričan) interno, tako da ćete morati uspostaviti a baza podataka (prostorno-centrični) vanjski. To komplicira upravljanje problemima i ugrožava vašu ukupnu izvedbu, a da ne spominjemo dodatne probleme stvorene za vaše DBA-ove, jer oni vjerojatno imaju minimalno razumijevanje osnova podaci tako i prostorni. S druge strane, ako vaš RDMBS stroj rukuje svim prostornim komponentama i njegov optimizator je svjestan posebnih potreba (na primjer, indeksiranje) prostornih objekata, tada vaši DBA-ovi mogu lako nositi se s upravljanjem problemima, a vi možete maksimizirati izvedbu.

Dodatno, trebate prilagoditi pripremno područje i sloj atomskog okruženja da biste uključili čišćenje adrese (a

ključni element prostorne analize), kao i naknadno spremanje prostornih objekata. Slijed izdanja crteža nastavlja se sada kada smo uveli pojam jasnog smjera. Kao prvo, ova aplikacija će diktirati vrstu softvera koji je potreban za vaš ETL napor.

Trebate li proizvode kao što je Trillium koji će mu pružiti čistu adresu ili dobavljača ETL-a po vašem izboru koji će pružiti tu funkcionalnost?
Za sada je važno da cijenite razinu dizajna koja mora biti dovršena prije nego što počnete implementirati svoje skladište. Gore navedeni primjeri trebali bi pokazati mnoštvo dizajnerskih odluka koje moraju slijediti identifikaciju bilo kojeg posebnog poslovnog zahtjeva. Ako su donesene ispravno, ove dizajnerske odluke promiču međuovisnost između fizičkih struktura vašeg okruženja, odabira korištene tehnologije i tijeka širenja informacijskog sadržaja. Bez ove konvencionalne BI arhitekture, vaša će organizacija biti podložna kaotičnoj mješavini postojećih tehnologija, u najboljem slučaju labavo povezanih kako bi se osigurala prividna stabilnost.

Održavajte informacijski sadržaj

Donošenje vrijednosti informacija vašoj organizaciji vrlo je težak zadatak. Bez dovoljnog razumijevanja i iskustva, ili pravilnog planiranja i dizajna, čak i najbolji timovi neće uspjeti. S druge strane, ako imate izvrsnu intuiciju i detaljno planiranje, ali nemate discipline za izvršenje, upravo ste uzalud potrošili novac i vrijeme jer je vaš trud osuđen na propast. Poruka bi trebala biti jasna: ako vam nedostaje jedna ili više ovih vještina, razumijevanje/iskustvo ili disciplina planiranja/dizajna ili implementacije, to će osakatiti ili uništiti izgradnju BI organizacije.

Je li vaš tim dovoljno spreman? Postoji li netko u vašem BI timu tko razumije ogroman analitički krajolik dostupan u BI okruženjima, te tehnike i tehnologije potrebne za održavanje tog krajolika? Postoji li netko u vašem timu tko može prepoznati razliku između naprednih aplikacija

statičko izvješćivanje i OLAP, ili razlike između ROLAP-a i OLAP-a? Prepoznaje li jedan od članova vašeg tima jasno kako izdvojiti i kako bi to moglo utjecati na skladište ili kako skladište može podržati performanse izdvajanja? Član tima razumije vrijednost podaci svemirska ili agentska tehnologija? Imate li nekoga tko cijeni jedinstvenu primjenu ETL alata u odnosu na tehnologiju brokera poruka? Ako ga nemate, nabavite ga. BI je puno veći od normaliziranog atomskog sloja, OLAP-a, zvjezdastih shema i ODS-a.

Posjedovanje razumijevanja i iskustva za prepoznavanje BI zahtjeva i njihovih rješenja ključno je za vašu sposobnost pravilnog formaliziranja korisničkih potreba te dizajniranja i implementacije njihovih rješenja. Ako vaša korisnička zajednica ima poteškoća u opisivanju zahtjeva, posao skladišnog tima je pružiti to razumijevanje. Ali ako ekipa skladišta

ne prepoznaje specifičnu primjenu BI-a - na primjer, rudarenje podataka - onda nije najbolje što su BI okruženja često ograničena na pasivna spremišta. Međutim, ignoriranje ovih tehnologija ne umanjuje njihovu važnost i učinak koji imaju na pojavu sposobnosti poslovne inteligencije vaše organizacije, kao i na informacijski krajolik koji planirate njegovati.

Planiranje mora uključivati pojam crtanja, a oboje zahtijeva kompetentnu osobu. Osim toga, projektiranje zahtijeva timsku skladišnu filozofiju i poštivanje standarda. Na primjer, ako je vaša tvrtka uspostavila standardnu platformu ili je identificirala određeni RDBMS koji želite standardizirati na cijeloj platformi, odgovornost je na svima u timu da se pridržavaju tih standarda. Općenito, tim izlaže potrebu za standardizacijom (korisničkim zajednicama), ali sam tim nije voljan pridržavati se standarda koji su uspostavljeni iu drugim područjima u tvrtki ili možda čak u sličnim tvrtkama. Ne samo da je to licemjerno, već pokazuje da tvrtka nije sposobna iskoristiti postojeće resurse i ulaganja. To ne znači da ne postoje situacije koje zahtijevaju nestandardiziranu platformu ili tehnologiju; međutim, skladišni napori

trebali bi ljubomorno štititi standarde tvrtke dok poslovni zahtjevi ne nalažu drugačije.

Treća ključna komponenta potrebna za izgradnju BI organizacije je disciplina.
Ovisi ukupno, podjednako o pojedincima i okolini. Projektanti, sponzori, arhitekti i korisnici moraju cijeniti disciplinu potrebnu za izgradnju informacijske strukture tvrtke. Dizajneri moraju usmjeriti svoje dizajnerske napore na takav način da nadopunjuju druge potrebne napore u društvu.

Na primjer, recimo da vaša tvrtka gradi ERP aplikaciju koja ima komponentu skladišta.
Stoga je odgovornost dizajnera ERP-a da surađuju s timom za skladišnu okolinu kako se ne bi natjecali ili duplirali već započeti posao.

Disciplina je također tema kojom se mora pozabaviti cijela organizacija i obično se uspostavlja i povjerava izvršnoj razini.
Jesu li menadžeri voljni pridržavati se osmišljenog pristupa? Pristup koji obećava stvaranje informacijskog sadržaja koji će u konačnici donijeti vrijednost svim područjima poduzeća, ali možda kompromituje planove pojedinca ili odjela? Sjetite se izreke “Razmišljati o svemu važnije je nego razmišljati o samo jednoj stvari”. Ova izreka vrijedi za BI organizacije.

Nažalost, mnoga skladišta usmjeravaju svoje napore na ciljanje i donošenje vrijednosti određenom odjelu ili određenim korisnicima, s malo pažnje na organizaciju u cjelini. Pretpostavimo da izvršni direktor zatraži pomoć od tima iz skladišta. Tim odgovara 90-dnevnim naporom koji uključuje ne samo isporuku zahtjeva za obavijesti koje je definirao upravitelj, već osigurava da svi podaci baza se miješaju na atomskoj razini prije uvođenja u predloženu tehnologiju kocke.
Ovaj inženjerski dodatak jamči da će poduzeće u skladištu imati koristi podaci potrebno za menadžera.
Međutim, izvršni direktor razgovarao je s vanjskim konzultantskim tvrtkama koje su predložile sličnu aplikaciju s isporukom za manje od 4 tjedna.

Pod pretpostavkom da je interni skladišni tim kompetentan, rukovoditelj ima izbor. Tko može podržati dodatnu inženjersku disciplinu potrebnu za kultiviranje poduzeća s informacijskom imovinom ili može odabrati brzu izgradnju vlastitog rješenja. Čini se da se posljednja bira prečesto i služi samo za stvaranje spremnika informacija od kojih koristi samo nekolicina ili pojedinac.

Kratkoročni i dugoročni ciljevi

Arhitekti i projektanti moraju formalizirati dugoročnu viziju cjelokupne arhitekture i planove za rast u BI organizaciji. Ova kombinacija kratkoročne dobiti i dugoročnog planiranja predstavlja dvije strane BI napora. Kratkoročna dobit je aspekt BI-a koji je povezan s iteracijama vašeg skladišta.

Ovdje se planeri, arhitekti i sponzori usredotočuju na ispunjavanje specifičnih komercijalnih zahtjeva. Na ovoj razini se grade fizičke strukture, kupuje tehnologija i implementiraju tehnike. Oni nipošto nisu izrađeni za ispunjavanje specifičnih zahtjeva kako ih definiraju određene zajednice korisnika. Sve se radi kako bi se odgovorilo na specifične zahtjeve koje definira određena zajednica.
Međutim, dugoročno planiranje je drugi aspekt BI-a. Ovdje su planovi i nacrti osigurali izgradnju bilo koje fizičke strukture, odabrane tehnologije i implementirane tehnike učinjene s pogledom prema poduzeću. Dugoročno planiranje osigurava koheziju potrebnu kako bi se osiguralo da poslovne koristi proizlaze iz bilo koje pronađene kratkoročne dobiti.

Opravdajte svoj BI trud

Un skladište podataka sama po sebi nema inherentnu vrijednost. Drugim riječima, ne postoji inherentna vrijednost između skladišnih tehnologija i tehnika implementacije.

Vrijednost bilo kojeg skladišnog napora nalazi se u radnjama koje se izvode kao rezultat skladišnog okruženja i informacijskog sadržaja kultiviranog tijekom vremena. Ovo je kritična točka koju treba razumjeti prije nego ikada pokušate procijeniti vrijednost bilo koje inicijative wherehouse.

Arhitekti i dizajneri prečesto pokušavaju primijeniti vrijednost na fizičke i tehničke komponente skladišta, dok se vrijednost zapravo temelji na poslovnim procesima na koje skladište i dobro prikupljene informacije pozitivno utječu.

Ovdje leži izazov uspostavljanja BI-a: Kako opravdati investiciju? Ako samo mjesto gdje nema unutarnju vrijednost, dizajneri projekta moraju istražiti, definirati i formalizirati koristi koje postižu oni pojedinci koji će koristiti skladište za poboljšanje specifičnih poslovnih procesa ili vrijednost zaštićenih informacija, ili oboje.

Da se stvari zakompliciraju, svaki poslovni proces na koji utječu napori skladištenja mogao bi pružiti "znatne" ili "male" koristi. Značajne prednosti pružaju opipljivu metriku za mjerenje povrata ulaganja (ROI) – na primjer, okretanje inventara dodatno vrijeme tijekom određenog razdoblja ili za niže troškove prijevoza po pošiljci. Teže je definirati suptilne prednosti, poput poboljšanog pristupa informacijama, u smislu opipljive vrijednosti.

Povežite svoj projekt da biste saznali više o Poslovni zahtjevi

Prečesto planeri projekata pokušavaju povezati vrijednost skladišta s amorfnim ciljevima poduzeća. Izjavom da se "vrijednost skladišta temelji na našoj sposobnosti da udovoljimo strateškim zahtjevima" otvaramo raspravu na ugodan način. No samo to nije dovoljno da se utvrdi ima li ulaganje u zalihe smisla. Najbolje je povezati iteracije skladišta sa specifičnim, poznatim poslovnim zahtjevima.

Mjerenje ROI-ja

Izračunavanje ROI-ja u skladišnom okruženju može biti posebno teško. Posebno je teško ako prednost

princip određenog ponavljanja je nešto što nije opipljivo ili lako mjerljivo. Jedno je istraživanje pokazalo da korisnici vide dvije glavne prednosti BI inicijativa:

▪ Stvorite sposobnost donošenja odluka
▪ Stvorite pristup informacijama
Ove beneficije su meke (ili blage) beneficije. Lako je vidjeti kako možemo izračunati ROI na temelju teške (ili velike) koristi kao što su smanjeni troškovi prijevoza, ali kako mjerimo sposobnost donošenja boljih odluka?
Ovo je definitivno izazov za planere projekata kada pokušavaju uvjeriti tvrtku da uloži u određeno skladište. Povećanje prodaje ili smanjenje troškova više nisu središnje teme koje pokreću BI okruženje.
Umjesto toga, gledate poslovne zahtjeve za boljim pristupom informacijama kako bi određeni odjel mogao brže donositi odluke. To su strateški pokretači koji su podjednako važni za poduzeće, ali su dvosmisleniji i teže ih je karakterizirati opipljivom metrikom. U ovom slučaju, izračun ROI-a može dovesti u zabludu, ako ne i irelevantno.
Dizajneri projekta moraju biti u mogućnosti pokazati opipljivu vrijednost za rukovoditelje kako bi odlučili isplati li se ulaganje u određenu iteraciju. Međutim, nećemo predlagati novu metodu za izračun povrata ulaganja, niti ćemo iznositi bilo kakve argumente za ili protiv nje.
Postoji mnogo dostupnih članaka i knjiga koje govore o osnovama izračuna ROI-ja. Postoje posebni prijedlozi vrijednosti kao što je vrijednost ulaganja (VOI), koje nude grupe poput Gartnera, a koje možete istražiti. Umjesto toga, usredotočit ćemo se na ključne aspekte bilo kojeg ROI-a ili drugih vrijednosnih prijedloga koje trebate razmotriti. Primjena povrata ulaganja Osim argumenta o "tvrdim" prednostima naspram "mekih" prednosti povezanih s BI naporima, postoje i druga pitanja koja treba uzeti u obzir prilikom primjene ROI-ja. Na primjer:

Pripišite previše ušteda DW naporima koji bi ionako došli
Recimo da je vaša tvrtka prešla s arhitekture glavnog računala na distribuirano UNIX okruženje. Dakle, sve uštede koje se mogu (ili ne moraju) ostvariti tim naporom ne bi trebale pripisivati isključivo, ako uopće (?), skladištu.

Ne voditi računa o svemu je skupo. A treba uzeti u obzir mnoge stvari. Razmotrite sljedeći popis:

▪ Početni trošak, uključujući izvedivost.
▪ Cijena namjenskog hardvera s pripadajućom pohranom i komunikacijama
▪ Troškovi softvera, uključujući upravljanje podaci i proširenja klijent/poslužitelj, ETL softver, DSS tehnologije, alati za vizualizaciju, aplikacije za planiranje i tijek rada te softver za nadzor, .
▪ Troškovi dizajna strukture podaci, uz izradu i optimizaciju
▪ Troškovi razvoja softvera izravno povezani s BI naporima
▪ Troškovi kućne podrške, uključujući optimizaciju performansi, uključujući kontrolu verzije softvera i operacije pomoći Primijenite "Big-Bang" ROI. Izgradnja skladišta kao jedan golemi napor osuđena je na neuspjeh, pa čak i izračunajte ROI za inicijativu velikog poduzeća. Ponuda je iznenađujuća, a planeri i dalje čine slabe pokušaje da procijene vrijednost cjelokupnog truda. Zašto planeri pokušavaju dati novčanu vrijednost poslovnoj inicijativi ako je općepoznato i prihvaćeno da je teško procijeniti određena ponavljanja? Kako je to moguće? Nije moguće uz nekoliko iznimaka. ne čini to Sada kada smo utvrdili što ne treba činiti pri izračunavanju ROI-ja, evo nekoliko točaka koje će nam pomoći u uspostavljanju pouzdanog procesa za procjenu vrijednosti vaših BI napora.

Postizanje konsenzusa o povratu ulaganja. Bez obzira na vaš izbor tehnike za procjenu vrijednosti vaših BI napora, s njom se moraju složiti sve strane, uključujući dizajnere projekta, sponzore i poslovne rukovoditelje.

Smanjite ROI na dijelove koji se mogu identificirati. Nužan korak prema razumnom izračunu ROI-ja je fokusiranje tog izračuna na određeni projekt. To vam zatim omogućuje procjenu vrijednosti na temelju ispunjenih specifičnih poslovnih zahtjeva

Definirajte troškove. Kao što je spomenuto, potrebno je uzeti u obzir brojne troškove. Nadalje, troškovi moraju uključivati ne samo one povezane s jednom iteracijom, već i troškove povezane s osiguranjem usklađenosti sa standardima tvrtke.

Definirajte pogodnosti. Jasnim povezivanjem ROI-a sa specifičnim poslovnim zahtjevima, trebali bismo moći identificirati prednosti koje će dovesti do ispunjavanja zahtjeva.

Smanjite troškove i koristi u neposrednoj dobiti. To je najbolji način da temeljite svoje procjene na neto sadašnjoj vrijednosti (NPV) za razliku od pokušaja predviđanja buduće vrijednosti u budućim prihodima.

Skratite vrijeme podjele vašeg ROI-ja na minimum. Dobro je dokumentirano tijekom dugog vremenskog razdoblja korištenja u vašem ROI-u.

Koristite više od jedne formule ROI. Postoje brojne metode za predviđanje povrata ulaganja i trebali biste planirati hoćete li koristiti jednu ili više njih, uključujući neto sadašnju vrijednost, internu stopu povrata (IRR) i povrat.

Definirajte ponovljivi proces. Ovo je ključno za izračun bilo koje dugoročne vrijednosti. Treba dokumentirati jedan ponovljivi proces za sve podsekvence projekta koje slijede.

Navedeni problemi su najčešći problemi definirani od strane stručnjaka za okolinu skladišta. Inzistiranje uprave na isporuci "Big-Bang" ROI-a je vrlo dezorijentirajuće. Ako sve svoje izračune ROI-ja započnete rastavljanjem na prepoznatljive, opipljive dijelove, imate dobre šanse za procjenu točne ocjene ROI-a.

Pitanja u vezi s prednostima povrata ulaganja

Kakve god bile vaše prednosti, meke ili tvrde, možete upotrijebiti neka osnovna pitanja da odredite njihovu vrijednost. Na primjer, korištenjem jednostavnog sustava skaliranja, od 1 do 10, možete izmjeriti učinak bilo kojeg napora pomoću sljedećih pitanja:

Kako biste ocijenili razumijevanje podaci prati ovaj projekt vaše tvrtke?
Kako biste procijenili poboljšanja procesa kao rezultat ovog projekta?
Kako biste izmjerili utjecaj novih uvida i zaključaka koji su sada dostupni ovom iteracijom
Kakav je bio utjecaj novih računalnih okruženja visokih performansi kao rezultat onoga što je naučeno? Ako je odgovora na ova pitanja malo, moguće je da tvrtka nije vrijedna ulaganja. Pitanja s visokim bodovanjem ukazuju na značajne dobitke vrijednosti i trebala bi poslužiti kao smjernice za daljnje istraživanje. Na primjer, visoka ocjena za poboljšanja procesa trebala bi navesti dizajnere da ispitaju kako su procesi poboljšani. Možda ćete otkriti da su neki ili svi dobici opipljivi i stoga se novčana vrijednost može lako primijeniti. Izvlačenje maksimuma iz prve iteracije skladište Najveći rezultat vašeg poslovnog napora često je u prvih nekoliko ponavljanja. Ovi rani napori tradicionalno uspostavljaju najkorisniji informacijski sadržaj za javnost i pomažu uspostaviti tehnološke temelje za sljedeće BI aplikacije. Obično svaka sljedeća podsekvenca od podaci skladišnih projekata donosi sve manje dodatne vrijednosti tvrtki općenito. To je osobito istinito ako iteracija ne dodaje nove teme ili zadovoljava potrebe nove korisničke zajednice.

Ova se značajka pohrane također odnosi na rastuće hrpe podaci povjesničari. Kako naknadni napori zahtijevaju više podaci i još kako podaci se s vremenom ulijevaju u skladište, većina podaci postaje manje relevantan za korištenu analizu. ove podaci često se nazivaju podaci u mirovanju i uvijek ih je skupo držati jer se gotovo nikad ne koriste.

Što to znači za sponzore projekta? U biti, rani sponzori dijele više od onoga što košta ulaganje. To je primarno jer su oni poticaj za uspostavljanje širokog tehnološkog okruženja skladišta i sloja resursa, uključujući i organske.

Ali ti prvi koraci donose najveću vrijednost i stoga projektanti često moraju opravdati investiciju.
Projekti napravljeni nakon vaše BI inicijative mogu imati niže (u usporedbi s prvim) i izravne troškove, ali donose manju vrijednost tvrtki.

A vlasnici organizacija trebaju početi razmatrati bacanje akumulacije podaci i manje relevantne tehnologije.

Rudarenje podataka: Ekstrakcija Dati

Brojne arhitektonske komponente zahtijevaju varijacije u tehnologijama i tehnikama rudarenja podataka—
na primjer, različiti "agenti" za ispitivanje točaka interesa klijenti, operativne sustave tvrtke i za sam dw. Ti agenti mogu biti napredne neuronske mreže obučene na POT trendove, kao što je buduća potražnja proizvoda temeljena na promocijama prodaje; motori temeljeni na pravilima za reakciju na skup Dato okolnosti, na primjer, medicinska dijagnoza i preporuke za liječenje; ili čak jednostavni agenti s ulogom izvješćivanja o iznimkama najvišim rukovoditeljima. Općenito ovi postupci ekstrakcije podaci si

provjeriti u stvarnom vremenu; stoga se moraju potpuno sjediniti s pokretom podaci se.

Online analitička obrada Obrada

Online analitika

Sposobnost rezanja, kockica, kotrljanja, bušenja i analize
što-ako je unutar opsega, fokus IBM-ovog tehnološkog paketa. Na primjer, postoje funkcije online analitičke obrade (OLAP) za DB2 koje unose dimenzionalnu analizu u softversku mašinu. baza podataka isti.

Funkcije dodaju dimenzionalnu korisnost SQL-u dok iskorištavaju sve prednosti prirodnog dijela DB2. Drugi primjer OLAP integracije je alat za ekstrakciju, DB2 OLAP Server Analyzer. Ova tehnologija omogućuje brzu i automatsku analizu kocki DB2 OLAP poslužitelja za lociranje i izvješćivanje o vrijednostima vrijednosti podaci neobično ili neočekivano u cijeloj kocki poslovnom analitičaru. I konačno, značajke DW centra omogućuju arhitektima da kontroliraju, između ostalog, profil kocke DB2 OLAP poslužitelja kao prirodnog dijela ETL procesa.

Spatial Analysis Spatial Analysis

Prostor predstavlja polovicu analitičkih sidrišta (leads) potrebnih za panoramu
široko analitički (vrijeme predstavlja drugu polovicu). Atomska razina skladišta, prikazana na slici 1.1, uključuje osnove vremena i prostora. Vremenske oznake usidre analize prema vremenu, a informacije o adresi usidre analize prema prostoru. Vremenske oznake provode analizu prema vremenu, a informacije o adresi provode analizu prema prostoru. Dijagram prikazuje geokodiranje – proces pretvaranja adresa u točke na karti ili točke u prostoru kako bi se koncepti kao što su udaljenost i unutar/izvana mogli koristiti u analizi – koje se provodi na atomskoj razini i prostorna analiza koja je dostupna analitičar. IBM nudi prostorna proširenja, razvijena u suradnji s Institutom za istraživanje sustava okoliša (ESRI), za baza podataka DB2 tako da se prostorni objekti mogu pohraniti kao uobičajeni dio baza podataka relacijski. DB2

Spatial Extenders također pružaju sva SQL proširenja za iskorištavanje prostorne analize. Na primjer, SQL ekstenzije za postavljanje upita
udaljenost između adresa ili je li točka unutar ili izvan definiranog poligonalnog područja, analitički su standard sa Spatial Extenderom. Pogledajte poglavlje 16 za više informacija.

Baza podataka-Rezidentni alati Alati Baza podataka-Rezidencija

DB2 ima mnoge BI-rezidentne SQL značajke koje pomažu u akciji analize. To uključuje:

Rekurzivne funkcije za izvođenje analize, kao što je " pronalaženje svih mogućih putanja leta iz San Francisko a New York".
Analitičke funkcije za rangiranje, kumulativne funkcije, kocka i zbrajanje za olakšavanje zadataka koji se inače javljaju samo s OLAP tehnologijom, sada su prirodni dio motora baza podataka
Mogućnost izrade tablica koje sadrže rezultate
Prodavači baza podataka lideri miješaju više BI mogućnosti u baza podataka isti.
Glavni dobavljači baza podataka miješaju više BI mogućnosti u baza podataka isti.
To osigurava bolju izvedbu i više mogućnosti izvršenja za BI rješenja.
O svojstvima i funkcijama DB2 V8 raspravlja se detaljno u sljedećim poglavljima:
Tehnička arhitektura i temelji upravljanja podacima (5. poglavlje)

Osnove DB2 BI (6. poglavlje)
DB2 materijalizirane tablice upita (poglavlje 7)
DB2 OLAP funkcije (poglavlje 13)
DB2 poboljšane BI značajke i funkcije (poglavlje 15) Pojednostavljeni sustav dostave podataka Sustav isporuke podaci pojednostavljeno

Arhitektura prikazana na slici 1.1 uključuje brojne strukture podaci fizički. Jedno je skladište podaci operativni. Općenito, ODS je predmetno orijentiran, integriran i aktualan objekt. Izgradili biste ODS za podršku, na primjer, prodajnom uredu. Prodaja ODS bi dopunila podaci iz brojnih različitih sustava, ali bi samo zadržao, na primjer, današnje transakcije. ODS se također može ažurirati više puta dnevno. Istodobno, procesi guraju podaci integrirani u druge aplikacije. Ova je struktura posebno dizajnirana za integraciju podaci aktualan i dinamičan te bi bio vjerojatan kandidat za podršku analitici u stvarnom vremenu, kao što je pružanje uslužnim agentima klijenti kupčeve trenutne informacije o prodaji izvlačenjem informacija o trendu prodaje iz samog skladišta. Druga struktura prikazana na slici 1.1 je formalno stanje za dw. Ne samo da je ovo mjesto za izvršenje potrebne integracije, kvalitete podaci, i transformacije podaci dolaznog skladišta, ali također je pouzdano i privremeno skladište za podaci replike koje bi se mogle koristiti u analizama u stvarnom vremenu. Ako odlučite koristiti ODS ili prostor za postavljanje, jedan je od najboljih alata za naseljavanje ovih struktura podaci korištenje različitih operativnih izvora je DB2-ov heterogeni distribuirani upit. Ovu sposobnost isporučuje opcijska DB2 značajka koja se zove DB2 Relational Connect (samo upit) i kroz DB2 DataJoiner (odvojeni proizvod koji dostavlja mogućnost upita, umetanja, ažuriranja i brisanja heterogenim distribuiranim RDBMS-ovima).

Ova tehnologija omogućuje arhitektima da podaci vezati podaci proizvodnja s analitičkim procesima. Ne samo da se tehnologija može prilagoditi gotovo svim zahtjevima replikacije koji bi se mogli pojaviti s analitikom u stvarnom vremenu, već se također može povezati s širokim rasponom baza podaci najpopularniji, uključujući DB2, Oracle, Sybase, SQL Server, Informix i druge. DB2 DataJoiner se može koristiti za popunjavanje strukture podaci formalno kao ODS ili čak stalna tablica zastupljena u skladištu dizajnirana za brzi oporavak trenutnih ažuriranja ili za prodaju. Naravno, te iste strukture podaci može se popuniti pomoću

još jedna važna tehnologija dizajnirana za replikaciju podaci, IBM DataPropagator Relational. (DataPropagator je zaseban proizvod za središnje sustave. DB2 UNIX, Linux, Windows i OS/2 uključuju usluge replikacije podataka podaci kao standardna značajka).
Još jedan način kretanja podaci oko poduzeća je integrator poslovnih aplikacija inače poznat kao broker poruka. Ova jedinstvena tehnologija omogućuje neusporedivu kontrolu za ciljanje i kretanje podaci oko tvrtke. IBM ima najčešće korištenog brokera poruka, MQSeries, ili varijaciju proizvoda koja uključuje zahtjeve e-commerce, IBM WebSphere MQ.
Za više rasprava o tome kako iskoristiti MQ za podršku skladišnog i BI okruženja, posjetite web stranica knjige. Za sada je dovoljno reći da je ova tehnologija izvrsno sredstvo za snimanje i transformaciju (pomoću MQSeries Integratora) podaci centrirani (ciljani) operateri angažirani za BI rješenja. MQ tehnologija je integrirana i upakirana u UDB V8, što znači da se redovima poruka sada može upravljati kao da su DB2 tablice. Koncept zavarivanja poruka u redu čekanja i svemira baza podataka relacijski se usmjerava prema snažnom okruženju isporuke podaci.

Nulta latencija Nulta latencija

Konačni strateški cilj za IBM je analiza bez kašnjenja. Kako definira
Gartner, BI sustav mora moći zaključiti, asimilirati i pružiti informacije analitičarima na zahtjev. Izazov je, naravno, kako miješati podaci trenutno i u stvarnom vremenu s potrebnim povijesnim informacijama, kao što su i podaci povezani obrazac/trend ili izdvojeno razumijevanje, kao što je profiliranje kupaca.

Takve informacije uključuju, na primjer, identifikaciju klijenti visokog ili niskog rizika ili koji proizvodi i klijenti najvjerojatnije će kupiti ako već imaju sir u svojim kolicima.

Postizanje nulte latencije zapravo ovisi o dva temeljna mehanizma:

Potpuno sjedinjenje podaci koji se analiziraju utvrđenim tehnikama i alatima koje je izradio BI
Sustav isporuke od podaci učinkovit kako bi se osiguralo da je analitika u stvarnom vremenu uistinu dostupna.Ovi preduvjeti za nultu latenciju ne razlikuju se od dva cilja koja je postavio IBM i koji su gore opisani. Blisko spajanje podaci To je dio IBM-ovog programa besprijekorne integracije. I stvoriti sustav isporuke podaci učinkovit u potpunosti ovisi o dostupnoj tehnologiji koja pojednostavljuje proces isporuke podaci. Kao rezultat toga, dva od tri IBM-ova cilja su kritična za ostvarenje trećeg. IBM svjesno razvija svoju tehnologiju kako bi osigurao da nulta latencija bude stvarnost za napore u skladištu. Sažetak / Sinteza BI organizacija pruža plan puta za izgradnju vašeg okruženja
iterativno. Mora se prilagoditi potrebama vašeg poslovanja, sadašnjim i budućim. Bez široke arhitektonske vizije, skladišne iteracije su nešto više od nasumičnih implementacija središnjeg skladišta koje malo doprinose stvaranju širokog, informativnog poduzeća. Prva prepreka voditeljima projekata je kako opravdati ulaganja potrebna za razvoj BI organizacije. Dok je izračun ROI-a ostao glavno uporište implementacije skladišta, sve ga je teže točno predvidjeti. To je dovelo do drugih metoda za određivanje vrijedite li svoj novac. Vrijednost ulaganja2 (VOI), na primjer, promovira se kao rješenje. To je dužnost arhitekata podaci a planeri projekata namjerno stvaraju i daju informacije udrugama korisnika, a ne samo da im pružaju uslugu podaci. Postoji ogromna razlika između to dvoje. Informacije su nešto što čini razliku u procesima donošenja odluka i učinkovitosti; relativno, i podaci oni su građevni blokovi za izvođenje tih informacija.

Čak i ako sam kritičan prema izvoru podaci Kako bi odgovorilo na poslovne zahtjeve, BI okruženje trebalo bi imati veću ulogu u stvaranju informacijskog sadržaja. Moramo poduzeti dodatne korake da očistimo, integriramo, transformiramo ili na drugi način stvorimo informacijski sadržaj prema kojem korisnici mogu djelovati, a zatim moramo osigurati da se te radnje i odluke, gdje su razumne, odražavaju u BI okruženju. Ako prebacimo skladište da služi samo na podaci, osigurano je da će udruge korisnika stvoriti informacijski sadržaj potreban za poduzimanje radnji. To osigurava da će njihova zajednica moći donositi bolje odluke, ali tvrtka pati od nedostatka znanja koje su koristili. Dato da arhitekti i planeri projekata pokreću specifične projekte u BI okruženju, oni ostaju odgovorni poduzeću kao cjelini. Jednostavan primjer ove dvostrane karakteristike BI iteracija nalazi se u izvoru podaci. Svi podaci primljeni za specifične poslovne zahtjeve moraju biti popunjeni u prvom atomskom sloju. Ovo osigurava razvoj poslovnog informacijskog sredstva, kao i upravljanje, rješavanje specifičnih zahtjeva korisnika definiranih u iteraciji.

Što je skladište podataka?

Skladište podataka srce je arhitekture informacijskih sustava od 1990. godine i podržava informacijske procese nudeći čvrstu integriranu platformu podaci povijesni podaci uzeti kao osnova za naknadne analize. THE skladište podataka nude jednostavnost integracije u svijetu nekompatibilnih aplikacijskih sustava. Skladište podataka to se razvilo u trend. Skladište podataka organizirati i pohraniti i podaci nužna za informacijske i analitičke procese temeljene na dugoj povijesnoj vremenskoj perspektivi. Sve to podrazumijeva značajan i stalan angažman u izgradnji i održavanju skladište podataka.

Pa što je a skladište podataka? skladište podataka I:

▪ predmetno orijentiran
▪ integrirani sustav
▪ varijantno vrijeme
▪ neisparljiv (ne briše)

zbirka od podaci koristi se za podršku menadžerskim odlukama u provedbi procesa.
I podaci umetnut u skladište podataka u većini slučajeva proizlaze iz operativnih okruženja. The skladište podataka stvara ga jedinica za pohranu, fizički odvojena od ostatka sustava koji sadrži podaci prethodno transformiran aplikacijama koje rade na informacijama koje proizlaze iz operativnog okruženja.

Doslovna definicija a skladište podataka zaslužuje detaljno objašnjenje jer postoje važni motivi i temeljna značenja koja opisuju karakteristike skladišta.

PREDMETNA ORIJENTACIJA ORIJENTACIJA TEMATSKI

Prva karakteristika a skladište podataka jest da je orijentiran na glavne igrače u tvrtki. Vodič kroz suđenja podaci u suprotnosti je s klasičnijom metodom koja uključuje usmjerenost aplikacija prema procesima i funkcijama, metodom koju uglavnom dijeli većina manje novijih sustava upravljanja.

Operativni svijet osmišljen je oko aplikacija i funkcija kao što su zajmovi, štednja, bankovne kartice i povjerenje za financijsku instituciju. Svijet dw-a organiziran je oko glavnih subjekata kao što su kupac, prodavač, proizvod i aktivnost. Usklađivanje oko tema utječe na dizajn i implementaciju podaci pronađeno u dw. Što je još važnije, glavna tema utječe na najvažniji dio ključne strukture.

Na svijet aplikacije utječu i dizajn baze podataka i dizajn procesa. Svijet dw-a fokusiran je isključivo na modeling podaci i na dizajnu baza podataka. Dizajn procesa (u svom klasičnom obliku) nije dio dw okruženja.

Razlike između izbora primjene procesa/funkcije i izbora predmeta također se otkrivaju kao razlike u sadržaju podaci na detaljnoj razini. THE podaci od dw ne uključuju i podaci koji se neće koristiti za DSS proces dok aplikacije

operativno orijentiran podaci sadržavati i podaci kako bi se odmah zadovoljili funkcionalni zahtjevi/zahtjevi za obradu koji mogu, ali i ne moraju imati nikakvu korist za DSS analitičar.
Drugi važan način na koji operativno orijentirane aplikacije podaci razlikovati se od podaci dw je u dei izvješćima podaci. Ja podaci operacije održavaju kontinuirani odnos između dvije ili više tablica na temelju poslovnog pravila koje je aktivno. THE podaci dw prelaze spektar vremena i odnosi koji se nalaze u dw-u su brojni. Mnoga pravila trgovanja (i sukladno tome, mnogi odnosi između podaci ) zastupljeni su u skladištu podaci između dva ili više stolova.

(Za detaljno objašnjenje odnosa između podaci se obrađuju u DW-u, upućujemo na Tech Topic o tom pitanju.)
Ni iz jedne druge perspektive osim one temeljne razlike između izbora funkcionalne/procesne aplikacije i izbor predmeta, postoji li veća razlika između operativnih sustava i podaci i DW.

INTEGRACIJA INTEGRACIJA

Najvažniji aspekt dw okruženja je da i podaci koji se nalaze unutar dw-a lako se integriraju. STALNO. BEZ IZUZETKA. Sama bit dw okruženja je da i podaci sadržane unutar granica skladišta integrirane su.

Integracija se otkriva na mnogo različitih načina – u dosljednim identificiranim konvencijama, u dosljednim mjerenjima varijabli, u dosljednim kodiranim strukturama, u fizičkim atributima podaci dosljedan, i tako dalje.

Tijekom godina dizajneri različitih aplikacija donijeli su mnoge odluke o tome kako bi se aplikacija trebala razvijati. Stil i individualizirane dizajnerske odluke dizajnerskih aplikacija otkrivaju se na stotinu načina: u razlikama u kodiranju, ključnoj strukturi, fizičkim karakteristikama, identifikacijskim konvencijama itd. Kolektivna sposobnost mnogih dizajnera aplikacija da stvaraju nedosljedne aplikacije je legendarna. Slika 3 prikazuje neke od najvažnijih razlika u načinima na koje su aplikacije dizajnirane.

Kodiranje: Kodiranje:

Dizajneri aplikacija odabrali su kodiranje polja – spol – na različite načine. Dizajner predstavlja seks na "m" i "ž". Drugi dizajner predstavlja spol kao "1" i "0". Drugi dizajner seks predstavlja kao "x" i "y". Drugi dizajner predstavlja spol kao "muški" i "ženski". Nije bitno kako seks dolazi u DW. "M" i "F" su vjerojatno dobri kao i cijela predstava.

Ono što je bitno je da iz kojeg god porijekla spolno polje potječe, to polje stiže u DW u dosljednom integriranom stanju. Posljedično, kada se polje učita u DW iz aplikacije u kojoj je predstavljeno u formatu "M" i "F", podaci moraju se pretvoriti u DW format.

Mjerenje atributa: Mjerenje Atributi:

Dizajneri aplikacija odlučili su mjeriti cjevovod na različite načine tijekom godina. Dizajner pohranjuje podaci cjevovoda u centimetrima. Drugi dizajner aplikacija pohranjuje podaci cjevovoda u smislu inča. Drugi dizajner aplikacija pohranjuje podaci cjevovoda u milijunima kubičnih stopa u sekundi. A drugi dizajner pohranjuje informacije o cjevovodu u smislu metara. Bez obzira na izvor, kada informacije o cjevovodu stignu u DW, moraju se mjeriti na isti način.

Prema pokazateljima na slici 3, pitanja integracije utječu na gotovo svaki aspekt projekta – fizičke karakteristike podaci, dilema postojanja više od jednog izvora podaci, pitanje nedosljednih identificiranih uzoraka, formata podaci nedosljedan, i tako dalje.

Bez obzira na temu dizajna, rezultat je isti – tj podaci moraju biti pohranjeni u DW na jedinstven i globalno prihvatljiv način čak i kada ih temeljni operativni sustavi pohranjuju drugačije podaci.

Kada analitičar DSS-a pogleda DW, cilj analitičara trebao bi biti iskorištavanje podaci koji se nalaze u skladištu,

a ne na pitanje o vjerodostojnosti ili dosljednosti podaci.

VREMENSKA VARIJANCA

sve podaci u DW-u su točni do neke točke u vremenu. Ova osnovna karakteristika podaci u DW-u se jako razlikuje od onih podaci naći u radnom okruženju. THE podaci radnog okruženja su precizni kao u trenutku pristupa. Drugim riječima, u radnom okruženju kada se pristupa pogonu podaci, očekuje se da će odražavati točne vrijednosti kao u trenutku pristupa. Zato što ja podaci u DW-u su precizni kao u nekom trenutku u vremenu (tj. ne "upravo sada"), rečeno je da ja podaci koji se nalaze u DW-u su "vremenska varijanca".
Vremenska varijanca od podaci DW se spominje na brojne načine.
Najjednostavniji način je da i podaci od DW predstavljaju podaci u dugom vremenskom horizontu – pet do deset godina. Vremenski horizont predstavljen za radnu okolinu mnogo je kraći od današnjih trenutnih vrijednosti do šezdeset devedeset
Aplikacije koje moraju dobro funkcionirati i moraju biti dostupne za obradu transakcija moraju nositi minimalnu količinu podaci ako dopuštaju bilo kakav stupanj fleksibilnosti. Dakle, operativne aplikacije imaju kratak vremenski horizont, poput teme dizajna audio aplikacije.
Drugi način na koji se 'vremenska varijanca' pojavljuje u DW-u je u strukturi ključa. Svaka ključna struktura u DW-u sadrži, implicitno ili eksplicitno, vremenski element, kao što je dan, tjedan, mjesec itd. Vremenski element je gotovo uvijek na dnu ulančanog ključa koji se nalazi u DW-u. U tim će prilikama element vremena postojati implicitno, kao što je slučaj kada se cijela datoteka duplicira na kraju mjeseca ili tromjesečja.
Treći način na koji se prikazuje vremenska varijanca je da i podaci DW-a, nakon što je ispravno registriran, ne može se ažurirati. THE podaci DW-a su, za sve praktične svrhe, dugačak niz snimaka. Naravno, ako su snimke krivo snimljene, snimke se mogu modificirati. Ali pod pretpostavkom da su snimke ispravno snimljene, one se ne mijenjaju čim se naprave. U nekim

U nekim slučajevima može biti neetično ili čak nevažeće da se snimke u DW-u mijenjaju. THE podaci operativni, budući da su precizni u trenutku pristupa, mogu se ažurirati prema potrebi.

NEISPALJIV

Četvrta važna karakteristika DW-a je da je nepromjenjiv.
Ažuriranja, umetanja, brisanja i izmjene redovito se vrše u operativnim okruženjima na bazi zapisa po zapis. Ali osnovna manipulacija na podaci koji su potrebni u DW-u mnogo je jednostavniji. Postoje samo dvije vrste operacija koje se događaju u DW-u – početno učitavanje podaci i pristup podaci. Nema ažuriranja za podaci (u općenitom smislu ažuriranja) u DW kao normalna operacija obrade. Postoje neke vrlo snažne posljedice ove osnovne razlike između operativne obrade i DW obrade. Na razini dizajna, potreba da budete oprezni u vezi s nepravilnim ažuriranjem nije faktor u DW-u, budući da ažuriranje podaci se ne provodi. To znači da se na razini fizičkog dizajna može uzeti sloboda za optimizaciju pristupa podaci, posebice u bavljenju temama fizičke normalizacije i denormalizacije. Još jedna posljedica jednostavnosti DW operacija je temeljna tehnologija koja se koristi za pokretanje DW okruženja. Potreba za podrškom inline ažuriranja zapis po zapis (kao što je često slučaj s operativnom obradom) zahtijeva da tehnologija ima vrlo složenu osnovu ispod prividne jednostavnosti.
Tehnologija koja podržava sigurnosno kopiranje i oporavak, transakcije i integritet podaci a otkrivanje i otklanjanje stanja zastoja prilično je složeno i nije potrebno za DW obradu. Karakteristike DW-a, orijentacija dizajna, integracija podaci unutar DW-a, vremenska varijanca i jednostavnost upravljanja podaci, sve vodi u okruženje koje se jako, jako razlikuje od klasičnog operativnog okruženja. Izvor gotovo svih podaci DW su radna okolina. Primamljivo je pomisliti da postoji velika redundantnost podaci između dvije sredine.
Zapravo, prvi dojam koji mnogi ljudi imaju je velika suvišnost podaci između radnog okruženja i radnog okruženja

DW. Takvo tumačenje je površno i pokazuje nerazumijevanje onoga što se događa u DW-u.
Zapravo postoji minimum redundantnosti podaci između radnog okruženja i i podaci od DW-a. Razmotrite sljedeće: I podaci filtriraju se Dato koji prelazi iz radnog okruženja u DW okruženje. Puno podaci nikada ne izlaze izvan radnog okruženja. Osim što ja podaci koji su potrebni za DSS obradu nalaze svoj smjer u okolini

▪ vremenski horizont podaci vrlo je različita od jedne sredine do druge. THE podaci u operativnom okruženju su vrlo cool. THE podaci u DW-u su puno stariji. Samo iz perspektive vremenskog horizonta, vrlo je malo preklapanja između operativnog okruženja i DW-a.

▪ DW sadrži podaci sažetak koji se nikada ne nalaze u okruženju

▪ Ja podaci prolaze temeljnu transformaciju dok prelaze na Slika 3 ilustrira da većina podaci su značajno izmijenjeni pod uvjetom da su odabrani i premješteni u DW. Drugim riječima, većina podaci fizički je i radikalno promijenjen dok se premješta u DW. S gledišta integracije oni nisu isti podaci koji se nalaze u radnom okruženju. U svjetlu ovih čimbenika, redundantnost podaci između dva okruženja je rijedak događaj, koji dovodi do manje od 1% redundancije između dva okruženja. STRUKTURA SKLADIŠTA DW imaju posebnu strukturu. Postoje različite razine sažetka i detalja koji razgraničavaju DW-ove.
Različite komponente DW-a su:

Metadata
Dati trenutni detalji
Dati starih detalja
Dati malo sažeto
Dati visoko sažeto

Daleko je glavna briga za podaci trenutni detalji. To je glavna briga jer:

I podaci trenutni detalji odražavaju najnovije događaje, koji su uvijek od velikog interesa i
i podaci trenutnih detalja je voluminozan jer je pohranjen na najnižoj razini granularnosti i
i podaci Aktualni detalji su gotovo uvijek pohranjeni na diskovnoj memoriji, kojoj se brzo pristupa, ali je skupa i složena za korištenje podaci detalja što su stariji podaci koji su pohranjeni u nekoj memoriji masa. Pristupa mu se sporadično i pohranjuje se na razini pojedinosti kompatibilnoj s podaci trenutni detalji. Iako nije obavezno pohraniti na alternativni medij za pohranu, zbog velikog volumena podaci u kombinaciji sa sporadičnim pristupom podaci, memorijska podrška za podaci stariji detaljni podaci obično nisu pohranjeni na disku. THE podaci sažeti neznatno su podaci koji su destilirani od pronađene niske razine detalja do trenutne razine detalja. Ova razina DW-a gotovo je uvijek pohranjena na disku. Problemi projektiranja koji se javljaju pred arhitektom podaci u konstrukciji ove razine DW-a su:

Koja je jedinica vremena gornji sažetak
Koji sadržaj, atributi će malo sažeti sadržaj podaci Sljedeća razina podaci koji se nalazi u DW-u je onaj od podaci visoko sažeto. THE podaci visoko sažeti su kompaktni i lako dostupni. THE podaci visoko sažeti ponekad se nalaze u DW okruženju, au drugim slučajevima i podaci visoko sažeti nalaze se izvan neposrednih zidova tehnologije u kojoj se nalazi DW. (u svakom slučaju, tj podaci visoko sažeti dio su DW-a bez obzira gdje i podaci su fizički smješteni). Posljednja komponenta DW-a su metapodaci. U mnogim aspektima metapodaci se nalaze u drugačijoj dimenziji od ostalih podaci DW-a jer metapodaci ne sadrže nikakve Dato preuzeti izravno iz radnog okruženja. Metapodaci imaju posebnu i vrlo važnu ulogu u DW-u. Metapodaci se koriste kao:

imenik koji pomaže DSS analitičaru identificirati sadržaj DW-a,
vodič za mapiranje podaci kako ja podaci transformirani su iz operativnog okruženja u DW okruženje,
vodič za algoritme koji se koriste za sažimanje između podaci trenutnih detalja i i podaci malo sažeto, tj podaci sažeto, metapodaci igraju mnogo veću ulogu u DW okruženju nego što su ikada imali u operativnom okruženju STARI DETALJ SPREMNI MEDIJ Za pohranjivanje te vrste može se koristiti magnetska traka podaci. U stvari postoji širok izbor medija za pohranjivanje koje bi trebalo uzeti u obzir za staru pohranu podaci detalja. Ovisno o volumenu podaci, učestalost pristupa, cijenu alata i vrstu pristupa, sasvim je vjerojatno da će drugi alati trebati staru razinu detalja u DW-u. TOK PODATAKA Postoji normalan i predvidljiv tok podaci unutar DW-a.
I podaci unesite DW iz radnog okruženja. (NAPOMENA: Postoje neke vrlo zanimljive iznimke od ovog pravila. Međutim, gotovo sve podaci unesite DW iz radnog okruženja). Dato da ja podaci unesete DW iz operativnog okruženja, transformira se kao što je prethodno opisano. Pod uvjetom ulaska u DW, tj podaci unesite trenutnu razinu detalja, kao što je prikazano. Tamo se nalazi i koristi se dok se ne dogodi jedan od tri događaja:

je pročišćena,
je sažet, i/ili ▪je Zastarjeli proces unutar DW-a se pomiče i podaci trenutni detalji a podaci starih detalja, na temelju starosti podaci. Postupak

sažetak koristi detalje podaci izračunati i podaci blago sažete i visoko sažete razine podaci. Postoje neke iznimke od prikazanog tijeka (o kojima ćemo raspravljati kasnije). Međutim, obično, za veliku većinu podaci pronađeno unutar DW-a, tok podaci kako je prikazano.

KORIŠTENJE SKLADIŠTA PODATAKA

Ne iznenađuju različite razine podaci unutar DW-a ne dobivaju različite razine korištenja. U pravilu, što je viša razina sažimanja, to je više i podaci koriste se.
Mnoge se upotrebe javljaju u podaci visoko sažeti, dok su stari podaci detalja se gotovo nikad ne koriste. Postoji dobar razlog za prelazak organizacije na paradigmu korištenja resursa. Više sažeto i podaci, to je brže i učinkovitije doći do podaci. Ako a dućan otkrije da obavlja mnoge procese na razini detalja DW-a, tada se troši odgovarajuća velika količina strojnih resursa. U svačijem je interesu obraditi što je moguće višu razinu sažimanja.

Za mnoge trgovine koristio se DSS analitičar u okruženju prije DW-a podaci na razini detalja. U mnogočemu dolazak u podaci detaljni sažetak nalikuje sigurnosnom pokrivaču, čak i kada su dostupne druge razine sažetka. Jedna od djelatnosti arh podaci je odviknuti korisnika DSS-a od stalne uporabe podaci na najnižoj razini detalja. Dvije su motivacije dostupne arhitektu podaci:

instaliranjem sustava povrata plaćanja, gdje krajnji korisnik plaća potrošene resurse e
koji pokazuju da se vrlo dobro vrijeme odziva može postići kada se ponašanje s i podaci je na visokoj razini sažimanja, dok slabo vrijeme odgovora dolazi od ponašanja podaci na niskoj razini OSTALI RAZMATRANJA Postoje i neka druga razmatranja izgradnje i upravljanja DW-om.
Prvo razmatranje odnosi se na indekse. THE podaci na višim razinama sažimanja mogu se slobodno indeksirati, dok i podaci

na nižim razinama detalja toliko su glomazni da se mogu štedljivo indeksirati. Iz iste lekseme, tj podaci na visokim razinama detalja može se relativno lako restrukturirati, dok je volumen od podaci na nižim razinama toliko je velik da i podaci ne mogu se lako obnoviti. Shodno tome, model od podaci a formalni rad obavljen dizajnom postavlja temelj za DW koji se primjenjuje gotovo isključivo na trenutnoj razini detalja. Drugim riječima, manekenske aktivnosti podaci ne primjenjuju se na razine sažimanja, u gotovo svakom slučaju. Drugo strukturalno razmatranje je podjela na podaci autor DW.

Podjelu je moguće izvesti na dvije razine – na razini dbms i na razini aplikacije. U podjeli na razini dbms, dbms je obaviješten o podjelama i sukladno tome ih kontrolira. U slučaju podjele na razini aplikacije, samo je programer obaviješten o podjelama i odgovornost za njihovu administraciju prepuštena je njemu

Ispod razine dbms, mnogo se posla obavlja automatski. Mnogo je nefleksibilnosti povezano s administracijom automatske podjele. U slučaju podjele na razini primjene podaci del skladište podataka, puno posla opterećuje programera, ali krajnji rezultat je fleksibilnost u administraciji podaci u skladište podataka

DRUGE ANOMALIJE

Dok komponente od skladište podataka Djeluju kao što je opisano za gotovo sve podaci, postoje neke korisne iznimke o kojima treba razgovarati. Izuzetak je onaj od podaci javni zbirni podaci. Ovi su podaci sažetaka koji su izračunati iz skladište podataka ali ih društvo koristi. THE podaci Javni sažeci pohranjuju se i njima se upravlja u skladište podataka, iako su kao što je prethodno spomenuto izračunati. Računovođe rade na izradi takvih kvartala podaci kao što su prihodi, tromjesečni troškovi, tromjesečna dobit i tako dalje. Posao koji obavljaju računovođe je vanjski skladište podataka. Međutim, i podaci koriste se “interno” unutar tvrtke – od marketing, prodaja itd. Druga anomalija, o kojoj nećemo raspravljati, je ona od podaci vanjski.

Još jedna izuzetna vrsta podaci koji se može naći u a skladište podataka je onaj stalnih detaljnih podataka. To uzrokuje potrebu za trajnim pohranjivanjem podaci na detaljnoj razini iz etičkih ili pravnih razloga. Ako tvrtka izlaže svoje radnike opasnim tvarima, postoji potreba za tim podaci detaljan i trajan. Ako tvrtka proizvodi proizvod koji uključuje javnu sigurnost, kao što su dijelovi aviona, postoji potreba za tim podaci stalni detalji, kao i ako tvrtka sklapa opasne ugovore.

Tvrtka si ne može priuštiti zanemarivanje detalja jer u sljedećih nekoliko godina, u slučaju tužbe, opoziva, spornog građevinskog nedostatka itd. izloženost tvrtke mogla bi biti velika. Kao rezultat toga postoji jedinstvena vrsta podaci poznati kao trajni detaljni podaci.

SAŽETAK

Un skladište podataka je objektno orijentirana, integrirana, vremenska varijanta, zbirka podaci postojan za podršku potrebama donošenja odluka u upravi. Svaka od istaknutih funkcija a skladište podataka ima svoje implikacije. Osim toga, postoje četiri razine podaci del skladište podataka:

Stari detalj
Trenutni detalj
Dati malo rekapitulirano
Dati visoko sažeti metapodaci također su važan dio skladište podataka. SAŽETAK Koncept skladištenja podaci Nedavno je dobio mnogo pozornosti i postao je trend 90-ih. To je zbog sposobnosti skladište podataka prevladati ograničenja sustava podrške administraciji kao što su sustavi podrške odlučivanju (DSS) i izvršni informacijski sustavi (EIS). Čak i ako koncept od skladište podataka izgleda obećavajuće, implementirati i skladište podataka može biti problematično zbog procesa skladištenja velikih razmjera. Unatoč složenosti skladišnih projekata podaci, mnogi dobavljači i konzultanti koji zalihe podaci tvrde da je skladištenje podaci struja ne pravi probleme. Međutim, na početku ovog istraživačkog projekta gotovo da nije bilo neovisnog, rigoroznog i sustavnog istraživanja. Kao rezultat toga, teško je reći što se zapravo događa u industriji kada se izgrade skladište podataka. Ova studija istraživala je praksu skladištenja podaci suvremenika čiji je cilj razviti bolje razumijevanje australske prakse. Pregled literature pružio je kontekst i temelj za empirijsko istraživanje. Postoje brojni nalazi iz ovog istraživanja. Prvo, ova je studija otkrila aktivnosti koje su se pojavile tijekom razvoja skladište podataka. U mnogim područjima, tj podaci okupljeni su potvrdili praksu opisanu u literaturi. Drugo, pitanja i problemi koji mogu utjecati na razvoj skladište podataka identificirani su ovom studijom. Konačno, koristi koje su stekle australske organizacije povezane s korištenjem skladište podataka su otkriveni.

Poglavlje 1

Kontekst istraživanja

Koncept skladištenja podataka široko je izložen i postao je trend u nastajanju 90-ih (McFadden 1996, TDWI 1996, Shah i Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman i Oates 2000). To se može vidjeti iz sve većeg broja članaka o skladištenju podataka u stručnim publikacijama (Little i Gibson 1999). Mnogi članci (vidi, na primjer, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett i King 1996, Graham i sur. 1996, Sakaguchi i Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, McCarthy 1997, O 'Donnell 1997, Edwards 1998, TDWI 1999) izvijestili su o značajnim prednostima organizacija koje provode i skladište podataka. Svoju su teoriju poduprli anegdotskim dokazima o uspješnim implementacijama, brojkama visokog povrata ulaganja (ROI) i, također, davanjem smjernica ili metodologija za razvoj skladište podataka

(Shanks i dr. 1997., Seddon i Benjamin 1998., Little i Gibson 1999.). U ekstremnom slučaju, Graham et al. (1996) izvijestili su o prosječnom povratu trogodišnje investicije od 401%.

Velik dio trenutne literature, međutim, previdio je složenost uključenu u poduzimanje takvih projekata. Projekti od skladište podataka obično su složeni i velikih razmjera i stoga imaju veliku vjerojatnost neuspjeha ako nisu pažljivo kontrolirani (Shah i Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs i Clymer 1998, Rao 1998). Za njihovu izgradnju potrebne su ogromne količine ljudskih i financijskih resursa, vremena i truda (Hill 1998., Crofts 1998.). Tipično potrebno vrijeme i financijska sredstva su otprilike dvije godine odnosno dva do tri milijuna dolara (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Ovo vrijeme i financijska sredstva su potrebna za kontrolu i konsolidaciju mnogih različitih aspekata skladištenja podataka (Cafasso 1995, Hill 1998). Uz razmatranja hardvera i softvera, druge funkcije, koje se razlikuju od ekstrakcije podaci na procese učitavanja podaci, kapacitet memorije za upravljanje ažuriranjima i meta podaci za obuku korisnika, mora se uzeti u obzir.

U vrijeme kada je ovaj istraživački projekt započeo, bilo je vrlo malo akademskih istraživanja koja su se provodila u području skladištenja podataka, osobito u Australiji. To je bilo vidljivo iz nedostatka objavljenih članaka o skladištenju podataka iz časopisa ili drugih akademskih spisa tog vremena. Mnogi od dostupnih akademskih spisa opisali su iskustvo SAD-a. Nedostatak akademskog istraživanja u području skladištenja podataka izazvao je pozive na rigorozna istraživanja i empirijske studije (McFadden 1996, Shanks et al. 1997, Little i Gibson 1999). Konkretno, istraživačke studije o procesu provedbe skladište podataka potrebno provesti kako bi se proširilo opće znanje o provedbi skladište podataka i poslužit će kao osnova za buduću istraživačku studiju (Shanks et al. 1997, Little i Gibson 1999).

Svrha ove studije je stoga proučiti što se zapravo događa kada organizacije provode i koriste i skladište podataka u Australiji. Konkretno, ova će studija uključivati analizu cijelog procesa razvoja a skladište podataka, počevši od inicijacije i planiranja preko dizajna i implementacije te naknadne upotrebe unutar australskih organizacija. Osim toga, studija će također doprinijeti trenutnoj praksi utvrđivanjem područja u kojima se praksa može dodatno poboljšati, a neučinkovitosti i rizici svesti na minimum ili izbjeći. Nadalje, poslužit će kao osnova za druge studije o skladište podataka u Australiji i popunit će prazninu koja trenutno postoji u literaturi.

Istrazivacka pitanja

Cilj ovog istraživanja je proučavanje aktivnosti uključenih u provedbu skladište podataka i njihovo korištenje od strane australskih organizacija. Osobito se proučavaju elementi u vezi s planiranjem projekta, razvojem, radom, uporabom i uključenim rizicima. Dakle, pitanje ovog istraživanja je:

“Kakva je dosadašnja praksa skladište podataka u Australiji?"

Da bi se učinkovito odgovorilo na ovo pitanje, potreban je niz pomoćnih istraživačkih pitanja. Konkretno, iz literature, koja je predstavljena u 2. poglavlju, identificirana su tri potpitanja za usmjeravanje ovog istraživačkog projekta: Kako su skladište podataka iz australskih organizacija? Na koje ste probleme naišli?

Koje su iskusne prednosti?
U odgovorima na ova pitanja korišten je eksplorativni istraživački dizajn koji je koristio anketu. Kao istraživačka studija, odgovori na gornja pitanja nisu potpuni (Shanks et al. 1993., Denscombe 1998.). U ovom slučaju potrebna je triangulacija kako bi se poboljšali odgovori na ova pitanja. Međutim, istraživanje će pružiti čvrstu osnovu za budući rad na ispitivanju ovih pitanja. Detaljna rasprava o obrazloženju i dizajnu metode istraživanja prikazana je u 3. poglavlju.

Struktura istraživačkog projekta

Ovaj istraživački projekt podijeljen je u dva dijela: kontekstualnu studiju koncepta skladištenja podataka i empirijsko istraživanje (vidi sliku 1.1), od kojih se svaki raspravlja u nastavku.

Dio I: Kontekstualna studija

Prvi dio istraživanja sastojao se od pregleda trenutne literature o različitim vrstama skladištenja podataka uključujući sustave za podršku odlučivanju (DSS), izvršne informacijske sustave (EIS), studije slučaja skladište podataka i koncepte skladište podataka. Nadalje, rezultati foruma skladište podataka i skupine stručnjaka i praktičara za sastanke koje je vodio istraživački tim Monash DSS, pridonijeli su ovoj fazi studije koja je imala za cilj stjecanje uvida u praksu skladište podataka te identificirati rizike uključene u njihovo usvajanje. Tijekom ovog razdoblja kontekstualnog proučavanja uspostavljeno je razumijevanje problematičnog područja kako bi se osiguralo temeljno znanje za kasnija empirijska istraživanja. Međutim, to je bio stalan proces tijekom provođenja istraživačke studije.

Dio II: Empirijsko istraživanje

Relativno novi koncept skladištenja podataka, posebno u Australiji, stvorio je potrebu za anketom kako bi se dobila široka slika korisničkog iskustva. Ovaj dio je proveden nakon što je problemsko područje utvrđeno opsežnim pregledom literature. Koncept skladištenja podataka formiran tijekom faze kontekstualne studije korišten je kao input za početni upitnik ove studije. Nakon toga ispitan je upitnik. Vi ste stručnjaci za skladište podataka sudjelovao u testu. Svrha testiranja inicijalnog upitnika bila je provjera potpunosti i točnosti pitanja. Na temelju rezultata testiranja upitnik je modificiran te je izmijenjena verzija poslana sudionicima ankete. Vraćeni upitnici su zatim analizirani na i podaci u tablicama, dijagramima i drugim formatima. THE

rezultati analize podaci čine snimku prakse skladištenja podataka u Australiji.

PREGLED SKLADIŠTA PODATAKA

Koncept skladištenja podataka razvio se s poboljšanjima računalne tehnologije.
Usmjeren je na prevladavanje problema s kojima se suočavaju grupe za podršku aplikacijama kao što su Decision Support System (DSS) i Executive Information System (EIS).

U prošlosti je najveća prepreka ovim aplikacijama bila nemogućnost tih aplikacija da pruže a baza podataka potrebno za analizu.
To je uglavnom uzrokovano prirodom posla menadžmenta. Interesi menadžmenta poduzeća stalno variraju ovisno o području koje pokriva. Stoga i podaci osnovni za ove primjene moraju se moći brzo mijenjati ovisno o dijelu koji se tretira.
To znači da i podaci moraju biti dostupni u odgovarajućem obliku za tražene analize. Zapravo, grupama za podršku aplikacijama u prošlosti je bilo vrlo teško prikupljati i integrirati podaci iz složenih i raznolikih izvora.

Ostatak ovog odjeljka predstavlja pregled koncepta skladištenja podataka i raspravlja o tome kako skladište podataka može prevladati probleme grupa za podršku aplikacijama.
Izraz "Skladište podataka” popularizirao je William Inmon 1990. Njegova često citirana definicija vidi Skladište podataka kao zbirka podaci predmetno orijentirano, integrirano, postojano i promjenjivo tijekom vremena, kao podrška upravljačkim odlukama.

Koristeći ovu definiciju Inmon ističe da i podaci nastanjen u a skladište podataka moraju imati sljedeće 4 karakteristike:

▪ Orijentiran na predmet
▪ Integrirano
▪ Neisparljiv
▪ Promjenjiv tijekom vremena Pod subjektno orijentiranim Inmonom se podrazumijeva da i podaci u skladište podataka u najvećim organizacijskim područjima koja su bila

definiran u modelu podaci. Na primjer sve podaci u vezi i klijenti nalaze se u predmetnom području KUPCI. Isto tako sve podaci koji se odnose na proizvode sadržani su u predmetnom području PROIZVODI.

Integrirani Inmon znači da i podaci koji dolaze s različitih platformi, sustava i lokacija kombiniraju se i pohranjuju na jednom mjestu. Posljedično tome podaci slični se moraju transformirati u konzistentne formate kako bi se mogli lako dodavati i uspoređivati.
Na primjer, muški i ženski spol u jednom su sustavu predstavljeni slovima M i F, au drugom 1 i 0. Da biste ih ispravno integrirali, jedan ili oba formata moraju se transformirati tako da su dva formata ista. U ovom slučaju možemo promijeniti M u 1 i F u 0 ili obrnuto. Predmetno orijentirani i Integrirani ukazuju na to da skladište podataka je dizajniran da pruži funkcionalnu i transverzalnu viziju podaci od strane tvrtke.

Pod neisparljivim on misli da i podaci u skladište podataka ostati dosljedan i ažuriranje podaci nije potrebno. Umjesto toga, svaka promjena u podaci izvornici se dodaju u baza podataka del skladište podataka. To znači da povijesni dei podaci sadržano je u skladište podataka.

Za varijable s vremenom Inmon ukazuje da i podaci u skladište podataka uvijek sadrže ei indikatore vremena podaci normalno prelaze određeni vremenski horizont. Na primjer a
skladište podataka može sadržavati 5 godina povijesnih vrijednosti klijenti od 1993. do 1997. Dostupnost povijesti i vremenskog niza podaci omogućuje analizu trendova.

Un skladište podataka može skupiti svoje podaci iz OLTP sustava; iz izvora podaci izvan organizacije i/ili drugim posebnim projektima sustava za snimanje podaci.
I podaci ekstrakti mogu proći kroz proces čišćenja, u ovom slučaju i podaci se transformiraju i integriraju prije pohranjivanja u baza podataka del skladište podataka. Zatim, i podaci

stanovnici unutar baza podataka del skladište podataka dostupni su prijavama krajnjih korisnika i alatima za oporavak. Pomoću ovih alata krajnji korisnik može pristupiti integriranom prikazu organizacije podaci.

I podaci stanovnici unutar baza podataka del skladište podataka pohranjuju se i detaljno i sažeto.
Razina sažetka može ovisiti o prirodi podaci. Ja podaci detaljno se može sastojati od podaci struja e podaci povjesničari
I podaci tantijeme nisu uključene u skladište podataka sve dok ja podaci u skladište podataka su ažurirani.
Osim pohranjivanja i podaci sebe, a skladište podataka također može pohraniti različite vrste Dato naziva METADATA koji opisuju podaci stanovnici u njegovom baza podataka.
Postoje dvije vrste metapodataka: razvojni metapodaci i analitički metapodaci.
Razvojni metapodaci koriste se za upravljanje i automatizaciju procesa ekstrakcije, čišćenja, mapiranja i učitavanja podaci u skladište podataka.
Informacije sadržane u razvojnim metapodacima mogu sadržavati pojedinosti o operativnim sustavima, pojedinosti o elementima koje treba izdvojiti, model podaci del skladište podataka i poslovna pravila za pretvaranje podaci.

Druga vrsta metapodataka, poznata kao analitički metapodaci, omogućuje krajnjem korisniku istraživanje sadržaja skladište podataka pronaći podaci dostupni i njihovo značenje u jasnim, netehničkim terminima.

Stoga analitički metapodaci funkcioniraju kao most između skladište podataka i aplikacije za krajnje korisnike. Ovi metapodaci mogu sadržavati poslovni model, opise podaci koji odgovaraju poslovnom modelu, unaprijed definirani upiti i izvješća, informacije za korisnički pristup i indeks.

Metapodaci o analizi i razvoju moraju se kombinirati u jedinstveni integrirani metapodatak o sadržaju kako bi pravilno funkcionirao.

Nažalost, mnogi od postojećih alata imaju vlastite metapodatke i trenutno ne postoje postojeći standardi za to

dopustiti alatima za skladištenje podataka da integriraju ove metapodatke. Kako bi popravili ovu situaciju, mnogi trgovci glavnim alatima za skladištenje podataka osnovali su Vijeće za meta podatke koje je kasnije postalo Koalicija za meta podatke.

Cilj ove koalicije je izgraditi standardni skup metapodataka koji omogućuje različitim alatima za skladištenje podataka pretvaranje metapodataka
Njihovi napori rezultirali su rođenjem Specifikacije za razmjenu meta podataka (MDIS) koja će omogućiti razmjenu informacija između Microsoftovih arhiva i povezanih MDIS datoteka.

Postojanje od podaci i sažeto/indeksirano i detaljno daje korisniku mogućnost da izvede DRILL DROWN (bušenje) iz podaci indeksirane u detaljne i obrnuto. Postojanje podaci detaljne povijesti omogućuju stvaranje analiza trendova tijekom vremena. Osim toga, analitički metapodaci mogu se koristiti kao direktorij baza podataka del skladište podataka pomoći krajnjim korisnicima da lociraju podaci nužno.

U usporedbi s OLTP sustavima, s njihovom sposobnošću da podrže analizu podaci i izvješćivanje, skladište podataka smatra se prikladnijim sustavom za informacijske procese kao što su izrada upita i odgovaranje na njih te izrada izvješća. Sljedeći odjeljak detaljno će istaknuti razlike između ova dva sustava.

SKLADIŠTE PODATAKA PROTIV OLTP SUSTAVA

Mnogi informacijski sustavi unutar organizacija namijenjeni su za podršku svakodnevnim operacijama. Ovi sustavi poznati kao OLTP SUSTAVI, bilježe kontinuirano ažurirane dnevne transakcije.

I podaci unutar ovih sustava često se mijenjaju, dodaju ili brišu. Na primjer, adresa kupca se mijenja kako se on seli s jednog mjesta na drugo. U tom će slučaju nova adresa biti registrirana izmjenom adresnog polja baza podataka. Glavni cilj ovih sustava je smanjiti transakcijske troškove i istovremeno smanjiti vrijeme obrade. Primjeri OLTP sustava uključuju kritične radnje kao što su unos narudžbe, obračun plaća, faktura, proizvodnja, korisnička služba klijenti.

Za razliku od OLTP sustava, koji su stvoreni za procese temeljene na transakcijama i događajima, tj skladište podataka stvoreni su za pružanje podrške za procese temeljene na analitici podaci i procesi donošenja odluka.

To se obično postiže integracijom i podaci iz raznih OLTP i vanjskih sustava u jednom "spremniku" od podaci, kao što je objašnjeno u prethodnom odjeljku.

Monashov model procesa skladištenja podataka

Model procesa za skladište podataka Monash su razvili istraživači iz Monash DSS Research Group, a temelji se na literaturi skladište podataka, o iskustvu u podršci razvoju polja sustava, o razgovorima s dobavljačima aplikacija za korištenje na skladište podataka, o skupini stručnjaka za korištenje skladište podataka.

Faze su: Inicijacija, Planiranje, Razvoj, Operacije i Objašnjenja. Dijagram objašnjava iterativnu ili evolucijsku prirodu razvoja a skladište podataka proces pomoću dvosmjernih strelica postavljenih između različitih faza. U ovom kontekstu, "iterativno" i "evolutivno" znači da se u svakom koraku procesa provedbene aktivnosti uvijek mogu kretati unatrag prema prethodnoj fazi. To je zbog prirode projekta skladište podataka u kojem se u svakom trenutku pojavljuju dodatni zahtjevi krajnjeg korisnika. Na primjer, tijekom razvojne faze procesa skladište podataka, krajnji korisnik zatraži novu dimenziju ili predmetno područje, što nije bilo dio izvornog plana, to se mora dodati u sustav. To uzrokuje promjenu u projektu. Rezultat je da dizajnerski tim mora promijeniti zahtjeve do sada stvorenih dokumenata tijekom faze projektiranja. U mnogim slučajevima, trenutno stanje projekta mora se vratiti u fazu projektiranja gdje se novi zahtjev mora dodati i dokumentirati. Krajnjem korisniku mora biti omogućen uvid u pregledanu konkretnu dokumentaciju i promjene koje su napravljene u fazi razvoja. Na kraju ovog razvojnog ciklusa projekt mora dobiti izvrsnu povratnu informaciju od razvojnog i korisničkog tima. Povratne informacije se zatim ponovno koriste za poboljšanje budućeg projekta.

Planiranje kapaciteta
Dw imaju tendenciju da budu vrlo velike veličine i rastu vrlo brzo (Best 1995, Rudin 1997a) kao rezultat količine podaci povijesti koje zadržavaju od svog trajanja. Rast također može biti uzrokovan podaci dodaci koje korisnici zahtijevaju za povećanje vrijednosti podaci koje već imaju. Sukladno tome, zahtjevi za skladištenje za podaci može značajno poboljšati (Eckerson 1997). Stoga je bitno osigurati, provođenjem planiranja kapaciteta, da sustav koji se gradi može rasti kako rastu potrebe (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
U planiranju skalabilnosti baze podataka, mora se znati očekivani rast veličine skladišta, vrste upita koji će se vjerojatno napraviti i broj podržanih krajnjih korisnika (Best 1995, Rudin 1997b, Foley 1997a). Izgradnja skalabilnih aplikacija zahtijeva kombinaciju skalabilnih poslužiteljskih tehnologija i skalabilnih tehnika dizajna aplikacija (Best 1995, Rudin 1997b. Obje su neophodne za izgradnju visoko skalabilne aplikacije. Skalabilne poslužiteljske tehnologije mogu olakšati i dati prednost dodavanju pohrane, memorije i CPU-a bez degradacije izvedba (Lang 1997, Telefonija 1997).

Postoje dvije glavne tehnologije skalabilnog poslužitelja: simetrična višestruka obrada (SMP) i masivna paralelna obrada (MPP) (IDC 1997., Humphries et al. 1999.). SMP poslužitelj obično ima više procesora koji dijele memoriju, sistemsku sabirnicu i druge resurse (IDC 1997., Humphries et al. 1999.). Mogu se dodati dodatni procesori kako bi se povećao snaga računski. Još jedna metoda za povećanje snaga SMP poslužitelja, je kombiniranje brojnih SMP strojeva. Ova tehnika je poznata kao grupiranje (Humphries et al. 1999). MPP poslužitelj, s druge strane, ima više procesora od kojih svaki ima vlastitu memoriju, sustav sabirnice i druge resurse (IDC 1997, Humphries et al. 1999). Svaki procesor se naziva čvor. Povećanje u snaga može se postići računalni

dodavanje dodatnih čvorova MPP poslužiteljima (Humphries et al. 1999).

Slabost SMP poslužitelja je da previše ulazno-izlaznih (I/O) operacija može zagušiti sistemsku sabirnicu (IDC 1997). Ovaj se problem ne pojavljuje unutar MPP poslužitelja budući da svaki procesor ima vlastiti sustav sabirnice. Međutim, međukonekcije između svakog čvora općenito su puno sporije od SMP sustava sabirnice. Dodatno, MPP poslužitelji mogu dodati dodatnu razinu složenosti programerima aplikacija (IDC 1997). Stoga na izbor između SMP i MPP poslužitelja mogu utjecati mnogi čimbenici, uključujući složenost aplikacija, omjer cijene i performansi, potreban kapacitet obrade, spriječene dw aplikacije i povećanje veličine baza podataka dw i u broju krajnjih korisnika.

U planiranju kapaciteta mogu se koristiti brojne skalabilne tehnike dizajna aplikacija. Koriste se različita razdoblja obavijesti kao što su dani, tjedni, mjeseci i godine. Uz različite rokove obavijesti, baza podataka može se podijeliti na upravljive grupirane dijelove (Inmon et al. 1997). Druga tehnika je korištenje sažetih tablica koje su konstruirane sažimanjem podaci da podaci detaljan. Pa ja podaci sažeti su kompaktniji nego detaljni, što zahtijeva manje memorijskog prostora. Dakle, podaci detalja može se pohraniti u jeftiniju jedinicu za pohranu, što štedi još više prostora za pohranu. Iako korištenje tablica sažetaka može uštedjeti memorijski prostor, potrebno je puno truda kako bi bile ažurne i usklađene s poslovnim potrebama. Međutim, ova tehnika je široko korištena i često se koristi zajedno s prethodnom tehnikom (Best 1995, Inmon 1996a, Chauduri i Dayal
1997).

Definiranje Skladište podataka Tehničke arhitekture Definicija tehnika dw arhitekture

Rani korisnici skladištenja podataka primarno su zamislili centraliziranu implementaciju dw-a u kojoj su svi podaci, uključujući i podaci vanjski, bili su integrirani u jednu,
fizička pohrana (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Glavna prednost ovog pristupa je da krajnji korisnici mogu pristupiti pregledu cijelog poduzeća podaci organizacijski (Ovum 1998). Još jedna prednost je što nudi standardizaciju podaci kroz organizaciju, što znači da postoji samo jedna verzija ili definicija za svaku terminologiju korištenu u dw repozitoriju (metapodaci) (Flanagan i Safdie 1997, Ovum 1998). Nedostatak ovog pristupa je, s druge strane, to što je skup i težak za konstrukciju (Flanagan i Safdie 1997, Ovum 1998, Inmon et al. 1998). Nedugo nakon arhitekture pohrane podaci centralizirano postalo popularno, koncept izdvajanja manjih podskupova evoluirao podaci za podršku potrebama specifičnih aplikacija (Varney 1996, IDC 1997, Berson i Smith 1997, peacock 1998). Ovi mali sustavi su izvedeni iz većeg skladište podataka centralizirano. Imenovani su skladište podataka ovisni odjelski ili ovisni martovi podataka. Arhitektura ovisne vitrine podataka poznata je kao troslojna arhitektura gdje se prva razina sastoji od skladište podataka centralizirano, drugo se sastoji od depozita od podaci odjelski a treći se sastoji od pristupa do podaci i pomoću alata za analizu (Demarest 1994, Inmon et al. 1997).

Trgovine podacima obično se grade nakon skladište podataka centralizirani je izgrađen kako bi zadovoljio potrebe specifičnih jedinica (White 1995, Varney 1996).
Trgovine podacima pohranjuju podaci vrlo relevantni u vezi s određenim jedinicama (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

Prednost ove metode je što neće biti Dato nije integrirano i da i podaci bit će manje suvišni unutar podatkovnih martova kao i svi ostali podaci dolaze iz skladišta podaci integriran. Još jedna prednost je to što će biti malo veza između svake vitrine podataka i njezinih izvora podaci jer svaka baza podataka ima samo jedan izvor podaci. Osim toga, uz ovu arhitekturu, krajnji korisnici još uvijek mogu pristupiti pregledu podaci

korporativne organizacije. Ova je metoda poznata kao metoda odozgo prema dolje, gdje se vitrine podataka grade nakon skladište podataka (paun 1998, Goff 1998).
Povećavajući potrebu za ranim prikazivanjem rezultata, neke su organizacije počele graditi neovisne marte podataka (Flanagan i Safdie 1997., White 2000.). U ovom slučaju, burze podataka dobivaju svoje podaci ravno od osnova podaci OLTP, a ne iz centraliziranog i integriranog skladišta, čime se eliminira potreba da se centralno skladište nalazi na licu mjesta.

Svaka baza podataka zahtijeva barem jednu poveznicu na svoje izvore podaci. Nedostatak višestrukih veza za svaki podatkovni mart je taj što, u usporedbi s prethodne dvije arhitekture, preobilje podaci značajno povećava.

Svaka baza podataka mora pohraniti sve podaci potrebno je lokalno da nema učinka na OLTP sustave. Ovo uzrokuje da i podaci pohranjuju se u različitim bazama podataka (Inmon et al. 1997). Još jedan nedostatak ove arhitekture je taj što dovodi do stvaranja složenih međusobnih veza između prodajnih mjesta i njihovih izvora podataka. podaci koje je teško provesti i kontrolirati (Inmon et al. 1997).

Još jedan nedostatak je što krajnji korisnici ne mogu pristupiti pregledu podataka o tvrtki jer i podaci različitih baza podataka nisu integrirani (Ovum 1998).
Još jedan nedostatak je da može postojati više od jedne definicije za svaku terminologiju koja se koristi u marcama podataka što stvara nedosljednosti podaci u organizaciji (Ovum 1998).
Unatoč gore navedenim nedostacima, neovisne burze podataka još uvijek privlače interes mnogih organizacija (IDC 1997). Jedan čimbenik koji ih čini privlačnima je to što se brže razvijaju i zahtijevaju manje vremena i resursa (Bresnahan 1996, Berson i Smith 1997, Ovum 1998). Posljedično, oni prvenstveno služe kao testni projekti koji se mogu koristiti za brzo identificiranje prednosti i/ili nedostataka u projektu (Parsaye 1995., Braly 1995., Newing 1996.). U ovom slučaju, dio koji treba implementirati u pilot projektu mora biti malen, ali važan za organizaciju (Newing 1996., Mansell-Lewis 1996.).

Ispitivanjem prototipa krajnji korisnici i administracija mogu odlučiti hoće li nastaviti ili zaustaviti projekt (Flanagan i Safdie 1997.).
Ako je odluka da se nastavi, prodavaonice podataka za druge industrije trebale bi se graditi jednu po jednu. Postoje dvije opcije za krajnje korisnike na temelju njihovih potreba u izgradnji neovisnih matrica podataka: integrirani/federirani i neintegrirani (Ovum 1998.)

U prvoj metodi, svaki novi podatkovni lanac trebao bi biti izgrađen na temelju trenutnih podatkovnih vitrina i modela podaci koristi tvrtka (Varney 1996, Berson i Smith 1997, Peacock 1998). Potreba za korištenjem modela podaci tvrtke znači da se mora osigurati da postoji samo jedna definicija za svaku terminologiju koja se koristi u svim martovima podataka, a to također treba osigurati da se različite marte podataka mogu kombinirati kako bi se dobio pregled informacija o tvrtki (Bresnahan 1996). Ova se metoda naziva odozdo prema gore i najbolja je kada postoji ograničenje financijskih sredstava i vremena (Flanagan i Safdie 1997., Ovum 1998., Peacock 1998., Goff 1998.). U drugoj metodi, izgrađeni podatkovni martovi mogu zadovoljiti samo potrebe određene jedinice. Varijanta federated data mart je skladište podataka distribuiran u kojem se baza podataka Međusklopovni softver Hub Servera koristi se za spajanje mnogih kioska podataka u jedno spremište podaci raspodijeljen (White 1995). U ovom slučaju, i podaci tvrtke raspoređene su u nekoliko prodajnih mjesta. Zahtjevi krajnjih korisnika prosljeđuju se na baza podataka posredni softver središta poslužitelja koji izvlači sve podaci zahtijevaju podatkovne burze i vraća rezultate aplikacijama krajnjih korisnika. Ova metoda pruža poslovne informacije krajnjim korisnicima. Međutim, problemi neovisnih burzi podataka još uvijek nisu otklonjeni. Postoji još jedna arhitektura koja se može koristiti, a zove se skladište podataka virtualni (White 1995). Međutim, ova arhitektura, koja je opisana na slici 2.9, nije arhitektura za pohranu podataka. podaci stvaran jer ne premješta učitavanje s OLTP sustava na skladište podataka (Demarest 1994).

Zapravo, zahtjevi od podaci od krajnjih korisnika prosljeđuju se OLTP sustavima koji vraćaju rezultate nakon obrade korisničkih zahtjeva. Iako ova arhitektura omogućuje krajnjim korisnicima generiranje izvješća i postavljanje zahtjeva, ona ne može pružiti

podaci povijesni i pregled informacija o tvrtki kao i podaci iz različitih OLTP sustava nisu integrirani. Dakle, ova arhitektura ne može zadovoljiti analizu podaci složene kao što su prognoze.

Odabir aplikacija za pristup i oporavak podaci

Svrha izgradnje a skladište podataka je prenijeti informacije krajnjim korisnicima (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); jedna ili više aplikacija za pristup i oporavak podaci mora se osigurati. Do danas postoji veliki izbor ovih aplikacija među kojima korisnik može birati (Hammergren 1998., Humphries et al. 1999.). Prijave koje odaberete određuju uspjeh vašeg skladišnog napora podaci u organizaciji jer su aplikacije najvidljiviji dio skladište podataka do krajnjeg korisnika (Inmon et al. 1997, Poe 1996). Biti uspješan a skladište podataka, mora biti u mogućnosti podržati aktivnosti analize podaci krajnjeg korisnika (Poe 1996, Seddon i Benjamin 1998, Eckerson 1999). Stoga se mora identificirati "razina" onoga što krajnji korisnik želi (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

Općenito, krajnji korisnici mogu se grupirati u tri kategorije: izvršni korisnici, poslovni analitičari i napredni korisnici (Poe 1996., Humphries et al. 1999.). Izvršni korisnici trebaju jednostavan pristup unaprijed definiranim skupovima izvješća (Humphries et al. 1999). Ovim se omjerima može lako pristupiti navigacijom izbornika (Poe 1996). Osim toga, izvješća bi trebala prezentirati informacije korištenjem grafičkog prikaza kao što su tablice i predlošci za brzi prijenos informacija (Humphries et al. 1999). Poslovni analitičari, koji možda nemaju tehničke mogućnosti da sami razviju izvješća od nule, trebaju biti u mogućnosti modificirati trenutna izvješća kako bi zadovoljili svoje specifične potrebe (Poe 1996., Humphries et al. 1999.). Napredni korisnici, s druge strane, tip su krajnjih korisnika koji imaju sposobnost generiranja i pisanja zahtjeva i izvješća od nule (Poe 1996, Humphries et al. 1999). Oni su ti koji

oni razvijaju izvješća za druge vrste korisnika (Poe 1996, Humphries et al. 1999).

Nakon što se odrede zahtjevi krajnjeg korisnika, mora se napraviti odabir aplikacija za pristup i oporavak podaci među svim dostupnim (Poe 1996, Inmon et al. 1997).
Pristup podaci i alati za dohvaćanje mogu se klasificirati u 4 vrste: OLAP alati, EIS/DSS alati, alati za upite i izvješća i alati za rudarenje podataka.

OLAP alati omogućuju korisnicima stvaranje ad hoc upita kao i onih napravljenih na baza podataka del skladište podataka. Osim toga, ovi proizvodi omogućuju korisnicima da dublje iz podaci općih do detaljnih.

Alati EIS/DSS pružaju izvršna izvješća kao što su analiza "što ako" i pristup izvješćima vođenim izbornikom. Izvješća bi trebala biti unaprijed definirana i spojena s izbornicima radi lakše navigacije.
Alati za upite i izvješća omogućuju korisnicima izradu unaprijed definiranih i specifičnih izvješća.

Alati za rudarenje podataka koriste se za identificiranje odnosa koji bi mogli baciti novo svjetlo na zaboravljene operacije u podaci skladišta podataka.

Uz optimizaciju zahtjeva svake vrste korisnika, odabrani alati moraju biti intuitivni, učinkoviti i jednostavni za korištenje. Također moraju biti kompatibilni s drugim dijelovima arhitekture i sposobni raditi s postojećim sustavima. Također se preporučuje da odaberete alate za pristup podacima i dohvaćanje s razumnom cijenom i performansama. Ostali kriteriji koje treba razmotriti uključuju predanost dobavljača alata podršci za njihov proizvod i kako će se razvijati u budućim izdanjima. Kako bi se osigurao angažman korisnika u korištenju skladišta podataka, razvojni tim uključuje korisnike u proces odabira alata. U ovom slučaju treba provesti praktičnu procjenu korisnika.

Kako bi poboljšao vrijednost skladišta podataka, razvojni tim također može omogućiti web pristup svom skladištu podataka. Web-omogućeno skladište podataka omogućuje korisnicima pristup podaci iz udaljenih mjesta ili tijekom putovanja. Daljnje informacije mogu

osigurati uz niže troškove kroz smanjenje troškova obuke.

2.4.3 Skladište podataka Faza operacije

Ova faza sastoji se od tri aktivnosti: definiranje strategija osvježavanja podataka, kontrola aktivnosti skladišta podataka i upravljanje sigurnošću skladišta podataka.

Definicija strategija osvježavanja podataka

Nakon početnog punjenja, tj podaci u baza podataka skladišta podataka moraju se povremeno osvježavati kako bi se reproducirale promjene koje su u njima napravljene podaci izvornici. Stoga morate odlučiti kada osvježiti, koliko često osvježavanje treba zakazati i kako osvježiti podatke podaci. Predlaže se osvježiti podaci kada se sustav može isključiti. Učestalost osvježavanja određuje razvojni tim na temelju zahtjeva korisnika. Postoje dva pristupa osvježavanju skladišta podataka: potpuno osvježavanje i kontinuirano učitavanje promjena.

Prvi pristup, potpuno osvježavanje, zahtijeva ponovno učitavanje svih podaci od nule. To znači da svi podaci potrebno se mora izdvojiti, očistiti, transformirati i integrirati u svako osvježenje. Ovaj pristup treba, koliko je to moguće, izbjegavati jer zahtijeva puno vremena i resursa.

Alternativni pristup je kontinuirano učitavanje promjena. Ovo dodaje i podaci koji su promijenjeni od posljednjeg ciklusa osvježavanja skladišta podataka. Identificiranje novih ili izmijenjenih zapisa značajno smanjuje količinu podaci koji se moraju propagirati u skladište podataka u svakom ažuriranju budući da samo ovi podaci bit će dodan u baza podataka skladišta podataka.

Postoji najmanje 5 pristupa koji se mogu koristiti za povlačenje i podaci novi ili modificirani. Za dobivanje učinkovite strategije osvježavanja podataka podaci mješavina ovih pristupa koja bilježi sve promjene u sustavu može biti korisna.

Prvi pristup, koji koristi vremenske oznake, pretpostavlja da su svi dodijeljeni podaci uredili i ažurirali vremensku oznaku tako da možete lako identificirati sve podaci izmijenjeni i novi. Ovaj pristup, međutim, nije naširoko korišten u većini današnjih operativnih sustava.
Drugi pristup je korištenje delta datoteke koju je generirala aplikacija koja sadrži samo promjene napravljene u podaci. Korištenje ove datoteke također pojačava ciklus ažuriranja. Međutim, čak ni ova metoda nije korištena u mnogim primjenama.
Treći pristup je skeniranje log datoteke, koja u osnovi sadrži informacije slične delta datoteci. Jedina je razlika u tome što se datoteka zapisnika stvara za proces oporavka i može biti teška za razumijevanje.
Četvrti pristup je izmjena koda aplikacije. Međutim, većina aplikacijskog koda je stara i krhka; stoga ovu tehniku treba izbjegavati.
Posljednji pristup je usporedba podaci izvora s glavnom dei datotekom podaci.

Kontrola aktivnosti skladišta podataka

Nakon što je skladište podataka pušteno u upotrebu korisnicima, mora se nadzirati tijekom vremena. U tom slučaju, administrator skladišta podataka može upotrijebiti jedan ili više alata za upravljanje i kontrolu za praćenje korištenja skladišta podataka. Konkretno, mogu se prikupljati informacije o osobama i vremenu u kojem pristupaju skladištu podataka. dođi podaci prikupljenih podataka, može se izraditi profil obavljenog posla koji se može koristiti kao ulaz u korisničku implementaciju storniranja. Chargeback omogućuje korisnicima da budu informirani o trošku obrade skladišta podataka.

Nadalje, revizija skladišta podataka također se može koristiti za prepoznavanje vrsta upita, njihove veličine, broja upita po danu, vremena reakcije na upit, dosegnutih sektora i količine podaci obrađeno. Još jedna svrha revizije skladišta podataka je identificirati podaci koji nisu u upotrebi. ove podaci mogu se ukloniti iz skladišta podataka kako bi se poboljšalo vrijeme

odgovora na izvršenje upita i pratiti rast podaci koji se nalaze unutar baza podataka skladišta podataka.

Upravljanje sigurnošću skladišta podataka

Skladište podataka sadrži podaci integrirani, kritični, osjetljivi do kojih se može lako doći. Zbog toga ga treba zaštititi od neovlaštenih korisnika. Jedan od načina implementacije sigurnosti je korištenje del funkcije DBMS dodijeliti različite privilegije različitim vrstama korisnika. Na taj se način pristupni profil mora održavati za svaku vrstu korisnika. Drugi način da osigurate skladište podataka je da ga šifrirate kako je napisano u baza podataka skladišta podataka. Pristup podaci i alati za dohvaćanje moraju dešifrirati podaci prije predstavljanja rezultata korisnicima.

2.4.4 Skladište podataka Faza implementacije

To je posljednja faza u ciklusu implementacije skladišta podataka. Aktivnosti koje će se provoditi u ovoj fazi uključuju osposobljavanje korisnika za korištenje skladišta podataka te provođenje pregleda skladišta podataka.

Obuka korisnika

Obuku korisnika treba obaviti prije pristupa podaci skladišta podataka i korištenje alata za dohvaćanje. Općenito, sesije bi trebale započeti uvodom u koncept pohrane podaci, sadržaj skladišta podataka, meta podaci te osnovne značajke alata. Zatim bi napredniji korisnici također mogli proučavati fizičke tablice i korisničke značajke alata za pristup podacima i dohvaćanje.

Postoje mnogi pristupi obuci korisnika. Jedan od njih uključuje odabir mnogih korisnika ili analitičara odabranih iz skupa korisnika, na temelju njihovih vještina vodstva i komunikacije. Osobno su obučeni o svemu što trebaju znati kako bi se upoznali sa sustavom. Po završetku obuke vraćaju se na svoja radna mjesta i počinju podučavati druge korisnike kako koristiti sustav. Na

Na temelju onoga što su naučili, drugi korisnici mogu početi istraživati skladište podataka.
Drugi je pristup obučavanje više korisnika u isto vrijeme, kao da pohađate tečaj u učionici. Ova metoda je prikladna kada postoji mnogo korisnika koje treba obučavati u isto vrijeme. Još jedna metoda je treniranje svakog korisnika pojedinačno, jednog po jednog. Ova metoda je prikladna kada ima malo korisnika.

Svrha obuke korisnika je upoznati vas s pristupom podaci i alate za dohvaćanje kao i sadržaj skladišta podataka. Međutim, neki korisnici mogu biti preopterećeni količinom informacija pruženih tijekom treninga. Stoga se mora provesti određeni broj sesija osvježenja radi stalne pomoći i odgovora na specifična pitanja. U nekim slučajevima formira se korisnička skupina za pružanje ove vrste podrške.

Prikupljanje povratnih informacija

Nakon što se skladište podataka uvede, korisnici mogu koristiti i podaci koji se nalaze u skladištu podataka u različite svrhe. Uglavnom, analitičari ili korisnici koriste i podaci u skladištu podataka za:

1 Prepoznajte trendove tvrtke
2. Analizirajte kupovne profile klijenti
3 Podijelite i klijenti i
4 Pružite najbolje usluge klijenti – prilagoditi usluge
5 Formulirajte strategije marketing
6 Osigurajte konkurentne ponude za analizu troškova i pomoć u kontroli
7 Podrška donošenju strateških odluka
8 Identificirajte prilike da se istaknete
9 Poboljšati kvalitetu postojećih poslovnih procesa
10 Provjerite dobit

Slijedeći smjer razvoja skladišta podataka, mogao bi se provesti niz pregleda sustava kako bi se dobile povratne informacije

i od razvojnog tima i od zajednice krajnjih korisnika.
Dobiveni rezultati mogu se uzeti u obzir za sljedeći razvojni ciklus.

Budući da skladište podataka ima inkrementalni pristup, ključno je učiti na uspjesima i pogreškama prethodnih razvoja.

2.5 Sažetak

U ovom poglavlju raspravljalo se o pristupima prisutnima u literaturi. U odjeljku 1 raspravljalo se o konceptu skladišta podataka i njegovoj ulozi u znanosti o odlučivanju. Odjeljak 2 opisuje glavne razlike između skladišta podataka i OLTP sustava. U odjeljku 3 raspravljali smo o Monash modelu skladišta podataka koji je korišten u odjeljku 4 za opisivanje aktivnosti uključenih u proces razvoja skladišta podataka, ove teze nisu bile temeljene na rigoroznom istraživanju. Ono što se događa u stvarnosti može biti vrlo različito od onoga što literatura izvještava, međutim ovi se rezultati mogu koristiti za stvaranje osnovne pozadine koja naglašava koncept skladišta podataka za ovo istraživanje.

Poglavlje 3

Metode istraživanja i projektiranja

Ovo poglavlje govori o metodama istraživanja i dizajna za ovu studiju. Prvi dio prikazuje generički prikaz istraživačkih metoda dostupnih za pronalaženje informacija, a nadalje se raspravlja o kriterijima za odabir najbolje metode za pojedino istraživanje. U odjeljku 2, zatim se raspravlja o dvije metode odabrane prema upravo izloženim kriterijima; od njih, jedan će biti izabran i usvojen s razlozima navedenim u odjeljku 3 gdje su također navedeni razlozi za isključivanje drugog kriterija. Odjeljak 4 predstavlja nacrt istraživanja, a odjeljak 5 zaključke.

3.1 Istraživanje informacijskih sustava

Istraživanje informacijskih sustava nije samo ograničeno na tehnološku domenu, već se također mora proširiti kako bi uključilo bihevioralne i organizacijske svrhe.
To dugujemo tezama raznih disciplina, od društvenih do prirodnih znanosti; to dovodi do potrebe za određenim spektrom istraživačkih metoda koje uključuju kvantitativne i kvalitativne metode koje će se koristiti za informacijske sustave.
Sve dostupne istraživačke metode su važne, zapravo nekoliko istraživača kao što su Jenkins (1985), Nunamaker i sur. (1991) i Galliers (1992) tvrde da ne postoji specifična univerzalna metoda za provođenje istraživanja u različitim poljima informacijskih sustava; zapravo metoda može biti prikladna za određeno istraživanje, ali ne i za druga. To nam dovodi do potrebe da odaberemo metodu koja je prikladna za naš poseban istraživački projekt: za ovaj izbor Benbasat et al. (1987) navode da se mora uzeti u obzir priroda i svrha istraživanja.

3.1.1 Priroda istraživanja

Različite metode temeljene na prirodi istraživanja mogu se svrstati u tri tradicije široko poznate u informacijskoj znanosti: pozitivističko, interpretativno i kritičko istraživanje.

3.1.1.1 Pozitivističko istraživanje

Pozitivističko istraživanje također je poznato kao znanstveno ili empirijsko istraživanje. Nastoji: “objasniti i predvidjeti što će se dogoditi u društvenom svijetu promatrajući pravilnosti i uzročno-posljedične odnose između elemenata koji ga sačinjavaju” (Shanks et al 1993).

Pozitivistička istraživanja također karakteriziraju ponovljivost, pojednostavljenja i opovrgavanja. Nadalje, pozitivistička istraživanja dopuštaju postojanje apriornih odnosa između proučavanih pojava.
Prema Galliersu (1992.) taksonomija je istraživačka metoda uključena u pozitivističku paradigmu, koja međutim nije ograničena na ovo, zapravo postoje laboratorijski eksperimenti, terenski eksperimenti, studije slučaja, demonstracije teorema, predviđanja i simulacije. Koristeći ove metode, istraživači priznaju da se fenomeni koji se proučavaju mogu promatrati objektivno i rigorozno.

3.1.1.2 Interpretativno istraživanje

Neuman (1994.) opisuje interpretativno istraživanje, koje se često naziva fenomenologijom ili antipozitivizmom, kao “sustavnu analizu društvenog značenja djelovanja kroz izravno i detaljno promatranje ljudi u prirodnim situacijama, kako bi se došlo do razumijevanja i tumačenju kako ljudi stvaraju i održavaju svoj društveni svijet”. Interpretativne studije odbacuju pretpostavku da se promatrani fenomeni mogu promatrati objektivno. Zapravo se temelje na subjektivnim interpretacijama. Nadalje, interpretativni istraživači ne nameću apriorna značenja fenomenima koje proučavaju.

Ova metoda uključuje subjektivne/argumentativne studije, akcijska istraživanja, deskriptivne/interpretativne studije, istraživanje budućnosti i igranje uloga. Uz ove ankete i studije slučaja mogu se uključiti u ovaj pristup jer se tiču studija pojedinaca ili organizacija unutar složenih situacija u stvarnom svijetu.

3.1.1.3 Kritičko istraživanje

Kritičko ispitivanje najmanje je poznat pristup u društvenim znanostima, ali je nedavno dobio pozornost istraživača informacijskih sustava. Filozofska pretpostavka da društvenu stvarnost povijesno proizvode i reproduciraju ljudi, kao i društveni sustavi svojim djelovanjem i interakcijama. Njihova je sposobnost, međutim, uvjetovana nizom društvenih, kulturnih i političkih razloga.

Poput interpretativnog istraživanja, kritičko istraživanje tvrdi da pozitivističko istraživanje nema nikakve veze s društvenim kontekstom i zanemaruje njegov utjecaj na ljudske postupke.
Kritičko istraživanje, s druge strane, kritizira interpretativno istraživanje da je previše subjektivno i da nema za cilj pomoći ljudima da poboljšaju svoje živote. Najveća razlika između kritičkog istraživanja i druga dva pristupa je njegova evaluacijska dimenzija. Dok je objektivnost pozitivističke i interpretativne tradicije predviđanje ili objašnjenje statusa quo ili društvene stvarnosti, kritičko istraživanje ima za cilj kritičku procjenu i transformaciju društvene stvarnosti koja se proučava.

Kritički istraživači obično se protive statusu quo kako bi uklonili društvene razlike i poboljšali društvene uvjete. Kritičko istraživanje posvećeno je procesualnom pogledu na fenomene od interesa i stoga je obično longitudinalno. Primjeri istraživačkih metoda su dugoročne povijesne studije i etnografske studije. Kritičko istraživanje, međutim, nije široko korišteno u istraživanju informacijskih sustava

3.1.2 Svrha istraživanja

Uz prirodu istraživanja, njegova svrha može poslužiti kao smjernica istraživaču pri odabiru pojedine metode istraživanja. Svrha istraživačkog projekta usko je povezana s položajem istraživanja u odnosu na istraživački ciklus koji se sastoji od tri faze: izgradnje teorije, testiranja teorije i usavršavanja teorije. Stoga, na temelju vremenskog rasporeda istraživačkog ciklusa, istraživački projekt može imati eksplanatornu, deskriptivnu, istraživačku ili prediktivnu svrhu.

3.1.2.1 Istraživačka istraživanja

Eksploratorno istraživanje ima za cilj istražiti potpuno novu temu i formulirati pitanja i hipoteze za buduća istraživanja. Ova vrsta istraživanja koristi se u izgradnji teorije za dobivanje početnih referenci u novom području. Obično se koriste kvalitativne metode istraživanja, kao što su studije slučaja ili fenomenološke studije.

Međutim, također je moguće koristiti kvantitativne tehnike kao što su istraživačka istraživanja ili eksperimenti.

3.1.3.3 Deskriptivno istraživanje

Deskriptivno istraživanje ima za cilj analizirati i detaljno opisati određenu organizacijsku situaciju ili praksu. Ovo je prikladno za izgradnju teorija i također se može koristiti za potvrdu ili osporavanje hipoteza. Deskriptivno istraživanje obično uključuje korištenje mjera i uzoraka. Najprikladnije metode istraživanja uključuju ankete i analizu prethodnika.

3.1.2.3 Eksplanatorno istraživanje

Eksplanatorna istraživanja pokušavaju objasniti zašto se stvari događaju. Izgrađen je na činjenicama koje su već proučene i pokušava pronaći razloge za te činjenice.
Stoga je eksplanatorno istraživanje obično izgrađeno na eksplorativnom ili deskriptivnom istraživanju i pomoćno je testiranju i pročišćavanju teorija. Eksplanatorno istraživanje obično koristi studije slučaja ili istraživačke metode temeljene na anketama.

3.1.2.4 Preventivna istraživanja

Preventivno istraživanje ima za cilj predvidjeti događaje i ponašanja koja se promatraju i koja se proučavaju (Marshall i Rossman 1995). Predviđanje je standardni znanstveni test istine. Ova vrsta istraživanja općenito uključuje ankete ili analizu podaci povjesničari. (Yin 1989.)

Gornja rasprava pokazuje da postoji niz mogućih istraživačkih metoda koje se mogu koristiti u određenoj studiji. Međutim, mora postojati jedna specifična metoda koja je prikladnija od ostalih za određenu vrstu istraživačkog projekta. (Galliers 1987, Yin 1989, De Vaus 1991). Stoga svaki istraživač treba pažljivo procijeniti prednosti i slabosti različitih metoda, kako bi usvojio najpogodniju i najkompatibilniju istraživačku metodu s istraživačkim projektom. (Jenkins 1985, Pervan i Klass 1992, Bonomia 1985, Yin 1989, Himilton i Ives 1992).

3.2. Moguće metode istraživanja

Cilj ovog projekta bio je proučavanje iskustva australskih organizacija s i podaci pohranjeno s razvojem skladište podataka. Dato Kako trenutno u Australiji nedostaju istraživanja u području skladištenja podataka, ovo istraživanje je još uvijek u teoretskoj fazi istraživačkog ciklusa i ima istraživačku svrhu. Istraživanje iskustva australskih organizacija koje prihvaćaju skladištenje podataka zahtijeva tumačenje stvarnog društva. Posljedično, filozofska pretpostavka na kojoj se temelji istraživački projekt slijedi tradicionalno tumačenje.

Nakon rigoroznog ispitivanja dostupnih metoda, identificirane su dvije moguće istraživačke metode: ankete i studije slučaja, koje se mogu koristiti za eksplorativno istraživanje (Shanks et al. 1993). Galliers (1992.) u svojoj revidiranoj taksonomiji argumentira prikladnost ove dvije metode za ovu posebnu studiju govoreći da su prikladne za izgradnju teorije. Sljedeća dva pododjeljka detaljno govore o svakoj metodi.

3.2.1 Metoda anketnog istraživanja

Anketna metoda istraživanja dolazi od antičke metode popisa stanovništva. Popis se sastoji od prikupljanja informacija od cijele populacije. Ova metoda je skupa i nepraktična, osobito ako je populacija velika. Stoga, u usporedbi s popisom stanovništva, anketa se obično fokusira na prikupljanje informacija za mali broj, ili uzorak, predstavnika stanovništva (Fowler 1988., Neuman 1994.). Uzorak odražava populaciju iz koje je izvučen, s različitim razinama točnosti, ovisno o strukturi uzorka, veličini i korištenoj metodi odabira (Fowler 1988, Babbie 1982, Neuman 1994).

Metoda ankete definirana je kao „snimke praksi, situacija ili pogleda u određenom trenutku, napravljene pomoću upitnika ili intervjua, iz kojih se mogu zaključiti
made” (Galliers 1992:153) [snimka praksi, situacija ili pogleda u određenom trenutku, poduzeta korištenjem upitnika ili intervjua, iz kojih se mogu donijeti zaključci]. Ankete se bave prikupljanjem informacija o nekom aspektu studije, od određenog broja sudionika, postavljanjem pitanja (Fowler 1988). Ovi upitnici i intervjui, koji uključuju telefonske intervjue licem u lice i one strukturirane, također su tehnike prikupljanja podaci najčešće korišteni u istraživanjima (Blalock 1970, Nachmias i Nachmias 1976, Fowler 1988), mogu se koristiti promatranja i analize (Gable 1994). Od svih ovih metoda prikupljanja podaci, korištenje upitnika je najpopularnija tehnika, jer osigurava da i podaci

prikupljeni su strukturirani i oblikovani, te stoga olakšavaju klasifikaciju informacija (Hwang 1987, de Vaus 1991).

Prilikom analize i podaci, strategija istraživanja često koristi kvantitativne tehnike, kao što je statistička analiza, ali se mogu koristiti i kvalitativne tehnike (Galliers 1992, Pervan

i Klass 1992, Gable 1994). Obično, i podaci prikupljeni se koriste za analizu distribucija i obrazaca asocijacija (Fowler 1988).

Iako su ankete općenito prikladne za istraživanje koje se bavi pitanjem 'što?' (što) ili proizlazeći iz toga, kao što su 'koliko' i 'koliko', mogu se postaviti putem pitanja 'zašto' (Sonquist i Dunkelberg 1977., Yin 1989.). Prema Sonquistu i Dunkelbergu (1977.), istraživačko istraživanje usmjereno je na izazivanje hipoteza, procjenu programa, opisivanje stanovništva i razvoj modela ljudskog ponašanja. Nadalje, ankete se mogu koristiti za proučavanje određenog mišljenja stanovništva, uvjeta, mišljenja, karakteristika, očekivanja pa čak i prošlih ili sadašnjih ponašanja (Neuman 1994).

Ankete omogućuju istraživaču da otkrije odnose među populacijom, a rezultati su obično općenitiji od drugih metoda (Sonquist i Dunkelberg 1977., Gable 1994.). Ankete omogućuju istraživačima da pokriju veće geografsko područje i dopru do velikog broja ispitanika (Blalock 1970, Sonquist i Dunkelberg 1977, Hwang i Lin 1987, Gable 1994, Neuman 1994). Konačno, ankete mogu pružiti informacije koje nisu dostupne drugdje ili u obliku potrebnom za analize (Fowler 1988).

Međutim, postoje neka ograničenja u provedbi ankete. Nedostatak je što istraživač ne može dobiti mnogo informacija o proučavanom objektu. To je zbog činjenice da se ankete provode samo u određeno vrijeme i stoga postoji ograničen broj varijabli i ljudi koje istraživač može

studija (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Drugi je nedostatak to što provođenje ankete može biti vrlo skupo u smislu vremena i resursa, osobito ako uključuje intervjue licem u lice (Fowler 1988).

3.2.2. Istraživačka metoda upitnika

Istraživačka metoda uključuje dubinsko proučavanje određene situacije unutar konteksta stvarnog svijeta tijekom određenog vremenskog razdoblja, bez ikakve intervencije od strane istraživača (Shanks & C. 1993., Eisenhardt 1989., Jenkins 1985.). Uglavnom se ova metoda koristi za opisivanje odnosa između varijabli koje se proučavaju u određenoj situaciji (Galliers 1992). Istrage mogu uključivati jedan ili više slučajeva, ovisno o fenomenu koji se analizira (Franz i Robey 1987, Eisenhardt 1989, Yin 1989).

Istraživačka metoda upitnika definirana je kao "empirijsko ispitivanje koje proučava suvremeni fenomen unutar njegovog stvarnog konteksta, koristeći više izvora prikupljenih od jednog ili više entiteta kao što su ljudi, grupe ili organizacije" (Yin 1989). Ne postoji jasna razlika između fenomena i njegovog konteksta i ne postoji eksperimentalna kontrola ili manipulacija varijablama (Yin 1989., Benbasat et al. 1987.).

Postoji niz tehnika za prikupljanje podaci koji se mogu koristiti u metodi ispitivanja, koja uključuje izravna opažanja, preglede arhivske građe, upitnike, pregled dokumentacije i strukturirane intervjue. Imajući raznolik raspon tehnika žetve podaci, istraživanja omogućuju istraživačima da se bave i jednim i drugim podaci kvalitativno i kvantitativno u isto vrijeme (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Kao što je slučaj s metodom ankete, anketni istraživač služi kao promatrač ili istraživač, a ne kao aktivni sudionik u organizaciji koja se proučava.

Benbasat i dr. (1987.) tvrde da je metoda ispitivanja posebno prikladna za izgradnju istraživačke teorije, koja počinje istraživačkim pitanjem i nastavlja se obrazovanjem.

teorije tijekom procesa prikupljanja podaci. Biti prikladan i za pozornicu

izgradnje teorije, Franz i Robey (1987) sugeriraju da se metoda ispitivanja također može koristiti za fazu kompleksne teorije. U tom slučaju se na temelju prikupljenih dokaza provjerava ili opovrgava zadana teorija ili hipoteza. Osim toga, anketa je također prikladna za istraživanja koja se bave pitanjima 'kako' ili 'zašto' (Yin 1989).

U usporedbi s drugim metodama, ankete omogućuju istraživaču da detaljnije uhvati bitne informacije (Galliers 1992., Shanks et al. 1993.). Nadalje, ankete omogućuju istraživaču razumijevanje prirode i složenosti proučavanih procesa (Benbasat et al. 1987).

Četiri su glavna nedostatka povezana s metodom istraživanja. Prvi je nedostatak kontroliranih odbitaka. Subjektivnost istraživača može promijeniti rezultate i zaključke studije (Yin 1989). Drugi nedostatak je nedostatak kontroliranog promatranja. Za razliku od eksperimentalnih metoda, istraživač ne može kontrolirati fenomene koji se proučavaju dok se ispituju u njihovom prirodnom kontekstu (Gable 1994). Treći nedostatak je nedostatak replikacije. To je zato što je malo vjerojatno da će istraživač promatrati iste događaje i ne može potvrditi rezultate određene studije (Lee 1989). Konačno, kao posljedica neponovljivosti, teško je generalizirati rezultate dobivene iz jednog ili više istraživanja (Galliers 1992, Shanks et al 1993). Svi ti problemi, međutim, nisu nepremostivi i istraživač ih zapravo može minimizirati primjenom odgovarajućih radnji (Lee 1989).

3.3. Obrazložite metodologiju istraživanja usvojeno

Od dvije moguće metode istraživanja za ovu studiju, metoda ankete smatra se najprikladnijom. Istraga je odbačena nakon pažljivog razmatranja relevantnih

zasluge i slabosti. Prikladnost ili neprikladnost svake metode za ovu studiju razmatra se u nastavku.

3.3.1. Neprikladnost metode istraživanja istrage

Metoda ispitivanja zahtijeva dubinsko proučavanje određene situacije unutar jedne ili više organizacija tijekom određenog vremenskog razdoblja (Eisenhardt 1989). U tom slučaju, razdoblje može premašiti vremenski okvir dan za ovu studiju. Još jedan razlog za neprihvaćanje metode ankete je taj što rezultati mogu patiti od nedostatka strogosti (Yin 1989). Subjektivnost istraživača može utjecati na rezultate i zaključke. Drugi razlog je taj što je ova metoda prikladnija za istraživanje pitanja tipa 'kako' ili 'zašto' (Yin 1989), dok je istraživačko pitanje za ovu studiju tipa 'što'. Posljednje, ali ne i najmanje važno, teško je generalizirati nalaze iz samo jednog ili nekoliko istraživanja (Galliers 1992, Shanks et al. 1993). Na temelju tog obrazloženja nije odabrana anketna metoda istraživanja jer nije bila prikladna za ovo istraživanje.

3.3.2. Pogodnost metode pretraživanja istraga

Kada je ovo istraživanje provedeno, praksa skladištenja podataka nije bila široko prihvaćena od strane australskih organizacija. Dakle, nije bilo puno informacija o njihovoj provedbi unutar australskih organizacija. Dostupne informacije potječu od organizacija koje su implementirale ili koristile a skladište podataka. U tom je slučaju anketna metoda istraživanja najprikladnija jer omogućuje dobivanje informacija koje drugdje nisu dostupne ili u obliku potrebnom za analizu (Fowler 1988). Osim toga, metoda anketnog istraživanja omogućuje istraživaču da dobije dobar uvid u prakse, situacije ili poglede u određenom trenutku (Galliers 1992, Denscombe 1998). Pregled je bio potreban kako bi se povećalo znanje o australskom iskustvu skladištenja podataka.

Nadalje, Sonquist i Dunkelberg (1977) navode da su rezultati anketnog istraživanja općenitiji od drugih metoda.

3.4. Dizajn istraživanja ankete

Istraživanje o praksama skladištenja podataka provedeno je 1999. Ciljnu populaciju činile su australske organizacije zainteresirane za studije skladištenja podataka, jer su vjerojatno već bile informirane o podaci koje pohranjuju i stoga mogu pružiti korisne informacije za ovu studiju. Ciljana populacija identificirana je kroz početnu anketu svih australskih članova The Data Warehousing Institute (Tdwi-aap). Ovaj odjeljak raspravlja o dizajnu faze empirijskog istraživanja ove studije.

3.4.1. Tehnika berbe podaci

Od tri tehnike koje se obično koriste u anketnim istraživanjima (tj. upitnik poštom, telefonski intervju i osobni intervju) (Nachmias 1976, Fowler 1988, de Vaus 1991), za ovu studiju usvojen je upitnik poštom. Prvi razlog za usvajanje potonjeg je to što može doseći geografski raspršenu populaciju (Blalock 1970, Nachmias i Nachmias 1976, Hwang i Lin 1987, de Vaus 1991, Gable 1994). Drugo, upitnik putem pošte prikladan je za visokoobrazovane sudionike (Fowler 1988). Upitnik poštom za ovu studiju bio je upućen sponzorima projekta skladištenja podataka, direktorima i/ili voditeljima projekta. Treće, upitnici poštom su prikladni kada je dostupna sigurna lista adresa (Salant i Dilman 1994). TDWI, u ovom slučaju, pouzdana udruga za skladištenje podataka pružila je mailing listu svojih australskih članova. Još jedna prednost upitnika putem pošte u odnosu na telefonski upitnik ili osobne intervjue je ta što omogućuje ispitanicima točnije odgovore, osobito kada ispitanici moraju pogledati bilješke ili razgovarati o pitanjima s drugim ljudima (Fowler 1988).

Potencijalni nedostatak može biti vrijeme potrebno za ispunjavanje upitnika poštom. Obično se anketa putem pošte provodi ovim redoslijedom: slanje pisama, čekanje odgovora i slanje potvrde (Fowler 1988., Bainbridge 1989.). Stoga ukupno vrijeme može biti dulje od vremena potrebnog za osobne ili telefonske razgovore. Međutim, ukupno vrijeme može se znati unaprijed (Fowler 1988, Denscombe 1998). Vrijeme utrošeno na vođenje osobnih intervjua ne može se unaprijed znati jer varira od intervjua do intervjua (Fowler 1988). Telefonski intervjui mogu biti brži od upitnika poštom i osobnih intervjua, ali mogu imati visoku stopu neodgovora zbog nedostupnosti nekih ljudi (Fowler 1988). Osim toga, telefonski intervjui općenito su ograničeni na relativno kratke liste pitanja (Bainbridge 1989).

Još jedna slabost upitnika poštom je visoka stopa neodgovora (Fowler 1988, Bainbridge 1989, Neuman 1994). Međutim, poduzete su protumjere povezivanjem ove studije s pouzdanom institucijom za skladištenje podataka (tj. TDWI) (Bainbridge 1989., Neuman 1994.), koja šalje dva podsjetna pisma onima koji ne odgovore (Fowler 1988., Neuman 1994.) i također uključuje dodatno pismo objašnjavajući svrhu studije (Neuman 1994).

3.4.2. Jedinica analize

Svrha ove studije je dobiti informacije o implementaciji skladištenja podataka i njegovoj upotrebi unutar australskih organizacija. Ciljana populacija sastoji se od svih australskih organizacija koje su implementirale ili provode, tj skladište podataka. Pojedinačne organizacije tada se registriraju na ime. Upitnik je poslan poštom organizacijama zainteresiranim za udomljavanje skladište podataka. Ova metoda osigurava da prikupljene informacije dolaze iz najprikladnijih izvora svake organizacije koja sudjeluje.

3.4.3. Uzorak ankete

“Mailing lista” sudionika istraživanja dobivena je od TDWI-a. S ovog popisa 3000 australskih organizacija odabrano je kao osnova za uzorkovanje. Uzorku je poslano dodatno pismo u kojem se objašnjava projekt i svrha istraživanja, zajedno s obrascom s odgovorima i unaprijed plaćenom omotnicom za povrat popunjenog upitnika. Od 3000 organizacija, 198 je pristalo sudjelovati u studiji. Tako mali broj odgovora je bio očekivan Dato veliki broj australskih organizacija koje su tada prihvatile ili prihvaćaju strategiju skladištenja podataka unutar svojih organizacija. Stoga se ciljna populacija za ovu studiju sastoji od samo 198 organizacija.

3.4.4. Sadržaj upitnika

Struktura upitnika temeljila se na Monash modelu skladištenja podataka (o kojem je prethodno bilo riječi u dijelu 2.3). Sadržaj upitnika temeljio se na analizi literature predstavljenoj u poglavlju 2. Primjerak upitnika koji je poslan sudionicima istraživanja nalazi se u Dodatku B. Upitnik se sastoji od šest odjeljaka koji slijede faze obuhvaćenog modela. Sljedećih šest odlomaka ukratko sažimaju sadržaj svakog odjeljka.

Odjeljak A: Osnovne informacije o organizaciji
Ovaj odjeljak sadrži pitanja koja se odnose na profil organizacija koje sudjeluju. Dodatno, neka od pitanja povezana su sa statusom sudionikovog projekta skladištenja podataka. Povjerljive informacije poput imena organizacije nisu otkrivene u analizi ankete.

Odjeljak B: Početak
Pitanja u ovom odjeljku povezana su sa zadatkom pokretanja skladištenja podataka. Postavljena su pitanja o inicijatorima projekta, jamcima, potrebnim vještinama i znanjima, ciljevima razvoja skladišta podataka i očekivanjima krajnjih korisnika.

Odjeljak C: Dizajn
Ovaj odjeljak sadrži pitanja koja se odnose na aktivnosti planiranja skladište podataka. Konkretno, pitanja su se odnosila na opseg izvršenja, trajanje projekta, cijenu projekta i analizu troškova i koristi.

Odjeljak D: Razvoj
U odjeljku o razvoju nalaze se pitanja koja se odnose na razvojne aktivnosti skladište podataka: zbirka zahtjeva krajnjeg korisnika, izvori podaci, logički model podaci, prototipovi, planiranje kapaciteta, tehničke arhitekture i odabir razvojnih alata za skladištenje podataka.

Odjeljak E: Operacija
Operativna pitanja vezana uz rad i proširivost skladište podataka, kako se razvija u sljedećoj fazi razvoja. Tamo kvaliteta podataka, strategije osvježavanja podaci, granularnost podaci, skalabilnost od skladište podataka i sigurnosna pitanja skladište podataka bila među vrstama postavljenih pitanja.

Odjeljak F: Razvoj
Ovaj odjeljak sadrži pitanja vezana uz korištenje skladište podataka od strane krajnjih korisnika. Istraživača je zanimala svrha i korisnost skladište podataka, usvojene strategije pregleda i obuke te strategija kontrole skladište podataka usvojeni.

3.4.5. Stopa odgovora

Iako se ankete putem pošte kritiziraju zbog niske stope odgovora, poduzete su mjere za povećanje stope vraćanja (kao što je prethodno objašnjeno u dijelu 3.4.1). Pojam 'stopa odgovora' odnosi se na postotak ljudi u određenom anketnom uzorku koji odgovore na upitnik (Denscombe 1998). Za izračun stope odgovora za ovu studiju korištena je sljedeća formula:

Broj ljudi koji su odgovorili
Stopa odgovora = ———————————————————————————– X 100 Ukupan broj poslanih upitnika

3.4.6. Pilotski test

Prije nego što je upitnik poslan uzorku, pitanja su ispitana provođenjem pilot testova, kako su predložili Luck i Rubin (1987), Jackson (1988) i de Vaus (1991). Svrha pilot testova je otkriti sve nezgodne, dvosmislene izraze i pitanja koja je teško protumačiti, razjasniti sve definicije i pojmove koji se koriste i identificirati približno vrijeme potrebno za ispunjavanje upitnika (Warwick i Lininger 1975, Jackson 1988, Salant i Dilman 1994). Pilot testovi provedeni su odabirom subjekata s karakteristikama sličnim onima konačnih subjekata, kako je predložio Davis e Cosenza (1993). U ovoj studiji šest stručnjaka za skladištenje podataka odabrano je kao pilot subjekti. Nakon svakog pilot testa izvršene su potrebne korekcije. Iz provedenih pilot testova sudionici su doprinijeli preoblikovanju i resetiranju konačne verzije upitnika.

3.4.7. Metode analize Po Dati

I podaci anketa prikupljenih iz zatvorenih upitnika analizirano je korištenjem statističkog programskog paketa pod nazivom SPSS. Mnogi su odgovori analizirani pomoću deskriptivne statistike. Određeni broj upitnika vraćen je nepotpun. S njima se postupalo s većom pažnjom kako bi se osiguralo da i podaci nedostajući nisu bili posljedica pogrešaka u unosu podataka, već zato što pitanja nisu bila prikladna za podnositelja registracije ili je podnositelj registracije odlučio ne odgovoriti na jedno ili više specifičnih pitanja. Ovi nedostajući odgovori zanemareni su tijekom analize podaci i kodirani su kao '- 9' kako bi se osiguralo njihovo isključivanje iz procesa analize.

Prilikom izrade upitnika, zatvorena pitanja su unaprijed kodirana tako da je svakoj opciji dodijeljen broj. Broj je zatim korišten za pripremu podaci tijekom analize (Denscombe 1998, Sapsford i Jupp 1996). Na primjer, bilo je šest opcija navedenih u pitanju 1 odjeljka B: upravni odbor, viši rukovoditelj, IT odjel, poslovna jedinica, konzultanti i ostalo. U dosjeu od podaci SPSS-a, generirana je varijabla za označavanje 'inicijatora projekta', sa šest vrijednosnih oznaka: '1' za 'upravni odbor', '2' za 'viši izvršni direktor' i tako dalje. Korištenje Likertinove ljestvice u nekim od zatvorenih pitanja također je omogućilo identifikaciju bez napora s obzirom na korištenje odgovarajućih numeričkih vrijednosti unesenih u SPSS. Za pitanja s neiscrpnim odgovorima, koji se međusobno ne isključuju, svaka je opcija tretirana kao jedna varijabla s dvije oznake vrijednosti: '1' za 'označeno' i '2' za 'nije označeno'.

Otvorena pitanja tretirana su drugačije od zatvorenih pitanja. Odgovori na ova pitanja nisu uneseni u SPSS. Umjesto toga, analizirani su ručno. Korištenje ove vrste pitanja omogućuje nam dobivanje informacija o slobodno izraženim idejama i osobnim iskustvima ispitanika (Bainbridge 1989, Denscombe 1998). Gdje je bilo moguće, napravljena je kategorizacija odgovora.

Za analizu podaci, koriste se jednostavne metode statističke analize, kao što su učestalost odgovora, srednja vrijednost, standardna devijacija i medijan (Argyrous 1996., Denscombe 1998.).
Gamma test pokazao se dobro za dobivanje kvantitativnih mjera povezanosti između podaci ordinali (Norusis 1983, Argyrous 1996). Ti su testovi bili prikladni jer korištene ordinalne ljestvice nisu imale mnogo kategorija i mogle su se prikazati u tablici (Norusis 1983).

3.5 Sažetak

U ovom poglavlju raspravljalo se o metodologiji istraživanja i dizajnu usvojenom za ovu studiju.

Odabir najprikladnije istraživačke metode za određenu studiju uzima u obzir
razmatranje brojnih pravila, uključujući prirodu i vrstu istraživanja, kao i prednosti i slabosti svake moguće metode (Jenkins 1985, Benbasat et al. 1097, Galliers i Land 1987, yin 1989, Hamilton i ives 1992, Galliers 1992, Neuman 1994). S obzirom na nedostatak postojećeg znanja i teorije o prihvaćanju skladištenja podataka u Australiji, ova istraživačka studija zahtijeva interpretativnu istraživačku metodu s istraživačkom sposobnošću istraživanja iskustava australskih organizacija. Odabrana metoda istraživanja odabrana je za prikupljanje informacija o prihvaćanju koncepta skladištenja podataka od strane australskih organizacija. Kao tehnika prikupljanja odabran je upitnik poštom podaci. Opravdanost metode istraživanja i tehnike prikupljanja podaci odabrani bit će navedeni u ovom poglavlju. Nadalje, raspravljalo se o jedinici analize, korištenom uzorku, postocima odgovora, sadržaju upitnika, predtestu upitnika i načinu analize upitnika. podaci.

Projektiranje a Skladište podataka:

Kombinacija odnosa entiteta i dimenzionalnog modeliranja

SAŽETAK
Pohranjivanje i podaci je glavni trenutni problem za mnoge organizacije. Ključno pitanje u razvoju računalne pohrane podaci to je njegov dizajn.
Dizajn mora podržavati otkrivanje koncepata u skladište podataka na naslijeđeni sustav i druge izvore podaci te također lako razumijevanje i učinkovitost u provedbi skladište podataka.
Velik dio literature o pohrani podaci preporučuje korištenje modeliranja odnosa entiteta ili dimenzionalnog modeliranja za predstavljanje dizajna skladište podataka.
U ovom radu pokazujemo kako se oba prikaza mogu kombinirati u jednom pristupu crtanju skladište podataka. Pristup koji se koristi je sustavan

ispitan u studiji slučaja i identificiran je u nizu važnih implikacija kod praktičara.

SKLADIŠTENJE PODATAKA

Un skladište podataka obično se definira kao "predmetno orijentirana, integrirana, vremenski varijabilna i postojana zbirka podataka koja podržava odluke menadžmenta" (Inmon i Hackathorn, 1994.). Predmetno orijentirana i integrirana ukazuje na to da skladište podataka je dizajniran da pređe funkcionalne granice Legaci sustava kako bi ponudio integriranu perspektivu podaci.
Vremenska varijanta utječe na povijesnu ili vremensku seriju podaci u jednom skladište podataka, što omogućuje analizu trendova. Neisparljiv označava da je skladište podataka ne ažurira se kontinuirano kao a baza podataka od OLTP. Umjesto toga povremeno se ažurira, s podaci koji dolaze iz unutarnjih i vanjskih izvora. The skladište podataka posebno je dizajniran za pretraživanje, a ne za ažuriranje integriteta i performansi rada.
Ideja pohranjivanja i podaci nije novost, to je bila jedna od svrha upravljanja podaci od šezdesetih (The Martin, 1982).
I skladište podataka nude infrastrukturu podaci za sustave podrške upravljanju. Sustavi podrške upravljanju uključuju sustave podrške odlučivanju (DSS) i izvršne informacijske sustave (EIS). DSS je informacijski sustav temeljen na računalu koji je dizajniran za poboljšanje ljudskog odlučivanja. EIS je obično sustav isporuke podaci koji poslovnim vođama omogućuje lak pristup prikazu podaci.
Opća arhitektura a skladište podataka ističe ulogu skladište podataka u podršci menadžmenta. Kao i ponudu infrastrukture podaci za EIS i DSS, al skladište podataka može mu se pristupiti izravno putem upita. THE podaci uključeno u a skladište podataka temelje se na analizi zahtjeva upravljanja informacijama i dobivaju se iz tri izvora: internih naslijeđenih sustava, sustava za prikupljanje podataka posebne namjene i vanjskih izvora podataka. THE podaci u internim naslijeđenim sustavima često su redundantni, nekonzistentni, niske kvalitete i pohranjeni u različitim formatima pa se moraju uskladiti i očistiti prije nego što se mogu učitati u

skladište podataka (Inmon, 1992; McFadden, 1996). THE podaci koji dolaze iz skladišnih sustava podaci ad hoc i iz izvora podaci vanjski se često koriste za povećanje (ažuriranje, zamjenu) i podaci iz naslijeđenih sustava.

Postoji mnogo uvjerljivih razloga za razvoj a skladište podataka, koji uključuju poboljšano donošenje odluka kroz učinkovitu upotrebu više informacija (Ives 1995), podršku za fokusiranje na cijele poslove (Graham 1996) i smanjenje podaci za EIS i DSS (Graham 1996, McFadden 1996).

Nedavna empirijska studija pokazala je, u prosjeku, povrat ulaganja za skladište podataka za 401% nakon tri godine (Graham, 1996). Međutim, druge empirijske studije o skladište podataka otkrili značajne probleme uključujući poteškoće u mjerenju i dodjeljivanju koristi, nedostatak jasne svrhe, podcjenjivanje svrhe i složenost procesa pohranjivanja koristi podaci, posebno u pogledu izvora i čistoće podaci. Pohranjivanje i podaci može se smatrati rješenjem problema upravljanja podaci između organizacija. Manipulacija podaci kao društveni resurs dugi je niz godina ostao jedan od ključnih problema u upravljanju informacijskim sustavima diljem svijeta (Brancheau i dr. 1996., Galliers i dr. 1994., Niederman i dr. 1990., Pervan 1993.).

Popularan pristup upravljanju podaci osamdesetih je to bio razvoj modela podaci društveni. Model podaci social je dizajniran da ponudi stabilnu osnovu za razvoj novih aplikacijskih sustava i baza podataka te rekonstrukcija i integracija naslijeđenih sustava (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kim i Everest 1994). Međutim, postoje mnogi problemi s ovim pristupom, posebno složenost i cijena svakog zadatka, te dugo vremena potrebno da se proizvedu opipljivi rezultati (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il skladište podataka to je zasebna baza podataka koja koegzistira s naslijeđenim bazama podataka, a ne da ih zamjenjuje. Stoga vam omogućuje usmjeravanje upravljanja podaci i izbjeći skupu rekonstrukciju naslijeđenih sustava.

POSTOJEĆI PRISTUPI DIZAJNU PODATAKA

SKLADIŠTE

Proces izgradnje i usavršavanja a skladište podataka treba ga više shvatiti kao evolucijski proces, a ne kao životni ciklus razvoja tradicionalnih sustava (Desio, 1995, Shanks, O'Donnell i Arnott 1997a ). Mnogo je procesa uključenih u projekt skladište podataka kao što je inicijalizacija, planiranje; informacije dobivene iz zahtjeva postavljenih od menadžera poduzeća; izvori, transformacije, čišćenje podaci i sinkronizacija iz naslijeđenih sustava i drugih izvora podaci; sustavi isporuke u razvoju; praćenje skladište podataka; i besmislenost evolucijskog procesa i konstrukcije a skladište podataka (Stinchi, O'Donnell i Arnott 1997b). U ovom časopisu fokusiramo se na to kako nacrtati podaci pohranjeni u kontekstu ovih drugih procesa. Postoji niz predloženih pristupa arhitekturi skladište podataka u književnosti (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Svaka od ovih metodologija ima kratak pregled s analizom njihovih prednosti i slabosti.

Inmonov (1994) pristup za Skladište podataka dizajn

Inmon (1994) je predložio četiri iterativna koraka za dizajn a skladište podataka (vidi sliku 2). Prvi korak je dizajn predloška podaci društveni kako bih razumio kako ja podaci mogu se integrirati kroz funkcionalna područja unutar organizacije razdvajanjem podaci pohraniti u područjima. Model podaci napravljen je za skladištenje podaci koji se odnose na donošenje odluka, uključujući podaci povjesničari, a uklj podaci deduciran i agregiran. Drugi korak je identificiranje tematskih područja za provedbu. Oni se temelje na prioritetima koje je odredila određena organizacija. Treći korak uključuje crtanje a baza podataka za predmetno područje obratite posebnu pozornost na uključivanje odgovarajućih razina granularnosti. Inmon preporučuje korištenje modela entiteta i odnosa. Četvrti korak je identificiranje izvornih sustava podaci potrebno i razviti procese transformacije za snimanje, čišćenje i formatiranje i podaci.

Snage Inmonovog pristupa su u tome što model podaci društveno pruža osnovu za integraciju podaci unutar organizacije i planiranja potpora za iterativni razvoj skladište podataka. Njegovi nedostaci su poteškoća i troškovi u dizajniranju modela podaci društvene, poteškoće u razumijevanju modela entiteta i odnosa koji se koriste u oba modela, to podaci društvene i to od podaci pohranjeno po predmetnom području i prikladnost podaci crteža skladište podataka za ostvarenje baza podataka relacijski ali ne i za baza podataka višedimenzionalan.

Ives' (1995) Pristup Skladište podataka dizajn

Ives (1995) predlaže pristup u četiri koraka dizajniranju informacijskog sustava za koji vjeruje da je primjenjiv na dizajn skladište podataka (vidi sliku 3). Pristup se u velikoj mjeri temelji na informacijskom inženjerstvu za razvoj informacijskih sustava (Martin 1990). Prvi korak je određivanje ciljeva, kritičnih i čimbenika uspjeha te ključnih pokazatelja uspješnosti. Ključni poslovni procesi i potrebne informacije modeliraju se kako bi nas doveli do modela podaci društveni. Drugi korak uključuje razvoj definirajuće arhitekture podaci pohranjeno po područjima, baza podataka di skladište podataka, tehnološke komponente koje su potrebne, skup organizacijske podrške potrebne za implementaciju i rad s njima skladište podataka. Treći korak uključuje odabir potrebnih programskih paketa i alata. Četvrti korak je detaljni dizajn i izgradnja skladište podataka. Ives napominje da pohranjivanje podaci to je ograničeni iterativni proces.

Snage Ivesovog pristupa su korištenje specifičnih tehnika za određivanje zahtjeva za informacijama, korištenje strukturiranog procesa za podršku integracije skladište podataka, odgovarajući odabir hardvera i softvera i korištenje višestrukih tehnika predstavljanja za skladište podataka. Njegove su mane svojstvene složenosti. Drugi uključuju poteškoće u razvoju mnogih razina baza podataka all'interno del skladište podataka u razumnom vremenu i razumnim troškovima.

Kimballov (1994) pristup Skladište podataka dizajn

Kimball (1994) je predložio pet iterativnih koraka za dizajn a skladište podataka (vidi slike 4). Njegov pristup posebno je posvećen dizajnu sola skladište podataka te o korištenju dimenzionalnih modela umjesto modela entiteta i odnosa. Kimball analizira te dimenzionalne modele jer je poslovnim vođama lakše razumjeti poslovanje, učinkovitije je kada se bave složenim konzultacijama i dizajnom baza podataka fizički je učinkovitiji (Kimball 1994). Kimball prepoznaje da razvoj a skladište podataka to je iterativno, i to skladište podataka odvojene tablice mogu se integrirati dijeljenjem u tablice zajedničkih dimenzija.

Prvi korak je identificirati određeno predmetno područje koje treba usavršiti. Drugi i treći korak odnose se na dimenzionalno modeliranje. U drugom koraku mjere identificiraju stvari od interesa u predmetnom području i grupiraju se u tablicu činjenica. Na primjer, u predmetnom području prodaje mjere od interesa mogu uključivati količinu prodanih artikala i dolar kao prodajnu valutu. Treći korak uključuje identificiranje dimenzija koje predstavljaju načine na koje se činjenice mogu grupirati. U predmetnom području prodaje, relevantne dimenzije mogu uključivati stavku, lokaciju i vremensko razdoblje. Tablica činjenica ima višedijelni ključ za povezivanje sa svakom dimenzijskom tablicom i obično sadrži vrlo velik broj činjenica. Nasuprot tome, tablice dimenzija sadrže opisne informacije o dimenzijama i drugim atributima koji se mogu koristiti za grupiranje činjenica. Povezana predložena tablica činjenica i dimenzija čini ono što se naziva zvjezdana shema zbog svog oblika. Četvrti korak uključuje izgradnju a baza podataka višedimenzionalni za usavršavanje zvjezdanog uzorka. Posljednji korak je identificiranje izvornih sustava podaci potrebno i razviti procese transformacije za snimanje, čišćenje i formatiranje i podaci.

Snage Kimballovog pristupa uključuju korištenje dimenzionalnih modela za predstavljanje podaci pohranjeni što ga čini lakšim za razumijevanje i dovodi do učinkovitog fizičkog dizajna. Dimenzionalni model koji također spremno koristi oba sustava baza podataka relacijski se mogu usavršiti ili sustavi baza podataka višedimenzionalni. Njegovi nedostaci uključuju nedostatak nekih tehnika za olakšavanje planiranja ili integracije mnogih zvjezdanih uzoraka unutar a skladište podataka i poteškoće projektiranja iz krajnje denormalizirane strukture u dimenzionalni model a podaci u naslijeđenom sustavu.

McFaddenov (1996) pristup podacima Dizajn skladišta

McFadden (1996) predlaže pristup u pet koraka za dizajniranje a skladište podataka (vidi sliku 5).
Njegov pristup temelji se na sintezi ideja iz literature i fokusiran je na dizajn singla skladište podataka. Prvi korak uključuje analizu zahtjeva. Iako tehničke specifikacije nisu propisane, McFaddenove bilješke identificiraju entitete podaci specifikacije i njihove atribute, te upućuje na čitatelje Watson i Frolick (1993) za hvatanje zahtjeva.
U drugom koraku dizajniran je model odnosa entiteta skladište podataka a zatim ga potvrđuju poslovni čelnici. Treći korak uključuje određivanje mapiranja iz naslijeđenih sustava i vanjskih izvora skladište podataka. Četvrti korak uključuje procese u razvoju, implementaciji i sinkronizaciji podaci u skladište podataka. U završnom koraku razvija se isporuka sustava s posebnim naglaskom na korisničko sučelje. McFadden napominje da je proces crtanja općenito iterativan.

Snage McFaddenovog pristupa ukazuju na sudjelovanje poslovnih lidera u određivanju zahtjeva, kao i na važnost resursa podaci, njihovo čišćenje i prikupljanje. Njegovi nedostaci uključuju nedostatak procesa za rastavljanje velikog projekta skladište podataka u mnogim integriranim fazama, i

poteškoće u razumijevanju modela entiteta i odnosa korištenih u dizajnu skladište podataka.

Ne biraju nas samo oni koji su nam bliski.

0/5 (0 recenzija)

Saznajte više u Online web agenciji

Pretplatite se kako biste primali najnovije članke e-poštom.

admin Predsjednik Uprave

👍Online web agencija | Web agencija stručnjak za digitalni marketing i SEO. Web agencija Online je web agencija. Za Agenzia Web Online uspjeh u digitalnoj transformaciji temelji se na temeljima Iron SEO verzije 3. Specijalnosti: integracija sustava, integracija poslovnih aplikacija, servisno orijentirana arhitektura, računalstvo u oblaku, skladište podataka, poslovna inteligencija, veliki podaci, portali, intraneti, web aplikacija Dizajn i upravljanje relacijskim i višedimenzionalnim bazama podataka Projektiranje sučelja za digitalne medije: upotrebljivost i grafika. Online web agencija tvrtkama nudi sljedeće usluge: -SEO na Googleu, Amazonu, Bingu, Yandexu; -Web analitika: Google Analytics, Google Tag Manager, Yandex Metrica; -Konverzije korisnika: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM na Google, Bing, Amazon Ads; - Marketing na društvenim mrežama (Facebook, Linkedin, Youtube, Instagram).

Pogledajte cijelu biografiju

Digitalni marketing Baza podataka DBMS Skladište podataka Znanost podatke Online oglašavanje Informacijska tehnologija Web-agencija Agencija za oglašavanje Marketing

Share:

Sviđa mi se:

Saznajte više u Online web agenciji