fbpx

Skladište podataka i ERP | CENTRALNA ARHIVA PODATAKA: ISTORIJA I EVOLUCIJA

ARHIV PODACI CENTRALNI: ISTORIJA I EVOLUCIJA


Dvije dominantne teme korporativne tehnologije 90-ih su
države i skladište podataka i ERP. Dugo vremena ova dva moćna
struje su bile dio korporativne IT bez ikakvih problema
raskrsnice. Bilo je gotovo kao da su materija i anti-materija. Ali
rast oba fenomena neminovno je doveo do jednog
njihova raskrsnica. Kompanije se danas suočavaju sa problemom
šta raditi sa ERP e skladište podataka. Ovaj članak će ilustrovati
koji su problemi i kako ih kompanije rješavaju.
NA POČETKU…
U početku je bilo skladište podataka. Skladište podataka je rođen za
suprotstaviti sistem aplikacija za obradu transakcija.
U prvim danima pamćenje dati trebalo je da bude
samo kontrapunkt obradi aplikacija
transakcije. Ali danas postoje mnogo sofisticiranije vizije
nego šta a skladište podataka. U današnjem svijetu
skladište podataka umeće se u strukturu koja može biti
pod nazivom Fabrika korporativnih informacija.
TVORNICA KORPORATIVNIH INFORMACIJA
(CIF)
Fabrika korporativnih informacija ima arhitektonske komponente
standard: nivo transformacije i integracije koda
koji integriše i dati dok sam ja dati kreću se iz okruženja
ekološka primjena skladište podataka kompanije; a
skladište podataka kompanije u kojoj i dati
detaljne i integrisane istorije. The skladište podataka kompanije služi kao
temelj na kojem se mogu graditi svi ostali dijelovi
životne sredine skladište podataka; skladište operativnih podataka (ODS).
ODS je hibridna struktura koja sadrži neke aspekte podataka
skladište i drugi aspekti OLTP okruženja; baza podataka, u kojima i
različita odjeljenja mogu imati vlastitu verziju podataka
skladište; a skladište podataka istraživanja u kojem i
"Mislioci" kompanije mogu da iznesu svoje upite
72 sata bez štetnog uticaja na skladište podataka; i uspomenu
blizu linije, u kojoj dati stari i dati veliki detalj može biti
jeftino uskladištena.
GDJE SE ERP kombinuje sa
TVORNICA KORPORATIVNIH INFORMACIJA
ERP se spaja sa Fabrikom korporativnih informacija na dva mesta.
Prvo kao osnovna aplikacija (baza) koja pruža
dati prijave na skladište podataka. U ovom slučaju i dati,
nastaje kao nusproizvod procesa transakcije,
integrirani su i učitani u skladište podataka kompanije. The
druga tačka ujedinjenja između ERP-a i CIF-a i ODS-a. Zaista, mnogi
okruženja ERP se koristi kao klasični ODS.
U slučaju da se ERP koristi kao osnovna aplikacija, on
isti ERP se također može koristiti u CIF-u kao ODS. U
međutim, ako se ERP koristi u obje uloge, postoji
mora postojati jasna razlika između dva entiteta. Drugim riječima,
kada ERP igra ulogu osnovne aplikacije i ODS,
dvije arhitektonske cjeline moraju biti različite. Ako samac
implementacija ERP-a pokušava igrati obje uloge
istovremeno će neminovno biti problema u
dizajn i implementacija ove strukture.
ODVOJENI ODS I OSNOVNE PRIMJENE
Mnogo je razloga koji dovode do cijepanja komponenti
arhitektonski. Možda najrečitije pitanje za razdvajanje
različite komponente arhitekture je da svaka komponenta
arhitekture ima svoj pogled. Potrebna je osnovna aplikacija
za drugu svrhu od ODS-a. Pokušajte da se preklapate
osnovni pogled aplikacije na svijet ODS-a ili obrnuto
to nije pravi način rada.
Shodno tome, prvi problem ERP-a u CIF-u je problem
provjerite postoji li razlika između osnovnih aplikacija i
SDGs.
MODELI PODATAKA U KORPORACIJI
FABRIKA INFORMACIJA
Za postizanje kohezije između različitih komponenti
arhitekture CIF-a, mora postojati model dati. ja
modeli dati služe kao veza između različitih komponenti
arhitekture kao što su osnovne aplikacije i ODS. THE
modeli dati postati "intelektualna mapa puta" za imati
pravo značenje različitim arhitektonskim komponentama CIF-a.
Idući ruku pod ruku sa ovim pojmom, ideja je da bi trebalo da postoji
biti odličan i jedinstven model dati. Očigledno mora
biti model dati za svaku od komponenti i dalje tamo
to mora biti razuman put koji povezuje različite modele.
Svaka komponenta arhitekture - ODS, osnovne aplikacije,
skladište podataka firma, i tako dalje.. - treba svoje
model of dati. I zato mora postojati precizna definicija
poput ovih modela dati međusobno se povezuju.
MOVE I PODACI DATUM ERP-a
SKLADIŠTVO
Ako je porijeklo dati je osnovna aplikacija i/ili ODS, kada
ERP umetci i dati Nel skladište podataka, takvo umetanje mora
javljaju na najnižem nivou "granularnosti". Recap or
jednostavno agregat i dati kako izlaze
iz osnovne primjene ERP-a ili iz ODS-a ERP-a nije
prava stvar za uraditi. THE dati detalji su potrebni u datumu
skladište koje čini osnovu DSS procesa. Takve dati
oni će se na mnogo načina preoblikovati pomoću prodajnih mjesta i istraživanja
del skladište podataka.
Displacement of dati iz osnovnog okruženja aplikacije
ERP-a na okruženje skladište podataka kompanije se obavlja u a
razumno opušteno. Taj pomak se dešava nakon toga
oko 24 sata od ažuriranja ili kreiranja u ERP-u. Činjenica o
imaju "lijeni" pokret bogova dati Nel skladište podataka
kompanije dozvoljava dati dolaze iz ERP-a da se "namire".
Jednom i dati deponuju se u osnovnoj aplikaciji,
onda možete bezbedno da premestite i dati ERP-a
u kompaniji. Još jedan cilj dostižan zahvaljujući kretanju
"Lenji" bogovi dati je jasno razgraničenje između operativnih procesa i
DSS. Sa "brzim" pokretom dati linija razdvajanja
između DSS-a i operativnog ostaje nejasno.
Kretanje dati od ODS-a ERP-a do skladište podataka
kompanije se obavlja periodično, obično
sedmično ili mjesečno. U ovom slučaju kretanje od
dati zasniva se na potrebi da se "očisti" staro dati istoričari.
Naravno, ODS sadrži i dati koji su mnogo noviji
poštovanje prema dati istoričari pronašli u skladište podataka.
Displacement of dati Nel skladište podataka to se skoro nikad ne radi
"Veleprodaja" (na veleprodajni način). Kopirajte tabelu
iz ERP okruženja do skladište podataka to nema smisla. Jedan pristup
mnogo realnije je pomeranje odabranih jedinica dati.
Samo dati koji su se promijenili od posljednjeg ažuriranja datuma
magacini su ti koji se trebaju premjestiti u podatke
skladište. Jedan od načina da saznate koje dati oni su modifikovani
budući da je zadnje ažuriranje potrebno pogledati vremenske oznake dati
nalazi u ERP okruženju. Dizajner bira sve promjene
koji su se dogodili od posljednjeg ažuriranja. Drugi pristup
je korištenje tehnika sticanja promjena dati. Sa
ove tehnike se analiziraju trake dnevnika i dnevnika kako bi se
odredi koje dati moraju biti premješteni iz ERP okruženja u
To od skladište podataka. Ove tehnike su najbolje
koliko dnevnika i traka dnevnika može biti pročitano iz ERP datoteka
bez daljih efekata na druge resurse ERP-a.
DRUGE KOMPLIKACIJE
Jedan od problema sa ERP-om u CIF-u je ono što se dešava drugima
izvori aplikacija ili ai dati ODS-a koji mora doprinijeti
skladište podataka ali nisu dio ERP okruženja. S obzirom na
zatvorena priroda ERP-a, posebno SAP-a, pokušaj integracije
ključeve iz vanjskih izvora dati sa i dati koji dolaze iz ERP-a u
vrijeme za pokret i dati Nel skladište podataka, to je veliki izazov.
I koliko su tačno vjerovatnoće da i dati aplikacija ili
ODS izvan ERP okruženja će biti integriran u podatke
skladište? Šanse su zapravo vrlo visoke.
FIND PODACI ISTORIJAT IZ ERP
Još jedan problem sa dati ERP-a je rezultat
iz potrebe da se ima dati istorijski unutar skladište podataka.
Obično skladište podataka potrebe dati istoričari. I
obično ih ERP tehnologija ne pohranjuje dati
istorijski, barem ne do tačke u kojoj je to potrebno na datum
skladište. Kada je velika količina dati istoričari počinju
dodati u ERP okruženje, takvo okruženje mora biti
očišćeno. Na primjer, pretpostavimo a skladište podataka mora
biti opterećen sa pet godina dati istorijski dok ERP drži
od toga najviše šest meseci dati. Sve dok je kompanija zadovoljna
prikupiti razne dati istorijski kako vreme prolazi,
tada nema problema u korištenju ERP-a kao izvora za
skladište podataka. Ali kada je skladište podataka moram ići
nazad u vreme i uzmi bogove dati istoričari koji nisu bili
prethodno prikupljeno i sačuvano od strane ERP-a, zatim ERP okruženje
postaje neefikasna.
ERP I METADATAK
Još jedno razmatranje o ERP-u i skladište podataka je li to
o postojećim metapodacima u ERP okruženju. Kao i metapodaci
oni prelaze iz ERP okruženja u skladište podataka, i
metapodaci moraju biti premješteni na isti način. Nadalje, i
metapodaci moraju biti transformirani u formatu i strukturi
zahtijeva infrastruktura skladište podataka. Postoji veliki
razlika između operativnih metapodataka i DSS metapodataka. Metapodaci
operativni su uglavnom za programera i za
programer. DSS metapodaci su prvenstveno za korisnika
finale. Postojeći metapodaci u ERP aplikacijama ili ODS-ovima
moraju se konvertovati i ova konverzija nije uvek laka
i direktno.
IZVORI ERP PODATAKA
Ako se ERP koristi kao provajder dati po il skladište podataka ci
mora biti solidan interfejs koji se pomera i dati iz okoline
ERP za okolinu skladište podataka. Interfejs mora:
▪ biti jednostavan za korištenje
▪ dozvoli pristup dati ERP-a
▪ uzeti značenje dati koji će biti premješteni
Nel skladište podataka
▪ znati ograničenja ERP-a koja mogu nastati
vrijeme kada se prijavite na dati ERP-a:
▪ referentni integritet
▪ hijerarhijski odnosi
▪ implicitne logičke veze
▪ konvencija primjene
▪ sve strukture dati podržan od strane ERP-a i tako dalje...
▪ biti efikasan u pristupu dati, pružanjem:
▪ direktno kretanje dati
▪ sticanje promjene dati
▪ podrška blagovremenom pristupu dati
▪ razumjeti format dati, i tako dalje…
INTERFEJS SA SAP-om
Interfejs može biti dva tipa, domaći ili komercijalni.
Neki od glavnih komercijalnih interfejsa uključuju:
▪ SAS
▪ Prime Solutions
▪ D2k, i tako dalje...
VIŠE ERP TEHNOLOGIJA
Tretiranje ERP okruženja kao da je jedna tehnologija je a
velika greška. Postoji mnogo ERP tehnologija, od kojih svaka ima svoje
snage. Najpoznatiji prodavci na tržištu su:
▪ SAP
▪ Oracle Financials
▪ PeopleSoft
JD Edwards
▪ Baans
SAP
SAP je najveći i najkompletniji ERP softver. Prijave
SAP-a obuhvata mnoge vrste aplikacija u mnogim područjima. SAP ima
reputacija bića:
▪ veoma velika
▪ vrlo teško i skupo za implementaciju
▪ potrebno je mnogo ljudi i konsultanata
implementirano
▪ potrebni su specijalizovani ljudi za implementaciju
▪ potrebno je mnogo vremena za implementaciju
Uz to, SAP ima reputaciju po tome što pamti svoje dati molto
pažljivo, što otežava pristup njima
osoba izvan SAP područja. Snaga SAP-a je da bude
sposoban da uhvati i pohrani veliku količinu dati.
SAP je nedavno najavio svoju namjeru proširenja
njegove primjene ai skladište podataka. Ima mnogo prednosti i nedostataka
u korištenju SAP-a kao dobavljača skladište podataka.
Jedna od prednosti je što je SAP već instaliran i to većina
konsultanti već poznaju SAP.
Nedostaci SAP-a kao dobavljača skladište podataka sono
mnogi: SAP nema iskustva u svijetu skladište podataka
Ako je SAP dobavljač skladište podataka, potrebno je "iznijeti"
i dati od SAP al skladište podataka. datum SAP-ov rekord
zatvoreni sistem, malo je vjerovatno da će biti lako ući iz SAP-a
to (???). Postoji mnogo naslijeđenih okruženja koja pokreću SAP,
kao što su IMS, VSAM, ADABAS, ORACLE, DB2 i tako dalje.
SAP insistira na pristupu "nije izmišljeno ovdje". SAP ne želi
surađivati ​​s drugim dobavljačima kako biste koristili ili kreirali skladište podataka.
SAP insistira na tome da sam generiše sav svoj softver.
Iako je SAP velika i moćna kompanija, činjenica je da
pokušava prepisati tehnologiju ELT, OLAP, administraciju
sistem, pa čak i osnovni kod dbms to je jednostavno ludo.
Umjesto usvajanja kooperativnog stava sa dobavljačima
di skladište podataka dugogodišnji, SAP je slijedio pristup koji
oni "znaju više". Ovakav stav koči uspjeh koji
SAP može imati u oblasti skladište podataka.
SAP-ovo odbijanje da omogući pristup vanjskim dobavljačima
brzo i ljubazno prema njima dati. Sama suština korišćenja
un skladište podataka je lak pristup dati. Cijela priča o SAP-u jeste
zasnovano na otežavanju pristupa dati.
SAP-ov nedostatak iskustva u radu s velikim količinama dati;
u oblasti skladište podataka postoje sveske dati nikad viđeno od tada
SAP i za rukovanje ovim velikim količinama dati morate imati jedan
odgovarajuću tehnologiju. SAP očigledno nije svjestan toga
tehnološka barijera koja postoji za ulazak u polje podataka
skladište.
Korporativna kultura SAP-a: SAP je stvorio posao
u dobijanju i dati iz sistema. Ali da biste to uradili morate imati
drugačiji mentalitet. Tradicionalno, softverske kompanije koje su bile
dobri u unosu podataka u okruženje nisu bili dobri u tome
dobijanje podataka da idu u drugom pravcu. Ako SAP može to učiniti
switch će biti prva kompanija koja će to učiniti.
Ukratko, upitno je da li kompanija treba da bira
SAP kao dobavljač skladište podataka. Postoje veoma ozbiljni rizici
s jedne strane i vrlo malo nagrada s druge strane. Ali postoji još jedan
razlog koji obeshrabruje izbor SAP-a kao dobavljača datuma
skladište. Jer svaka kompanija treba da ima isti datum
skladište svih ostalih firmi? The skladište podataka to je srce
konkurentsku prednost. Kad bi svaka kompanija usvojila isto
skladište podataka bilo bi teško, čak ako ne i nemoguće,
ostvariti konkurentsku prednost. Čini se da SAP misli da a
skladište podataka može se posmatrati kao kolačić, a to je a
dodatni znak njihovog „dobijanja podataka
u ".
Nijedan drugi ERP dobavljač nije tako dominantan kao SAP.
Nesumnjivo će biti kompanija koje će slijediti SAP put
za njihove skladište podataka ali vjerovatno ovi datumi
SAP skladišta će biti velika, skupa i vrlo zahtjevna
vreme za njihovo stvaranje.
Ova okruženja uključuju aktivnosti kao što su "obrada bankovnih blagajni",
procesi za rezervacije aviona, procesi za žalbe
osiguranje i tako dalje. Transakcioni sistem je bio efikasniji,
očiglednija je bila potreba za razdvajanjem između operativnih procesa i
DSS (Sistem za podršku odlučivanju). Međutim, sa sistemima resursa
ljudski i lični, nikada se ne suočavate sa velikim količinama
transakcije. I, naravno, kada se neko zaposli
ili napustite kompaniju ovo je zapis o transakciji.
Ali u odnosu na druge sisteme, sisteme ljudskih resursa i
lični jednostavno nemaju mnogo transakcija. Stoga, u
sistem ljudskih i ličnih resursa nije sasvim očigledno da postoji
treba DataWarehouse. Na mnogo načina ovi sistemi
predstavljaju spajanje DSS sistema.
Ali postoji još jedan faktor koji treba uzeti u obzir ako se to mora učiniti
radi sa datawarehouse i PeopleSoft. U mnogim okruženjima, tj dati
ljudski i lični resursi su sekundarni u odnosu na posao
primarna kompanija. Većina kompanija radi
proizvodnja, prodaja, pružanje usluga i tako dalje. THE
Sistemi ljudskih i ličnih resursa su obično sekundarni (ili od
podrška) osnovnoj poslovnoj liniji kompanije. Dakle, jeste
dvosmisleno i nezgodno a skladište podataka odvojeno za
podrška ljudskim i ličnim resursima.
PeopleSoft se u tom pogledu veoma razlikuje od SAP-a. Sa SAP-om jeste
obavezno da postoji a skladište podataka. Sa PeopleSoft, nije
onda tako jasno. Skladište podataka je opciono uz PeopleSoft.
Najbolja stvar koja se može reći za dati PeopleSoft je taj podatak
skladište se može koristiti za skladištenje i dati u vezi
stari ljudski i lični resursi. Drugi razlog za
koju kompanija želi da koristi a skladište podataka a
na štetu PeopleSoft okruženja je omogućiti pristup i
besplatan pristup alatima za analizu, ai dati by PeopleSoft. Ali
pored ovih razloga, mogu postojati slučajevi u kojima je bolje da to ne činite
imaju skladište podataka za dati PeopleSoft.
Ukratko
Postoji mnogo uvida u konstrukciju datuma
skladište unutar ERP softvera.
Neki od njih su:
▪ Ima smisla imati a skladište podataka koji izgleda kao bilo koji
drugo u industriji?
▪ Koliko je fleksibilan ERP skladište podataka softver?
▪ ERP skladište podataka softver može da obradi veliki broj
dati koji se nalazi u "skladište podataka arena"?
▪ Koja je evidencija koju ERP dobavljač ima
suočavanje lako i jeftino, u smislu vremena, ai dati? (šta
je rekord ERP dobavljača u isporuci jeftinih, na
vrijeme, lako pristupiti podacima?)
▪ Kakvo je razumevanje DSS arhitekture i
“Fabrika korporativnih informacija” od strane ERP dobavljača?
▪ ERP dobavljači razumiju kako doći dati unutar
okoliša, ali i razumjeti kako ih izvesti?
▪ Koliko je otvoren prodavac ERP do sada instrumenata
skladištenje?
Sva ova razmatranja moraju se uzeti u obzir prilikom određivanja
gde staviti skladište podataka koji će ugostiti i dati ERP i drugi
dati. Općenito, osim ako za to ne postoji uvjerljiv razlog
u suprotnom, preporučuje se izgradnja skladište podataka napolje
iz okruženja ERP dobavljača.
POGLAVLJE 1
Pregled BI organizacije
Ključne točke:
Repozitoriji informacija rade na suprotan način od poštovanja
do arhitekture poslovne inteligencije (BI):
Korporativna kultura i IT mogu ograničiti uspjeh u
izgradnja BI organizacija.
Tehnologija više nije ograničavajući faktor za BI organizacije. The
problem za arhitekte i projektante nije ako
tehnologija postoji, ali ako mogu efikasno implementirati
dostupna tehnologija.
Za mnoge kompanije a skladište podataka to je nešto više od depozita
pasivna distribucija i dati korisnicima kojima je to potrebno. THE dati
oni se izvlače iz izvornih sistema i naseljavaju u ciljne strukture
di skladište podataka. ja dati mogu se čistiti i sa cjelinom
bogatstvo. Međutim, ne dodaje se ni dodatna vrijednost
prikupio dati tokom ovog procesa.
U suštini, pasivni DW, u najboljem slučaju, daje rezultate
samo ja dati čista i operativna za korisnička udruženja. Tamo
stvaranje informacija i analitičko razumijevanje zavise
u potpunosti od strane korisnika. Procijenite da li je DW (Skladište podataka) je
uspjeh je subjektivan. Ako sudimo o uspjehu na
sposobnost efikasnog prikupljanja, integracije i čišćenja i dati
korporativni na predvidljivoj osnovi, onda da, DW je uspješan.
S druge strane, ako pogledamo zbirku, konsolidaciju i to
eksploataciju informacija o organizaciji u cjelini, dakle
DW je promašaj. DW daje malu ili nikakvu vrijednost
informacije. Kao rezultat toga, korisnici su primorani da se snalaze,
stvarajući tako silose za informacije. Ovo poglavlje predstavlja
potpunu viziju za sumiranje arhitekture BI (Business
Inteligencija) kompanija. Počnimo s opisom BI i
onda ćemo prijeći na rasprave o dizajnu i
razvoj informacija, za razliku od jednostavnog pružanja i dati
korisnicima. Diskusije se zatim fokusiraju na izračunavanje
vrijednost vaših BI napora. Zaključujemo definiranjem kako IBM
bavi se arhitektonskim BI zahtjevima vaše organizacije.
Opis arhitekture
organizacija BI
Sada su moćni informacioni sistemi orijentisani na transakcije
na dnevnom redu u svakom velikom preduzeću, na nivou
zapravo igralište za kompanije širom svijeta.
Međutim, ostanak konkurentan sada zahtijeva analitički sistem
orijentisan na to može revolucionisati sposobnost kompanije ponovnim otkrivanjem i
koristeći informacije koje već imaju. Ovi sistemi
analitika proizilazi iz razumijevanja iz bogatstva dati
dostupan. BI može poboljšati performanse u svim informacijama
kompanije. Kompanije mogu poboljšati odnose s kupcima i
dobavljača, poboljšati profit proizvoda i usluga, generirati
nove i najbolje ponude, kontrolu rizika i između mnogih drugih
zarada drastično smanjuje potrošnju. Sa BI tvojim
kompanija konačno počinje da koristi informacije o kupcima
kao konkurentno sredstvo zahvaljujući aplikacijama koje imaju ciljeve
tržište.
Imati pravi posao znači imati konačne odgovore
ključna pitanja kao što su:
▪ Koji od naših kupaca tjeraju nas da zarađujemo više, ili tamo
šalju s gubitkom?
▪ Gdje žive naši najbolji kupaca u vezi sa prodavnica/
skladište koje često posjećuju?
▪ Koji od naših proizvoda i usluga se može prodati najviše
efektivno i kome?
▪ Koji proizvodi se mogu najefikasnije prodati i kome?
▪ Koja prodajna kampanja je bila najuspješnija i zašto?
▪ Koji su kanali prodaje najefikasniji za koje proizvode?
▪ Kako možemo poboljšati odnose sa našim najboljima kupaca?
Većina kompanija ima dati grubo odgovoriti
ova pitanja.
Operativni sistemi stvaraju velike količine proizvoda, od
kupac i dati tržište sa prodajnih mjesta, rezervacije,
od servisa za korisnike i sistema tehničke podrške. Izazov je
izdvojiti i iskoristiti ove informacije.
Mnoge kompanije koriste samo male djeliće vlastite dati
za strateške analize.
I dati preostali, često spojeni sa i dati proizilaze iz vanjskih izvora kao što su i
"Izvještaji Vlade" i druge kupljene informacije su jedno
rudnik zlata koji samo čeka da bude istražen, npr dati mora
biti rafiniran samo u vašem informativnom kontekstu
organizacija.
Ovo znanje se može primijeniti na nekoliko načina, varijacija
od dizajniranja opće korporativne strategije do
lična komunikacija sa dobavljačima, putem call centara,
fakturisanje, Internet i druge tačke. Današnje poslovno okruženje diktira
da DW i srodna BI rješenja dalje evoluiraju
izvođenje tradicionalnih struktura dati koji i dati normalizovano na
atomski nivo i "farme zvijezda/kocka".
Ono što je potrebno da ostanemo konkurentni je spajanje
tradicionalna i napredna tehnologija u nastojanju da podrži a
ogroman analitički pejzaž.
Konačno, opšte okruženje mora poboljšati znanje
kompanije u cjelini, vodeći računa o poduzetim radnjama
kao posljedica provedenih analiza, one su korisne za sve
korist.
Na primjer, recimo da rangirate svoj kupaca u kategorijama
visok ili nizak rizik.
Ako se ove informacije generiraju ekstrahirajućim modelom ili
na druge načine, mora se staviti u DW i učiniti dostupnim
bilo ko, na bilo koji način pristupa, kao što je i
statičke izvještaje, tabele, tabele ili analitičku obradu u
linija (OLAP).
Međutim, trenutno je dosta ovakvih informacija
ostati u silosima dati pojedinaca ili odjela koje stvaraju
analizu. Organizacija u cjelini ima malu ili nikakvu vidljivost
za razumevanje. Samo miješanjem ove vrste sadržaja
informacije u vašoj kompaniji DW možete eliminisati silose
informacije i podignite svoje Dw okruženje.
Postoje dvije velike prepreke razvoju organizacije
of BI.
Prvo, imamo problem same organizacije
srodnih propisa.
Iako ne možemo pomoći u promjenama politike
organizacije, možemo vam pomoći da razumete komponente
BI organizacija, njena arhitektura i kako
IBM tehnologija olakšava njegov razvoj.
Druga prepreka koju treba prevazići je nedostatak tehnologije
integrisano i poznavanje metode koja podseća na ceo prostor
BI za razliku od samo male komponente.
IBM reaguje na promene u tehnologiji
integracije. Vaša je odgovornost da obezbedite dizajn
samosvjestan. Ova arhitektura se mora razvijati sa
tehnologija odabrana za integraciju bez ograničenja, ili barem sa
tehnologija koja se pridržava otvorenih standarda. Takođe, tvoj
menadžment kompanije mora osigurati da je preduzeće Bi
vršiti prema rasporedu i to ne dozvoliti
razvoj informacionih silosa koji proizilaze iz samoposluživanja
agende ili ciljeve.
To ne znači da BI okruženje nije osjetljivo
reagovati na različite potrebe i zahtjeve različitih korisnika; umjesto toga, to znači
da je implementacija tih individualnih potreba i zahtjeva
urađeno za dobrobit cijele BI organizacije.
Opis arhitekture BI organizacije može
može se naći na strani 9 na slici 1.1. Arhitektura demonstrira
bogat spoj tehnologija i tehnika.
Sa tradicionalnog pogleda, arhitektura uključuje sljedeće komponente
skladišta
Atomic Layer.
Ovo je temelj, srce cijelog DW-a, a samim tim i svega
strateško izvještavanje.
I dati pohranjeni ovdje zadržat će historijski integritet, izvještaji o
dati i uključuju izvedenu metriku, kao i čistoću,
integrirani i pohranjeni korištenjem predložaka za izdvajanje.
Sva naknadna upotreba ovih dati i povezane informacije je
proizilaze iz ove strukture. Ovo je odličan izvor za
ekstrakcija od dati i za izvještaje sa strukturiranim SQL upitima
Operativni depozit od dati ili bazu izvještaja o
dati(Skladište operativnih podataka (ODS) ili izvještavanje
baza podataka.)
Ovo je struktura od dati posebno dizajniran za
tehničko izvještavanje.
I dati pohraniti i prenijeti ove strukture konačno
propagirati u skladištu kroz organizacionu zonu (etažiranje
područje), gdje bi se mogao koristiti za strateško izvještavanje.
Staging area.
Prva stanica za većinu dati namenjeno za životnu sredinu
skladište je zona organizacije.
Evo ja dati oni su integrisani, očišćeni i transformisani u dati korisno to
će popuniti strukturu skladišta
Datum marts.
Ovaj dio arhitekture predstavlja strukturu dati koristi
posebno za OLAP. Prisustvo datamarta, ako i dati sono
pohranjene u zvjezdanoj šemi koje se preklapaju dati
višedimenzionalni u relacionom okruženju, ili u ormarićima za arhiviranje
di dati vlasnički koristi specifična OLAP tehnologija, kao što je
DB2 OLAP poslužitelj, nije relevantno.
Jedino ograničenje je da arhitektura olakšava upotrebu dati
multidimenzionalni.
Arhitektura također uključuje kritične tehnologije i tehnike Bi
koji se razlikuju kao:
Prostorna analiza
Prostor je neočekivana informacija za analitičara i
od presudne je važnosti da se završi rezolucija. Svemir može
predstavljaju informacije ljudi koji žive u određenoj
lokaciju, kao i informacije o tome gdje se ta lokacija nalazi
fizički u poređenju sa ostatkom svijeta.
Da biste izvršili ovu analizu, morate početi tako što ćete vezati svoju
informacije o koordinatama geografske širine i dužine. To je
se naziva "geokodiranje" i mora biti dio ekstrakcije,
transformacija, i proces učitavanja (ETL) na nivou
vašeg skladišta.
Data mining.
Ekstrakcija od dati omogućava našim kompanijama da rastu
broj kupaca, da predvidi prodajne trendove i omogući
upravljanje odnosima sa i kupaca (CRM), između ostalih inicijativa
BI.
Ekstrakcija od dati stoga mora biti integrisan sa strukturama
dati DWHouse i podržan od strane procesa skladištenja za
utvrditi efektivnu i efikasnu upotrebu tehnologije i
povezane tehnike.
Kao što je naznačeno u BI arhitekturi, atomski nivo
Dwhouse je, kao i datamarts, odličan izvor dati
za ekstrakciju. Te iste strukture također moraju biti
primaocima rezultata ekstrakcije da se utvrdi dostupnost za
najšira publika.
Agenti.
Postoje različiti agenti za ispitivanje klijenta za svaku tačku kao što su, tj
operativni sistemi kompanije i isti dw. Ovi agenti mogu
biti napredne neuronske mreže obučene da uče o njima
trendovi svake tačke, kao što je buduća potražnja za proizvodom
o promociji prodaje, motorima zasnovanim na pravilima na koje treba reagirati
un dato splet okolnosti, ili čak jednostavni agenti koji
oni prijavljuju izuzetke "vrhunskim rukovodiocima". Ovi procesi rade
generalno prisutan u realnom vremenu i stoga mora
biti usko povezan sa kretanjem istog dati.
Sve ove strukture dati, tehnologije i tehnike garancija
da nećete provesti noć stvarajući organizaciju
vaš BI.
Ova aktivnost će se razvijati u postupnim koracima, za male
bodova.
Svaki korak je nezavisan projektni napor i o njemu se izvještava
kao iteracija u vašoj dw ili BI inicijativi. Iteracije
može uključiti implementaciju novih tehnologija, za
počnite s novim tehnikama dodavanjem novih struktura dati ,
loading i dati dodatno, ili sa proširenjem analize
vaše okruženje. O ovom paragrafu se više raspravlja
dublje u poglavlju 3.
Pored tradicionalnih struktura Dw i alata Bi postoje i druge
funkcije vaše BI organizacije koje dugujete
dizajn, kao što su:
Dodirne tačke kupaca (dodir kupca
bodova).
Kao i kod svake moderne organizacije postoji veliki broj
dodirne tačke kupaca koje ukazuju na to kako imati iskustvo
pozitivno za tvoje kupaca. Postoje tradicionalni kanali kao što su i
trgovci, operateri centrala, direktna pošta, multimedija i štampa
oglašavanje, kao i najnoviji kanali poput e-pošte i weba, tj dati
moraju se nabaviti proizvodi s nekom tačkom kontakta,
transportuje, čisti, transformiše i potom naseljava u strukture dati della
BI.
Osnove of dati operativne i korisničke asocijacije (Operational
baze podataka i korisničke zajednice).
Na kraju kontaktnih tačaka kupaca naći ćete osnove dati
primjena kompanije i korisničke zajednice. THE dati postojeći
sono dati tradicionalna koja se mora ponovo ujediniti i spojiti sa dati da
protok od kontaktnih tačaka kako bi se ispunili potrebni
informacije.
Analitičari. (Analitičari)
Primarni korisnik BI okruženja je analitičar. On je taj
koristi od trenutne ekstrakcije dati operativan, integrisan sa
različiti izvori dati , proširen funkcijama kao što je analiza
geografske (geokodiranje) i predstavljene u BI tehnologijama koje
omogućavaju vam ekstrahiranje, OLAP, napredno SQL izvješćivanje i analizu
geografska. Primarni interfejs za analitičara sa okruženjem
izvještavanje je BI portal.
Međutim, analitičar nije jedini koji ima koristi od arhitekture
BI.
Rukovodioci, velika udruženja korisnika, pa čak i partneri, dobavljači i ja
kupaca oni bi trebali pronaći prednosti u poslovnoj BI.
Petlja povratnog napajanja.
BI arhitektura je okruženje za učenje. Princip
karakteristika razvoja je omogućavanje postojanih struktura dati
da se ažurira kroz korišćenu BI tehnologiju i kroz akcije
razumijevanja korisnika. Primjer je evaluacija
kupac (bodovanje kupaca).
Ako odjel prodaje napravi model rudarstva
rezultata korisnika za korištenje nove usluge, zatim
odjel prodaje ne bi trebao biti jedina grupa korisnika
usluge.
Umjesto toga, rudarski model bi trebao biti napravljen kao dio
prirodni protok podataka unutar kompanije i rezultati kupaca
trebalo bi da postane integralni deo informacionog okruženja
skladište, vidljivo svim korisnicima. Bi-bi-centrični IBM Suite
uključujući DB2 UDB, DB2 OLAP server uključuje većinu
deo važnih komponenti tehnologije, definisanih na slici
1.1.
Koristimo arhitekturu kako je prikazana na slici u ovoj knjizi
dajte nam nivo kontinuiteta i pokažite kako svaki proizvod
IBM-a odgovara opštoj šemi BI.
Pružanje informativnog sadržaja (pružanje
Informativni sadržaj)
Dizajniranje, razvoj i implementacija vašeg BI okruženja je
teška operacija. Dizajn mora da obuhvati toliko toga
trenutne i buduće poslovne potrebe. Dizajn arhitekture
mora biti potpuna kako bi uključila sve pronađene zaključke
tokom faze projektovanja. Izvršenje mora ostati
posvećeni jednoj jedinoj svrsi: razvoju arhitekture BI
kako je formalno predstavljeno na crtežu i na osnovu zahtjeva
poslovanja.
Posebno je teško tvrditi da će disciplina osigurati
relativnog uspeha.
Ovo je jednostavno jer ne razvijate cijelo BI okruženje
odjednom, ali se odvija u malim koracima tokom vremena.
Međutim, identifikovanje BI komponenti vaše arhitekture jeste
važno iz dva razloga: Vi ćete voditi sve naredne odluke
arhitektonske tehnike.
Moći ćete svjesno dizajnirati određenu upotrebu tehnologije
iako možda nećete dobiti predstavnika kojem je to potrebno
tehnologije nekoliko mjeseci.
Razumijevanje vaših poslovnih zahtjeva u dovoljnoj mjeri će uticati na vrstu
proizvoda koje ćete nabaviti za svoju arhitekturu.
Dizajn i razvoj vaše arhitekture osiguravaju
da je vaše skladište
nije slučajan događaj, već "dobro osmišljen",
pažljivo konstruisan oglas opera umjetnosti kao mozaik od
kombinovana tehnologija.
Dizajnirajte sadržaj informacija
Svo početno planiranje mora se fokusirati i identificirati
glavne komponente BI koje će biti potrebne okruženju
generalno u sadašnjosti i budućnosti.
Poznavanje poslovnih zahtjeva je važno.
Čak i prije nego što počne svo konvencionalno planiranje,
planer projekta često može identificirati jedan ili dva
komponentu odmah.
Ravnoteža komponenti koje mogu biti potrebne za
vaša arhitektura se, međutim, ne može lako pronaći.
U fazi projektovanja, glavni deo arhitekture
povezuje sesiju razvoja aplikacije (JAD) na pretragu
da identifikuju poslovne zahteve.
Ponekad se ovi zahtjevi mogu prepustiti vanjskim izvršiteljima
upite i izvještavanje.
Na primjer, korisnici to izjavljuju ako žele automatizaciju
trenutno se izvještaj mora ručno generirati integracijom
dva omjera struje i sabiranje proračuna izvedenih iz
kombinacija od dati.
Iako je ovaj zahtjev jednostavan, on definira određeni zahtjev
funkcionalnost funkcije koju morate uključiti kada
kupiti alate za izvještavanje za svoju organizaciju.
Projektant također mora slijediti dodatne zahtjeve za
dobiti kompletnu sliku. Korisnici se žele pretplatiti na
ovaj izvještaj?
Podskupovi izvještaja se generiraju i šalju raznim e-poštom
korisnici? Želite li vidjeti ovaj izvještaj na portalu kompanije?
Svi ovi zahtjevi su dio jednostavne potrebe za
zamijenite ručni izvještaj prema zahtjevu korisnika. Prednost
od ovih vrsta zahtjeva je da svi, korisnici i dizajneri, imaju
razumijevanje koncepta izvještaja.
Međutim, postoje i druge vrste poslova koje moramo planirati.
Kada su poslovni zahtjevi navedeni u obliku
Poslovna strateška pitanja, lako je za iskusnog dizajnera
uočiti zahtjeve mjere/činjenice i dimenzije.
Slika 1.2 ilustruje mjerne i dimenzionalne komponente a
Poslovni problem.
Ako JAD korisnici ne znaju kako da deklariraju svoje zahtjeve
u obliku poslovnog problema, dizajner će često pružiti
primjeri za preskakanje-početak sesije prikupljanja
zahtjevima.
Stručni dizajner može pomoći korisnicima da razumiju ne samo
stratešku trgovinu, ali i kako je obučiti.
Pristup prikupljanja zahtjeva razmatran je u poglavlju 3; za
sada želimo samo ukazati na potrebu dizajna za svakoga
vrste BI zahtjeva
Strateški poslovni problem nije samo uslov
Poslovni, ali i dizajnerski trag. Ako moraš da odgovoriš
na multidimenzionalno pitanje, onda morate zapamtiti,
dostaviti i dati dimenzije, a ako trebate pohraniti i
dati multidimenzionalno, morate odlučiti koju vrstu tehnologije ili
tehniku ​​koju ćete koristiti.
Da li implementirate rezerviranu šemu kockaste zvijezde ili oboje?
Kao što vidite, čak i jednostavan poslovni problem
može imati značajan uticaj na dizajn. kako god
ove vrste poslovnih zahtjeva su uobičajene i, naravno, najmanje
od strane iskusnih dizajnera i projektanta.
Bilo je dovoljno debata o tehnologijama i podršci
OLAP i širok spektar rješenja je dostupan. Do sada
spomenuli smo potrebu kombiniranja jednostavnog izvještavanja sa i
dimenzionalni zahtjevi poslovanja i kako ti zahtjevi
utiču na tehničke arhitektonske odluke.
Ali koji su to zahtjevi koji se ne mogu lako razumjeti
od strane korisnika ili DW tima? Analiza vam nikada neće trebati
prostorna (prostorna analiza)?
Modeli rudarenja dati oni će biti neophodan deo vašeg
budućnost? Ko zna?
Važno je napomenuti da ovakvih tehnologija nije mnogo
poznati općim zajednicama korisnika i članovima tima
Dw, djelomično, to bi se moglo dogoditi jer oni obično
njima rukuju neki interni ili tehnički stručnjaci treće strane. To je
ekstremni slučaj problema koje ove vrste tehnologija stvaraju. Self
korisnici ne mogu opisati poslovne zahtjeve niti ih uokviriti
kako bi dali smjernice dizajnerima, oni to mogu
ostati neprimećen ili, još gore, jednostavno ignorisan.
Postaje problematičnije kada dizajner i programer ne uspiju
mogu prepoznati primjenu jednog od ovih naprednih ali
kritične tehnologije.
Kao što smo često čuli da dizajneri kažu, „pa, zašto
Zar to nećemo ostaviti po strani dok ne dobijemo ovu drugu stvar?
“Da li ih zaista zanimaju prioriteti ili ih jednostavno izbjegavaju
zahtjeve koje ne razumiju? Najvjerovatnije je to posljednja hipoteza.
Recimo da je vaš prodajni tim saopštio zahtjev
poslovanja, kao što je prikazano na slici 1.3, kao što vidite,
zahtjev je uokviren u obliku poslovnog problema. Tamo
razlika između ovog problema i tipičnog dimenzionalnog problema je
udaljenost. U ovom slučaju, prodajna grupa želi znati,
na mjesečnom nivou ukupna prodaja proizvoda, skladišta i
kupaca koji žive u krugu od 5 milja od skladišta u kojem se nalaze
kupuju.
Nažalost, dizajneri ili arhitekte jednostavno mogu
zanemarite komponentu prostora govoreći: „mi imamo klijenta, tj
proizvod i ja dati depozita. Držimo se udaljenosti do
još jedna iteracija.
"Pogrešan odgovor. Ova vrsta poslovnog problema se tiče
u potpunosti BI. Predstavlja dublje razumijevanje
naše poslovanje i snažan analitički prostor za naše analitičare.
BI je izvan jednostavnog upita ili standardnog izvještavanja, ili
čak i OLAP. To ne znači da ove tehnologije ne rade
su važni za vašu BI, ali sami ne predstavljaju
BI okruženje.
Dizajn za informacijski kontekst
(Dizajn za informativni sadržaj)
Sada kada smo identifikovali poslovne zahtjeve koji ih izdvajaju
razne osnovne komponente moraju biti uključene u crtež
opšti arhitektonski. Neke od komponenti BI su dio
naših početnih napora, dok neki neće biti sprovedeni za
nekoliko mjeseci.
Međutim, svi poznati zahtjevi odražavaju se u dizajnu tako da
kada moramo implementirati određenu tehnologiju, mi jesmo
spremite se da to uradite. Nešto o projektu će odražavati razmišljanje
tradicionalno.
Na primjer, slika 1.1, na početku poglavlja, prikazuje datum
mart koji čuva dati dimenzionalni.
Ovaj set od dati koristi se za podršku kasnijoj upotrebi
dati dimenzionalno vođen poslovnim pitanjima koja
identifikovali smo. Kao i dodatni dokumenti
generisani, kao što je razvoj dizajna dati, mi
počet ćemo formalizirati kako i dati šire se u okolinu.
Utvrdili smo potrebu da zastupamo dati tako
dimenzionalno, dijeleći ih (prema specifičnim potrebama
utvrđeno) na pijacama.
Sljedeće pitanje na koje treba odgovoriti je: kako će se oni graditi
ove baze podataka?
Gradite li zvijezde da podupiru kocke, ili samo kocke, ili samo zvijezde?
(ili prave kocke, ili prave zvijezde). Generirajte arhitekturu za podatke
zavisne trgovine koje zahtijevaju atomski sloj za sve dati
aquisites? Dozvolite nezavisnim bazama podataka da pribave dati
direktno sa operativnih sistema?
Koju tehnologiju kocke ćete pokušati standardizirati?
Imate ogromne količine bogova dati potrebno za dimenzionu analizu
ili su vam potrebne kocke nacionalne prodajne snage na jednoj
na sedmičnoj bazi ili na oba? Napravite moćnu stavku
kao što je DB2 OLAP poslužitelj za financije ili Cognos kocke
PowerPlay za vašu prodajnu organizaciju ili oboje?
Ovo su sjajne arhitektonske dizajnerske odluke koje
će uticati na vaše BI okruženje od sada pa nadalje. Da,
identifikovali ste potrebu za OLAP-om. Sada kako ćete to izvesti
vrsta tehnike i tehnologije?
Kako neke od najnaprednijih tehnologija utiču na vaše
crteži? Pretpostavljamo da ste utvrdili potrebu
prostor u vašoj organizaciji. Sada morate pozvati
izdanja arhitektonskih crteža iako neplanirana
za izvođenje svemirskih komponenti nekoliko mjeseci. Arhitekta mora
dizajnirajte danas na osnovu onoga što je potrebno. Predvidite potrebu za
prostornu analizu koja generiše, skladišti, sprovodi i obezbeđuje
pristup dati prostor. Ovo bi zauzvrat trebalo da posluži kao a
ograničenje u pogledu vrste tehnologije i specifikacija
softversku platformu koju trenutno možete razmotriti. Za
na primjer, sistem uprave baza podataka odnosni
(RDBMS) koji izvodite za svoj atomski sloj mora imati
dostupno je robusno prostorno proširenje. Ovo bi osiguralo
maksimalne performanse pri korištenju geometrije i objekata
prostor u vašim analitičkim aplikacijama. Ako vaš RDBMS ne radi
mogu podnijeti i dati (prostorno-centrično) interno, tako da ćete morati
uspostaviti a baza podataka (prostorno-centrično) eksterno. Ovo komplikuje
upravljanje izdanjima i ugrožavanje vašeg ukupnog učinka,
da ne spominjem dodatne probleme koji su vam stvoreni
DBA, jer vjerovatno imaju malo razumijevanja
od osnova dati prostor takođe. S druge strane, ako je vaš
RDMBS upravlja svim prostornim i srodnim komponentama
optimizator je svjestan posebnih potreba (npr.
indeksiranje) prostornih objekata, onda vaši DBA mogu rukovati
odmah upravljajte izdanjima i možete podići
performanse.
Također, morate podesiti područje za izvođenje i sloj
atomsko okruženje koje uključuje čišćenje adrese (a
ključni element prostorne analize), kao i sljedeće
ušteda prostornih objekata. Slijed izdanja
dizajn se nastavlja sada kada smo uveli pojam čišćenja
adresa. Kao prvo, ova aplikacija će diktirati vrstu
softver koji vam je potreban za vaš ETL napor.
Potrebni su vam proizvodi kao što je Trillium da vam daju adresu
clean, ili ETL provajdera kojeg ste odabrali da to omogući
funkcionalnost?
Za sada je važno da cijenite nivo dizajna kakav jeste
mora biti završen prije nego što počnete da pravite svoj
okruženje (magacin). Gore navedeni primjeri bi trebali
demonstrirati mnoštvo dizajnerskih odluka koje moraju uslijediti
identifikaciju bilo kojeg posebnog poslovnog zahtjeva. Ako je urađeno
ispravno, ove dizajnerske odluke promoviraju
međuzavisnost između fizičkih struktura vašeg okruženja, tj
izbor korišćene tehnologije i tok razmnožavanja
informativni sadržaj. Bez ove konvencionalne arhitekture
BI, vaša organizacija će biti podložna mješavini
haotične postojeće tehnologije, u najboljem slučaju, ujedinjene na neki način
nije tačna da bi pružila prividnu stabilnost.
Održavajte informativni sadržaj
Donošenje vrijednosti informacija vašoj organizaciji je
veoma teška operacija. Bez dovoljnog razumevanja
i iskustvo, ili pravilno planiranje i crtanje, čak i
bolji timovi bi propali. S druge strane, ako imate veliku
uvid i detaljan dizajn, ali bez discipline za to
izvršenje, upravo ste potrošili svoj novac i svoje vrijeme
jer je vaš trud osuđen na propast. Poruka bi trebala
budite jasni: ako vam nedostaje jedan ili više ovih
vještine, razumijevanje / iskustvo ili planiranje / crtanje o
disciplina implementacije, to će dovesti do osakaćenja ili
uništiti konstrukciju BI organizacije.
Da li je vaš tim dovoljno pripremljen? Neko je na tvojoj
BI tim koji razumije široki dostupni analitički pejzaž
u BI okruženjima, u potrebnim tehnikama i tehnologijama
da utiče na taj pejzaž? Neko je u tvom timu
koji može prepoznati razliku primjene između naprednih
statičko izvještavanje i OLAP, ili razlike između ROLAP-a i OLAP-a? Jedan od
članovi vašeg tima jasno prepoznaju put
ekstrakt i kako to može uticati na skladište ili kako
može li skladište podržati performanse rudarstva? Član
tima razumije vrijednost dati prostor ili tehnologija
na osnovu agenta? Imate li nekoga ko cijeni jedinstvenu aplikaciju
ETL alata naspram brokerske tehnologije
poruka? Ako ga nemate, nabavite ga. BI je mnogo više
veliki dio normaliziranog atomskog sloja, OLAP-a, shema a
zvijezda i ODS.
Imajte razumijevanja i iskustva da prepoznate zahtjeve
BI i njihovih rješenja je od suštinskog značaja za vašu sposobnost da
pravilno formalizirati potrebe korisnika i dizajn
i provode svoja rješenja. Ako vaša korisnička zajednica ima
poteškoće u opisivanju zahtjeva, to je posao tima
skladište daju taj uvid. Ali ako tim od
magacin
ne prepoznaje specifičnu primjenu BI – na primjer, dat
rudarenje - onda to nije najbolja stvar koju BI okruženja rade
često ograničeni na pasivne depozite. Međutim, zanemarite ove
tehnologije ne umanjuje njihov značaj i efekat koji imaju
o nastanku vaših mogućnosti poslovne inteligencije
organizaciju, kao i informacijsku strukturu koju dizajnirate
promovirati.
Dizajn mora uključivati ​​pojam dizajna, ur
oba zahtevaju kompetentnu osobu. Osim toga, dizajn
to zahtijeva timsku filozofiju i zapažanje
standardima. Na primjer, ako ga je vaša kompanija osnovala
standardnu ​​platformu ili je identifikovao određeni RDBMS koji ste vi
želite da se standardizuje preko platforme, to se nazire
svi u timu se pridržavaju tih standarda. Generalno jedan
tim izlaže potrebu za normalizacijom (korisniku
communites), ali sam tim nije voljan da se pridruži
standardi uspostavljeni iu drugim oblastima u kompaniji ili možda čak u
slične kompanije. Ne samo da je ovo licemjerno, već osigurava da firma to ne čini
sposoban je da iskoristi postojeće resurse i investicije. To ne znači
da ne postoje situacije koje garantuju platformu ili jednu
nestandardna tehnologija; međutim, napori skladišta
oni treba da ljubomorno štite standarde preduzeća do
da poslovni zahtjevi ne nalažu drugačije.
Treća ključna komponenta potrebna za izgradnju BI
organizacija je disciplina.
Zavisi sveukupno, podjednako od pojedinaca i okoline.
Planeri projekata, sponzori, arhitekte i korisnici moraju to cijeniti
disciplina neophodna za izgradnju informacione strukture kompanije.
Dizajneri moraju usmjeriti svoje dizajnerske napore na takav način da
završiti druge neophodne poduhvate u društvu.
Na primjer, recimo da vaša kompanija gradi a
ERP aplikacija koja ima komponentu skladišta.
Stoga je odgovornost ERP dizajnera da sarađuju sa njima
tim skladišnog okruženja da se ne takmiči ili
duplirati već započeti posao.
Disciplina je takođe tema koja treba da bude zauzeta
od strane cijele organizacije i obično se osniva i povjerava a
izvršni nivo.
Da li su rukovodioci spremni da se pridržavaju osmišljenog pristupa? A
pristup koji obećava stvaranje informativnog sadržaja koji je
na kraju će doneti vrednost svim oblastima preduzeća, ali možda
Da li kompromituje pojedinačne ili resorne planove? Zapamtite izreku
“Razmišljati o svemu važnije je od razmišljanja samo o jednoj stvari.”
Ova izreka važi za BI organizacije.
Nažalost, mnoga skladišta fokusiraju svoje napore
koji žele da pokrenu i donesu vrednost određenom odeljenju ili a
specifične korisnike, bez obzira na organizaciju
general. Pretpostavimo da menadžer zatraži pomoć od tima na
washouse. Tim odgovara 90-dnevnim poslom koji
uključuje ne samo isporuku zahtjeva za obavještavanje definisanih od strane
menadžer, ali osigurava da sve dati baze se mešaju u nivo
atomski prije nego što je uveden u tehnologiju kocke
prijedlog.
Ovaj inženjerski dodatak osigurava da podvig od
washouse će imati koristi od dati potreban menadžeru.
Međutim, izvršna vlast je razgovarala sa vanjskim konsultantskim kućama da
su predložili sličnu aplikaciju sa isporukom za manje od 4
sedmice.
Pod pretpostavkom da je interni tim za bunar kompetentan,
menadžer ima izbor. Ko može podržati disciplinu
dodatni inženjering potreban za farmu bunara
informatičko preduzeće ili mogu izabrati da naprave svoje
brzo rešenje. Čini se da je ovo drugo zaista izabrano
prečesto i služi samo za kreiranje kontejnera informacija
od kojih nekolicina ili pojedinac imaju koristi.
Kratkoročni i dugoročni ciljevi
Arhitekte i projektanti moraju formalizirati a
dugoročnu viziju ukupne arhitekture i planova za
rasti u BI organizaciji. Ova kombinacija od
kratkoročni profit i dugoročno planiranje
predstavljaju dva lica napora BI. Kratkoročni dobitak
isteka je aspekt BI koji je povezan s iteracijama
vaše skladište.
Na ovo se fokusiraju planeri, arhitekti i sponzori
ispunjavaju specifične poslovne zahtjeve. Na ovom nivou je
grade se fizičke strukture, kupuje se tehnologija i
implementirane su tehnike. Oni nikako nisu stvoreni za suočavanje
specifične zahtjeve definirane od strane određenih korisničkih zajednica.
Sve se radi kako bi se ispunili definisani specifični zahtjevi
iz određene zajednice.
Dugoročno planiranje je, međutim, drugi aspekt
of BI. Ovo je mjesto gdje su planovi i dizajn osigurali da to bude
izgradili bilo koju fizičku strukturu, odabrane tehnologije i
realizovane tehnike napravljene sa pogledom prema preduzeću. I the
dugoročno planiranje koje obezbeđuje koheziju
neophodno kako bi se osiguralo da poslovne koristi prirastu svima
pronađene kratkoročne dobiti.
Opravdajte svoj BI napor
Un skladište podataka samo po sebi nema inherentnu vrijednost. U drugom
riječi, ne postoji inherentna vrijednost između tehnologija
skladištenje i tehnike implementacije.
Vrijednost svakog skladišnog napora nalazi se u akcijama
izvedena kao rezultat skladišnog okruženja i sadržaja
informacije kultivisane tokom vremena. Ovo je kritična tačka koju treba razumjeti
prije nego što ikada pokušate procijeniti vrijednost bilo koje inicijative
Dom.
Prečesto arhitekte i planeri pokušavaju primijeniti vrijednost na
skladišne ​​fizičke i tehničke komponente kada je u stvari vrijednost
nalazi sa poslovnim procesima na koje pozitivno utiče
skladište i dobro stečene informacije.
Ovdje leži izazov za osnivanje BI: Kako opravdati investiciju?
Ako sama kuća nema suštinsku vrednost, dizajneri od
projekat mora istražiti, definirati i formalizirati koristi
postižu oni pojedinci koji će koristiti skladište za
poboljšati specifične poslovne procese ili vrijednost
zaštićene informacije ili oboje.
Zakomplikovati teme, bilo koji poslovni proces
na koje utiču napori u skladištu mogli bi dati koristi
“značajan” ili “mali”. Značajne prednosti pružaju a
opipljiva metrika za mjerenje povrata ulaganja (ROI) – npr
na primjer, okretanje zaliha dodatno vrijeme tokom perioda
specifične ili za niže troškove transporta po pošiljci. To je više
Teško je odrediti male prednosti, kao što je bolji pristup
informacije, u smislu opipljive vrijednosti.
Povežite svoj projekat da biste saznali
poslovne zahtjeve
Prečesto dizajneri projekta pokušavaju povezati vrijednost
skladišta sa amorfnim ciljevima preduzeća. navodeći to
“Vrijednost skladišta je zasnovana na našoj sposobnosti
zadovoljiti strateške zahtjeve” ugodno otvaramo
govor. Ali samo to nije dovoljno da se utvrdi da li
investicija u magacin ima smisla. Bolje je povezati ponavljanja
skladišta sa specifičnim komercijalnim zahtjevima i napomenama.
Izmjerite ROI
Izračunavanje ROI u skladištu može biti
posebno teško. Posebno je teško ako vodi
princip određenog ponavljanja je nešto nematerijalno ili
lako izmjeriti. Istraživanje je pokazalo da korisnici percipiraju
dvije glavne prednosti BI inicijativa:
▪ Stvoriti sposobnost donošenja odluka
▪ Kreirati pristup informacijama
Ove pogodnosti su meke (ili blage) koristi. Lako je to vidjeti
kako možemo izračunati ROI na osnovu tvrdog ruba (o
veće) kao što je smanjenje troškova transporta, ali kako
mjerimo li sposobnost donošenja boljih odluka?
Ovo je svakako izazov za planere projekta kada
oni pokušavaju da navedu kompaniju da investira u jednu određenu
skladišni napor. Povećanje prodaje ili smanjenje troškova
one više nisu centralne teme koje pokreću BI okruženje.
Umjesto toga, tražite pristup u poslovnim zahtjevima
najbolje do informacija kako bi određeni odjel mogao
donosite odluke brže. Ovo su strateški pokretači a
koji su podjednako važni za firmu, ali jesu
dvosmislenije i teže za karakterizaciju opipljivom metrikom.
U ovom slučaju, izračunavanje ROI može biti pogrešno, ako ne i irelevantno.
Dizajneri projekta moraju biti u stanju da pokažu vrijednost
opipljivo za rukovodioce da odluče da li će ulaganje u
posebno ponavljanje se računa. Međutim, nećemo predložiti novi
metodom za izračunavanje ROI-a, niti ćemo iznositi bilo kakve za ili argumente
protiv toga.
Dostupni su mnogi članci i knjige u kojima se raspravlja o osnovama
izračunajte ROI. Postoje posebni vrijednosni prijedlozi kao što je vrijednost
o investicijama (VOI), koje nude grupe poput Gartnera, da možete
istraživati. Umjesto toga, fokusirat ćemo se na ključne aspekte bilo kojeg
ROI ili druge vrijednosti koje trebate uzeti u obzir.
Primjena ROI
Pored argumenta o „tvrdim“ beneficijama naspram „mekih“ koristi
U vezi sa BI naporima postoje i druga pitanja koja treba razmotriti
kada primenimo ROI. Na primjer:
Pripisivanje prevelike uštede naporima DW-a koji će doći
kako god
Recimo da je vaša kompanija prešla sa arhitekture
mainframe na distribuirano UNIX okruženje. Tako bilo
uštede koje se mogu (ili ne moraju) ostvariti tim naporom
ne treba pripisivati ​​isključivo, ako svima (?), to
skladište.
Ne računati sve je skupo. I ima mnogo stvari za
uzeti u obzir. Razmotrite sljedeću listu:
▪ Troškovi pokretanja, uključujući izvodljivost.
▪ Troškovi namjenskog hardvera sa povezanim skladištem e
komunikacije
▪ Troškovi softvera, uključujući upravljanje dati i ekstenzije
klijent/server, ETL softver, DSS tehnologije, alati
aplikacije za vizualizaciju, zakazivanje i protok
softver za rad i nadzor, .
▪ Troškovi projektovanja strukture dati, sa realizacijom, i
optimizacija
▪ Troškovi razvoja softvera direktno povezani sa trudom
BI
▪ Troškovi kućne podrške, uključujući optimizaciju
performanse, uključujući kontrolu verzija softvera e
operacije pomoći
Primijenite “Big-Bang” ROI.
Realizacija magacina kao jedinstven i gigantski napor
sigurno neće uspjeti, pa izračunajte i ROI za inicijativu
velikog preduzeća Ponuda je iznenađujuća, a da dizajneri
nastavljaju sa slabim pokušajima da procijene vrijednost cjeline
napor.
Jer dizajneri pokušavaju dati novčanu vrijednost
na inicijativu preduzeća ako je to opšte poznato i prihvaćeno
da li je teško procijeniti specifična ponavljanja? Kako je to moguće? Nije
moguće uz nekoliko izuzetaka. Ne radi to.
Sada kada smo ustanovili šta ne treba raditi prilikom izračunavanja
ROI, evo nekoliko tačaka koje će nam pomoći u definiranju
pouzdan proces za procjenu vrijednosti vaših BI napora.
Dobivanje ROI saglasnosti. Bez obzira na tvoje
izbor tehnike za procjenu vrijednosti vaših BI napora je obavezan
biti dogovoren od strane svih strana, uključujući planere projekta,
korporativni sponzori i rukovodioci.
Podijelite ROI na prepoznatljive dijelove. Neophodan korak ka unutra
razumno izračunavanje ROI je da se taj proračun koncentriše na a
konkretan projekat. To vam onda omogućava da procijenite vrijednost
na osnovu specifičnih poslovnih zahtjeva koji su ispunjeni
Definirajte troškove. Kao što je spomenuto, brojni troškovi moraju biti
razmatrano. Nadalje, troškovi moraju uključivati ​​ne samo povezane troškove
na pojedinačnu iteraciju, ali i na povezane troškove
kako bi se osigurala usklađenost sa korporativnim standardima.
Definirajte beneficije. Jasnim povezivanjem ROI sa zahtjevima
određene trgovine, trebali bismo biti u mogućnosti da identifikujemo
pogodnosti koje će dovesti do ispunjavanja zahtjeva.
Smanjite troškove i koristi u neposrednim dobicima. To je put
najbolji način za zasnivanje vaših procjena na neto sadašnjoj vrijednosti
(NPV) za razliku od pokušaja predviđanja buduće vrijednosti u
buduća zarada.
Smanjite vrijeme da svoj ROI podijelite na minimum. I'
dobro dokumentovano dugo vremena korišteno u vašem
ROI
Koristite više od jedne formule ROI. Postoje brojne metode za
Predviđanje povrata ulaganja i trebali biste planirati da li ćete koristiti jedan ili
plus, uključujući neto sadašnju vrijednost, internu brzinu povratne informacije
(IRR) i oporavak.
Definirajte ponovljivi proces. Ovo je ključno za izračunavanje
bilo koju dugoročnu vrijednost. Trebalo bi da bude dokumentovano a
jedan ponovljivi proces za sve podsekvence projekta a
pratiti.
Navedeni problemi su najčešći problemi koje definišu stručnjaci
okruženja bunara. Insistiranje uprave na
imati “Big-Bang” ROI isporuku je veoma zbunjujuće. Ako pokrenete sve
vaše kalkulacije ROI tako što ćete ih raščlaniti na prepoznatljive, opipljive dijelove, imate
dobra prilika za procjenu tačne procjene ROI.
Pitanja o prednostima povrata ulaganja
Bez obzira na vaše prednosti, meke ili tvrde, možete koristiti
neka osnovna pitanja za određivanje njihove vrijednosti. To
primjer koristeći jednostavan sistem skale, od 1 do 10, vi
možete pratiti učinak bilo kojeg napora koristeći sljedeće
pitanja:
▪ Kako biste ocijenili razumijevanje dati prateći ovo
projekat Vaše kompanije?
▪ Kako biste procijenili poboljšanja procesa kao rezultat
ovaj projekat?
▪ Kako biste sada izmjerili uticaj novih uvida i zaključaka
dostupno ovom iteracijom
▪ Kakav je bio uticaj novih računarskih okruženja e
izvođenje kao rezultat naučenog?
Ako je odgovora na ova pitanja malo, moguće je da
preduzeće nije vredno uloženih investicija. Pitanja sa visokim
bodovni poen do značajnog povećanja vrijednosti i treba
služe kao vodiči za dalju istragu.
Na primjer, visok rezultat za poboljšanja procesa
trebalo bi da navede dizajnere da pogledaju kako su procesi
poboljšan. Možda ćete otkriti da su neki ili svi dobici ostvareni
oni su opipljivi i stoga može lako biti novčana vrijednost
primijenjeno.
Izvlačenje maksimuma iz prve iteracije
magacin
Najveći rezultat vašeg poslovnog napora često je u
prvih nekoliko iteracija. Ovi rani napori tradicionalno
uspostaviti najkorisniji informativni sadržaj za javnost e
uspostavlja pomoć temelja tehnologije za kasnije
BI aplikacije.
Obično svaki sljedeći niz dati projekta of
skladišta donose sve manju dodatnu vrijednost preduzeću
general. Ovo je posebno tačno ako iteracija ne uspije
dodaje nove argumente ili ne zadovoljava potrebu za novim
korisničku zajednicu.
Ova funkcija pohranjivanja također se odnosi na hrpe
raste po dati istoričari. Kako naknadni napori zahtijevaju više
dati i kako više dati se vremenom ulivaju u skladište, većina
dati postaje manje relevantan za korišćenu analizu. Ove dati sono
često zovu dati spavaju i uvijek ih je skupo držati jer
skoro da se ne koriste.
Šta to znači za sponzore projekta? U suštini, i
prvi sponzori dijele više od troškova ulaganja.
Ovo je primarno jer su oni poticaj za osnivanje sloja
veliki skladišni resursi i tehnološko okruženje,
uključujući organske.
Ali ovi prvi koraci nose najveću vrijednost, a time i dizajnere
projekta često mora opravdati investiciju.
Projekti urađeni nakon vaše BI inicijative mogu imati troškove
inferiorni (u poređenju sa prvim) i direktni, ali imaju manju vrijednost
preduzeću.
I vlasnici organizacija moraju početi razmatrati
baciti akumulaciju dati i manje relevantne tehnologije.
Data Mining: Ekstrakcija dati
Brojne arhitektonske komponente zahtijevaju varijacije
tehnologije i tehnike rudarenja podataka—
na primjer, različiti "agenti" za ispitivanje tačaka interesa
kupaca, operativnim sistemima kompanije i za isti dw. Ove
agenti mogu biti napredne neuronske mreže obučene za
lonac trendova, kao što je buduća potražnja za proizvodima zasnovana na
promocije prodaje; motori zasnovani na pravilima za
reagovati na set dato okolnosti, na primjer, dijagnoza
medicinske i preporuke za liječenje; ili čak jednostavni agenti
sa ulogom prijavljivanja izuzetaka višim menadžerima (vrh
rukovodioci). Generalno, ovi procesi ekstrakcije dati si
verifikovati u realnom vremenu; stoga, moraju biti ujedinjeni
potpuno sa pokretom dati sami.
Online analitička obrada
Online analitika
Sposobnost rezanja, kockice, kotrljanja, bušenja
i izvršite analizu
šta ako, je unutar opsega, cilja paketa
IBM tehnologija. Na primjer, funkcije analitičkog tretmana
online (OLAP) postoji za DB2 koji donosi dimenzionalnu analizu u
motor of baza podataka isto.
Funkcije dodaju dimenzionalni uslužni program u SQL while
iskoristite sve prednosti prirodnog dijela DB2. Drugi
primjer OLAP integracije je alat za ekstrakciju, DB2
OLAP Analyzer Server. Ova tehnologija omogućava kocke od
DB2 OLAP poslužitelj biti brz i automatski
analizirane kako bi se locirali i izvijestili o vrijednostima dati neobično ili neočekivano
za svu kocku trgovačkom analitičaru. I konačno, funkcije
DW centar, između ostalog, obezbjeđuje sredstva za provjeru arhitekata
ostale stvari, profilirajte kocku DB2 OLAP poslužitelja kao dio
priroda ETL procesa.
Prostorna analiza. Prostorna analiza
Prostor predstavlja polovinu analitičkih sidara (kondukcija).
potrebno za panoramu
široko analitičko (vrijeme predstavlja drugu polovinu). Atomski nivo
(atomski nivo) skladišta, prikazanog na slici 1.1,
uključuje osnove za vrijeme i prostor. Snimci
Analiza sidra zasnovana na vremenu za informacije o vremenu i adresi
anker analiza iz svemira. Vremenske oznake
izvršite analizu na vrijeme i obratite se potencijalnim informacijama
prostorna analiza. Na dijagramu je prikazan proces geokodiranja
pretvaranje adresa u tačke na mapi ili tačke u prostoru
tako da koncepti poput udaljenosti i iznutra/spolja mogu biti
koristi se u analizi – sprovedenoj na atomskom nivou i prostornoj analizi
koji se stavlja na raspolaganje analitičaru. IBM pruža proširenja
prostor, razvijen sa Institutom za istraživanje sistema zaštite životne sredine (ESRI),
al baza podataka DB2 tako da prostorni objekti mogu biti
čuva kao normalan deo baza podataka relacijski. db2
Spatial Extenderi, oni također pružaju sve SQL ekstenzije za
iskoristite prednosti prostorne analize. Na primjer, SQL ekstenzije iz
pitanje o
udaljenost između adresa ili ako je tačka unutar ili izvan područja
definisani poligonalni, su analitički standard sa prostornim
ekstenderi. Pogledajte poglavlje 16 za više informacija.
baza podataka-Rezident Tools Tools baza podataka-
Rezident
DB2 ima mnoge SQL BI-rezidentne pomoćne značajke
u akciji analize. To uključuje:
▪ Rekurzivne funkcije za obavljanje analize, kao što je „pronađi
sve moguće putanje leta od San Francisco a Njujork".
▪ Analitičke funkcije za rangiranje, kumulativne funkcije, kocka
i zbirni paketi za olakšavanje zadataka koji se obično dešavaju
samo uz OLAP tehnologiju, sada su prirodni dio
motor of baza podataka
▪ Mogućnost kreiranja tabela koje sadrže rezultate
Prodavci od baza podataka lideri kombinuju više od BI sposobnosti
Nel baza podataka isto.
Glavni dobavljači baza podataka oni se miješaju više od
funkcionalnost BI in baza podataka isto.
Ovo pruža najbolje performanse i više mogućnosti izvršenja za datoteke
BI rješenja.
Raspravlja se o DB2 V8 karakteristikama i funkcijama
detaljno u sljedećim poglavljima:
Osnove tehničke arhitekture i upravljanja podacima
(Poglavlje 5)
▪ DB2 BI osnove (poglavlje 6)
▪ DB2 materijalizirane tablice upita (materijalizirani upit
Tabele) (poglavlje 7)
▪ DB2 OLAP funkcije (poglavlje 13)
▪ DB2 poboljšane BI karakteristike i funkcije (Poboljšani BI
Karakteristike i funkcije) (poglavlje 15)
Pojednostavljeni sistem dostave podataka
Sistem isporuke od dati pojednostavljeno
Arhitektura prikazana na slici 1.1 uključuje nekoliko
strukture dati fizički. Jedno je skladište dati operativni.
Općenito, ODS je objektno orijentisan,
integrisana i aktuelna. Da li biste napravili ODS za podršku, npr
na primjer, ured za prodaju. Prodaja ODS bi dopunila dati
iz brojnih različitih sistema, ali bi zadržao samo, npr
na primjer, današnje transakcije. ODS se može ažurirati
čak i nekoliko puta dnevno. Istovremeno, procesi
push i dati integrisan u druge aplikacije. Ovaj objekat je
posebno dizajniran za integraciju dati strujni i dinamički e
bio bi vjerovatno kandidat za podršku analitici u realnom vremenu,
kako pružiti agente usluga kupaca informacije o prodaji
struje kupaca izdvajanjem informacija o trendu prodaje
iz samog magacina. Druga struktura prikazana na slici 1.1 je
formalni status za dw. Ne samo da je ovo mjesto za
izvršenje potrebne integracije, kvalitet dati, e
transformacije dati zaliha dolaze, ali i to je
pouzdano i privremeno skladište za dati replicirao to
može se koristiti u analitici u realnom vremenu. Ako odlučite
koristite ODS ili prostor za stažiranje, jedan
najboljih alata za popunjavanje ovih struktura dati koristeći
različiti operativni izvori je DB2 heterogeni distribuirani upit.
Ovu mogućnost isporučuje DB2 opcijska funkcija
pod nazivom DB2 Relational Connect (samo upiti) i kroz DB2
DataJoiner (zaseban proizvod koji postavlja pitanje,
umetak, ažuriranje i mogućnost otkazivanja a
heterogeno distribuirani RDBMS).
Ova tehnologija omogućava arhitektima da dati vezati dati di
proizvodnja sa analitičkim procesima. Ne može samo tehnologija
prilagoditi praktično bilo kojem od zahtjeva za replikaciju koji
mogli bi doći do analize u realnom vremenu, ali ona
takođe se mogu povezati na širok spektar baza dati više
popularan, uključujući DB2, Oracle, Sybase, SQL Server,
Informix i drugi. DB2 DataJoiner se može koristiti za popunjavanje
struktura dati formalno poput ODS-a ili čak stola
stalno zastupljen u skladištu predviđenom za restauraciju
brzo za trenutna ažuriranja ili za prodaju. naravno,
te iste strukture dati može se popuniti pomoću
još jedna važna tehnologija dizajnirana za replikaciju dati, IBM
DataPropagator Relational. (DataPropagator je zaseban proizvod
za centralne sisteme. DB2 UNIX, Linux, Windows i OS/2 uključuju
usluge replikacije dati kao standardna karakteristika).
Druga metoda za kretanje dati operišući okolo
za poduzeće je inače integrator poslovnih aplikacija
poznat kao posrednik poruka
Jedinstvena tehnologija omogućava neusporedivu kontrolu u centru
(ciljanje) i pomaknite se dati oko kompanije. IBM ima brokera
najčešće korištene poruke, MQSeries, ili varijacije
proizvoda koji uključuje zahtjeve za e-commerce, IBM
WebSphere MQ.
Za više diskusije o tome kako iskoristiti MQ za podršku a
skladište i BI okruženje, posjetite web stranica knjige. Za sada jeste
dovoljno je reći da je ova tehnologija odličan medij za
hvatanje i transformacija (koristeći MQSeries Integrator) dati
ciljani operativci regrutovani za BI rješenja. Tamo
MQ tehnologija je integrisana i upakovana u UDB V8, koji
znači da se redovima poruka sada može upravljati
kao da su DB2 tabele. Koncept zavarivanja
poruke u redu čekanja i univerzum baza podataka relacione glave
prema moćnom okruženju isporuke dati.
Zero-Latency Nulto kašnjenje
Krajnji strateški cilj za IBM je analiza nulte latencije.
Kako je definisano od strane
Gartner, BI sistem mora biti u stanju da zaključi, asimiluje
i pružati informacije analitičarima na zahtjev. Izazov,
naravno, leži u tome kako se mešati dati aktuelno iu realnom vremenu
sa potrebnim istorijskim informacijama, kao što su i dati srodni model/od
tendencija, ili izvučeno razumevanje, kao ocrtavanje
klijent
Takve informacije uključuju, na primjer, identifikaciju kupaca ad
visok ili nizak rizik ili koji proizvodi i kupaca kupiće mnogo
vjerovatno ako već imaju sira u kolicima
akvizicije.
Dobivanje nulte latencije zapravo zavisi od dva
osnovni mehanizmi:
▪ Potpuno spajanje dati koji se analiziraju sa
utvrđenim tehnikama i alatima koje je razvio BI
▪ Sistem isporuke dati efikasno da to osigura
analiza u realnom vremenu je zapravo dostupna
Ovi preduslovi za nultu latenciju se ne razlikuju od ova dva
ciljeve koje je postavio IBM i gore opisane.
Čvrsto spajanje dati je dio programa
besprijekornu integraciju organizirao IBM. I stvoriti sistem
isporuke od dati efikasan u potpunosti zavisi od
dostupna tehnologija koja pojednostavljuje proces isporuke
dati. Kao rezultat, dva od tri IBM-ova cilja su kritična
napraviti treću. IBM svjesno razvija svoje
tehnologija za osiguranje nulte latencije je stvarnost za
skladišnih napora.
Sažetak / Sinteza
BI organizacija pruža mapu puta za
kreirajte svoje okruženje
iterativno. Mora biti prilagođen tako da odražava potrebe
Vaše poslovanje, kako sadašnje tako i buduće. Bez arhitektonske vizije
široka, broj ponavljanja je nešto više od
nasumične implementacije centralnog skladišta koje malo doprinose
stvoriti široko, informativno preduzeće.
Prva prepreka za menadžere projekata je kako opravdati
ulaganja neophodna za razvoj BI organizacije.
Dok je izračun ROI ostao glavni oslonac za
magacinskih dostignuća, postaje sve teže
tačno predvideti. To je dovelo do drugih metoda za
Odluku da li ćete isplatiti svoj novac. The
vrijednost na investiciji2 (VOI), na primjer, je nabavljena
kao rešenje.
To je obaveza arhitekata dati i na projektantima
namjerno stvaraju i pružaju informacije udruženjima
korisnicima, a ne samo davati sui uslugu dati. Postoji a
ogromna razlika između to dvoje. Informacija je nešto što se radi
razlika u procesima donošenja odluka i efektivnosti; relativno, tj
dati oni su gradivni blokovi za izvođenje tih informacija.
Čak i ako je kritičan prema izvoru dati za adresiranje zahteva
BI okruženje bi trebalo da ima veću ulogu
u kreiranju informativnog sadržaja. Moramo uzeti
dodatne mjere za čišćenje, integraciju, transformaciju ili
inače kreirati informativni sadržaj prema kojem se
korisnici mogu poduzeti radnju, pa se moramo pobrinuti da oni
akcije i te odluke, gdje su razumne, imaju povratnu informaciju
u BI okruženju. Ako ostavimo skladište da služi samo na dati,
osigurano je da će asocijacije korisnika kreirati sadržaj
informacije potrebne za poduzimanje radnje. To osigurava da njihova
zajednica će moći da donosi bolje odluke, ali preduzeće
pati od nedostatka znanja koje su koristili.
datum da arhitekte i projektanti iniciraju projekte
specifični za BI okruženje, ostaju odgovorni preduzeću
uglavnom. Jednostavan primjer ove dvije funkcije
lica iteracija BI nalazi se u izvoru dati. Sve
dati primljeni za posebne komercijalne zahtjeve moraju biti
naseljen u prvom atomskom sloju. Time se osigurava razvoj
korporativne informacijske imovine, kao i upravljanje, usmjeravanje
specifične korisničke zahtjeve definirane u iteraciji.

W hatisa D ata W arehouse ?
Skladište podataka to je srce arhitekture informacionih sistema
od 1990. godine i podržava informacione procese nudeći solidnu
integrisana platforma od dati istorijski uzet kao osnova za kasnije
analize. THE skladište podataka nude lakoću integracije u a
svijet nekompatibilnih aplikativnih sistema. Datum
skladište je evoluiralo u modu. Skladište podataka
organizirati i zapamtiti i dati neophodno za informacione procese e
analitički na osnovu duge istorijske vremenske perspektive. Sve
ovo uključuje znatan i stalan trud u izgradnji i
u održavanju skladište podataka.
Dakle, šta je a skladište podataka? A skladište podataka i:
▪ predmetno orijentisan
▪ integrisani sistem
▪ vremenska varijacija
▪ nepostojan (ne poništava)
zbirka od dati koristi se kao podrška menadžerskim odlukama u
implementacija procesa.
I dati umetnuto u skladište podataka nastaju u većini
slučajevi iz operativnih okruženja. The skladište podataka je napravljen od strane jednog
skladišna jedinica, fizički odvojena od ostatka
sistem, koji sadrži dati prethodno obrađeno od strane
aplikacije koje rade na informacijama koje potiču iz okruženja
operativni.
Doslovna definicija a skladište podataka zaslužuje detaljnu istragu
objašnjenje jer postoje važne motivacije i značenja
fond koji opisuju karakteristike skladišta.
PREDMETNA ORIJENTACIJA ORIJENTACIJA
TEMATSKI
Prva karakteristika a skladište podataka je da je to usmjereno
glavni igrači u kompaniji. Vodič kroz procese
dati to je u suprotnosti sa klasičnijim metodom koji predviđa
orijentacija aplikacija prema procesima i funkcijama,
metod koji uglavnom dijeli većina
stariji sistemi usmerenja.
Operativni svijet je dizajniran oko aplikacija i funkcija
kao što su zajmovi, štednja, bankovne kartice i trust za instituciju
finansijski. Svijet dw je organiziran oko tema
principali kao što su kupac, prodavac, proizvod i aktivnost.
Usklađivanje oko tema utiče na dizajn i
o izradi dati pronađeno u dw. Najupečatljivije,
glavna tema utiče na najvažniji deo
ključna struktura.
Na svijet aplikacije utiče i dizajn podataka
osnovi nego iz dizajna procesa. Svijet of
dw je fokusiran isključivo na video modeliranje dati Uključeno je
crtež od baza podataka. Dizajn procesa (u njegovom obliku
klasična) nije dio dw okruženja.
Razlike između izbora aplikacije procesa/funkcije i
izbor predmeta otkrivaju se i kao razlike u sadržaju
od dati na detaljnom nivou. THE dati del dw ne uključuje i dati da
neće se koristiti za DSS proces, dok aplikacije
operativno orijentisan dati sadrže i dati zadovoljiti
odmah funkcionalne/procesne zahtjeve koji mogu o
najmanje koristi od DSS analitičara.
Još jedan važan način na koji se operativno orijentirane aplikacije
ai dati razlikovati od dati dw je u izvještajima dati. ja dati
operativci održavaju stalnu vezu između dva ili više stolova
na osnovu poslovnog pravila koje je aktivno. THE dati by dw
oni obuhvataju spektar vremena i omjeri pronađeni u dw su
mnogi. Mnoga trgovačka pravila (i shodno tome, mnoga
izvještaji o dati ) su zastupljeni u zalihama dati između dva ili
više stolova.
(Za detaljno objašnjenje kako su odnosi između dati sono
upravljano u DW-u, o tome se pozivamo na Tech Topic
pitanje.)
Ni iz jedne druge perspektive osim iz perspektive razlike
fundamentalno između izbora funkcionalnosti/procesa i primjene
izbor predmeta, veća je razlika između sistema
operativni i dati i DW.
INTEGRACIJA INTEGRACIJA
Najvažniji aspekt dw okruženja je da i dati pronađeno
u dw se lako integrišu. UVIJEK. WITHOUT
IZUZIMCI. Sama suština dw okruženja je da i dati
sadržane u granicama skladišta su integrisane.
Integracija se otkriva na mnogo različitih načina – u konvencijama
identifikovan konzistentan, u meri konzistentnih varijabli, u
konzistentne kodificirane strukture, u fizičkim atributima dati
dosljedan, i tako dalje.
Tokom godina dizajneri nekoliko aplikacija su ga napravili
posjedovanje mnogih odluka o tome kako aplikacija treba
biti razvijeni. Stil i individualizirane dizajnerske odluke
aplikacije dizajnera otkrivaju se na stotinu načina: u
razlike kodiranja, ključna struktura, fizičke karakteristike,
konvencije o identifikaciji i tako dalje. Kolektivni kapacitet mnogih
dizajneri aplikacija za kreiranje nedosljednih aplikacija
to je legendarno. Slika 3 otkriva neke od više razlika
važno za način na koji su aplikacije dizajnirane.
Kodiranje: Kodiranje:
Dizajneri aplikacija su odabrali kodiranje polja –
seks - na različite načine. Dizajner predstavlja seks kao
“m” i “f”. Drugi dizajner predstavlja rod kao "1"
i “0”. Drugi dizajner predstavlja rod kao "x" i
"y". Drugi dizajner predstavlja rod kao "muški" i
"žensko". Zaista nije važno kako seks ulazi u DW. "M"
i "F" su vjerovatno jednako dobri kao i svi
reprezentacija.
Ono što je važno jeste da iz kog god porekla potiče polno polje,
to polje stiže u DW u konzistentnom integrisanom stanju. Od
posljedica kada se polje učita u DW iz
aplikacija u kojoj je to formairano
“M” i “F”, tj dati mora se konvertovati u DW format.
Measurement of Attributes: Measurement of
Atributi:
Dizajneri aplikacije odlučili su izmjeriti cjevovod
na razne načine tokom kursa
Nekoliko godina. Dizajner pohranjuje i dati cjevovoda u
centimetara. Drugi dizajner aplikacija pohranjuje dati
cjevovoda u inčima. Još jedan dizajner
prodavnice aplikacija i dati cjevovoda u milionima kubnih stopa
u sekundi. I drugi dizajner pohranjuje informacije o
cjevovoda u smislu jardi. Bez obzira na izvor, kada
informacije o cjevovodu stižu u DW moraju biti
mjereno na isti način.
Prema indikacijama na slici 3, problemi integracije
oni utiču na skoro svaki aspekt dizajna – karakteristike
fizičkih bogova dati, dilema da postoji više od jednog izvora dati, u
pitanje nedosljednih identificiranih uzoraka, formata dati
nedosledno, i tako dalje.
Bez obzira na argument dizajna, rezultat je isti –
i dati moraju biti pohranjeni u DW u jednini e
globalno prihvatljiv način čak i kada operativni sistemi
fond skladišti drugačije i dati.
Kada analitičar DSS-a pogleda DW, analitičarev objektiv
treba da bude eksploatacija dati koji se nalaze u magacinu,
umjesto da se pitate o kredibilitetu ili dosljednosti
dati.
VREMENSKA VARIJANCIJA
Sve sam dati u DW-u su tačni u određenom trenutku.
Ova osnovna karakteristika dati u DW se veoma razlikuje od dati
nalazi u radnom okruženju. THE dati operativnog okruženja su
tačne kao u trenutku pristupa. Drugim riječima,
u radnom okruženju kada pristupate jedinici dati, tu da
sačekajte da prikaže tačne vrijednosti kao u trenutku pristupa.
Zašto ja dati u DW su tačni kao nekada u
vrijeme (tj. ne "trenutno"), tj dati pronađeno u DW
oni su “vremenska varijacija”.
Vremenska varijacija od dati od strane DW-a se pominje na brojne načine.
Najjednostavniji način je da i dati DW predstavlja dati to je
dug vremenski horizont – pet do deset godina. Horizont
vrijeme predstavljeno za radno okruženje je mnogo kraće
▪ od današnjih trenutnih vrijednosti do šezdeset devedeset
Aplikacije koje moraju dobro funkcionirati i trebaju biti
dostupan za obradu transakcija mora donijeti
minimalni iznos od dati ako priznaju bilo kakav stepen
fleksibilnost. Dakle, operativne aplikacije imaju horizont
kratak vremenski okvir, kao dizajnerski argument
zvučne aplikacije.
Drugi način na koji se 'vremenska varijanta' pojavljuje u DW je u
ključna struktura. Svaka ključna struktura u DW sadrži,
implicitno ili eksplicitno, vremenski element, kao što je
dan, sedmica, mjesec itd. Element vremena je skoro uvek
na dnu spojenog ključa koji se nalazi u DW-u. U ovim
u prilikama, element vremena će postojati implicitno, kao što je slučajnost
gdje se cijeli fajl duplira na kraju mjeseca ili kvartala.
Treći način na koji se prikazuje vremenska varijacija je da i dati del
DW, samo uredno registrovan, ne može biti
ažurirano. THE dati DW su, za sve praktične svrhe, dugačke
serija snimaka (snapshot). Naravno, ako su snimci
snimljene pogrešno, onda snimci mogu biti
modificirano. Ali pod pretpostavkom da su snimljeni snimci
ispravno, ne mijenjaju se čim se naprave. U nekim
slučajevima može biti neetično ili čak nevažeće da snimci u
DW su modificirani. THE dati operativan, tačan kao u
u trenutku pristupa, mogu se ažurirati kako izgleda
potreba.
NOT VOLATILE
Četvrta važna karakteristika DW-a je da je neisparljiv.
Vrše se ažuriranja, umetanja, brisanja i izmjene
redovno za operativna okruženja na bazi evidencije po zapis. Ali
osnovna manipulacija dati potrebno u DW je mnogo više
jednostavno. Postoje samo dvije vrste operacija koje se javljaju u
DW – početno učitavanje dati i pristup dati. Tamo nije
nema ažuriranja dati (u opštem smislu
ažuriranje) u DW-u kao normalna operacija obrade.
Postoje neke vrlo snažne posljedice ove razlike
osnova između operativne obrade i DW obrade. Na nivou
po dizajnu, potreba za oprezom pri nadogradnji
abnormalno nije faktor u DW, od ažuriranja dati nije
sprovedeno. To znači da na fizičkom nivou dizajna,
mogu se uzeti u obzir da se optimizira pristup dati,
posebno u bavljenju temama standardizacije i od
fizička denormalizacija. Još jedna posljedica jednostavnosti
DW-ovih operacija je u osnovnoj tehnologiji koja se koristi za
pokrenite DW okruženje. Morate podržavati ažuriranja
zapis po zapis u liniji (kao što je često slučaj sa
operativna obrada) tehnologija je potrebna da ima neke
vrlo složene osnove pod prividnom jednostavnošću.
Tehnologija koja podržava backup i oporavak, transakcije
i integriteta dati a otkriće i otklanjanje zastoja je
prilično složen i nije potreban za DW obradu.
Karakteristike DW-a, dizajnerska orijentacija,
integraciju dati unutar DW, vremenska varijansa i jednostavnost
upravljanja dati, sve vodi u okruženje koje je vrlo, vrlo
drugačije od klasičnog radnog okruženja. Izvor skoro svih
dati od DW-a su radno okruženje. Primamljivo je razmišljati
da postoji veliki višak dati između dva okruženja.
Zapravo, prvi utisak koji mnogi ljudi imaju je taj
velika redundantnost dati između radnog okruženja i okruženja
DW ekstenzija. Takvo tumačenje je površno i dokazuje a
nedostatak razumevanja šta se dešava u DW.
Zaista postoji minimum zaliha dati između operativnog okruženja
i od dati od DW. Smatramo sljedeće:
▪ I dati oni su filtrirani dato koje prelazite iz operativnog okruženja
na DW okruženje. Mnogi dati nikad ne padnu u nesvijest
iz operativnog okruženja. Samo da i dati koji su potrebni za
DSS obrada nalazi svoj pravac u okruženju
▪ vremenski horizont dati veoma se razlikuje od okruženja
drugome. THE dati u radnom okruženju su vrlo svježe. THE dati
u DW-u su mnogo stariji. Samo iz perspektive
vremenskog horizonta, postoji vrlo malo preklapanja
između radnog okruženja i DW-a.
▪ DW sadrži dati sažetaka koji nikada nisu pronađeni
u okruženju
▪ I dati od tada dožive fundamentalnu transformaciju
trenutak kada pređu na sliku 3 to najviše ilustruje
dio dati su značajno promijenjene
biti odabran i premješten na DW. Drugim riječima, the
večina dati je fizički modificiran e
radikalno jer se prebacuje na DW. Sa tačke gledišta
integracije nisu isti dati koji borave
u radnom okruženju.
S obzirom na ove faktore, redundantnost od dati između dva okruženja je
rijetka pojava, što dovodi do manje od 1% redundancije između njih
okruženja.
STRUKTURA SKLADIŠTA
DW imaju posebnu strukturu. Postoje različiti nivoi sažetka i od
detalj koji razgraničava DW-ove.
Različite komponente DW-a su:
▪ Metapodaci
dati trenutni detalji
dati starih detalja
dati malo sažeto
dati visoko sažeto
Daleko glavna briga je za i dati detalja
struje. To je primarna briga jer:
▪ I dati trenutni detalji odražavaju najnovije događaje,
koji su uvek od velikog interesovanja i
▪ i dati trenutnih detalja su obimni jer jesu
pohranjeni na najnižem nivou granularnosti e
▪ i dati trenutni detalji se gotovo uvijek pohranjuju na
disk memorija, kojoj je brzo pristupiti, ali skupa i
kompleks iz
I dati detalja su stariji dati koji su pohranjeni na
neko sećanje na masa. Ima pristup sporadično i jeste
pohranjene na nivou detalja kompatibilnom sa dati detaljan
struje. Iako nije obavezno pohranjivanje na mediju od
alternativne memorije, zbog velike zapremine dati ujedinjeni sa
sporadični pristup dati, medij za skladištenje dati di
stariji detalji se obično ne pohranjuju na disk.
I dati olako sažeto jesu dati koji se destiliraju na dnu
nivo detalja koji se nalazi na trenutnom nivou detalja. Ovo
DW nivo je skoro uvek pohranjen u memoriji diska. THE
problemi dizajna koji se predstavljaju arhitekti dati
u izgradnji ovog nivoa DW su:
▪ Koja je jedinica vremena gore urađeno sumiranje
▪ Koji sadržaj, atributi će malo rezimirati
sadržaj dati
Sledeći nivo dati pronađeno u DW je ono od dati visoko
sažeto. THE dati visoko sažeti su kompaktni i laki
pristupačno. THE dati ponekad se nalaze vrlo sažeti
u DW okruženju iu drugim slučajevima i dati visoko sumirani su
pronađeno izvan neposrednih zidova tehnologije u kojoj se nalazi DW.
(u svakom slučaju, tj dati visoko sažeti su dio DW
bez obzira gde i dati su fizički smješteni).
Konačna komponenta DW-a je komponenta metapodataka. U mnogim aspektima
metapodaci se nalaze u drugoj dimenziji od ostalih dati
DW-a, jer metapodaci ne sadrže nikakve dato direktno
preuzeto iz operativnog okruženja. Metapodaci imaju posebnu ulogu e
veoma važno u DW. Metapodaci se koriste kao:
▪ direktorij koji pomaže DSS analitičaru da locira
DW sadržaj,
▪ vodič za mapiranje dati o tome kako ja dati Oni su bili
transformisan iz radnog okruženja u DW okruženje,
▪ vodič za algoritme koji se koriste za sumiranje između i dati di
trenutni detalj ei dati malo sažeto, tj dati visoko
sažeto,
Metapodaci igraju mnogo veću ulogu u DW okruženju
u poređenju sa onim što su ikada imali u operativnom okruženju
STARI MEDIJ ZA SKLADIŠTENJE DETALJA
Magnetna traka se može koristiti za čuvanje takve vrste
dati. Zaista postoji širok izbor medija za skladištenje koji
treba uzeti u obzir za očuvanje starog dati di
detalj.
U zavisnosti od obima dati, frekvencija pristupa, cijena
alata i vrste pristupa, sasvim je vjerovatno
da će drugim alatima biti potreban stari nivo detalja
u DW.
TOK PODATAKA
Postoji normalan i predvidljiv tok dati u okviru DW.
I dati oni ulaze u DW iz radnog okruženja. (NAPOMENA: postoje
nekoliko vrlo zanimljivih izuzetaka od ovog pravila. Međutim, skoro
sve dati unesite DW iz radnog okruženja). datum da ja dati
oni ulaze u DW iz radnog okruženja, on se transformiše kakav je bio
opisano ranije. Pod uslovom da unesete DW, tj dati ulaze u
trenutni nivo detalja, kao što je prikazano. Tamo se nalazi i koristi se
sve dok se ne dogodi jedan od tri događaja:
▪ je prečišćen,
▪ je sažet, i/ili
▪ jeste
Zastarjeli proces unutar DW se pomiče i dati trenutni detalji
a dati detalja staro, prema starosti od dati. Proces
sažimanje koristi detalje o dati za izračunavanje dati
blago sažeti i visoko sažeti nivoi dati. Oni su
neki izuzeci od prikazanog toka (o tome će biti riječi kasnije).
Međutim, obično za veliku većinu dati pronađeno
unutar DW, tok od dati to je kako je predstavljeno.
KORIŠĆENJE SKLADIŠTA PODATAKA
Nije iznenađujuće da su različiti nivoi dati u okviru DW ne
primaju različite nivoe upotrebe. Po pravilu, što je viši nivo
sumiranje, plus i dati oni se koriste.
Mnoge upotrebe se javljaju u dati visoko sažeto, dok je staro
dati detalja se gotovo nikada ne koriste. Postoji dobar razlog u tome
premjestiti organizaciju na paradigmu korištenja resursa. Više ima
sažetak i dati, to je brže i efikasnije doći do toga dati. Znam
un prodavnica otkrijte da radi dosta detaljne obrade DW-ova,
zatim odgovarajuću veliku količinu mašinskih resursa
se konzumira. Svima je u najboljem interesu da ide na suđenje
kao u visokom nivou sažimanja što je pre moguće.
Za mnoge prodavnice koristio se DSS analitičar u okruženju pre DW
dati na nivou detalja. U mnogim aspektima dolazak u dati detaljan
podsjeća na sigurnosno ćebe, čak i kada su dostupni
drugi nivoi sažimanja. Jedna od delatnosti arh dati è
odviknuti korisnika DSS od stalne upotrebe dati na plus nivou
niske detalje. Postoje dva razloga
arhitekte dati:
▪ instaliranje povratnog sistema, gdje krajnji korisnik plaća
potrošeni resursi e
▪ ukazuje da može biti vrlo dobro vrijeme odgovora
dobijeno kada se ponašanje sa i dati na visokom je standardu
rezimiranja, dok slabo vrijeme odgovora dolazi od
ponašanje od dati na niskom nivou
OSTALI RAZMATRANJA
Postoji nekoliko drugih razmatranja izgradnje i upravljanja
D.W.
Prvo razmatranje je indeks. THE dati na najvišim nivoima
sažetak se može slobodno indeksirati, dok i dati
na nižim nivoima detalja su toliko glomazni da mogu biti
štedljivo indeksirano. Iz istog tokena, tj dati na visokim nivoima
detalji se mogu relativno lako obnoviti,
dok je zapremina dati na nižim nivoima je toliko velika da i dati non
mogu se lako renovirati. Shodno tome, model
od dati i formalni posao koji je obavio dizajn predstavljaju
osnova za DW primijenjena gotovo isključivo na nivo
detalj struja. Drugim riječima, aktivnosti modeliranja
dati oni se ne odnose na nivoe sumiranja, u skoro svakom slučaju.
Još jedno strukturalno razmatranje je ono o podpodjelu
dati od DW.
Particija se može izvršiti na dva nivoa – na nivou dbms i al
nivo aplikacije. U diviziji na nivou dbmson dbms è
obavještava o odjeljenjima i u skladu s tim ih kontroliše. U slucaju da
podjelu na nivou aplikacije, samo je programer
obaviješteni o odjeljenjima i njihovoj odgovornosti
uprava je prepuštena njemu
Ispod nivoa dbms, dosta posla se obavlja automatski. Tu je
mnogo nefleksibilnosti povezane sa automatskom administracijom
divizije. U slučaju primjene na nivou divizije dati del
skladište podataka, dosta posla pada na programera, ali
krajnji rezultat je fleksibilnost u administraciji dati u datumu
magacin
DRUGE ANOMALIJE
Dok su komponente skladište podataka rade kako je opisano
za skoro sve dati, postoje neki korisni izuzeci koji moraju
raspravljati. Izuzetak je onaj od dati javni sažetci
(javni zbirni podaci). Ovo su dati rezimea koji su bili
izračunato iz skladište podataka ali ih društvo koristi. THE dati
javni sažetci se pohranjuju i upravljaju u skladište podataka,
iako su, kao što je gore spomenuto, razabrati. THE
računovođe rade na izradi takvih kvartalno dati kao
prihodi, tromjesečni rashodi, kvartalni profit i tako dalje. Posao
koje rade računovođe je eksterno u odnosu na skladište podataka. Međutim, i dati sono
koristi se „interno“ unutar kompanije – od marketing, prodaja itd.
Još jedna anomalija, o kojoj nećemo govoriti, je ona od dati vanjski.
Još jedna izvanredna vrsta dati koji se mogu naći u podacima
skladište je trajnih detaljnih podataka. Ovi uzrokuju
potrebno je trajno pohraniti i dati na jednom nivou
detaljno iz etičkih ili pravnih razloga. Ako kompanija prikazuje i
radnicima povezanim sa opasnim materijama postoji potreba za dati
detaljno i trajno. Ako kompanija proizvodi proizvod koji
uključuje javnu sigurnost, koji dijelovi aviona, postoje
potreba za dati stalni detaljan, kao i ako firma
sklapaju opasne ugovore.
Kompanija ne može priuštiti da previdi određene razloge
tokom narednih nekoliko godina, u slučaju tužbe, opoziva, a
sporni građevinski nedostatak i sl. izloženost kompanije
moglo bi biti veliko. Kao rezultat toga postoji jedinstvena vrsta dati
poznat kao trajni detaljni podaci.
SAŽETAK
Un skladište podataka to je objektno orijentisana, integrisana, varijanta
vrijeme, zbirka dati nepostojan za podršku potrebama
odluka uprave. Svaka od istaknutih funkcija
un skladište podataka ima svoje implikacije. Plus ima četiri
nivoa dati del skladište podataka:
▪ Stari detalj
▪ Trenutni detalj
dati blago rekapitulirano
dati visoko sažeto
Metapodaci su takođe važan deo skladište podataka.
SAŽETAK
Koncept skladištenja dati nedavno primljeno
puno pažnje i postao je trend 90-ih
zbog kapaciteta a skladište podataka da ih savladaju
ograničenja sistema podrške administraciji kao što su i
sistemi za podršku odlučivanju (DSS) i informacioni sistemi
izvršni (EIS).
Čak i ako koncept skladište podataka izgleda obećavajuće,
implementirati i skladište podataka može biti problematično zbog
velikih skladišnih procesa. Uprkos
složenost skladišnih projekata dati, mnogi dobavljači
i konsultanti za skladištenje dati oni to tvrde
skladištenje dati struja ne stvara nikakve probleme.
Međutim, na početku ovog istraživačkog projekta, gotovo nijedan
sprovedena su nezavisna, rigorozna i sistematska istraživanja. Od
Zbog toga je teško reći šta se zaista dešava
u industriji kada se grade skladište podataka.
Ova studija istraživala je praksu skladištenja dati
savremenika koji ima za cilj da razvije bogatije razumevanje
australijske prakse. Analiza literature je dala
kontekst i temelj za empirijsko istraživanje.
Postoje brojni nalazi iz ovog istraživanja. Prvo
mjestu, ova studija je otkrila aktivnosti koje su se dogodile
tokom razvoja skladište podataka. U mnogim oblastima, tj dati okupljeni
potvrdila praksu opisanu u literaturi. Drugo
stranice, probleme i probleme koji mogu utjecati na
razvoj skladište podataka identifikovani su ovom studijom.
Konačno, koristi stečene od australijskih organizacija povezanih sa
upotreba skladište podataka su otkriveni.
Poglavlje 1
Kontekst istraživanja
Koncept skladištenja podataka dobio je široko priznanje
izloženosti i pretvorio se u trend u nastajanju u
90-e (McFadden 1996, TDWI 1996, Shah i Milstein 1997,
Shanks et al. 1997, Eckerson 1998, Adelman i Oates 2000). To je
vidi se iz sve većeg broja članaka o podacima
skladištenje u trgovačkim publikacijama (Little i Gibson 1999).
Mnogi članci (vidi, na primjer, Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett i King 1996, Graham et al. 1996,
Sakaguchi i Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997, McCarthy 1997, O' Donnell 1997, Edwards 1998, TDWI
1999) izvijestili su o značajnim koristima koje proizlaze iz organizacija
koji implementiraju i skladište podataka. Podržali su svoju teoriju
uz anegdotske dokaze o uspješnim implementacijama, visok povrat
o brojkama ulaganja (ROI) i, takođe, pružanju smjernica
reference ili metodologije za razvoj skladište podataka
(Shanks et al. 1997, Seddon i Benjamin 1998, Little i Gibson
1999). U ekstremnom slučaju, Graham et al. (1996) imaju
prijavio prosječan povrat na trogodišnju investiciju od 401%.
Veliki dio sadašnje literature je, međutim, zanemario
složenosti uključenih u preduzimanje takvih projekata. Projekti of
skladište podataka obično su složene i velike i
stoga impliciraju veliku vjerovatnoću neuspjeha ako nisu
pažljivo kontrolisan (Shah i Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs i Clymer 1998, Rao
1998). Oni zahtijevaju ogromne količine ljudi i resursa
finansijski i, vrijeme i trud za njihovu izgradnju (Hill 1998, Crofts 1998). The
tipično vrijeme i potrebna finansijska sredstva su respektivno
oko dvije godine i dva ili tri miliona dolara (Braly 1995, Foley
1997b, Bort 1998, Humphries et al. 1999). Ova vremena i sredstva
od finansijskih institucija se traži da kontrolišu i konsoliduju mnoge aspekte
razlike u skladištenju podataka (Cafasso 1995, Hill 1998). Na strani
hardverskih i softverskih razmatranja, druge funkcije, koje se razlikuju
od ekstrakcije dati na procese utovara dati, od
kapacitet memorije za upravljanje ažuriranjima i meta podacima dati
za obuku korisnika, mora se uzeti u obzir.
U vrijeme kada je ovaj istraživački projekat započeo, bilo je vrlo malo
akademska istraživanja sprovedena u oblasti skladištenja podataka,
posebno u Australiji. To je bilo vidljivo iz nedostatka predmeta
objavljeno o skladištenju podataka u novinama ili drugim spisima
akademici tog vremena. Mnogi od akademskih spisa
dostupan opisao iskustvo SAD. Nedostatak
akademska istraživanja u oblasti sl skladištenja podataka izazvala su
pozivaju na rigorozna istraživanja i empirijska istraživanja (McFadden 1996,
Shanks et al. 1997, Little i Gibson 1999). Konkretno, studije
istraživanja o procesu implementacije skladište podataka
potrebno je sprovesti radi proširenja znanja
generalno u pogledu implementacije skladište podataka e
poslužiće kao osnova za buduću istraživačku studiju (Shanks ed
drugi. 1997, Little i Gibson 1999).
Stoga je svrha ove studije da se prouči šta zapravo
To se dešava kada organizacije održavaju i koriste podatke
skladište u Australiji. Konkretno, ova studija će uključiti
analiza cjelokupnog razvojnog procesa a skladište podataka,
počevši od inicijacije i planiranja preko dizajna i
implementaciju i naknadnu upotrebu unutar organizacija
Australijanac. Osim toga, studija će također doprinijeti dosadašnjoj praksi
identifikovanje oblasti u kojima se praksa može dalje razvijati
poboljšati, a neefikasnost i rizici se mogu minimizirati ili
izbjegavati. Nadalje, poslužit će kao osnova za druge studije o skladište podataka in
Australiji i popuniće prazninu koja trenutno postoji u literaturi.
Istraživačka pitanja
Cilj ovog istraživanja je proučavanje uključenih aktivnosti
u implementaciji skladište podataka i njihovu upotrebu od strane
Australijske organizacije. Posebno se proučavaju elementi
u vezi planiranja, razvoja,
rad, korištenje i uključeni rizici. Dakle pitanje
ovog istraživanja je:
“Kakva je sadašnja praksa skladište podataka u Australiji?"
Da biste efikasno odgovorili na ovaj problem, a
određeni broj pomoćnih istraživačkih pitanja. Konkretno, tri
potpitanja su identifikovana iz literature, tj
predstavljeno u poglavlju 2, da vodi ovaj istraživački projekat:
Kako se implementiraju i skladište podataka po organizacijama
Australijanac? S kojim problemima ste se susreli?
Koje su prednosti doživljene?
U odgovoru na ova pitanja korišten je crtež
istraživačko istraživanje koje koristi anketu. Kako učim
istraživački, odgovori na gornja pitanja nisu potpuni
(Shanks et al. 1993., Denscombe 1998.). U ovom slučaju jeste
triangulacija je potrebna da bi se poboljšali odgovori na njih
zahtjevi. Međutim, istraga će pružiti čvrstu osnovu za
budući rad na ispitivanju ovih pitanja. Jedan detaljan
rasprava o opravdanosti metode i dizajna istraživanja
predstavljeno je u poglavlju 3.
Struktura istraživačkog projekta
Ovaj istraživački projekat podijeljen je u dva dijela: kontekstualnu studiju
koncepta skladištenja podataka i empirijskog istraživanja (vidi
slika 1.1), od kojih je svaki razmotren u nastavku.
Dio I: Kontekstualna studija
Prvi dio istraživanja sastojao se od preispitivanja
trenutnu literaturu o različitim vrstama skladištenja podataka uključujući i
sistemi za podršku odlučivanju (DSS), informacioni sistemi
executive (EIS), studije slučaja skladište podataka i koncepti datuma
skladište. Nadalje, rezultati foruma skladište podataka i bogovi
sastanke grupa za stručnjake i profesionalce koje vodi grupa
Istraživanje Monash DSS, doprinelo je ovoj fazi studije
koji je imao za cilj da dobije informacije o praksi podataka
skladište i da se identifikuju rizici povezani sa njihovim usvajanjem.
Tokom ovog perioda kontekstualnog proučavanja, razumijevanja
problematičnog područja je uspostavljeno da pruži znanje o
osnova za kasnija empirijska istraživanja. Međutim, ovo
to je bio proces koji je trajao dok se studija odvijala
istraživanja.
Dio II: Empirijska istraživanja
Relativno novi koncept skladištenja podataka, posebno
u Australiji, stvorio potrebu za sprovođenjem ankete za
dobiti širu sliku iskustva korištenja. Ovo
dio je obavljen kada je problemski domen bio
ustanovljen je opsežnim pregledom literature. Koncept
skladišta podataka formiranog tokom faze kontekstualnog proučavanja je
je korišten kao ulazni podatak za početni upitnik ove studije.
Nakon toga, upitnik je pregledan. Vi ste eksperti za spojeve
skladište je učestvovalo u testiranju. Svrha testa
Prvobitni upitnik je trebao provjeriti kompletnost i tačnost
neka pitanja. Na osnovu rezultata testiranja, upitnik je
je izmijenjena i izmijenjena verzija je poslana na
učesnici ankete. Tada su vraćeni upitnici bili
analizirano za i dati u tabelama, dijagramima i drugim formatima. THE
rezultate analize dati formiraju trenutnu fotografiju
praksa skladištenja podataka u Australiji.
PREGLED SKLADIŠTA PODATAKA
Koncept skladištenja podataka je evoluirao sa poboljšanjima
kompjuterske tehnologije.
Usmjeren je na prevazilaženje problema sa kojima se susreću grupe
podrška aplikacijama kao što je sistem za podršku odlučivanju (DSS) e
Izvršni informacioni sistem (EIS).
U prošlosti je glavna prepreka ovim aplikacijama bila
nemogućnost ovih aplikacija da pruže a baza podataka
neophodno za analizu.
To je uglavnom uzrokovano prirodom posla
menadžment. Interesi menadžmenta kompanije se razlikuju
stalno u zavisnosti od tretiranog područja. Stoga i dati
osnovne za ove aplikacije moraju biti u mogućnosti
brzo mijenjati ovisno o dijelu koji se tretira.
To znači da i dati mora biti dostupan u formi
adekvatan za potrebne analize. U stvari, grupe za podršku
aplikacijama je u prošlosti bilo veoma teško prikupiti ed
integrirati dati iz složenih i raznovrsnih izvora.
Ostatak ovog odjeljka predstavlja pregled koncepta
skladištenje podataka i bavi se kako skladište podataka može savladati
Problemi grupe za podršku aplikaciji.
Izraz „Skladište podataka” je objavio William Inmon 1990. godine.
Njegova često citirana definicija vidi Skladište podataka doći
zbirka od dati predmetno orijentisan, integrisan, nepromenljiv i promenljiv
tokom vremena, kao podrška odlukama upravljanja.
Koristeći ovu definiciju Inmon naglašava da i dati stanovnika
in un skladište podataka mora posjedovati sljedeće 4
karakteristike:
▪ Predmetno orijentisan
▪ Integrisan
▪ Neisparljiv
▪ Promjenjivo tokom vremena
Pod subjektno orijentisanim Inmon znači da i dati u datumu
skladište u najvećim organizacionim područjima koja su bila
definisano u modelu dati. Na primjer sve dati u vezi i kupaca
nalaze se u predmetnoj oblasti KUPCI. Isto tako sve
dati koji se odnose na proizvode sadržani su u predmetnom području
PROIZVODI.
Pod Integrated Inmon znači da i dati dolaze iz različitih
platforme, sistemi i lokacije se kombinuju i pohranjuju u
jedno mjesto. Posljedično dati slično se mora transformisati
u dosljednim formatima kako bi se mogli dodavati i upoređivati
lako.
Na primjer, zastupljeni su muški i ženski rod
slovima M i F u jednom sistemu, a sa 1 i 0 u drugom. Za
integrirati ih na pravi način, jedan ili oba formata moraju
transformirati tako da dva formata budu ista. U ovom
U slučaju možemo promijeniti M u 1 i F u 0 ili obrnuto. Orijentisan ka
predmet i Integrisani ukazuju da je skladište podataka dizajniran je za
pružaju funkcionalnu i transverzalnu viziju dati sa strane
kompanije.
Pod Nehlapljivim on podrazumijeva da i dati Nel skladište podataka ostati
dosljedan i ažuriran dati nije potrebno. Umjesto toga, svaki
promijeniti u dati originali se dodaju u baza podataka datuma
skladište. To znači da istorijski dei dati je sadržan u
skladište podataka.
Za varijable s vremenom Inmon označava da i dati Nel skladište podataka
uvijek sadrže ei indikatore vremena dati normalmente
preći određeni vremenski horizont. Na primjer a
skladište podataka može sadržavati 5 godina historijskih vrijednosti kupaca Dal
1993. do 1997. Dostupnost historije i vremenske serije
od dati omogućava vam da analizirate trendove.
Un skladište podataka može prikupiti svoje dati iz sistema
OLTP;od porijekla dati izvan organizacije i/ili od strane drugih stručnjaka
hvatanje sistemskih projekata dati.
I dati ekstrakti mogu proći kroz proces čišćenja, u
ovaj slučaj i dati oni se transformišu i integrišu pre nego što postanu
pohranjen u baza podataka del skladište podataka. Onda sam dati
stanovnika unutar baza podataka del skladište podataka su dostupni
za pristup krajnjem korisniku i alate za oporavak. Koristeći
ovim alatima krajnji korisnik može pristupiti integrisanom pogledu
organizacije dati.
I dati stanovnika unutar baza podataka del skladište podataka sono
pohranjeni iu detaljima iu sažetim formatima.
Nivo sažetka može zavisiti od prirode dati. ja dati
detaljan može se sastojati od dati struja e dati istoričari
I dati tantijeme nisu uključene u skladište podataka do i dati
Nel skladište podataka su ažurirani.
Pored skladištenja dati sebe, a skladište podataka može isto
pohraniti drugu vrstu dato pod nazivom METADATA koji
opisati i dati stanovnika u njegovom baza podataka.
Postoje dvije vrste metapodataka: razvojni metapodaci i razvojni metapodaci
analize.
Razvojni metapodaci se koriste za upravljanje i automatizaciju
procesi ekstrakcije, čišćenja, mapiranja i utovara dati Nel
skladište podataka.
Informacije sadržane u razvojnim metapodacima mogu sadržavati
detalji operativnih sistema, detalji elemenata za izdvajanje,
model dati del skladište podataka i pravila kompanije za
konverzija dati.
Druga vrsta metapodataka, poznata kao metapodaci analitike
omogućava krajnjem korisniku da istraži sadržaj podataka
skladište za pronalaženje dati dostupni i šta oni znače u terminima
jasno i netehnicki.
Stoga metapodaci analitike rade kao most između podataka
aplikacije za skladište i krajnje korisnike. Ovi metapodaci mogu
sadrže poslovni model, opise dati dopisnici
poslovnom modelu, unapred definisanim upitima i izveštajima,
informacije za prijavu korisnika i indeks.
Metapodaci analize i razvoja moraju biti kombinovani u jedan
integrirani sadržaj metapodataka kako bi ispravno funkcionirao.
Nažalost, mnogi od postojećih alata imaju svoje
metapodataka i trenutno ne postoje postojeći standardi koji
omogućavaju alatima za skladištenje podataka da ih integrišu
metapodaci. Kako bi popravili ovu situaciju mnogi trgovci
Glavni alati za skladištenje podataka su formirali Meta Data
Vijeće koje je kasnije postalo Meta Data Coalition.
Svrha ove koalicije je da izgradi skup metapodataka
standard koji omogućava različitim alatima za skladištenje podataka da
pretvoriti metapodatke
Njihovi napori su rezultirali rođenjem Mete
Specifikacija razmjene podataka (MDIS) koja će omogućiti razmjenu
informacija između Microsoft arhiva i povezanih MDIS datoteka.
Postojanje dati kako sažeti/indeksirani tako i detaljni dati
korisnik mogućnost izvođenja DRILL DROWN
(bušenje) hajde dati indeksirano na detaljne i obrnuto.
Postojanje dati detaljne istorije omogućavaju stvaranje
analiza trenda tokom vremena. Pored toga, metapodaci analize mogu
koristiti kao direktorij baza podataka del skladište podataka po
pomozite krajnjim korisnicima da lociraju i dati potrebno.
U poređenju sa OLTP sistemima, sa njihovom sposobnošću podrške
analiza dati i izvještavanje, skladište podataka posmatra se kao sistem
prikladniji za informacione procese kao što su pravljenje i
odgovarati na upite i praviti izvještaje. Sledeći odeljak
će detaljno istaći razlike ova dva sistema.
DATA WAREHOUSE PROTIV OLTP SISTEMA
Mnogi informacioni sistemi unutar organizacija
Namijenjeni su za podršku svakodnevnim operacijama. Ove
sistemi poznati kao OLTP SISTEMI, hvataju transakcije
svakodnevno se ažurira.
I dati unutar ovih sistema često se modificiraju, dodaju ili
obrisano. Na primjer, adresa kupca se jedva mijenja
seli se s jednog mjesta na drugo. U ovom slučaju nova adresa
će se registrovati promjenom polja adrese baza podataka.
Glavni cilj ovih sistema je smanjenje troškova
transakcije i istovremeno skratiti vrijeme obrade.
Primjeri OLTP sistema uključuju kritične radnje kao što je pisanje
računovodstvo narudžbi, obračun plaća, fakture, proizvodnja, ai usluge kupaca.
Za razliku od OLTP sistema koji su kreirani po procesu
na osnovu transakcija i događaja, tj skladište podataka stvoreni su
pružiti podršku procesima zasnovanim na analitici dati je U
procesi odlučivanja.
Ovo se obično postiže integracijom i dati iz raznih sistema
OLTP i eksterni u jednom "kontejneru". dati,kao što je objašnjeno
u prethodnom odeljku.
Monash model procesa skladištenja podataka
Model procesa za skladište podataka Monash je razvio
istraživača iz Monash DSS Research Group, zasnovano je na
literature of skladište podataka, o iskustvu u podršci
razvoj sistemskih oblasti, o razgovorima sa dobavljačima
aplikacije za upotrebu na skladište podataka, na grupi stručnjaka
u upotrebi skladište podataka.
Faze su: početak, planiranje, razvoj i operacije
Objašnjenja. Dijagram objašnjava iterativnu prirodu ili
evolucijski razvoj a skladište podataka koristiti proces
dvosmjerne strelice postavljene između različitih faza. U ovom
“iterativni” i “evolucijski” kontekst znače da na svakom
korak procesa, mogu se obaviti aktivnosti implementacije
uvijek propagirati unazad do prethodne faze. Ovo je
zbog prirode projekta a skladište podataka u kojem
dodatni zahtjevi nastaju u bilo kojem trenutku
krajnjeg korisnika. Na primjer, tokom faze razvoja a
proces od skladište podataka, jedan je zahtjevan od strane krajnjeg korisnika
novu dimenziju ili predmetnu oblast, koja nije pripadala
originalni plan, ovo se mora dodati sistemu. Ovo
uzrokuje promjenu u projektu. Rezultat je da tim od
dizajn mora promijeniti zahtjeve do sada kreiranih dokumenata
tokom faze projektovanja. U mnogim slučajevima, trenutno stanje
projekat mora da se vrati u fazu projektovanja gde
novi zahtjev se mora dodati i dokumentirati. Korisnik
final mora biti u mogućnosti da vidi konkretnu dokumentaciju koja se pregleda ei
promjene koje su napravljene u fazi razvoja. Na kraju
Ovaj razvojni ciklus projekat mora dobiti odlične povratne informacije
oba tima, razvojni tim i korisnički tim. THE
povratne informacije se zatim ponovo koriste za poboljšanje budućeg projekta.
Planiranje kapaciteta
Dw imaju tendenciju da budu veoma velike veličine i rastu
vrlo brzo (Best 1995, Rudin 1997a) nakon
Količina dati istorije koje zadržavaju od svog trajanja. Tamo
rast takođe može biti uzrokovan dati dodatne stavke koje zahtijeva
korisnicima da povećaju vrijednost dati koje već imaju. Od
shodno tome, zahtjevi za skladištenje za dati mogu
biti značajno poboljšani (Eckerson 1997). Tako je
neophodno je osigurati provođenjem planiranja
kapacitet sa kojim sistem koji se gradi može rasti
rast potreba (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
U planiranju dw skalabilnosti, mora se znati
očekivani rast veličine zaliha, vrste pitanja
koji će se vjerovatno provesti i broj podržanih krajnjih korisnika (Najbolji
1995, Rudin 1997b, Foley 1997a). Napravite skalabilne aplikacije
zahtijeva kombinaciju skalabilnih serverskih tehnologija i tehnika
dizajna skalabilnih aplikacija (Best 1995, Rudin 1997b.
Oba su neophodna prilikom kreiranja aplikacije
izuzetno skalabilan. Skalabilne serverske tehnologije mogu
čine jednostavnim i korisnim dodavanje prostora za skladištenje, memoriju i
CPU bez degradiranja performansi (Lang 1997, Telephony 1997).
Postoje dvije glavne skalabilne serverske tehnologije: compute
simetrično višestruko (SMP) i masivna obrada
paralelno (MPP) ) (IDC 1997, Humphries et al. 1999). Server
SMP obično ima više procesora koji dijele jednu memoriju,
sabirni sistem i drugi resursi (IDC 1997, Humphries et al. 1999).
Za proširenje se mogu dodati dodatni procesori
ona moć računski. Još jedna metoda za povećanje
moć računska snaga SMP servera, je kombinovanje brojnih
SMP mašine. Ova tehnika je poznata kao grupisanje (Humphries
et al. 1999). MPP server, s druge strane, ima više procesora svaki
sa sopstvenom memorijom, sistemom magistrale i drugim resursima (IDC 1997,
Humphries et al. 1999). Svaki procesor se naziva čvorom. A
povećanje u moć može se postići računski
dodavanje dodatnih čvorova MPP serverima (Humphries et al.
1999).
Slabost SMP servera je previše ulazno-izlaznih operacija
(I/O) može zagušiti sistem sabirnice (IDC 1997). Ovo
problem se ne javlja unutar MPP servera jer svaki
procesor ima svoj sistem magistrale. Međutim, međusobne veze
između svakog čvora oni su generalno mnogo sporiji od sistema sabirnice
SMP-ova. Dodatno, MPP serveri mogu dodati sloj
dodatna složenost za programere aplikacija (IDC
1997). Tako se može uticati na izbor između SMP i MPP servera
mnogo faktora, uključujući složenost pitanja, odnos
cijena/performanse, potrebni kapacitet tretmana,
spriječene dw aplikacije i povećanje veličine baza podataka
dw i u broju krajnjih korisnika.
Brojne skalabilne tehnike dizajna aplikacija
može se koristiti u planiranju kapaciteta. Jedan
koristi različite periode obavještavanja kao što su dani, sedmice, mjeseci i godine.
Imajući različite periode obavještenja, baza podataka mogu se podijeliti na
komadi se lako grupišu (Inmon et al. 1997). Drugi
tehnika je korištenje sažetih tabela koje su konstruirane
sažimanje dati da dati detaljan. Dakle, ja dati sažetaka je više
kompaktan nego detaljan, što zahtijeva manje memorijskog prostora.
Dakle dati detalji se mogu pohraniti u drajv
jeftinije skladištenje, što štedi još više prostora za skladištenje.
Iako korištenje tabela sa sažetkom može uštedjeti prostor
memorije, zahtijevaju puno truda kako bi ih održali ažurnim
u skladu sa komercijalnim potrebama. Međutim, ova tehnika jeste
široko se koristi i često se koristi u kombinaciji sa tehnikom
prethodni (Best 1995, Inmon 1996a, Chauduri i Dayal
1997).
definiranje Skladište podataka tehnički
Arhitekture Definicija tehnika
dw arhitekture
Rani oni koji su usvojili skladištenje podataka prvenstveno su osmislili
centralizirana implementacija dw gdje su svi dati, uključeno
i dati eksterne, bile su integrisane u jednu,
fizičko skladištenje (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Glavna prednost ovog pristupa je da su krajnji korisnici
Mogu pristupiti pogledu na poduzetničkom nivou
(prikaz u cijelom preduzeću) dei dati organizacioni (Ovum 1998). Drugi
prednost je što nudi standardizaciju dati attraverso
organizacije, što znači da postoji samo jedna verzija ili
definicija za svaku terminologiju koja se koristi u depozitu dw
(reposity) metapodaci (Flanagan i Safdie 1997, Ovum 1998). The
mana ovog pristupa je, s druge strane, što je skup i težak
biti izgrađen (Flanagan i Safdie 1997, Ovum 1998, Inmon et al.
1998). Nedugo nakon arhitekture skladištenja dati
centralizovan je postao popularan, koncept ekstrakcije je evoluirao
najmanjih podskupova dati da podrži potrebe
specifične primjene (Varney 1996, IDC 1997, Berson i Smith
1997, paun 1998). Ovi mali sistemi su izvedeni iz više
veliki skladište podataka centralizovano. Zovu se datum
zavisna odjelna skladišta ili zavisna prodajna mjesta podataka.
Arhitektura zavisne baze podataka poznata je kao
troslojna arhitektura gdje se prvi sloj sastoji od podataka
centralizovano skladište, drugo se sastoji od magacina dati
odjela, a treći se sastoji od pristupa dati i od alata
analiza (Demarest 1994, Inmon et al. 1997).
Satovi podataka se obično grade nakon skladište podataka
centralizovan je izgrađen da zadovolji potrebe
specifične jedinice (White 1995, Varney 1996).
Baza podataka pohranjuje dati veoma relevantno u vezi sa pojedinostima
jedinstvo (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
Prednost ove metode je što neće biti dato non
integrisan i da i dati oni će biti manje suvišni unutar podataka
marts od svega dati dolaze iz skladišta dati integrisan.
Još jedna prednost je što će između njih biti malo veza
baza podataka i srodni izvori dati jer svaka baza podataka ima samo
izvor dati. Plus sa ovom arhitekturom na mjestu, korisnici
finala još uvijek može pristupiti pregledu dati
korporativne organizacije. Ova metoda je poznata kao
metoda odozgo prema dolje, u kojoj se baze podataka grade nakon podataka
skladište (paun 1998, Goff 1998).
Povećana potreba za rano pokazivanjem rezultata, neki
organizacije su počele sa izgradnjom nezavisnih baza podataka
(Flanagan i Safdie 1997, White 2000). U ovom slučaju, baza podataka
oni uzimaju svoje dati direktno od osnova dati OLTP a ne iz
centralizovano i integrisano skladištenje, čime se eliminiše potreba za
imaju centralno skladište na lokaciji.
Svako tržište podataka zahtijeva barem jednu vezu do svojih izvora
di dati. Jedna mana što postoji više veza za svaki datum
mart je da, u poređenju sa dve prethodne arhitekture,
preobilje od dati značajno povećava.
Svaka baza podataka mora pohraniti sve dati traženo lokalno za
nemaju uticaja na OLTP sisteme. Ovo uzrokuje da i dati
pohranjeni su u različitim bazama podataka (Inmon et al. 1997).
Još jedan nedostatak ove arhitekture je što ona vodi do
stvaranje složenih interkonekcija između baza podataka i njihovih
izvori dati koje je teško provesti i kontrolisati (Inmon ed
drugi. 1997).
Još jedan nedostatak je što krajnji korisnici ne mogu napajati
pristupiti pregledu informacija o kompaniji kao i dati
različita tržišta podataka nisu integrisana (Ovum 1998).
Još jedan nedostatak je što ih može biti više od jednog
definicija za svaku terminologiju koja se koristi u bazama podataka koje generiše
nedoslednosti od dati u organizaciji (Ovum 1998).
Uprkos gore navedenim nedostacima, nezavisna tržišta podataka
i dalje privlače interesovanje mnogih organizacija (IDC 1997).
Jedan od faktora koji ih čini privlačnima je da se brže razvijaju
i zahtijevaju manje vremena i resursa (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Shodno tome, oni uglavnom služe
kao test projekti koji se mogu koristiti za identifikaciju
brzo koristi i/ili nesavršenosti u projektu (Parsaye
1995, Braly 1995, Newing 1996). U ovom slučaju, dio iz
implementacija u pilot projekat mora biti mala, ali važna
za organizaciju (Newing 1996, Mansell-Lewis 1996).
Ispitivanjem prototipa, krajnji korisnici i administracija mogu
odlučiti da li nastaviti ili zaustaviti projekat (Flanagan i Safdie
1997).
Ako je odluka da se nastavi, vitrine podataka za druge sektore
treba ih graditi jedan po jedan. Postoje dvije opcije za
krajnjim korisnicima na osnovu njihovih potreba u konstrukciji podataka
nezavisni matri: integrisani/udruženi i neintegrisani (Ovum
1998)
U prvoj metodi, svaka nova baza podataka treba da se izgradi
na osnovu trenutnih prodajnih mjesta i modela dati koristi
od strane firme (Varney 1996, Berson i Smith 1997, Peacock 1998).
Potreba za korištenjem modela dati kompanije to čini neophodnim
osigurati da postoji samo jedna definicija za svaku terminologiju
koristi se kroz data marts, ovo je također da bi se osiguralo da podaci
Različite trgovine se mogu spojiti kako bi se dao pregled
korporativne informacije (Bresnahan 1996). Ova metoda je
naziva se odozdo prema gore i najbolje je kada postoji ograničenje
finansijska sredstva i vrijeme (Flanagan i Safdie 1997, Ovum 1998,
paun 1998, Goff 1998). U drugoj metodi, data marts
izgrađen može zadovoljiti samo potrebe određene jedinice.
Varijanta federalnog tržišta podataka je skladište podataka distribuirano
u kojem baza podataka Hub server Middleware se koristi za spajanje mnogih
vitrine podataka u jednom spremištu dati distribuira (White 1995). U
ovaj slučaj, tj dati kompanije su raspoređene u nekoliko baza podataka.
Zahtjevi krajnjih korisnika se prosljeđuju baza podataka
server hub middleware, koji izdvaja sve dati traženi podacima
prodaje i vraća rezultate aplikacijama krajnjeg korisnika. Ovo
metoda pruža poslovne informacije krajnjim korisnicima. Kako god,
Problemi sa bazama podataka još uvijek nisu otklonjeni
nezavisni. Postoji još jedna arhitektura koja se može koristiti, a to je
pozovite skladište podataka virtuelni (White 1995). Međutim, ovo
arhitektura, koja je opisana na slici 2.9, nije arhitektura
skladištenja dati pravi jer ne pomera teret
od OLTP sistema do skladište podataka (Demarest 1994).
Zapravo, zahtjevi od dati krajnji korisnici su prešli na
OLTP sistemi koji vraćaju rezultate nakon obrade
zahtjevi korisnika. Iako ova arhitektura dozvoljava korisnicima
finale za generisanje izveštaja i formulisanje zahteva, ne može da obezbedi
dati historijski i pregled informacija o kompaniji kao i dati
iz različitih OLTP sistema nisu integrisani. Dakle, ovaj
arhitektura ne može zadovoljiti analizu dati kompleksa kao npr
primjer prognoze.
Izbor aplikacija za pristup i pristup
oporavak od dati
Svrha izgradnje a skladište podataka je prenijeti
informacije krajnjim korisnicima (Inmon et al 1997, Poe 1996,
McFadden 1996, Shanks et al 1997, Hammergren 1998); jedan ili
višestruki pristup i aplikacije za oporavak dati mora biti obezbeđen. To
Danas postoji širok izbor ovih aplikacija koje korisnik može izabrati
izaberite (Hammergren 1998, Humphries et al. 1999). The
odabrane aplikacije određuju uspjeh napora
skladištenja dati u organizaciji jer
aplikacije su najvidljiviji dio skladište podataka korisniku
konačno (Inmon et al. 1997, Poe 1996). Uspješiti spoj
skladište, mora biti u stanju da podrži aktivnosti analize dati
krajnjeg korisnika (Poe 1996, Seddon i Benjamin 1998, Eckerson
1999). Dakle, "nivo" onoga što krajnji korisnik želi mora biti
identifikovani (Poe 1996, Mattison 1996, Inmon et al 1997,
Humphries et al. 1999.).
Uopšteno govoreći, krajnji korisnici se mogu grupirati u tri
kategorije: izvršni korisnici, poslovni analitičari i napredni korisnici (Poe
1996, Humphries et al. 1999). Izvršni korisnici trebaju
lak pristup unapred definisanim skupovima izveštaja (Humphries ed
ostali 1999). Ovi izvještaji se mogu lako postići pomoću
navigacija kroz meni (Poe 1996). Plus, izvještaji bi trebali
prezentirati informacije koristeći grafički prikaz
kao što su tabele i šabloni za brzi transport
informacije (Humphries et al. 1999). Poslovni analitičari, koji nemaju
oni mogu imati tehničke mogućnosti za razvoj odnosa
nule sami po sebi, moraju biti u mogućnosti da modifikuju trenutne odnose na
zadovoljiti njihove specifične potrebe (Poe 1996, Humphries et al
1999). Napredni korisnici su, s druge strane, tip krajnjih korisnika koji
imaju mogućnost generiranja i pisanja zahtjeva i izvještaja
nula (Poe 1996, Humphries et al. 1999). Oni su ti koji
razvijati izvještaje za druge tipove korisnika (Poe 1996, Humphries
i drugi 1999).
Kada se odrede zahtjevi krajnjeg korisnika, moraju se ispuniti
izbor aplikacija za pristup i oporavak dati između svih
one dostupne (Poe 1996, Inmon et al. 1997).
Pristup dati a alati za pronalaženje mogu biti
klasificirani u 4 tipa: OLAP alat, EIS/DSS alat, alat za upite i
alati za izvještavanje i rudarenje podataka.
OLAP alati omogućavaju korisnicima da kreiraju i ad hoc upite
one napravljene na baza podataka del skladište podataka. Plus ovi proizvodi
omogućiti korisnicima da analiziraju dati generalno za one
detaljan.
EIS/DSS alati pružaju izvršno izvještavanje kao analizu „šta ako”.
i pristup izvještajima organizovanim po menijima. Izvještaji moraju biti
unapred definisan i spojen sa menijima za lakšu navigaciju.
Alati za upite i izvještavanje omogućavaju korisnicima izradu izvještaja
unapred definisane i specifične.
Alati za rudarenje podataka koriste se za identifikaciju odnosa koji
mogao baciti novo svjetlo na zaboravljene operacije u dati del
datawarehouse.
Uz optimizaciju zahtjeva svake vrste korisnika, tj
Odabrani alati moraju biti intuitivni, efikasni i laki za korištenje.
Oni također moraju biti kompatibilni s drugim dijelovima arhitekture e
sposoban za rad sa postojećim sistemima. Takođe se predlaže da
odaberite alate za pristup podacima i pronalaženje sa cijenama i performansama
razumno. Ostali kriterijumi koje treba razmotriti uključuju posvećenost
dobavljač alata u podršci njihovom proizvodu i razvoju koji isti
isto će imati i u budućim izdanjima. Kako bi osigurali angažman korisnika
u korišćenju skladišta podataka, razvojni tim uključuje
korisnika u procesu odabira alata. U ovom slučaju
treba izvršiti praktičnu procjenu korisnika.
Razvojni tim može poboljšati vrijednost skladišta podataka
također pružaju web pristup svojim skladištima podataka. A
Web-omogućeno skladište podataka omogućava korisnicima pristup dati
sa udaljenih mjesta ili tokom putovanja. Dodatne informacije mogu
biti obezbeđen po nižim troškovima kroz smanjenje troškova
di trening.
2.4.3 Skladište podataka Operativna faza
Ova faza se sastoji od tri aktivnosti: Definiranje datumskih strategija
osvježavanje, kontrola aktivnosti skladišta podataka i upravljanje
sigurnost skladišta podataka.
Definicija strategija osvježavanja podataka
Nakon početnog opterećenja, tj dati Nel baza podataka skladišta podataka
mora se periodično osvježavati da biste igrali
izvršene promjene na dati originali. Stoga moramo odlučiti
kada osvežiti, koliko često
osvježiti i kako osvježiti dati. Predlaže se da se uradi
refresh dei dati kada se sistem može isključiti. Tamo
Brzinu osvježavanja određuje razvojni tim
na zahtjeve korisnika. Postoje dva pristupa za osvježavanje
Skladište podataka: potpuno osvježavanje i kontinuirano učitavanje
promjene.
Prvi pristup, potpuno osvježenje, zahtijeva ponovno učitavanje
sve dati od nule. To znači da sve dati potrebno mora
biti izvučeni, očišćeni, transformirani i integrirani u svako osvježavanje. Ovo
pristup treba, koliko god je to moguće, izbjegavati jer
To zahtijeva puno vremena i resursa.
Alternativni pristup je kontinuirano učitavanje i
promjene. Ovo dodaje i dati koji su promijenjeni
od posljednjeg ciklusa osvježavanja skladišta podataka. Identifikacija
novih ili izmijenjenih zapisa značajno smanjuje količinu
dati koji se moraju propagirati do skladišta podataka u svakom
ažurirati samo ove dati će biti dodan u baza podataka
skladišta podataka.
Postoji najmanje 5 pristupa koji se mogu koristiti za povlačenje
i dati novo ili modificirano. Da biste dobili efikasnu strategiju
refresh dei dati mješavina ovih pristupa može biti korisna
preuzima sve promjene u sistemu.
Prvi pristup, koji koristi vremenske oznake, pretpostavlja da dolazi
dodijeljen svima dati uredio i ažurirao vremensku oznaku tako
da mogu sve lako identifikovati dati izmijenjeno i novo.
Ovaj pristup, međutim, nije bio široko korišten u većini
deo današnjih operativnih sistema.
Drugi pristup je korištenje delta datoteke koju generiše
aplikacija koja sadrži samo promjene napravljene na dati.
Korišćenje ove datoteke takođe pojačava ciklus ažuriranja.
Međutim, čak ni ova metoda nije korištena u mnogima
aplikacije.
Treći pristup je skeniranje datoteke dnevnika, koja
u osnovi sadrži slične informacije kao i delta fajl. Jedini
razlika je u tome što se kreira log datoteka za proces oporavka i
može biti teško razumjeti.
Četvrti pristup je izmjena koda aplikacije.
Međutim, većina koda aplikacije je stara i
fragile; stoga ovu tehniku ​​treba izbjegavati.
Posljednji pristup je poređenje dati izvori sa datotekom
glavni bogovi dati.
Kontrola aktivnosti skladišta podataka
Jednom kada je skladište podataka pušteno korisnicima, jeste
potrebno ga pratiti tokom vremena. U ovom slučaju, administrator
skladišta podataka može koristiti jedan ili više alata za upravljanje i
kontrolu za praćenje korištenja skladišta podataka. Posebno
mogu se prikupljati informacije o ljudima i vremenu
kojima pristupaju skladištu podataka. Hajde dati usevi se mogu stvarati
profil obavljenog posla koji se može koristiti kao ulaz
u implementaciji povrata plaćanja korisnika. The Chargeback
omogućava korisnicima da budu informisani o troškovima obrade
datawarehouse.
Nadalje, kontrola skladišta podataka se također može koristiti za
identificirati tipove upita, njihovu veličinu, broj upita po
dan, vrijeme odgovora na upit, dosegnuti sektori i količina
di dati obrađeno. Još jedna svrha provjere
skladište podataka je da identifikuje dati koji nisu u upotrebi. Ove dati
mogu se ukloniti iz skladišta podataka radi poboljšanja vremena
odgovora na izvršenje upita i prati rast
dati koji borave unutar baza podataka skladišta podataka.
Upravljanje sigurnošću skladišta podataka
Skladište podataka sadrži dati integrisano, kritično, osetljivo da
može se lako doći. Iz tog razloga bi trebalo
biti zaštićeni od neovlaštenih korisnika. Jedan način da
implementirati sigurnost je korištenje funkcije del DBMS
dodijeliti različite privilegije različitim tipovima korisnika. U ovom
način, profil se mora održavati za svaki tip korisnika
pristup. Drugi način da osigurate svoje skladište podataka je da ga šifrirate
kako je napisano baza podataka skladišta podataka. Pristup
dati a alati za pronalaženje moraju dešifrirati dati prije podnošenja i
rezultate korisnicima.
2.4.4 Skladište podataka Faza implementacije
To je posljednja faza u ciklusu implementacije skladišta podataka. The
aktivnosti koje će se provesti u ovoj fazi uključuju obuku
korisnicima da koriste skladište podataka i kreiraju recenzije
skladišta podataka.
Obuka korisnika
Prvo treba obaviti obuku korisnika
pristupa dati skladišta podataka i korištenje alata
pronalaženje. Generalno, sesije treba da počnu sa
uvod u koncept skladištenja dati, to
sadržaj skladišta podataka, ai meta dati i osnovne karakteristike
alata. Tada bi i napredniji korisnici mogli proučavati
fizičke tabele i korisničke karakteristike pristupa podacima i alata
pronalaženje.
Postoji mnogo pristupa obuci korisnika. Jedan od
ovo uključuje odabir mnogih korisnika ili analitičara koje bira a
grupa korisnika, na osnovu njihovog vodstva i sposobnosti
komunikacija. Oni su obučeni u ličnom svojstvu na
sve što treba da znaju da bi se upoznali sa
sistem. Kada se obuka završi, vraćaju se svom poslu i
počinju da podučavaju druge korisnike kako da koriste sistem. Na
na osnovu onoga što su naučili, drugi korisnici mogu početi
istražite skladište podataka.
Drugi pristup je obučavanje mnogih korisnika u istom
vrijeme, kao da pohađate tečaj u učionici. Ova metoda
Pogodan je kada postoji mnogo korisnika koje treba obučiti
u isto vrijeme. Još jedna metoda je treniranje
svakog korisnika pojedinačno, jednog po jednog. Ova metoda je
pogodno kada ima malo korisnika.
Svrha obuke korisnika je da vas upozna
sa pristupom dati i alati za pronalaženje kao i sadržaj
datawarehouse. Međutim, neki korisnici mogu biti preopterećeni
prema količini informacija datih tokom sesije
obuku. Dakle, određeni broj stvari mora da se uradi
stalne sesije podrške i osvježavanja za odgovor
na konkretna pitanja. U nekim slučajevima se formira grupa
korisnicima da pruže ovu vrstu podrške.
Prikupljanje povratnih informacija
Nakon što je skladište podataka uvedeno, korisnici mogu
koristiti i dati koji se nalaze u skladištu podataka za različite svrhe.
Uglavnom analitičari ili korisnici koriste i dati Nel
skladište podataka za:
1 Identifikujte trendove kompanije
2 Analizirajte profile kupovine kupaca
3 Podijelite i kupaca i od
4 Pružiti najbolje usluge za kupaca – prilagođavanje usluga
5 Formulirajte strategije marketing
6 Dajte konkurentne ponude za analizu troškova i pomoć
kontrola
7 Podržite strateško donošenje odluka
8 Identifikujte mogućnosti da se istaknete
9 Poboljšati kvalitet tekućih poslovnih procesa
10 Provjerite profit
Prateći smjer razvoja skladišta podataka, mogli bi
Izvršite seriju pregleda sistema kako biste dobili povratne informacije
kako od razvojnog tima tako i od zajednice
krajnjim korisnicima.
Dobijeni rezultati se mogu uzeti u obzir za
sledeći razvojni ciklus.
Pošto skladište podataka ima inkrementalni pristup,
bitno je učiti iz uspjeha i grešaka prethodnih
razvoj događaja.
2.5 Sažetak
U ovom poglavlju razmatrani su pristupi prisutni u
književnost. U odjeljku 1 raspravljalo se o konceptu
skladište podataka i njegova uloga u nauci o odlučivanju. U
odeljak 2 glavne razlike između
skladišta podataka i OLTP sistemi. U odeljku 3 raspravljali smo o
Monash model skladišta podataka koji je korišten
u odjeljku 4 kako bi se opisali aktivnosti uključene u proces
razvoj skladišta podataka na kojima se ove teze nisu zasnivale
rigorozno istraživanje. Ono što se dešava u stvarnosti može biti
veoma različito od onoga što literatura izveštava, bez obzira na ovo
rezultati se mogu koristiti za stvaranje osnovnog prtljaga koji
naglasiti koncept skladišta podataka za ovo istraživanje.
Poglavlje 3
Metode istraživanja i projektovanja
Ovo poglavlje se bavi metodama istraživanja i dizajna za
ovu studiju. Prvi dio prikazuje generički prikaz metoda
štaviše dostupnih istraživanja za pronalaženje informacija
razmatraju se kriterijumi za odabir najbolje metode za jednu
posebna studija. Dvije metode se zatim razmatraju u odjeljku 2
odabrani prema upravo navedenim kriterijima; od njih će biti izabrani i
usvojio jedan sa razlozima navedenim u odjeljku 3 gdje se nalaze
takođe su objašnjeni razlozi za isključenje drugog kriterijuma. Tamo
dio 4 predstavlja dizajn istraživanja, a dio 5 ga predstavlja
zaključci.
3.1 Istraživanje informacionih sistema
Istraživanje informacionih sistema nije jednostavno ograničeno
na tehnološko polje, ali se takođe mora proširiti da uključi
ciljeve u pogledu ponašanja i organizacije.
To dugujemo tezama različitih disciplina u rasponu od
društvene nauke na prirodne; ovo dovodi do potrebe za a
određeni spektar istraživačkih metoda koji uključuju kvantitativne metode
i one kvalitativne koje će se koristiti za informacione sisteme.
Važne su sve dostupne istraživačke metode, zapravo nekoliko
istraživači kao što su Jenkins (1985), Nunamaker et al. (1991) i Galliers
(1992) tvrde da ne postoji specifična univerzalna metoda
da sprovodi istraživanja u različitim oblastima informacionih sistema; Zaista
metoda može biti prikladna za određeno istraživanje, ali ne
za druge. To nam dovodi do potrebe da odaberemo metodu koja
je pogodan za naš konkretni istraživački projekat: za ovo
izbor Benbasat et al. (1987) navode da ih treba uzeti u obzir
prirodu i svrhu istraživanja.
3.1.1 Priroda istraživanja
Mogu biti različite metode zasnovane na prirodi istraživanja
klasificiran u tri tradicije široko poznate u nauci
informacija: pozitivističko, interpretativno i kritičko istraživanje.
3.1.1.1 Pozitivističko istraživanje
Pozitivističko istraživanje poznato je i kao naučna studija ili
empirijski. Pokušava da: „objasni i predvidi šta će se dogoditi u
društvenom svijetu gledajući na pravilnosti i uzročno-posledične veze
među elementima koji ga čine” (Shanks et al 1993).
Pozitivističko istraživanje karakteriše i ponovljivost,
pojednostavljenja i opovrgavanja. Nadalje, pozitivistička istraživanja priznaju
postojanje apriornih odnosa između proučavanih pojava.
Prema Galliersu (1992) taksonomija je istraživačka metoda
uključeno u pozitivističku paradigmu, koja međutim nije ograničena na ovo,
u stvari postoje laboratorijski eksperimenti, terenski eksperimenti,
studije slučaja, dokazi teorema, predviđanja i simulacije.
Koristeći ove metode istraživači priznaju da su fenomeni
proučavani mogu se posmatrati objektivno i rigorozno.
3.1.1.2 Interpretativno istraživanje
Interpretativno istraživanje, koje se često naziva fenomenologija ili
Neuman (1994) opisuje antipozitivizam kao „analizu
sistematičnost društvenog značenja akcije kroz direktnu i
detaljno posmatranje ljudi u prirodnim situacijama, u redu
kako bi se došlo do razumijevanja i tumačenja kako
ljudi stvaraju i održavaju svoj društveni svijet." Studije
interpretativne metode odbacuju pretpostavku da su posmatrani fenomeni
može se objektivno posmatrati. U stvari, oni su zasnovani
o subjektivnim interpretacijama. Nadalje, interpretativni istraživači ne rade
nameću a priori značenja pojavama koje proučavaju.
Ova metoda uključuje subjektivne/argumentativne studije, radnje
istraživanja, deskriptivne/interpretativne studije, buduća istraživanja i igre
uloga. Pored ovih istraživanja mogu biti i studije slučaja
uključeni u ovaj pristup jer se tiču ​​studija
pojedinci ili organizacije u složenim situacijama
stvarnog svijeta.
3.1.1.3 Kritičko istraživanje
Kritičko ispitivanje je najmanje poznat pristup u nauci
društveni, ali je nedavno dobio pažnju istraživača
u oblasti informacionih sistema. Filozofska pretpostavka da je
društvenu stvarnost istorijski proizvode i reprodukuju ljudi,
kao i društveni sistemi sa njihovim akcijama i interakcijama. Njihova
sposobnost je, međutim, posredovana određenom količinom obzira
društveni, kulturni i politički.
Baš kao i interpretativno istraživanje, kritičko istraživanje tvrdi da
pozitivistička istraživanja nemaju nikakve veze s društvenim kontekstom i ignoriraju ga
njegov uticaj na ljudske postupke.
Kritičko istraživanje, s druge strane, kritizira interpretativno istraživanje
biti previše subjektivan i zato što nema za cilj da pomogne
ljudi da poboljšaju svoje živote. Najveća razlika između
kritičko istraživanje i druga dva pristupa je njegova evaluativna dimenzija.
Dok je objektivnost pozitivističke i interpretativne tradicije za
predvidjeti ili objasniti status quo ili društvenu stvarnost, kritičko istraživanje
ima za cilj kritičku evaluaciju i transformaciju osnovne društvene stvarnosti
studija.
Kritički se istraživači obično suprotstavljaju statusu quo kako bi
otkloniti društvene razlike i poboljšati socijalne uslove. Tamo
kritičko istraživanje je posvećeno procesnom pogledu na
fenomena od interesa i stoga je normalno longitudinalno.
Primjeri istraživačkih metoda su dugoročne istorijske studije i
etnografske studije. Kritičko istraživanje, međutim, nije bilo
široko se koristi u istraživanju informacionih sistema
3.1.2 Svrha istraživanja
Uz prirodu pretrage, može se koristiti i njena svrha
da vodi istraživača u odabiru određene metode
istraživanja. Svrha istraživačkog projekta je usko povezana
na poziciju pretrage u odnosu na ciklus pretraživanja koji se sastoji od
tri faze: izgradnja teorije, testiranje teorije i usavršavanje teorije
teorija. Dakle, na osnovu momentuma u odnosu na ciklus pretraživanja, a
istraživački projekat može imati eksplanatornu, deskriptivnu, svrhu
istraživački ili prediktivni.
3.1.2.1 Eksploratorno istraživanje
Istraživačko istraživanje ima za cilj istraživanje neke teme
potpuno nove i formulišu istraživačka pitanja i hipoteze
budućnost. Ova vrsta istraživanja se koristi u izgradnji
teorija za dobijanje početnih referenci u novoj oblasti.
Obično se koriste kvalitativne metode istraživanja, kao što su slučajevi
studijskih ili fenomenoloških studija.
Međutim, moguće je koristiti i kvantitativne tehnike kao npr
istraživačka istraživanja ili eksperimenti.
3.1.3.3 Deskriptivno istraživanje
Deskriptivno istraživanje je u velikoj mjeri usmjereno na analizu i opisivanje
detaljno opisati određenu situaciju ili organizacionu praksu. Ovo
je prikladan za izgradnju teorije i može se koristiti i za
potvrditi ili osporiti hipoteze. Obično deskriptivno istraživanje
uključuje korištenje mjerenja i uzoraka. Najprikladnije metode istraživanja
uključuju istraživanja i analize prethodnika.
3.1.2.3 Eksplanatorno istraživanje
Eksplanatorno istraživanje pokušava objasniti zašto se stvari dešavaju.
Izgrađen je na činjenicama koje su već proučene i koje se pokušavaju pronaći
razloge za ove činjenice.
Dakle, eksplanatorno istraživanje se obično gradi na istraživanju
istraživačka ili deskriptivna i pomoćna je testiranju i rafiniranju
teorije. Eksplanatorno istraživanje obično koristi studije slučaja
ili metode istraživanja zasnovane na anketama.
3.1.2.4 Preventivno istraživanje
Preventivno istraživanje ima za cilj predviđanje događaja i ponašanja
pod opservacijom koja se proučavaju (Marshall i Rossman
1995). Predviđanje je standardni naučni test istine.
Ova vrsta istraživanja uglavnom koristi ankete ili analizu
dati istoričari. (Yin 1989.)
Gornja rasprava pokazuje da postoji veliki broj
moguće istraživačke metode koje se mogu koristiti u studiji
posebno. Međutim, mora postojati posebna metoda koja je prikladnija
drugih za određenu vrstu istraživačkog projekta. (Galliers
1987, Yin 1989, De Vaus 1991). Svaki istraživač, dakle, ima
potrebno je pažljivo procijeniti snage i slabosti
razne metode, kako bi se došlo do usvajanja najpogodnije istraživačke metode e
kompatibilan sa istraživačkim projektom. (Jenkins 1985, Pervan i Klass
1992, Bonomia 1985, Yin 1989, Himilton i Ives 1992).
3.2. Moguće metode istraživanja
Cilj ovog projekta je bio proučavanje iskustva u
Australijske organizacije sa i dati pohranjen sa jednim
razvoj skladište podataka. datum koji trenutno postoji
nedostatak istraživanja u području skladištenja podataka u Australiji,
ovaj istraživački projekat je još u teorijskoj fazi ciklusa
istraživanja i ima istraživačku svrhu. Istraživanje iskustva u
Australijske organizacije koje usvajaju skladištenje podataka
zahtijeva tumačenje stvarnog društva. Shodno tome, the
slijedi filozofska pretpostavka koja je u osnovi istraživačkog projekta
tradicionalnom tumačenju.
Nakon rigoroznog ispitivanja dostupnih metoda, oni su identifikovani
dvije moguće metode istraživanja: ankete i studije slučaja
(studija slučaja), koji se mogu koristiti za istraživanje
istraživački (Shanks et al. 1993). Galliers (1992) to tvrdi
prikladnost ove dvije metode za ovu konkretnu studiju u
njegova revidirana taksonomija kaže da su pogodni za izgradnju
teorijski. Sljedeća dva pododjeljka razmatraju svaku metodu u
detalj.
3.2.1 Metoda istraživanja ankete
Metoda anketnog istraživanja potiče od drevne metode
popis. Popis se sastoji od prikupljanja informacija od
čitava populacija. Ova metoda je skupa i nepraktična
posebno ako je populacija velika. Dakle, u poređenju sa
popisa, anketa je obično fokusirana na
prikupiti informacije za mali broj ili uzorak
predstavnici stanovništva (Fowler 1988, Neuman 1994). A
uzorak odražava populaciju iz koje je izvučen, s različitim
nivoe tačnosti, prema strukturi uzorka,
veličina i korišteni metod odabira (Fowler 1988, Babbie
1982, Neuman 1994).
Metoda istrage je definirana kao "snimci praksi,
situacije ili poglede u određenom trenutku, preduzeti koristeći
upitnike ili intervjue iz kojih se mogu izvesti zaključci
napravljeno” (Galliers 1992:153) [trenutna fotografija praksi,
situacije ili poglede u određenom trenutku, preduzeti koristeći
upitnici ili intervjui iz kojih se mogu izvesti zaključci]. The
istrage se bave prikupljanjem informacija o određenim aspektima
studije, od strane određenog broja učesnika, izrada
pitanja (Fowler 1988). Čak i ovi upitnici i intervjui, koji
uključuju telefonske razgovore licem u lice i strukturirane intervjue,
su tehnike sakupljanja dati najčešće se koristi u
istraživanja (Blalock 1970, Nachmias and Nachmias 1976, Fowler
1988), mogu se koristiti zapažanja i analize (Gable
1994). Od svih ovih metoda prikupljanja dati, upotreba
upitnik je najpopularnija tehnika, jer osigurava da i dati
prikupljeni su strukturirani i formatirani, te stoga olakšavaju
klasifikacija informacija (Hwang 1987, de Vaus 1991).
Prilikom analize i dati, istražna strategija često koristi
kvantitativne tehnike, kao što je statistička analiza, ali one mogu biti
Koriste se i kvalitativne tehnike (Galliers 1992, Pervan
i Klass 1992, Gable 1994). Normalno, i dati prikupljeni su
koristi se za analizu distribucija i obrazaca asocijacija
(Fowler 1988).
Iako su ankete općenito prikladne za istraživanje
baveći se pitanjem 'šta?' (šta) ili iz toga
derivirajući, kao što su 'quanto' (koliko) i 'quant'è (koliko), oni
može se postaviti kroz pitanje 'zašto' (Sonquist i
Dunkelberg 1977, Yin 1989). Prema Sonquistu i Dunkelbergu
(1977), istraživačka istraga ima za cilj teške hipoteze, program
evaluaciju, opisivanje populacije i razvoj modela
ljudsko ponašanje. Osim toga, mogu se koristiti ankete
proučiti određeno mišljenje o stanovništvu, uslovima,
mišljenja, karakteristike, očekivanja, pa čak i prošla ponašanja
ili sadašnje (Neuman 1994).
Istraživanja omogućavaju istraživaču da otkrije odnose između
populacije i rezultati su obično generičniji od
druge metode (Sonquist i Dunkelberg 1977, Gable 1994). The
ankete omogućavaju istraživačima da pokriju geografsko područje
šire i da dopre do mnogih deklaratora (Blalock 1970,
Sonquist i Dunkelberg 1977, Hwang i Lin 1987, Gable 1994,
Neuman 1994). Konačno, ankete mogu pružiti informacije
koji nisu dostupni drugdje ili u obliku potrebnom za analize
(Fowler 1988).
Međutim, postoje neka ograničenja u sprovođenju ankete. Jedan
nedostatak je što istraživač ne može dobiti mnogo informacija
u vezi sa proučavanim objektom. To je zbog činjenice da je
istrage se provode samo u određeno vrijeme i stoga
postoji ograničen broj varijabli i ljudi koje istraživač može
studija (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Još jedan nedostatak je ono što može biti vođenje ankete
veoma skupo u smislu vremena i resursa, posebno ako
uključuje intervjue licem u lice (Fowler 1988).
3.2.2. Metoda istraživanja istraživanja
Metod istraživanja upitnika uključuje dubinsko proučavanje
određenu situaciju u njenom stvarnom kontekstu u a
određenom vremenskom periodu, bez ikakve intervencije sa strane
istraživač (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Ova metoda se uglavnom koristi za opisivanje odnosa između
varijable koje se proučavaju u određenoj situaciji
(Galliers 1992). Istrage mogu uključivati ​​pojedinačne slučajeve ili
višestruko, u zavisnosti od analiziranog fenomena (Franz i Robey 1987,
Eisenhardt 1989, Yin 1989).
Metoda istraživanja istraživanja definisana je kao „upit
empirijska studija koja proučava savremeni fenomen unutar
relativnom stvarnom kontekstu, koristeći više izvora prikupljenih iz jednog ili
više entiteta kao što su ljudi, grupe ili organizacije” (Yin 1989).
Ne postoji jasno razdvajanje između fenomena i njegovog konteksta e
nema kontrole ili eksperimentalne manipulacije varijablama (Yin
1989, Benbasat i dr. 1987).
Postoji niz tehnika za prikupljanje bogova dati da mogu
biti upotrijebljen u metodi upita, što uključuje
neposredna zapažanja, pregledi arhivske građe, upitnici,
pregled dokumentacije i strukturirane intervjue. Imati
širok spektar tehnika berbe dati, istrage
omogućavaju istraživačima da se bave i jednim i drugim dati kvalitativno to
količine u isto vrijeme (Bonoma 1985, Eisenhardt 1989, Yin
1989, Gable 1994). Kao što je slučaj sa metodom anketiranja, a
istraživač-istraživač djeluje kao promatrač ili istraživač, a ne
kao aktivni učesnik u organizaciji koja se proučava.
Benbasat i saradnici (1987) tvrde da je metoda istraživanja
posebno pogodna za teorijske građevinske studije, koje
započnite s istraživačkim pitanjem i nastavite s obukom
teorije tokom procesa prikupljanja dati. Biti
pogodan i za scenu
izgradnje teorije, Franz i Robey (1987) sugeriraju da
Metoda upita se također može koristiti za kompleks
teorijska faza. U ovom slučaju, na osnovu prikupljenih dokaza, jedan
data teorija ili hipoteza je potvrđena ili opovrgnuta. Plus, istraga jeste
također pogodan za istraživanje koje se bavi pitanjima 'kako' ili 'kako'
'zašto' (Yin 1989).
U poređenju sa drugim metodama, ankete omogućavaju istraživaču da
detaljnije uhvatiti bitne informacije (Galliers
1992, Shanks et al 1993). Nadalje, istrage dozvoljavaju
istraživača kako bi razumjeli prirodu i složenost proučavanih procesa
(Benbasat et al. 1987).
Postoje četiri glavna nedostatka povezana s metodom
istrage. Prvi je nedostatak kontrolisanih odbitaka. Tamo
subjektivnost istraživača može promijeniti rezultate i zaključke
studije (Yin 1989). Drugi nedostatak je nedostatak
kontrolisano posmatranje. Za razliku od eksperimentalnih metoda,
istraživač ne može kontrolisati proučavane fenomene
budući da se ispituju u njihovom prirodnom kontekstu (Gable 1994). The
treći nedostatak je nedostatak replikacije. To je zbog činjenice
da je malo vjerovatno da će istraživač promatrati iste događaje, i
ne može provjeriti rezultate određene studije (Lee 1989).
Konačno, kao posljedica neponovljivosti, teško je
generalizovati rezultate dobijene iz jednog ili više istraživanja (Galliers
1992, Shanks et al 1993). Svi ovi problemi, međutim, nisu
su nepremostivi i mogu se, u stvari, minimizirati
istraživač primjenjujući odgovarajuće akcije (Lee 1989).
3.3. Obrazložite metodologiju istraživanja
usvojeno
Od dvije moguće istraživačke metode za ovu studiju, metoda
istraga se smatra najprikladnijom. Istraga je
je odbačeno nakon pažljivog razmatranja relevantnih
zaslugama i slabostima. Pogodnost ili neprikladnost svakog od njih
metoda za ovu studiju razmatra se u nastavku.
3.3.1. Neprikladnost metode istraživanja
istrage
Metoda istraživanja zahtijeva dubinsko proučavanje jednog
posebna situacija unutar jedne ili više organizacija za a
vremenski period (Eisenhardt 1989). U ovom slučaju, period može
premašiti vremenski okvir dat za ovu studiju. Drugi
razlog neusvajanja metode ankete je taj što su rezultati
mogu patiti od nedostatka strogosti (Yin 1989). Subjektivnost
istraživača može uticati na rezultate i zaključke. Drugi
razlog je taj što je ova metoda pogodnija za istraživanje pitanja
tipa 'kako' ili 'zašto' (Yin 1989), dok je istraživačko pitanje
za ovu studiju ona je tipa 'šta'. Zadnji ali ne i posljednji
Važno je da je teško generalizirati nalaze samo jednog ili
nekoliko istraživanja (Galliers 1992, Shanks et al 1993). Na bazi
ovo racionalno objašnjenje, istraživačka metoda istraživanja nije
je izabran jer nije bio pogodan za ovu studiju.
3.3.2. Pogodnost metode pretraživanja
istraga
Kada je ovo istraživanje sprovedeno, praksa skladištenja podataka
nije bio široko prihvaćen od strane
Australijske organizacije. Dakle, nije bilo mnogo informacija
u pogledu njihove implementacije u okviru
Australijske organizacije. Dostupne informacije su stigle
od organizacija koje su implementirale ili koristile podatke
skladište. U ovom slučaju, metod anketnog istraživanja je najveći
pogodan jer vam omogućava da dobijete informacije koje nisu
dostupno na drugom mestu ili u obliku potrebnom za analizu (Fowler 1988).
Osim toga, metoda anketnog istraživanja omogućava istraživaču da
steći dobar uvid u praksu, situacije ili
viđeno u određeno vrijeme (Galliers 1992, Denscombe 1998).
Da bi se povećao, bio je potreban sveukupni pogled
znanje o australskom iskustvu skladištenja podataka.
Opet, Sonquist i Dunkelberg (1977) navode da su rezultati
Anketno istraživanje je opštije od drugih metoda.
3.4. Dizajn istraživanja istraživanja
Istraga o praksi skladištenja podataka sprovedena je 1999. godine.

Ciljnu populaciju činile su organizacije
Australci zainteresovani za studije skladištenja podataka, kakvi su bili
vjerovatno već obaviješten o i dati koje pohranjuju i,
stoga bi mogao pružiti korisne informacije za ovu studiju. Tamo
Ciljna populacija je identifikovana inicijalnim istraživanjem
svi australijski članovi 'The Data Warehousing Institute' (Tdwiaap).
Ovaj odjeljak govori o dizajnu faze istraživanja
empirijski dokazi ove studije.
3.4.1. Tehnika berbe dati
Od tri tehnike koje se obično koriste u anketnom istraživanju
(tj. poštanski upitnik, telefonski intervju i intervju
lični) (Nachmias 1976, Fowler 1988, de Vaus 1991), za
ova studija je usvojila upitnik putem pošte. Prvi
razlog za usvajanje ovog drugog je taj što se njime može postići a
geografski disperzirano stanovništvo (Blalock 1970, Nachmias e
Nachmias 1976, Hwang i Lin 1987, de Vaus 1991, Gable 1994).
Drugo, poštanski upitnik je pogodan za učesnike
visoko obrazovani (Fowler 1988). Pošalji upitnik za ovo
studija je upućena sponzorima projekta skladištenja podataka,
direktori i/ili projekt menadžeri. Treće, upitnici daleko
pošte su prikladne kada imate sigurnu listu
adrese (Salant i Dilman 1994). TDWI, u ovom slučaju, jedan
Udruženje pouzdanih skladišta podataka dalo je listu adresa
njenih australijskih članica. Još jedna prednost upitnika
putem pošte u odnosu na telefonski upitnik ili intervjue
lično je to što omogućava registrantima da više odgovore
tačnost, posebno kada se registranti moraju konsultovati
bilježi ili raspravlja o pitanjima s drugim ljudima (Fowler
1988).
Potencijalni nedostatak može biti vrijeme potrebno za
sprovesti upitnike poštom. Obično, upitnik daleko
pošta se obavlja ovim redoslijedom: slati pisma, čekati
odgovore i pošaljite potvrdu (Fowler 1988, Bainbridge 1989).
Dakle, ukupno vrijeme može biti duže od vremena potrebnog za
lične intervjue ili za telefonske intervjue. Međutim, the
ukupno vrijeme može biti poznato unaprijed (Fowler 1988,
Denscombe 1998). Vrijeme provedeno u vođenju intervjua
lični podaci ne mogu biti poznati unaprijed jer se razlikuju od
jedan intervju drugom (Fowler 1988). Telefonski intervjui
može biti brže od poštanskih upitnika i
lične intervjue, ali može imati visoku stopu nestalih
odgovor zbog nedostupnosti nekih ljudi (Fowler 1988).
Osim toga, telefonski intervjui su općenito ograničeni na spiskove
relativno kratka pitanja (Bainbridge 1989).
Još jedna slabost upitnika putem pošte je visoka stopa
nedostatak odgovora (Fowler 1988, Bainbridge 1989, Neuman
1994). Međutim, preduzete su kontramjere, udruživanje
ovu studiju sa institucijom od poverenja u oblasti podataka
skladištenje (tj. TDWI) (Bainbridge 1989, Neuman 1994),
koji šalje dva pisma podsjetnika onima koji nisu odgovorili
(Fowler 1988, Neuman 1994) i također uključuje pismo
dodatak koji objašnjava svrhu studije (Neuman 1994).
3.4.2. Jedinica analize
Svrha ove studije je da dobije informacije o
implementacija skladišta podataka i njegovo korištenje
u okviru australijskih organizacija. Ciljna populacija
čine sve australske organizacije koje imaju
implementiraju ili sprovode, tj skladište podataka. u
zatim se registruju pojedinačne organizacije. Upitnik
poslana je poštom organizacijama zainteresovanim za usvajanje
di skladište podataka. Ova metoda osigurava da informacije
prikupljeni dolaze iz najprikladnijih resursa svake organizacije
učesnik.
3.4.3. Uzorak ankete
Preuzeta je “mailing lista” učesnika ankete
TDWI. Sa ove liste, 3000 australijskih organizacija
odabrani su kao osnova za uzorkovanje. A
dodatno pismo objašnjava projekat i svrhu istrage,
zajedno sa listom za odgovore i unaprijed plaćenom kovertom za
poslati natrag popunjeni upitnik su poslani uzorku.
Od 3000 organizacija, 198 je pristalo da učestvuje u
studija. Očekivao se tako mali broj odgovora dato il
veliki broj australijskih organizacija koje su tada imali
prihvatili ili prihvatali strategiju datuma
skladištenje u okviru svojih organizacija. Dakle,
Ciljna populacija za ovu studiju sastoji se od samo 198
organizacije.
3.4.4. Sadržaj upitnika
Struktura upitnika zasnovana je na modelu datuma
Skladištenje u Monašu (prethodno razmatrano u dijelu 2.3). The
sadržaj upitnika zasnovan je na analizi
literatura predstavljena u poglavlju 2. Kopija upitnika
poslano učesnicima ankete
u Dodatku B. Upitnik se sastoji od šest dijelova, koji
slijede faze modela o kojem se raspravlja. Sljedećih šest pasusa
oni ukratko sumiraju sadržaj svakog odjeljka.
Odjeljak A: Osnovne informacije o organizaciji
Ovaj odjeljak sadrži pitanja vezana za profil
organizacije koje učestvuju. Osim toga, neka od pitanja su
koji se odnose na stanje projekta skladišta podataka
učesnik. Povjerljive informacije kao što je vaše ime
organizacije nisu otkriveni u analizi ankete.
Odjeljak B: Početak
Pitanja u ovom dijelu odnose se na početnu aktivnost
skladištenje podataka. Pitanja su postavljana koliko dugo
odnosi se na inicijatore projekta, garante, vještine i znanja
zahtjeve, ciljeve razvoja skladišta podataka i
očekivanja krajnjih korisnika.
Odjeljak C: Dizajn
Ovaj odjeljak sadrži pitanja vezana za aktivnosti
planiranje skladište podataka. Posebno se postavljaju pitanja
navesti obim izvođenja, trajanje projekta, cijenu
projekta i analizu troškova i koristi.
Odjeljak D: Razvoj
U odjeljku za razvoj nalaze se pitanja vezana za aktivnosti
razvoj skladište podataka: zbirka zahtjeva korisnika
konačno, izvori dati, logički model dati, prototipovi,
planiranje kapaciteta, tehničke arhitekture i odabir
alati za razvoj skladišta podataka.
Odjeljak E: Operacija
Operativna pitanja vezana za operaciju ed
na proširivost skladište podataka, kako se razvija u
sledeća faza razvoja. Tamo kvaliteta podataka, strategije
refresh dei dati, granularnost dati, skalabilnost podataka
skladišta i sigurnosnih problema skladište podataka bili su između
vrste postavljenih pitanja.
Odjeljak F: Razvoj
Ovaj odjeljak sadrži pitanja koja se odnose na korištenje podataka
skladište po krajnjim korisnicima. Istraživač je bio zainteresovan
u svrhu i korisnost skladište podataka, pregled i strategije
usvojene obuke i strategije kontrole podataka
magacin usvojen.
3.4.5. Stopa odgovora
Iako se ankete putem pošte kritikuju zbog toga što imaju stopu od
slab odziv, preduzete su mere za povećanje
stopa povrata (kao što je ranije djelimično razmotreno
3.4.1). Termin 'stopa odgovora' se odnosi na postotak
ljudi u određenom uzorku ankete koji odgovaraju na
upitnik (Denscombe 1998). Korišteno je sljedeće
formula za izračunavanje stope odgovora za ovu studiju:
Broj ljudi koji su odgovorili
Stopa odgovora =
——————————————————————————— X 100
Ukupan broj poslanih upitnika
3.4.6. Pilot Test
Prije nego se upitnik pošalje uzorku, postavljaju se pitanja
je ispitan izvođenjem pilot testova, kako je predložio Luck
i Rubin (1987), Jackson (1988) i de Vaus (1991). Svrha
pilot testovi otkrivaju sve neugodne, dvosmislene i izraze
pitanja koja je teško protumačiti, razjasniti bilo koja
definicije i termini koji se koriste i za identifikaciju približnog vremena
potrebno je popuniti upitnik (Warwick i Lininger 1975,
Jackson 1988, Salant i Dilman 1994). Pilot testovi su bili
vrši odabirom subjekata sa sličnim karakteristikama
završnih predmeta, kao što je predložio Davis e Cosenza (1993). U
u ovoj studiji bilo je šest stručnjaka za skladištenje podataka
izabrani kao pilot subjekti. Nakon svakog pilot testiranja, jesu
izvršene su neophodne korekcije. Iz sprovedenih pilot testova, tj
učesnici su pomogli u preoblikovanju i resetovanju
konačna verzija upitnika.
3.4.7. Metode analize By dati
I dati istraga prikupljenih iz zatvorenih upitnika su
analizirani su pomoću statističkog softverskog paketa
pod nazivom SPSS. Mnogi odgovori su analizirani
koristeći deskriptivnu statistiku. Određeni broj upitnika
vratili su se nepotpuni. Ovi su tretirani većim
obratite pažnju da budete sigurni da i dati nestali nisu bili jedan
posljedica grešaka u unosu podataka, ali zašto pitanja ne
bili su prikladni za deklaratora, ili je deklarator odlučio da to ne čini
odgovori na jedno ili više konkretnih pitanja. Ovi odgovori
nedostaju su zanemareni tokom analize dati i bili su
kodirani kao '- 9' kako bi se osiguralo njihovo isključenje iz procesa
analize.
Prilikom pripreme upitnika, pitanja su bila zatvorena
unaprijed kodirano dodjeljivanjem broja svakoj opciji. Broj
zatim je korišten za pripremu i dati tokom analize
(Denscombe 1998, Sapsford i Jupp 1996). Na primjer, bilo ih je
šest opcija navedenih u pitanju 1 odjeljka B: savjet
odbor, visoki rukovodilac, IT odjel, jedinica
poslovanja, konsultanata i još mnogo toga. U fajlu dati SPSS, je
generirana je varijabla koja označava 'inicijatora projekta',
sa šest oznaka vrijednosti: '1' za 'upravni odbor', '2'
za 'izvršnu vlast na visokom nivou' i tako dalje. Upotreba Likertinove skale
u nekim od zatvorenih pitanja to je takođe dozvolilo
identifikacija koja ne zahtijeva nikakav napor s obzirom na korištenje vrijednosti
odgovarajući brojevi uneseni u SPSS. Za pitanja sa
neiscrpni odgovori, koji se međusobno ne isključuju,
svaka opcija je tretirana kao jedna varijabla sa dvije
oznake vrijednosti: '1' za 'označeno' i '2' za 'neoznačeno'.
Otvorena pitanja tretirana su drugačije od pitanja
zatvoreno. U odgovore na ova pitanja nije se ulazilo
SPSS. Umjesto toga, analizirani su ručno. Upotreba ovoga
vrsta pitanja vam omogućava da dobijete informacije o idejama
slobodno izražena i lična iskustva ispitanika
(Bainbridge 1989, Denscombe 1998). Gdje je bilo moguće, to je urađeno
kategorizacija odgovora.
Za analizu dati, koriste se jednostavne metode statističke analize,
kao što su učestalost odgovora, srednja vrijednost, standardna devijacija
srednja vrijednost i medijana (Argyrous 1996, Denscombe 1998).
Gama test je bio efikasan za dobijanje kvantitativnih merenja
asocijacija između dati redni brojevi (Norusis 1983, Argyrous 1996).
Ovi testovi su bili prikladni jer korištene ordinalne skale nisu
imali su mnogo kategorija i mogli su se prikazati u tabeli
(Norusis 1983).
3.5 Sažetak
U ovom poglavlju, metodologija istraživanja i
dizajni usvojeni za ovu studiju.
Odabir najprikladnije istraživačke metode za a
posebna studija obuhvata
razmatranje brojnih pravila, uključujući prirodu i vrstu
istraživanja, kao i prednosti i slabosti svakog mogućeg
metoda (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987,
yin 1989, Hamilton i Ives 1992, Galliers 1992, Neuman 1994). Pogled
nedostatak postojećeg znanja i teorije o tome
o usvajanju skladišta podataka u Australiji, ova studija je
istraživanje zahtijeva interpretativnu istraživačku metodu sa vještinom
istraživački za istraživanje iskustava organizacija
Australijanac. Odabrana metoda istraživanja odabrana je za
prikupiti informacije u vezi sa usvajanjem koncepta datuma
skladištenje od strane australijskih organizacija. A
Kao tehnika prikupljanja izabran je poštanski upitnik dati. u
opravdanja metode istraživanja i tehnike prikupljanja dati
odabrani će biti navedeni u ovom poglavlju. Takodje je bilo
predstavio diskusiju o jedinici analize, uzorku
korišćeni, procenti odgovora, sadržaj upitnika,
pre-test upitnika i metoda analize dati.

Projektovanje a Skladište podataka:
Kombinacija odnosa entiteta i dimenzionalnog modeliranja
ABSTRACT
Čuvanje i dati To je veliki aktuelni problem za mnoge
organizacije. Ključni problem u razvoju
skladištenja dati to je njegov dizajn.
Dizajn mora podržavati otkrivanje koncepata u podacima
skladište do naslijeđenog sistema i drugih izvora dati a takođe i jedan
lako razumevanje i efikasnost u implementaciji podataka
skladište.
Velik dio literature o skladištenju dati preporučuje se
korištenje modeliranja odnosa entiteta ili dimenzionalnog modeliranja za
predstavljaju dizajn skladište podataka.
U ovom radu pokazujemo kako oboje
reprezentacije se mogu kombinovati u jedan pristup za
crtež od skladište podataka. Pristup koji se koristi je sistematičan
ispitan u studiji slučaja i identifikovan je u nizu
važne implikacije sa profesionalcima.
DATA WAREHOUSING
Un skladište podataka se obično definiše kao „predmetno orijentisan,
integrirano, vremenski promjenjivo i nepromjenjivo prikupljanje podataka za podršku
odluka menadžmenta” (Inmon i Hackathorn, 1994).
Predmetno orijentisana i integrisana ukazuje da je skladište podataka è
dizajniran da pređe funkcionalne granice naslijeđenih sistema za
nude integrisanu perspektivu dati.
Vremenska varijanta utiče na istorijsku prirodu ili prirodu vremenske serije dati in
un skladište podataka, što omogućava analizu trendova.
Neisparljiv označava da je skladište podataka nije kontinuirano
ažurirano kao a baza podataka of OLTP. Radije se ažurira
periodično, sa dati dolaze iz internih i eksternih izvora. The
skladište podataka posebno je dizajniran za istraživanje
radije nego za integritet ažuriranja i performanse
operacije.
Ideja pohranjivanja i dati nije novo, to je bila jedna od namjena
upravljanja dati od šezdesetih (The Martin, 1982).
I skladište podataka nude infrastrukturu dati za menadžment
sistemi podrške. Sistemi podrške menadžmentu uključuju odlučivanje
sistemi podrške (DSS) i izvršni informacioni sistemi (EIS).
DSS je kompjuterski baziran informacioni sistem koji je
dizajniran da poboljša proces, a samim tim i prianjanje
ljudska odluka. EIS je tipično sistem isporuke
dati što omogućava poslovnim rukovodiocima da lako pristupe pogledu
od dati.
Opća arhitektura a skladište podataka ističe ulogu
skladište podataka u podršci menadžmentu. Pored ponude
infrastrukturu dati za EIS i DSS, al skladište podataka je moguće
pristupite direktno putem upita. THE dati uključeno u datum
skladišta se zasnivaju na analizi zahtjeva za informacijama
upravljanja i dobijaju se iz tri izvora: internih naslijeđenih sistema,
sistemi za prikupljanje podataka posebne namjene i eksterni izvori podataka. THE
dati u internim naslijeđenim sistemima oni su često suvišni,
nedosljedni, niske kvalitete i pohranjeni u različitim formatima
tako da ih treba uskladiti i očistiti prije nego što ih ubacite u
skladište podataka (Inmon, 1992; McFadden, 1996). THE dati od
iz sistema za skladištenje dati ad hoc i iz izvora dati
eksterni se često koriste za povećanje (ažuriranje, zamjena) i
dati iz naslijeđenih sistema.
Postoji mnogo uvjerljivih razloga za razvoj a skladište podataka,
koji uključuju bolje donošenje odluka kroz upotrebu
efektivno više informacija (Ives 1995), podrška za fokus
na kompletan posao (Graham 1996), i smanjenje troškova
pružanje dati za EIS i DSS (Graham 1996, McFadden
1996).
Nedavna empirijska studija pokazala je, u prosjeku, povratak od
ulaganja za i skladište podataka za 401% nakon tri godine (Graham,
1996). Međutim, druge empirijske studije o skladište podataka imati
otkrili značajne probleme uključujući poteškoće u mjerenju ed
dodeljivanje koristi, nedostatak jasne svrhe, potcenjivanje iste
svrha i složenost procesa skladištenja i dati, u
posebno u pogledu izvora i čistoće dati.
Čuvanje i dati može se smatrati rješenjem
na problem upravljanja dati između organizacija. Tamo
manipulacija dati kao društveni resurs ostao je jedan od
ključna pitanja u upravljanju informacionim sistemima širom sveta
svijetu dugi niz godina (Brancheau et al. 1996., Galliers et al. 1994.,
Niederman et al. 1990, Pervan 1993).
Popularan pristup upravljanju dati osamdesetih je bilo
razvijanje modela dati društveni. Model dati društveni je bio
dizajniran da ponudi stabilnu osnovu za razvoj novih sistema
aplikacije e baza podataka i rekonstrukciju i integraciju naslijeđa
sistema (Brancheau et al.
1989, Goodhue et al. 1988:1992, Kim i Everest 1994).
Međutim, postoji mnogo problema s ovim pristupom, u
posebno, složenost i trošak svakog zadatka, te dugo vrijeme
potrebno da ima opipljive rezultate (Beynon-Davies 1994, Earl
1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997).
Il skladište podataka to je zasebna baza podataka koja koegzistira sa starim bazama podataka
baze podataka umjesto da ih zamjenjuju. Stoga vam to omogućava
usmjeriti upravljanje dati i izbjeći skupu rekonstrukciju
naslijeđenih sistema.
POSTOJEĆI PRISTUPI DIZAJNU PODATAKA
SKLADIŠTVO
Proces izgradnje i usavršavanja a skladište podataka
treba shvatiti više kao evolucijski proces, a ne kao a
razvojni životni ciklus tradicionalnih sistema (Desire, 1995, Shanks,
O'Donnell i Arnott 1997a). Mnogo je procesa uključenih u a
projekat of skladište podataka kao što su inicijalizacija, planiranje;
informacije dobijene iz zahtjeva koji se traže od menadžera kompanije;
izvori, transformacije, čišćenje dati i sinhronizacija iz naslijeđa
sistema i drugih izvora dati; sistemi isporuke u razvoju;
praćenje skladište podataka; i besmislenost procesa
evolucija i konstrukcija a skladište podataka (Stinchi, O'Donnell
i Arnott 1997b). U ovom časopisu fokusiramo se na to kako
nacrtaj i dati pohranjene u kontekstu ovih drugih procesa.
Postoji niz pristupa predloženih za arhitekturu podataka
skladište literature (Inmon 1994, Ives 1995, Kimball 1994
McFadden 1996). Svaka od ovih metodologija ima sažetak
pregled sa analizom njihovih snaga i slabosti.
Inmonov (1994) pristup za Skladište podataka
dizajn
Inmon (1994) je predložio četiri iterativna koraka za crtanje podataka
skladište (vidi sliku 2). Prvi korak je dizajn šablona
dati društveni da razumem kako ja dati mogu biti integrisani
preko funkcionalnih područja unutar organizacije
dijeljenje i dati skladištiti u područjima. Model dati stvoreno je za
u radnju dati koji se odnose na donošenje odluka, uključujući dati
istoričari, uključujući dati oduzeti i agregirani. Drugi korak je
identifikovati predmetne oblasti za implementaciju. Ovi su zasnovani
o prioritetima koje odredi određena organizacija. Treći
korak uključuje crtanje a baza podataka za predmetno područje, mjesta
obratite posebnu pažnju na uključivanje odgovarajućih nivoa granularnosti.
Inmon preporučuje korištenje modela entiteta i odnosa. Četvrto
korak je da se identifikuju izvorni sistemi dati potrebno i razvijati
procesi transformacije za snimanje, čišćenje i formatiranje i dati.
Snage Inmonovog pristupa su taj model dati društvene
nudi osnovu za integraciju dati unutar organizacije
i podrška planiranju za iterativni razvoj podataka
skladište. Njegove mane su poteškoća i cijena crtanja
model dati društvene, teškoće u razumijevanju modela entiteta i
relacije korištene u oba modela, tj dati društveni i onaj od dati
pohranjene po predmetnoj oblasti i prikladnost dati del
crtež od skladište podataka za realizaciju baza podataka
relacijski, ali ne i za baza podataka višedimenzionalni.
Ivesov (1995) pristup Skladište podataka
dizajn
Ives (1995) predlaže pristup u četiri koraka dizajniranju a
informacioni sistem za koji smatra da je primenljiv na dizajn podataka
skladište (vidi sliku 3). Pristup je veoma zasnovan na
Informacioni inženjering za razvoj informacionih sistema
(Martin 1990). Prvi korak je određivanje ciljeva, faktora
kritični i uspješni i ključni indikatori učinka. THE
ključni poslovni procesi i potrebne informacije su
modelirano da nas dovede do modela dati društveni. Drugi korak
uključuje razvoj definirajuće arhitekture dati
pohranjeno po oblastima, baza podataka di skladište podataka, komponente
tehnologije koja je potrebna, skup organizacijske podrške
potrebno za implementaciju i rad skladište podataka. Treći
korak uključuje odabir potrebnih softverskih paketa i alata.
Četvrti korak je detaljno projektovanje i izgradnja objekta
skladište podataka. Ives napominje da se čuva dati on je vezan čovek
iterativni proces.
Snaga Ivesovog pristupa je upotreba specifičnih tehnika za
odrediti zahtjeve za informacijama, korištenje strukturiranih
proces koji podržava integraciju skladište podataka,
odabir odgovarajućeg hardvera i softvera, te korištenje višestrukih
tehnike predstavljanja za skladište podataka. Njegove mane
oni su svojstveni kompleksnosti. Drugi uključuju poteškoće u
razvijaju mnoge nivoe baza podataka all'interno del skladište podataka in
razumnim rokovima i troškovima.
Kimballov (1994) pristup Skladište podataka
dizajn
Kimball (1994) je predložio pet iterativnih koraka za crtanje podataka
skladište (vidi sliku 4). Njegov pristup je posebno
posvećen dizajnu samo jednog skladište podataka i korištenje modela
dimenzionalni u odnosu na modele entiteta i odnosa. Kimball
analizirati te dimenzionalne modele jer mi je to lakše razumjeti
poslovni lideri su efikasniji kada se bave poslom
kompleksne konsultacije i dizajn baza podataka fizički je više
efikasan (Kimball 1994). Kimball prepoznaje da je razvoj a
skladište podataka to je iterativno, i to skladište podataka razdvojeni mogu
biti integriran kroz podjelu u tablice dimenzija
često.
Prvi korak je identifikovanje određene predmetne oblasti
usavršeno. Drugi i treći korak tiču ​​se oblikovanja
dimenzionalni. U drugom koraku mjerenja identificiraju stvari
interesovanje za predmetnu oblast i grupisane u tabelu činjenica.
Na primjer, u oblasti prodajnog predmeta mjere od interesa
može uključiti količinu prodanih artikala i dolar
kao prodajna valuta. Treći korak uključuje identifikaciju
dimenzije koje su načini na koje se mogu grupirati i
činjenice. U prodajnom predmetu, relevantne dimenzije
može uključivati ​​stavku, lokaciju i vremenski period. Tamo
tabela činjenica ima višedijelni ključ za povezivanje sa svakim
tablica dimenzija i obično sadrži veliki broj
puna činjenica. Nasuprot tome, tabele dimenzija sadrže
deskriptivne informacije o dimenzijama i drugim atributima koji
može se koristiti za grupisanje činjenica. Tabela činjenica e
dimenzije povezane s prijedlogom čine ono što se zove jedan
zvjezdasti uzorak zbog svog oblika. Četvrti korak uključuje
izgradnja a baza podataka višedimenzionalni da ga usavrši
zvjezdasti uzorak. Poslednji korak je identifikacija izvornih sistema dati
potrebno i razviti procese transformacije za stjecanje, čišćenje
i format i dati.
Jake strane Kimballovog pristupa uključuju korištenje modela
dimenzionalan da predstavlja i dati pohranjeni koji to čine
lako razumljivo i dovodi do efikasnog fizičkog dizajna. A
dimenzionalni model koji takođe lako koristi oba
sistemi baza podataka relacijski mogu biti usavršeni ili sistemi
baza podataka multidimenzionalni. Njegove mane uključuju nedostatak
nekih tehnika za olakšavanje planiranja ili integracije
mnogo uzoraka zvijezde unutar jednog skladište podataka i
poteškoće u projektiranju od ekstremno denormalizirane strukture u a
dimenzionalni model a dati u naslijeđenom sistemu.
McFadden-ov (1996) pristup podacima
Dizajn skladišta
McFadden (1996) predlaže pristup u pet koraka
nacrtati a skladište podataka (vidi sliku 5).
Njegov pristup zasniva se na sintezi ideja iz literature
i fokusiran je na dizajn samo jednog skladište podataka. Prvi
korak uključuje analizu zahtjeva. Iako specifičnosti
tehnike nisu propisane, McFaddenove bilješke identificiraju
entiteta dati specifikacije i njihove atribute, a odnosi se na Watsonove čitaoce
i Frolick (1993) za stjecanje zahtjeva.
U drugom koraku dizajniran je model odnosa entiteta
skladište podataka a zatim potvrđen od strane rukovodilaca kompanije. Treći
korak uključuje određivanje mapiranja iz naslijeđenog sistema
i eksterni izvori skladište podataka. Četvrti korak uključuje
procesa u razvoju, implementaciji i sinhronizaciji dati Nel
skladište podataka. U završnom koraku, sistem se isporučuje
razvijen sa posebnim naglaskom na korisničkom interfejsu.
McFadden ističe da je proces crtanja općenito
iterativno.
Jake strane McFaddenovog pristupa se fokusiraju na učešće
od strane poslovnih lidera u određivanju zahteva i takođe
važnost resursa dati, njihovo čišćenje i sakupljanje. Ona
nedostaci se tiču ​​nepostojanja procesa za podjelu a
odličan projekat od strane skladište podataka u mnogim integrisanim fazama, i
poteškoće u razumijevanju modela entiteta i odnosa koji se koriste u dizajnu
skladište podataka.

    0/5 (0 recenzija)
    0/5 (0 recenzija)
    0/5 (0 recenzija)

    Saznajte više od Online Web Agencije

    Pretplatite se da primate najnovije članke putem e-pošte.

    avatar autora
    admin CEO
    👍Online web agencija | Stručnjak za web agencije za digitalni marketing i SEO. Web Agency Online je web agencija. Za Agenzia Web Online uspjeh u digitalnoj transformaciji zasniva se na osnovama Iron SEO verzije 3. Specijalnosti: sistemska integracija, integracija poslovnih aplikacija, servisno orijentirana arhitektura, računalstvo u oblaku, skladište podataka, poslovna inteligencija, veliki podaci, portali, intraneti, web aplikacije Dizajn i upravljanje relacionim i višedimenzionalnim bazama podataka Dizajniranje interfejsa za digitalne medije: upotrebljivost i grafika. Online web agencija nudi kompanijama sljedeće usluge: -SEO na Google, Amazon, Bing, Yandex; -Web analitika: Google Analytics, Google Tag Manager, Yandex Metrica; -Konverzije korisnika: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM na Google, Bing, Amazon Ads; - Marketing na društvenim mrežama (Facebook, Linkedin, Youtube, Instagram).
    Moja agilna privatnost
    Ova stranica koristi tehničke kolačiće i kolačiće za profiliranje. Klikom na prihvatiti odobravate sve kolačiće za profilisanje. Klikom na odbij ili X, svi kolačići za profilisanje se odbijaju. Klikom na prilagodite moguće je odabrati koje kolačiće za profiliranje želite aktivirati.
    Ova stranica je u skladu sa Zakonom o zaštiti podataka (LPD), švicarskim saveznim zakonom od 25. septembra 2020. i GDPR, Uredbom EU 2016/679, koja se odnosi na zaštitu ličnih podataka kao i slobodno kretanje takvih podataka.