https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

Skladišče podatkov in načrtovanje virov v podjetju | DWH in ERP

ARHIV PODATKI OSREDNJA : ZGODOVINA IZD EVOLUCIJA

Dve prevladujoči temi korporativne tehnologije v devetdesetih sta bili i podatkovno skladišče in ERP. Dolgo časa sta bila ta dva močna toka del korporativne IT, ne da bi se kdaj presekala. Bilo je skoraj tako, kot da bi bili materija in antimaterija. Toda rast obeh pojavov je neizogibno vodila do njunega preseka. Danes se podjetja soočajo s problemom, kaj storiti z ERP in podatkovno skladišče. Ta članek bo pojasnil, kakšne so težave in kako jih podjetja rešujejo.

NA ZAČETKU…

Na začetku je bil podatkovno skladišče. Skladišče podatkov rojen je bil za boj proti aplikacijskemu sistemu za obdelavo transakcij. V zgodnjih dneh pomnjenja Podatki mišljeno je bilo kot nasprotje aplikacijam za obdelavo transakcij. Toda dandanes obstajajo veliko bolj prefinjene vizije o tem, kaj a podatkovno skladišče. V današnjem svetu je podatkovno skladišče vstavljen je v strukturo, ki jo lahko imenujemo Tovarna korporativnih informacij.

KORPORATIVNA INFORMACIJSKA TOVARNICA (CIF)

Tovarna korporativnih informacij ima standardne arhitekturne komponente: plast integracije in preoblikovanja kode, ki združuje i Podatki medtem ko jaz Podatki se preselijo iz aplikacijskega okolja v okolje podatkovno skladišče družbe; a podatkovno skladišče podjetja, kjer je Podatki podrobni in integrirani zgodovinarji. The podatkovno skladišče podjetja služi kot temelj, na katerem je mogoče graditi vse druge dele okolja podatkovno skladišče; shramba operativnih podatkov (ODS). ODS je hibridna struktura, ki vsebuje nekatere vidike podatkovno skladišče in drugi vidiki okolja OLTP; podatkovne marce, kjer imajo lahko različni oddelki svojo različico podatkovno skladišče; a podatkovno skladišče raziskovanje, kjer lahko misleci podjetja oddajo svoje 72-urne poizvedbe brez škodljivega vpliva na podatkovno skladišče; in skoraj vrstični pomnilnik, v katerem Podatki stara in Podatki podrobnosti v razsutem stanju lahko poceni shranite.

KJE SE ERP kombinira z KORPORATIVNA INFORMACIJSKA TOVARNICA

ERP se združuje s Tovarno korporativnih informacij na dveh mestih. Predvsem kot osnovna aplikacija, ki zagotavlja i Podatki vloge za podatkovno skladišče. V tem primeru i Podatki, ki nastanejo kot stranski produkt transakcijskega procesa, so integrirani in naloženi v podatkovno skladišče družbe. Druga vez med ERP in CIF je ODS. Dejansko se v mnogih okoljih ERP uporablja kot klasični ODS.

V primeru, da se ERP uporablja kot osnovna aplikacija, se isti ERP lahko uporablja tudi v CIF kot ODS. V vsakem primeru, če naj se ERP uporablja v obeh vlogah, mora obstajati jasna razlika med entitetama. Z drugimi besedami, ko ima ERP vlogo osnovne aplikacije in ODS, je treba ločiti obe arhitekturni enoti. Če ena sama izvedba ERP poskuša izpolniti obe vlogi hkrati, bo neizogibno prišlo do težav pri oblikovanju in izvajanju tega okvira.

LOČENE ODS IN OSNOVNE UPORABE

Razlogov za delitev arhitekturnih komponent je veliko. Morda najbolj zgovorna točka pri ločevanju različnih komponent arhitekture je, da ima vsaka komponenta arhitekture svoj pogled. Osnovna aplikacija ima drugačen namen kot ODS. Poskusite s prekrivanjem

osnovni pogled aplikacije na svet ODS ali obratno ni pošten način dela.

Posledično je prva težava ERP v CIF preveriti, ali obstaja razlika med osnovnimi aplikacijami in ODS.

VZORCI PODATKOV V PODJETJU TOVARNICA INFORMACIJ

Da bi dosegli kohezijo med različnimi komponentami arhitekture CIF, mora obstajati model Podatki. Modeli od Podatki služijo kot povezava med različnimi komponentami arhitekture, kot so osnovne aplikacije in ODS. Modeli od Podatki postanejo »intelektualni zemljevid« za pridobitev pravega pomena iz različnih arhitekturnih komponent CIF.

Če gremo z roko v roki s tem pojmom, je ideja, da mora obstajati en velik in en sam vzorec Podatki. Očitno mora obstajati vzorec Podatki za vsako komponento in poleg tega mora obstajati razumna pot, ki povezuje različne modele. Vsaka komponenta arhitekture – ODS, osnovne aplikacije, podatkovno skladišče podjetja itd.. – potrebuje svoj model Podatki. Zato je treba natančno opredeliti, kako ti modeli Podatki med seboj se povezujejo.

PREMAKI I PODATKI DATUMA ERP SKLADIŠČE

Če je izvor Podatki je osnovna aplikacija in/ali ODS, ko ERP vstavi i Podatki v podatkovno skladišče, mora ta vstavitev potekati na najnižji ravni "zrnatosti". Preprosto povzamemo ali združimo i Podatki ker prihajajo iz osnovne aplikacije ERP ali ERP ODS, ni prava stvar. THE Podatki podrobnosti so potrebne v podatkovno skladišče tvoriti osnovo procesa DSS. Takšna Podatki podatkovni borzi in raziskovanje jih bodo v mnogih pogledih preoblikovali podatkovno skladišče.

Premik Podatki iz osnovnega aplikacijskega okolja ERP v podatkovno skladišče družbe poteka na dokaj sproščen način. Ta premik se izvede približno 24 ur po posodobitvi ali ustvarjanju v ERP. Dejstvo, da imate "leno" gibanje Podatki v podatkovno skladišče podjetja dovoljuje Podatki ki prihajajo iz ERP na "poravnavo". Enkrat i Podatki so shranjeni v osnovni aplikaciji, potem lahko varno premaknete Podatki ERP v podjetju. Še en cilj, ki ga je mogoče doseči z "lenim" gibanjem Podatki je jasna razmejitev med operativnimi procesi in DSS. S "hitrim" gibanjem Podatki meja med DSS in operativnim ostaja nejasna.

Gibanje Podatki od ODS ERP do podatkovno skladišče družbe se izvaja periodično, običajno tedensko ali mesečno. V tem primeru gibanje Podatki temelji na potrebi po "čiščenju" starega Podatki zgodovinarji. ODS seveda vsebuje i Podatki ki so veliko novejši od Podatki zgodovinarji našli v podatkovno skladišče.

Premik Podatki v podatkovno skladišče skoraj nikoli se ne izvaja "na debelo" (na veletrgovski način). Kopirajte tabelo iz okolja ERP v podatkovno skladišče to nima smisla. Veliko bolj realističen pristop je premikanje izbranih enot Podatki. Samo Podatki ki so se spremenile od zadnje posodobitve podatkovno skladišče so tisti, ki bi jih morali preseliti v podatkovno skladišče. Eden od načinov, da veste, katere Podatki ki so se od zadnje posodobitve spremenile, je pogledati časovne žige Podatki najdemo v okolju ERP. Oblikovalec izbere vse spremembe, ki so se zgodile od zadnje posodobitve. Drugi pristop je uporaba tehnik zajemanja sprememb Podatki. S temi tehnikami se analizirajo dnevniki in trakovi dnevnikov, da se ugotovi, kateri Podatki je treba premakniti iz okolja ERP v okolje podatkovno skladišče. Te tehnike so najboljše, saj je dnevnike in dnevnike mogoče brati iz datotek ERP brez nadaljnjega vpliva na druge vire ERP.

DRUGI ZAPLETI

Ena od težav ERP v CIF je, kaj se zgodi z drugimi viri aplikacij ali AI Podatki ODS, ki mora prispevati k podatkovno skladišče vendar niso del okolja ERP. Glede na zaprto naravo ERP, zlasti SAP, poskuša integrirati ključe iz zunanjih virov Podatki z i Podatki ki prihajajo iz ERP v času selitve i Podatki v podatkovno skladišče, to je velik izziv. In kakšne so točno verjetnosti, da i Podatki aplikacij ali ODS zunaj okolja ERP bodo integrirani v podatkovno skladišče? Možnosti so pravzaprav zelo visoke.

NAJTI PODATKI ZGODOVINE IZ ERP

Druga težava z Podatki ERP je tisto, ki izhaja iz potrebe imeti Podatki zgodovinarji znotraj podatkovno skladišče. Običajno podatkovno skladišče potrebe Podatki zgodovinarji. Teh tehnologija ERP običajno ne shrani Podatki zgodovinski, vsaj ne v tolikšni meri, kot je to nujno v podatkovno skladišče. Ko je velika količina Podatki Če se dnevniki začnejo seštevati v okolju ERP, je treba to okolje očistiti. Denimo, da a podatkovno skladišče mora biti obremenjen s petimi leti Podatki zgodovinski, ERP pa jih hrani največ šest mesecev Podatki. Dokler je podjetje zadovoljno zbrati število Podatki zgodovinski, ko čas mineva, potem ni težav z uporabo ERP kot vira za podatkovno skladišče. Toda ko je podatkovno skladišče mora iti nazaj v čas in vzeti bogove Podatki zgodovine, ki je predhodno ni zbral in shranil ERP, postane okolje ERP neučinkovito.

ERP IN METADATA

Še en premislek, ki ga je treba upoštevati pri ERP e podatkovno skladišče je tisti na obstoječih metapodatkih v okolju ERP. Tako kot se metapodatki selijo iz okolja ERP v podatkovno skladišče, je treba metapodatke premakniti na enak način. Poleg tega je treba metapodatke preoblikovati v obliko in strukturo, ki jo zahteva infrastruktura podatkovno skladišče. Obstaja velika razlika med operativnimi metapodatki in metapodatki DSS. Operativni metapodatki so večinoma za razvijalca in za

programer. Metapodatki DSS so namenjeni predvsem končnemu uporabniku. Obstoječe metapodatke v aplikacijah ERP ali ODS je treba pretvoriti in ta konverzija ni vedno enostavna in enostavna.

VIR ERP PODATKOV

Če se ERP uporablja kot ponudnik Podatki za podatkovno skladišče obstajati mora trden vmesnik, ki se premika i Podatki iz okolja ERP v okolje podatkovno skladišče. Vmesnik mora:

▪ biti enostaven za uporabo
▪ omogoči dostop do Podatki ERP
▪ zaznati pomen Podatki ki se selijo v podatkovno skladišče
▪ poznati omejitve ERP, ki se lahko pojavijo pri dostopu do Podatki ERP:
▪ referenčna celovitost
▪ hierarhični odnosi
▪ implicitna logična razmerja
▪ konvencija uporabe
▪ vse strukture Podatki podpira ERP in tako naprej ...
▪ biti učinkovit pri dostopu Podatki, z zagotavljanjem:
▪ neposredno gibanje Podatki
▪ pridobitev drobiža Podatki
▪ podpira pravočasen dostop do Podatki
▪ razumeti obliko Podatki, in tako naprej… VMESNIK SAP Vmesnik je lahko dveh vrst, domači ali komercialni. Nekateri glavni komercialni vmesniki vključujejo:

▪ SAS
▪ Prime Solutions
▪ D2k in tako naprej ... VEČ ERP TEHNOLOGIJ Obravnavanje okolja ERP, kot da gre za eno samo tehnologijo, je velika napaka. Obstaja veliko tehnologij ERP, od katerih ima vsaka svoje prednosti. Najbolj znani prodajalci na trgu so:

▪ SAP
▪ Oracle Financials
▪ PeopleSoft
JD Edwards
▪ Baans SAP SAP je največja in najobsežnejša programska oprema ERP. Aplikacije SAP vključujejo številne vrste aplikacij na številnih področjih. SAP ima sloves, da je:

▪ zelo velika
▪ zelo težko in drago za izvedbo
▪ potrebuje veliko ljudi in svetovalcev za izvedbo
▪ potrebuje specializirane ljudi za izvedbo
▪ potrebuje veliko časa za implementacijo. Prav tako ima SAP sloves, da si zapomni svoje Podatki blizu, zaradi česar nekdo zunaj območja SAP težko dostopa do njih. Prednost SAP-ja je v tem, da lahko zajame in shrani velike količine Podatki. SAP je nedavno objavil, da namerava razširiti svoje aplikacije na podatkovno skladišče. Uporaba SAP kot prodajalca ima veliko prednosti in slabosti podatkovno skladišče. Prednost je, da je SAP že nameščen in večina svetovalcev že pozna SAP.
Slabosti, če imate SAP kot dobavitelja podatkovno skladišče jih je veliko: SAP nima izkušenj v svetu podatkovno skladišče Če je SAP dobavitelj podatkovno skladišče, je treba "vzeti" i Podatki od SAP do podatkovno skladišče. Datum SAP-jevo zgodovino zaprtega sistema, je malo verjetno, da bo vanj enostavno dobiti i od SAP (???). Obstaja veliko podedovanih okolij, ki poganjajo SAP, kot so IMS, VSAM, ADABAS, ORACLE, DB2 itd. SAP vztraja pri pristopu »not invented here«. SAP ne želi sodelovati z drugimi prodajalci pri uporabi ali ustvarjanju podatkovno skladišče. SAP vztraja pri ustvarjanju lastne programske opreme sam.

Čeprav je SAP veliko in močno podjetje, dejstvo, da poskušamo znova napisati tehnologijo ELT, OLAP, sistemsko administracijo in celo kodno osnovo dbms to je preprosto noro. Namesto da bi zavzeli odnos sodelovanja z dobavitelji podatkovno skladišče SAP že dolgo sledi pristopu, ki ga »najbolje pozna«. Ta odnos zavira uspeh, ki bi ga SAP lahko dosegel na področju podatkovno skladišče.
SAP-jeva zavrnitev, da bi zunanjim prodajalcem omogočila hiter in eleganten dostop do njihovih Podatki. Samo bistvo uporabe a podatkovno skladišče je enostaven dostop Podatki. Celotna zgodba SAP temelji na oteževanju dostopa Podatki.
Pomanjkanje izkušenj SAP-a pri obravnavanju velikih količin Podatki; na področju podatkovno skladišče obstajajo količine Podatki nikoli viden od SAP in za obvladovanje teh velikih količin Podatki imeti morate pravo tehnologijo. SAP se očitno ne zaveda te tehnološke ovire, ki obstaja za vstop na to področje podatkovno skladišče.
SAP-jeva korporativna kultura: SAP je podjetje zgradil v pridobivanju i Podatki iz sistema. Toda za to morate imeti drugačno mentaliteto. Tradicionalno podjetja, ki so bila programska oprema dobra pri pridobivanju podatkov v okolju, niso bila dobra pri pridobivanju podatkov v drugo smer. Če bo SAP-u uspelo narediti tovrstno zamenjavo, bo to prvo podjetje, ki mu bo to uspelo.

Skratka, vprašljivo je, ali naj podjetje izbere SAP za dobavitelja podatkovno skladišče. Na eni strani so zelo resna tveganja, na drugi pa zelo malo nagrad. Obstaja pa še en razlog, ki odvrača od izbire SAP za dobavitelja podatkovno skladišče. Kajti vsako podjetje bi moralo imeti enako podatkovno skladišče vseh drugih podjetij? The podatkovno skladišče je srce konkurenčne prednosti. Če bi vsako podjetje sprejelo enako podatkovno skladišče bi bilo težko, čeprav ne nemogoče, doseči konkurenčno prednost. Zdi se, da SAP meni, da a podatkovno skladišče je mogoče razumeti kot piškotek, kar je še en znak njihove miselnosti, da aplikacije »dobijo podatke«.

Noben drug ponudnik ERP ni tako prevladujoč kot SAP. Nedvomno bodo obstajala podjetja, ki se bodo odločila za SAP podatkovno skladišče ampak menda te podatkovno skladišče SAP-ji bodo veliki, dragi in dolgotrajni za izdelavo.

Ta okolja vključujejo dejavnosti, kot so obdelava bančnih blagajn, procesi letalskih rezervacij, postopki pritožb glede zavarovanja itd. Bolj kot je deloval transakcijski sistem, bolj očitna je bila potreba po ločitvi med operativnim procesom in DSS (Decision Support System). Vendar pa s kadrovskimi in kadrovskimi sistemi nikoli niste soočeni z velikimi količinami transakcij. In seveda, ko je oseba zaposlena ali zapusti podjetje, je to zapis transakcije. Toda v primerjavi z drugimi sistemi kadrovski in kadrovski sistemi preprosto nimajo veliko transakcij. Zato v kadrovskih in kadrovskih sistemih ni povsem očitno, da obstaja potreba po DataWarehouse. V mnogih pogledih so ti sistemi združitve sistemov DSS.

Obstaja pa še en dejavnik, ki ga je treba upoštevati pri obravnavi podatkovnega skladišča in PeopleSofta. V mnogih krogih, tj Podatki Kadrovski in osebni viri so drugotnega pomena glede na primarno dejavnost podjetja. Večina podjetij se ukvarja s proizvodnjo, prodajo, opravljanjem storitev ipd. Kadrovski in kadrovski sistemi so običajno sekundarni (ali podpirajo) glavno dejavnost podjetja. Zato je dvoumno in neprijetno a podatkovno skladišče ločeno za kadrovsko in osebno podporo.

PeopleSoft se v tem pogledu zelo razlikuje od SAP-ja. Pri SAP je obvezno, da obstaja podatkovno skladišče. Pri PeopleSoftu ni vse tako jasno. Podatkovno skladišče ni obvezno pri PeopleSoft.

Najboljša stvar, ki jo lahko rečem za Podatki PeopleSoft je to podatkovno skladišče se lahko uporablja za arhiviranje i Podatki povezanih s starimi človeškimi in osebnimi viri. Drugi razlog, zakaj bi podjetje želelo uporabiti a podatkovno skladišče a

slabost okolja PeopleSoft je, da omogoča dostop in prost dostop do orodij za analizo, ai Podatki avtor PeopleSoft. Toda poleg teh razlogov lahko obstajajo primeri, ko je zaželeno, da nimate podatkovnega skladišča Podatki PeopleSoft.

V povzetku

Obstaja veliko idej, ki se nanašajo na gradnjo a podatkovno skladišče znotraj programske opreme ERP.
Nekateri od teh so:

▪ Smiselno je imeti a podatkovno skladišče kdo izgleda kot kateri koli drug v industriji?
▪ Kako prilagodljiv je ERP podatkovno skladišče programsko opremo?
▪ ERP podatkovno skladišče programska oprema zmore količino Podatki ki se nahaja v apodatkovno skladišče arena"?
▪ Kakšno je sledenje beleženju, ki ga prodajalec ERP izvaja ob enostavnem in poceni, zamudnem, ai Podatki? (kakšni so prodajalci ERP pri dobavi poceni, pravočasnih in enostavno dostopnih podatkov?)
▪ Kako prodajalec ERP razume arhitekturo DSS in tovarno informacij podjetja?
▪ Prodajalci ERP vedo, kako priti Podatki v okolju, ampak tudi razumeti, kako jih izvoziti?
▪ Kako odprt je prodajalec ERP za orodja za shranjevanje podatkov?
Vse te premisleke je treba upoštevati pri določanju, kam postaviti podatkovno skladišče ki bo gostil i Podatki ERP in drugi Podatki. Na splošno je gradnja priporočljiva, razen če ni tehtnega razloga za drugače podatkovno skladišče zunaj okolja prodajalca ERP. POGLAVJE 1 Pregled organizacije BI Ključne točke:
Repozitoriji informacij delujejo v nasprotju z arhitekturo poslovne inteligence (BI):
Korporativna kultura in IT lahko omejujeta uspeh gradnje organizacij poslovne inteligence.

Tehnologija ni več omejevalni dejavnik za organizacije poslovne inteligence. Problem za arhitekte in načrtovalce projektov ni, ali tehnologija obstaja, ampak ali lahko učinkovito implementirajo razpoložljivo tehnologijo.

Za številna podjetja a podatkovno skladišče je malo več kot pasivni depozit, ki distribuira i Podatki uporabnikom, ki jo potrebujejo. THE Podatki so ekstrahirani iz izvornih sistemov in jih poselijo v ciljne strukture podatkovno skladišče. Podatki z malo sreče jih je mogoče tudi očistiti. Vendar pa ni dodana ali zbrana nobena dodatna vrednost Podatki med tem postopkom.

V bistvu pasivni dw v najboljšem primeru zagotavlja samo i Podatki čist in operativen za združenja uporabnikov. Kreiranje informacij in analitično razumevanje sta v celoti odvisna od uporabnikov. Če presodim, ali je DW (Skladišče podatkov) ali je uspeh subjektiven. Če ocenjujemo uspeh na podlagi sposobnosti učinkovitega zbiranja, povezovanja in čiščenja i Podatki podjetja na predvidljivi osnovi, potem ja, DW je uspešen. Po drugi strani pa, če pogledamo zbiranje, konsolidacijo in izkoriščanje informacij organizacije kot celote, potem je DW neuspeh. DW zagotavlja malo ali nič informacijske vrednosti. Posledično so uporabniki prisiljeni zadovoljiti, kar ustvarja informacijske silose. To poglavje predstavlja celovito vizijo za povzetek poslovne arhitekture podjetja (BI). Začnemo z opisom poslovne inteligence in nato preidemo na razpravo o oblikovanju in razvoju informacij, v nasprotju s preprostim zagotavljanjem Podatki uporabnikom. Razprave se nato osredotočijo na izračun vrednosti vaših prizadevanj za poslovno inteligenco. Zaključimo z opredelitvijo, kako IBM obravnava arhitekturne zahteve BI vaše organizacije.

Opis arhitekture organizacija BI

Zmogljivi informacijski sistemi, usmerjeni v transakcije, so zdaj na dnevnem redu v vsakem velikem podjetju in učinkovito izenačujejo konkurenčne pogoje za korporacije po vsem svetu.

Da bi ostali konkurenčni, pa so zdaj potrebni analitično usmerjeni sistemi, ki lahko revolucionirajo sposobnost podjetja, da ponovno odkrije in uporabi informacije, ki jih že imajo. Ti analitični sistemi izhajajo iz razumevanja bogastva Podatki na voljo. BI lahko izboljša učinkovitost vseh informacij v podjetju. Podjetja lahko izboljšajo odnose med strankami in dobavitelji, izboljšajo donosnost izdelkov in storitev, ustvarijo nove in boljše posle, nadzorujejo tveganje in med številnimi drugimi pridobitvami drastično zmanjšajo stroške. Z BI vaše podjetje končno začne uporabljati informacije o strankah kot konkurenčno sredstvo zahvaljujoč aplikacijam, ki imajo tržne cilje.

Imeti pravi način poslovanja pomeni imeti dokončne odgovore na ključna vprašanja, kot so:

▪ Kateri od naših stranke Ali zaradi njih zaslužimo več ali izgubljamo denar?
▪ Kjer živijo naši najboljši stranke v povezavi z trgovina/ skladišče pogosto?
▪ Katere naše izdelke in storitve je mogoče najbolj učinkovito prodati in komu?
▪ Katere izdelke je mogoče najbolj učinkovito prodati in komu?
▪ Katera prodajna akcija je uspešnejša in zakaj?
▪ Kateri prodajni kanali so najbolj učinkoviti za katere izdelke?
▪ Kako lahko izboljšamo odnose z najboljšimi stranke? Večina podjetij ima Podatki težko odgovoriti na ta vprašanja.
Operativni sistemi ustvarjajo velike količine izdelkov, kupcev in stroškov Podatki od prodajnih mest, rezervacij, storitev za stranke in sistemov tehnične podpore. Izziv je pridobiti in izkoristiti te informacije. Številna podjetja imajo dobiček le od svojih majhnih delčkov Podatki za strateške analize.
I Podatki preostali, pogosto združeni z i Podatki pridobivanje zunanjih virov, kot so vladna poročila in druge kupljene informacije, so zlati rudnik, ki samo čaka na raziskovanje, in Podatki treba jih je samo izboljšati v informacijskem kontekstu vaše organizacije.

To znanje je mogoče uporabiti na več načinov, od oblikovanja celotne korporativne strategije do osebne komunikacije z dobavitelji, prek klicnih centrov, fakturiranja, Internet in druge točke. Današnje poslovno okolje narekuje, da se DW in sorodne rešitve BI razvijejo onkraj vodenja tradicionalnih poslovnih struktur. Podatki kar i Podatki normalizirana na atomski ravni in »farme zvezd/kock«.

Kar je potrebno za ohranitev konkurenčnosti, je zlitje tradicionalnih in naprednih tehnologij v prizadevanju za podporo širokega analitičnega okolja.
Nenazadnje mora splošno okolje izboljšati poznavanje podjetja kot celote in zagotoviti, da so ukrepi, sprejeti kot rezultat opravljenih analiz, koristni, tako da imajo vsi koristi.

Recimo, na primer, da uvrstite svojega stranke v kategorijah z visokim ali nizkim tveganjem.
Ne glede na to, ali so te informacije ustvarjene z modelom rudarjenja ali drugimi sredstvi, jih je treba vnesti v DW in omogočiti dostop vsakomur prek katerega koli orodja za dostop, kot so statična poročila, preglednice, tabele ali spletna analitična obdelava (OLAP).

Vendar trenutno veliko tovrstnih informacij ostaja v silosih Podatki posameznikov ali oddelkov, ki ustvarjajo analizo. Organizacija kot celota ima malo ali nič vidnosti za razumevanje. Samo z mešanjem te vrste informacijske vsebine v vaš DW podjetja lahko odpravite informacijske silose in dvignete svoje okolje DW.
Obstajata dve veliki oviri pri razvoju organizacije poslovne inteligence.
Najprej imamo problem same organizacije in njene discipline.
Čeprav ne moremo pomagati pri spremembah organizacijske politike, lahko pomagamo razumeti komponente BI organizacije, njeno arhitekturo in kako IBM-ova tehnologija omogoča njen razvoj.
Druga ovira, ki jo je treba premagati, je pomanjkanje integrirane tehnologije in znanja o metodi, ki prikliče celoten prostor BI namesto le majhne komponente.

IBM se odziva na spremembe v integracijski tehnologiji. Vaša odgovornost je zagotoviti zavestno oblikovanje. To arhitekturo je treba razviti s tehnologijo, izbrano za neomejeno integracijo, ali vsaj s tehnologijo, ki se drži odprtih standardov. Poleg tega mora vodstvo vašega podjetja zagotoviti, da se podjetje Bi izvaja po urniku in ne dovoljuje razvoja informacijskih silosov, ki izhajajo iz sebičnih načrtov ali ciljev.
To ne pomeni, da BI okolje ni občutljivo za odziv na različne potrebe in zahteve različnih uporabnikov; namesto tega pomeni, da se izvajanje teh individualnih potreb in zahtev izvaja v korist celotne organizacije poslovnega obveščanja.
Opis arhitekture organizacije BI je na sliki 9 na strani 1.1. Arhitektura prikazuje bogato mešanico tehnologij in tehnik.
S tradicionalnega pogleda arhitektura vključuje naslednje komponente skladišča

Atomska plast.

To je temelj, srce celotnega DW in s tem strateškega poročanja.
I Podatki shranjeni tukaj bodo ohranili zgodovinsko celovitost, poročajo o Podatki in vključujejo izpeljane metrike ter so očiščene, integrirane in shranjene z uporabo rudarskih modelov.
Vsa nadaljnja uporaba le-teh Podatki in povezane informacije izhajajo iz te strukture. To je odličen vir za rudarjenje Podatki in za poročila s strukturiranimi poizvedbami SQL

Operativni depozit v višini Podatki ali poročilo o Podatki(Operativno shranjevanje podatkov (ODS) ali poročanje Baza podatkov.)

To je struktura Podatki posebej zasnovan za tehnično poročanje.

I Podatki shranjeni in sporočeni nad temi strukturami se lahko sčasoma razširijo v skladišče preko odlagališča, kjer se lahko uporabijo za strateško signalizacijo.

Uprizoritveno območje.

Prva postaja za večino Podatki namenjeno skladiščnemu okolju je organizacijska cona.
Tukaj i Podatki so integrirani, očiščeni in preoblikovani v Podatki dobička, ki bo napolnil strukturo skladišča

Datumski marki.

Ta del arhitekture predstavlja strukturo Podatki uporablja se posebej za OLAP. Prisotnost stojnic podatkov, če i Podatki shranjeni so v zvezdnih shemah, ki jih prekrivajo Podatki večdimenzionalni v relacijskem okolju ali v datotekah Podatki lastništvo, ki ga uporablja določena tehnologija OLAP, kot je strežnik OLAP DB2, ni relevantno.

Edina omejitev je, da arhitektura olajša uporabo Podatki večdimenzionalni.
Arhitektura vključuje tudi kritične Bi tehnologije in tehnike, ki se razlikujejo kot:

Prostorska analiza

Vesolje je za analitika nepričakovana informacija in je ključnega pomena za popolno rešitev. Prostor lahko predstavlja informacije o ljudeh, ki živijo na določeni lokaciji, pa tudi informacije o tem, kje je ta lokacija fizično glede na preostali svet.

Za izvedbo te analize morate začeti s povezovanjem svojih informacij s koordinatami zemljepisne širine in dolžine. To se imenuje "geokodiranje" in mora biti del procesa ekstrahiranja, preoblikovanja in nalaganja (ETL) na atomski ravni vašega skladišča.

Podatkovno rudarjenje.

Pridobivanje Podatki našim podjetjem omogoča povečanje števila stranke, predvideti prodajne trende in omogočiti upravljanje odnosov z i stranke (CRM), med drugimi BI pobudami.

Pridobivanje Podatki zato ga je treba integrirati s strukturami EU Podatki skladišče in podprto s skladiščnimi procesi za ugotavljanje učinkovite in uspešne uporabe tehnologije in povezanih tehnik.

Kot je navedeno v arhitekturi BI, sta Dwhouse na atomski ravni in podatkovni trgi odličen vir Podatki za ekstrakcijo. Te iste lastnosti morajo biti tudi prejemniki rezultatov pridobivanja, da se zagotovi dostopnost najširšemu občinstvu.

Agenti.

Obstajajo različni "agenti", ki pregledajo stranko za katero koli točko, kot so operacijski sistemi podjetja in sam dw. Ti agenti so lahko napredne nevronske mreže, usposobljene za učenje o trendih na vsaki točki, kot je prihodnje povpraševanje po izdelkih, ki temelji na pospeševanju prodaje, motorji, ki temeljijo na pravilih, za odzivanje na datotek niz okoliščin ali celo preprosti agenti, ki poročajo o izjemah najvišjim vodstvom. Ti procesi se običajno odvijajo v realnem času in morajo biti zato tesno povezani z gibanjem procesov Podatki. Vse te strukture Podatki, tehnologije in tehnike zagotavljajo, da ne boste preživeli noči pri ustvarjanju organizacije vašega BI.

Ta dejavnost se bo razvijala postopoma za majhne točke.
Vsak korak je neodvisen projektni napor in se imenuje ponovitev v vašem BI dw ali pobudi. Ponovitve lahko vključujejo implementacijo novih tehnologij, začenši z novimi tehnikami, dodajanje novih okvirov Podatki , nalaganje i Podatki dodatno ali z analizo razširitve vašega okolja. Ta odstavek je podrobneje obravnavan v 3. poglavju.

Poleg tradicionalnih ogrodij DW in orodij BI morate oblikovati še druge vidike vaše organizacije BI, kot so:

Dotične točke kupca (Dotik kupca točke).

Kot pri vsaki sodobni organizaciji obstajajo številne stične točke strank, ki kažejo, kako pridobiti pozitivno izkušnjo za svojo stranke. Obstajajo tradicionalni kanali, kot so trgovci, centralni operaterji, direktna pošta, večpredstavnost in tiskano oglaševanje, pa tudi sodobnejši kanali, kot sta e-pošta in splet, Podatki izdelke z neko kontaktno točko je treba pridobiti, prepeljati, očistiti, predelati in nato naseliti v obratih Podatki BI.

Osnove Podatki operativna in uporabniška združenja (

zbirke podatkov in uporabniške skupnosti).
Na koncu kontaktnih točk stranke našli boste osnove Podatki uporaba družbenih in uporabniških skupnosti. THE Podatki obstoječi so Podatki tradicionalno, ki jo je treba združiti in združiti z Podatki ki teče od stičnih točk, da bi dosegli potrebne informacije.

Analitiki. (Analitiki)

Glavni uporabnik okolja BI je analitik. On je tisti, ki ima koristi od trenutnega pridobivanja Podatki operativni , integriran z različnimi viri Podatki , dopolnjen s funkcijami, kot je geografska analiza (geokodiranje) in predstavljen v tehnologijah BI, ki omogočajo rudarjenje, OLAP, napredno poročanje SQL in geografsko analizo. Primarni vmesnik analitika do poročevalskega okolja je portal BI.

Vendar pa analitik ni edini, ki ima koristi od arhitekture BI.
Vodstvo, velika združenja uporabnikov in celo partnerji, dobavitelji in i stranke koristi bi morali najti v poslovnem BI.

Povratna povratna zanka.

BI arhitektura je učno okolje. Značilno načelo razvoja je dopuščanje obstojnih struktur Podatki posodabljati glede na uporabljeno BI tehnologijo in dejanja uporabnika. Primer je točkovanje strank.

Če prodajni oddelek izvaja rudarski model rezultatov strank, kot je uporaba nove storitve, potem prodajni oddelek ne bi smel biti edina skupina, ki ima koristi od storitve.

Namesto tega bi moralo rudarjenje po modelu potekati kot naravni del pretoka podatkov v podjetju, rezultati strank pa bi morali postati integrirani del informacijskega konteksta skladišča, viden vsem uporabnikom. Bi-bI-centric IBM Suite vključno z DB2 UDB, DB2 OLAP Server vključuje najpomembnejše tehnološke komponente, opredeljene na sliki 1.1.

Uporabljamo arhitekturo, kot je prikazana na tej sliki iz knjige, da nam zagotovi določeno raven kontinuitete in pokaže, kako se vsak IBM-ov izdelek ujema s celotno shemo BI.

Zagotavljanje informacijske vsebine (zagotavljanje Vsebina informacij)

Oblikovanje, razvoj in implementacija vašega BI okolja je zastrašujoča naloga. Zasnova mora zajemati sedanje in prihodnje poslovne zahteve. Arhitekturna risba mora biti celovita, da vključuje vse zaključke, ugotovljene v fazi načrtovanja. Izvajanje mora ostati zavezano enemu samemu namenu: razviti arhitekturo poslovnega obveščanja, kot je formalno predstavljena v načrtu in temelji na poslovnih zahtevah.

Še posebej težko je trditi, da bo disciplina zagotovila relativni uspeh.
To je preprosto, ker BI okolja ne razvijate naenkrat, ampak v majhnih korakih skozi čas.

Vendar pa je prepoznavanje komponent poslovne inteligence vaše arhitekture pomembno iz dveh razlogov: vi boste vodili vse nadaljnje tehnične odločitve o arhitekturi.
Zavestno boste lahko načrtovali določeno uporabo tehnologije, čeprav morda ne boste več mesecev potrebovali tehnologije.

Zadostno razumevanje vaših poslovnih zahtev bo vplivalo na vrsto izdelkov, ki jih pridobite za svojo arhitekturo.
Zasnova in razvoj vaše arhitekture zagotavljata, da je vaše skladišče

ni naključen dogodek, temveč dobro premišljen, skrbno sestavljen oglas deluje umetnosti kot mozaika mešane tehnologije.

Oblikujte informacijsko vsebino

Vsa začetna zasnova se mora osredotočiti in identificirati glavne komponente BI, ki jih bo celotno okolje potrebovalo zdaj in v prihodnosti.
Poznavanje poslovnih zahtev je pomembno.

Še preden se začne uradno načrtovanje, lahko načrtovalec projekta pogosto takoj identificira eno ali dve komponenti.
Ravnovesja komponent, ki so morda potrebne za vašo arhitekturo, pa ni mogoče enostavno najti. Med fazo načrtovanja glavni del arhitekture veže sejo za razvoj aplikacij (JAD) na raziskavo za prepoznavanje poslovnih zahtev.

Včasih je te zahteve mogoče zaupati orodjem za poizvedovanje in poročanje.
Uporabniki na primer navajajo, da morajo, če želijo avtomatizirati trenutno poročilo, ustvariti ročno z integracijo dveh trenutnih poročil in dodajanjem izračunov, izpeljanih iz kombinacije Podatki.
Čeprav je ta zahteva preprosta, opredeljuje določeno funkcionalnost funkcije, ki jo morate vključiti, ko kupujete orodja za poročanje za svojo organizacijo.

Oblikovalec mora upoštevati tudi dodatne zahteve, da dobi popolno sliko. Ali se uporabniki želijo naročiti na to poročilo?
Ali so podnabori poročil ustvarjeni in poslani po e-pošti različnim uporabnikom? Želite videti to poročilo na portalu podjetja? Vse te zahteve so del preproste potrebe po zamenjavi ročnega poročila, kot ga zahtevajo uporabniki. Prednost tovrstnih zahtev je, da so vsi, uporabniki in oblikovalci, seznanjeni s konceptom poročil.

Obstajajo pa tudi druge vrste podjetij, ki jih moramo načrtovati. Ko so poslovne zahteve navedene v obliki strateških poslovnih vprašanj, je za izkušenega načrtovalca enostavno razbrati dimenzije in zahteve glede dejstev.

Če uporabniki JAD ne znajo navesti svojih zahtev v obliki poslovnega problema, bo načrtovalec pogosto ponudil primere, da preskoči sejo zbiranja zahtev.
Strokovni načrtovalec lahko uporabnikom pomaga razumeti ne le strateško poslovanje, temveč tudi, kako ga oblikovati.
Pristop zbiranja zahtev je obravnavan v 3. poglavju; zaenkrat želimo samo poudariti potrebo po oblikovanju za vse vrste zahtev BI.

Strateški poslovni problem ni samo poslovna zahteva, ampak tudi oblikovalski iztočnica. Če morate odgovoriti na večdimenzionalno vprašanje, potem si ga morate zapomniti, predstaviti Podatki dimenzije in če si morate zapomniti Podatki večdimenzionalni, se morate odločiti, katero vrsto tehnologije ali tehnike boste uporabili.

Ali implementirate rezervirano zvezdno shemo kocke ali oboje? Kot lahko vidite, lahko celo preprosto poslovno vprašanje močno vpliva na oblikovanje. Toda te vrste poslovnih zahtev so običajne in seveda vsaj za izkušene načrtovalce projektov in oblikovalce.

O tehnologijah in podpori OLAP je bilo dovolj razprav, na voljo pa je veliko različnih rešitev. Doslej smo se dotaknili potrebe po združitvi enostavnega poročanja z dimenzionalnimi poslovnimi zahtevami in kako te zahteve vplivajo na odločitve o tehnični arhitekturi.

Katere pa so zahteve, ki jih uporabniki ali ekipa Dw ne razumejo zlahka? Ali boste kdaj potrebovali prostorsko analizo (analysisi spatial)?
Rudarski modeli Podatki Ali bodo nujni del vaše prihodnosti? Kdo ve?

Pomembno je omeniti, da skupnosti splošnih uporabnikov in člani ekipe DW te vrste tehnologij ne poznajo dobro, deloma je to lahko zato, ker jih običajno obravnavajo nekateri notranji ali tretji tehnični strokovnjaki. To je robni primer težav, ki jih povzročajo tovrstne tehnologije. Če uporabniki ne morejo opisati poslovnih zahtev ali jih oblikovati tako, da bi oblikovalcem zagotovili smernice, lahko ostanejo neopažene ali, še huje, preprosto prezrte.

Bolj problematično postane, ko oblikovalec in razvijalec ne moreta prepoznati uporabe ene od teh naprednih, a kritičnih tehnologij.
Kot smo pogosto slišali oblikovalce reči: »No, zakaj tega ne pospravimo, dokler ne dobimo te druge stvari? »Ali jih res zanimajo prioritete ali se preprosto izogibajo zahtevam, ki jih ne razumejo? Najverjetneje gre za zadnjo predpostavko. Recimo, da je vaša prodajna ekipa sporočila poslovno zahtevo, kot je prikazano na sliki 1.3, kot lahko vidite, je zahteva oblikovana v obliki poslovnega problema. Razlika med tem problemom in tipičnim dimenzijskim problemom je razdalja. V tem primeru želi prodajna ekipa na mesečni ravni izvedeti skupno prodajo izdelkov, skladišč in stranke ki živijo v krogu 5 milj od skladišča, kjer nakupujejo.

Na žalost lahko oblikovalci ali arhitekti preprosto zanemarijo prostorsko komponento z besedami: "Imamo stranko, izdelek in Podatki depozita. Zadržimo razdaljo do druge ponovitve.

"Napačen odgovor. Ta vrsta poslovnih težav je povezana z BI. Predstavlja globlje razumevanje našega poslovanja in robusten analitični prostor za naše analitike. BI presega preprosto poizvedovanje ali standardno poročanje ali celo OLAP. To ne pomeni, da te tehnologije niso pomembne za vaš BI, vendar same po sebi ne predstavljajo okolja BI.

Zasnova za informacijski kontekst (Oblikovanje za informacijsko vsebino)

Zdaj, ko smo identificirali poslovne zahteve, ki razlikujejo različne ključne komponente, jih je treba vključiti v celotno arhitekturno risbo. Nekatere komponente BI so del naših začetnih prizadevanj, medtem ko nekatere ne bomo uvedli še nekaj mesecev.

Vse znane zahteve pa se odražajo v zasnovi, tako da smo, ko moramo implementirati določeno tehnologijo, na to pripravljeni. Nekaj o projektu bo odražalo tradicionalno razmišljanje.

Ta sklop Podatki se uporablja za podporo poznejši uporabi Podatki razsežnosti, ki jih poganjajo poslovna vprašanja, ki smo jih identificirali. Ko se ustvarijo dodatni dokumenti, kot je razvoj projekta Podatki, bomo začeli s formalizacijo kot i Podatki se širijo v okolju. Ugotovili smo potrebo po zastopanju i Podatki na dimenzionalni način in jih razdeli (glede na posebne specifične potrebe) v podatkovne borze.

Naslednje vprašanje, na katerega je treba odgovoriti, je: Kako bodo zgrajeni ti podatkovni borzi?
Ali sestavljate zvezde, ki podpirajo kocke, ali samo kocke, ali samo zvezde? (ali desne kocke, ali desne zvezdice). Ustvarite arhitekturo za odvisne podatkovne borze, ki zahtevajo atomsko plast za vse Podatki pridobiti? Omogoči pridobivanje neodvisnih podatkovnih kart Podatki neposredno iz operacijskih sistemov?

Katero tehnologijo kock boste poskušali standardizirati?

Imate ogromne količine bogov Podatki potrebna za dimenzijsko analizo ali potrebujete kocke vaše nacionalne prodajne sile na tedenski osnovi ali oboje? Ali gradite zmogljiv objekt, kot je strežnik DB2 OLAP za finance ali kocke Cognos PowerPlay za vašo prodajno organizacijo ali oboje? To so velike arhitekturne načrtovalske odločitve, ki bodo vplivale na vaše okolje poslovne inteligence. Da, prepoznali ste potrebo po OLAP. Kako boš zdaj izpeljal takšno tehniko in tehnologijo?

Kako nekatere naprednejše tehnologije vplivajo na vaš dizajn? Recimo, da ste prepoznali prostorsko potrebo v vaši organizaciji. Zdaj se morate spomniti na izdaje arhitekturnih risb, tudi če prostorskih komponent ne nameravate izdelati več mesecev. Arhitekt mora danes projektirati glede na to, kar je potrebno. Predvidite potrebo po prostorski analizi, ki ustvarja, shranjuje, vzdržuje in omogoča dostop Podatki prostorski. To bi moralo služiti kot omejitev glede vrste tehnologije programske opreme in specifikacij platforme, ki jih trenutno lahko upoštevate. Na primer, upravni sistem baza podatkov relacijski (RDBMS), ki ga vzdržujete za svojo atomsko plast, mora imeti na voljo robusten prostorski obseg. To bi zagotovilo največjo zmogljivost pri uporabi geometrije in prostorskih objektov v vaših analitičnih aplikacijah. Če vaš RDBMS ne prenese Podatki (prostorsko osredotočen) interno, zato boste morali vzpostaviti a baza podatkov (prostorsko-centrični) zunanji. To oteži obvladovanje težav in ogrozi vašo splošno učinkovitost, da ne omenjamo dodatnih težav, ki jih povzroča vašim upraviteljem baze podatkov, saj imajo verjetno minimalno razumevanje osnov Podatki tudi prostorsko. Po drugi strani pa, če vaš mehanizem RDMBS obravnava vse prostorske komponente in se njegov optimizator zaveda posebnih potreb (na primer indeksiranja) prostorskih objektov, lahko vaši upravitelji baze podatkov zlahka obravnavajo težave pri upravljanju in lahko povečate zmogljivost.

Prav tako morate prilagoditi uprizoritveno območje in plast atomskega okolja, da vključite čiščenje naslova (a

ključni element prostorske analize), kot tudi kasnejše shranjevanje prostorskih objektov. Nasledstvo oblikovalskih edicij se nadaljuje zdaj, ko smo uvedli pojem čistoče naslovov. Prvič, ta aplikacija bo narekovala vrsto programske opreme, ki jo potrebujete za vaš ETL trud.

Ali potrebujete izdelke, kot je Trillium, da vam zagotovijo čist naslov, ali prodajalca ETL po vaši izbiri, da vam zagotovi to funkcionalnost?
Za zdaj je pomembno, da cenite raven oblikovanja, ki mora biti dokončana, preden začnete vzdrževati svoje skladišče. Zgornji primeri bi morali prikazati množico oblikovalskih odločitev, ki morajo slediti identifikaciji katere koli posebne poslovne zahteve. Ko so pravilno sprejete, te oblikovalske odločitve spodbujajo soodvisnost med fizičnimi strukturami vašega okolja, izbiro uporabljene tehnologije in pretokom širjenja informacijske vsebine. Brez te običajne arhitekture BI bo vaša organizacija podvržena kaotični mešanici obstoječih tehnologij, v najboljšem primeru ohlapno povezanih, da bi zagotovile navidezno stabilnost.

Vzdrževanje informacijske vsebine

Prinašanje vrednosti informacij v vašo organizacijo je zelo težka naloga. Brez zadostnega razumevanja in izkušenj ali ustreznega inženiringa in oblikovanja bi tudi najboljše ekipe propadle. Po drugi strani pa, če imate odlično intuicijo in natančen načrt, vendar nimate discipline za izvedbo, ste samo zapravili denar in čas, ker je vaš trud obsojen na neuspeh. Sporočilo mora biti jasno: Če vam manjka ena ali več od teh spretnosti, razumevanja/izkušenj ali discipline načrtovanja/oblikovanja ali izvajanja, bo to povzročilo ohromljenje ali uničenje zgradbe organizacije poslovne inteligence.

Je vaša ekipa dovolj pripravljena? Ali kdo v vaši skupini za poslovno inteligenco razume obsežno analitično pokrajino, ki je na voljo v okoljih poslovne inteligence, ter tehnike in tehnologije, potrebne za vzdrževanje te krajine? Ali je v vaši ekipi kdo, ki bi lahko opazil razliko pri napredni uporabi

statično poročanje in OLAP ali razlike med ROLAP in OLAP? Ali eden od članov vaše ekipe jasno prepozna način rudarjenja in kako lahko vpliva na skladišče ali kako lahko skladišče podpira zmogljivost rudarjenja? Član ekipe razume vrednost Podatki vesoljska ali agentska tehnologija? Ali imate koga, ki ceni edinstveno uporabo orodij ETL proti tehnologiji Message Broker? Če ga nimate, si ga nabavite. BI je veliko večji od normalizirane atomske plasti, OLAP, zvezdnih shem in ODS.

Razumevanje in izkušnje za prepoznavanje zahtev poslovne inteligence in njihovih rešitev so bistvenega pomena za vašo sposobnost pravilne formalizacije potreb uporabnikov ter načrtovanja in implementacije njihovih rešitev. Če ima vaša uporabniška skupnost težave pri opisovanju zahtev, mora ekipa skladišča zagotoviti to razumevanje. Če pa ekipa skladišča

ne prepozna posebne uporabe BI – na primer podatkovnega rudarjenja –, potem ni najbolje, da so okolja BI pogosto omejena na pasivna skladišča. Vendar ignoriranje teh tehnologij ne zmanjša njihovega pomena in učinka, ki ga imajo na nastanek zmogljivosti poslovne inteligence v vaši organizaciji, kot tudi na informacijsko sredstvo, ki ga nameravate promovirati.

Oblikovanje mora vključevati pojem risanja, oboje pa zahteva kompetentnega posameznika. Poleg tega načrtovanje zahteva skupinsko filozofijo in skladnost s standardi. Na primer, če je vaše podjetje vzpostavilo standard platforme ali je identificiralo določen RDBMS, ki ga želi standardizirati na celotni platformi, morajo vsi v ekipi upoštevati te standarde. Na splošno ekipa izraža potrebo po standardizaciji (uporabniškim skupnostim), sama ekipa pa se ne želi držati standardov, ki so vzpostavljeni na drugih področjih podjetja ali morda celo v podobnih podjetjih. Ne samo, da je to hinavsko, ampak tudi dokazuje, da podjetje ni sposobno izkoristiti obstoječih virov in naložb. To ne pomeni, da ni situacij, ki upravičujejo nestandardizirano platformo ali tehnologijo; vendar prizadevanja skladišča

ljubosumno morajo varovati standarde podjetja, dokler poslovne zahteve ne narekujejo drugače.

Tretja ključna komponenta, ki je potrebna za izgradnjo BI organizacije, je disciplina.
Odvisno je v celoti, enako od posameznikov kot od okolja. Načrtovalci projektov, sponzorji, arhitekti in uporabniki morajo ceniti disciplino, ki je potrebna za izgradnjo informacijskih sredstev podjetja. Oblikovalci morajo usmeriti svoja oblikovalska prizadevanja tako, da dopolnjujejo druga prizadevanja, potrebna v družbi.

Na primer, recimo, da vaše podjetje zgradi aplikacijo ERP, ki ima komponento skladišča.
Zato je odgovornost načrtovalcev ERP, da sodelujejo z ekipo za skladiščno okolje, da ne konkurirajo ali podvajajo že začetega dela.

Disciplina je tudi tema, ki jo mora obravnavati celotna organizacija in je običajno vzpostavljena in pooblaščena na izvršni ravni.
Ali so se vodstveni delavci pripravljeni držati oblikovanega pristopa? Pristop, ki obljublja ustvarjanje informacijske vsebine, ki bo na koncu prinesla vrednost vsem področjem podjetja, vendar bo morda ogrozila dnevne rede posameznikov ali oddelkov? Ne pozabite na pregovor: »Razmišljati o vsem je pomembneje kot razmišljati o eni stvari«. Ta rek velja za organizacije poslovne inteligence.

Na žalost se številna skladišča osredotočajo na ciljanje in zagotavljanje vrednosti določenemu oddelku ali določenim uporabnikom, pri čemer se malo ozirajo na organizacijo na splošno. Recimo, da upravnik zaprosi za pomoč ekipo skladišča. Ekipa se odzove z 90-dnevnim prizadevanjem, ki vključuje ne le zagotavljanje zahtev glede obveščanja, ki jih je določil izvršni direktor, ampak zagotavljanje, da vsi Podatki baze se pomešajo v atomsko raven, preden se uvedejo v predlagano tehnologijo kocke.
Ta inženirski dodatek zagotavlja, da bo podjetje v skladišču imelo koristi od Podatki potrebno za upravitelja.
Vendar pa je izvršni direktor govoril z zunanjimi svetovalnimi podjetji, ki so predlagala podobno aplikacijo z dostavo v manj kot 4 tednih.

Ob predpostavki, da je notranja ekipa skladišča kompetentna, ima izvršni direktor izbiro. Kdo lahko podpira dodatno inženirsko disciplino, potrebno za rast informacijskega sredstva podjetja, ali se lahko odloči za hitro izdelavo lastne rešitve. Zdi se, da je slednje izbrano prepogosto in služi le za ustvarjanje vsebnikov informacij, ki koristijo nekaterim ali posameznikom.

Kratkoročni in dolgoročni cilji

Arhitekti in načrtovalci projektov morajo formalizirati dolgoročno vizijo celotne arhitekture in načrtov za rast organizacije poslovne inteligence. Ta kombinacija kratkoročnega dobička in dolgoročnega načrtovanja sta dve plati prizadevanj poslovne inteligence. Kratkoročni prihodki so vidik BI, ki je povezan z iteracijami vašega skladišča.

Tu se načrtovalci, arhitekti in sponzorji osredotočajo na izpolnjevanje posebnih poslovnih zahtev. Na tej ravni se gradijo fizične strukture, kupuje tehnologija in izvajajo tehnike. Nikakor niso narejeni za izpolnjevanje posebnih zahtev, kot jih definirajo posamezne skupnosti uporabnikov. Vse je narejeno z namenom naslavljanja specifičnih zahtev določene skupnosti.
Dolgoročno načrtovanje pa je drugi vidik BI. Tukaj so načrti in zasnove zagotovili, da je bila zgrajena kakršna koli fizična struktura, izbrane tehnologije in izvedene tehnike so bile narejene s pogledom na podjetje. Dolgoročno načrtovanje zagotavlja kohezijo, ki je potrebna za zagotovitev, da dobiček podjetja izhaja iz morebitnih ugotovljenih kratkoročnih dobičkov.

Upravičite svoj BI trud

Un podatkovno skladišče samo po sebi nima inherentne vrednosti. Z drugimi besedami, med skladiščnimi tehnologijami in tehnikami izvajanja ni inherentne vrednosti.

Vrednost katerega koli prizadevanja za skladiščenje je v dejanjih, izvedenih kot rezultat skladiščnega okolja in informacijske vsebine, ki se gojijo skozi čas. To je kritična točka, ki jo morate razumeti, preden poskusite oceniti vrednost katere koli pobude wherehouse.

Arhitekti in načrtovalci prepogosto poskušajo uporabiti vrednost za fizične in tehnične komponente skladišča, čeprav vrednost dejansko temelji na poslovnih procesih, na katere skladišče in dobro zajeti podatki pozitivno vplivajo.

Tukaj je izziv za ustanovitev BI: Kako upravičite naložbo? Če samo skladišče nima nobene intrinzične vrednosti, morajo načrtovalci projekta raziskati, definirati in formalizirati koristi za tiste posameznike, ki bodo uporabljali skladišče za izboljšanje specifičnih poslovnih procesov ali vrednosti zaščitenih informacij ali obojega.

Da bi zadeve zapletli, bi lahko vsak poslovni proces, na katerega vplivajo skladiščna prizadevanja, zagotovil "znatne" ali "blage" koristi. Pomembne ugodnosti zagotavljajo oprijemljivo metriko za merjenje donosnosti naložbe (ROI) – na primer obrnite zalogo še enkrat v določenem obdobju ali za nižje stroške prevoza na pošiljko. Težje je opredeliti subtilne koristi, kot je izboljšan dostop do informacij, v smislu oprijemljive vrednosti.

Povežite svoj projekt, če želite izvedeti poslovne zahteve

Načrtovalci projektov prepogosto poskušajo povezati vrednost skladišča z amorfnimi cilji podjetja. Z izjavo, da »vrednost skladišča temelji na naši sposobnosti zadovoljevanja strateških zahtev«, na prijeten način odpiramo razpravo. A samo to ni dovolj, da bi ugotovili, ali je naložba v skladišče smiselna. Najbolje je, da predstavnike skladišč povežete s specifičnimi poslovnimi poizvedbami in opombami.

Izmerite ROI

Izračun ROI v okolju skladišča je lahko še posebej težaven. Še posebej težko je, če vodi

določenega ponavljanja je nekaj neotipljivega ali enostavno merljivega. Ena študija je pokazala, da uporabniki zaznavajo dve glavni prednosti pobud BI:

▪ Ustvarite sposobnost odločanja
▪ Ustvarite dostop do informacij
Te koristi so mehke (ali blage). Preprosto je razumeti, kako lahko izračunamo donosnost naložbe na podlagi trdih (ali večjih) koristi, kot so znižani stroški prevoza, toda kako izmerimo sposobnost sprejemanja boljših odločitev?
To je vsekakor izziv za načrtovalce projektov, ko poskušajo prepričati podjetje, da investira v določeno skladiščno dejavnost. Povečevanje prodaje ali zmanjševanje stroškov nista več osrednji temi, ki poganjata okolje poslovnega obveščanja.
Namesto tega iščete poslovne zahteve za boljši dostop do informacij, tako da lahko določen oddelek hitreje sprejema odločitve. To so strateška gonila, ki so enako pomembna za podjetje, vendar so bolj dvoumna in jih je težje opredeliti v oprijemljivi meritvi. V tem primeru je izračun ROI lahko zavajajoč, če ne celo nepomemben.
Oblikovalci projektov morajo biti sposobni dokazati oprijemljivo vrednost za vodilne, da se lahko odločijo, ali je naložba v določeno ponovitev vredna. Vendar ne bomo predlagali nove metode za izračun donosnosti naložbe, niti ne bomo navajali nobenih argumentov za ali proti njej.
Na voljo je veliko člankov in knjig, ki razpravljajo o osnovah izračuna donosnosti naložbe. Obstajajo posebne ponudbe vrednosti, kot je vrednost naložbe (VOI), ki jih ponujajo skupine, kot je Gartner, ki jih lahko raziščete. Namesto tega se bomo osredotočili na ključne vidike morebitne donosnosti naložbe ali drugih vrednostnih predlogov, ki jih morate upoštevati. Uporaba ROI Poleg argumenta o "trdih" proti "mehkim" koristim, povezanim s prizadevanji za poslovno inteligenco, obstajajo še druga vprašanja, ki jih je treba upoštevati pri uporabi ROI. Na primer:

Pripisovanje preveč prihrankov prizadevanjem za DW, ki bi vseeno prišli
Recimo, da se je vaše podjetje preselilo iz arhitekture glavnega računalnika v porazdeljeno okolje UNIX. Torej kakršnih koli prihrankov, ki bi lahko (ali ne) bili realizirani s tem trudom, ne bi smeli pripisati izključno, če sploh (?), skladišču.

Če ne upoštevate vsega, je drago. In upoštevati je treba marsikaj. Razmislite o naslednjem seznamu:

▪ Stroški zagona, vključno z izvedljivostjo.
▪ Stroški namenske strojne opreme s pripadajočim pomnilnikom in komunikacijami
▪ Stroški programske opreme, vključno z upravljanjem Podatki in razširitve odjemalec/strežnik, programska oprema ETL, tehnologije DSS, orodja za vizualizacijo, aplikacije za razporejanje in potek dela ter programska oprema za spremljanje, .
▪ Stroški načrtovanja konstrukcije Podatki, z ustvarjanjem in optimizacijo
▪ Stroški razvoja programske opreme, neposredno povezani s prizadevanji za poslovno inteligenco
▪ Stroški domače podpore, vključno z optimizacijo delovanja, vključno z nadzorom različic programske opreme in operacijami pomoči Uporabite "Big-Bang" ROI. Gradnja skladišča kot en sam velikanski napor je obsojena na neuspeh, zato tudi izračunajte donosnost naložbe za pobudo velikega podjetja. Ponudba je presenetljiva in da načrtovalci še naprej slabo poskušajo oceniti vrednost celotnega truda. Zakaj načrtovalci poskušajo dati denarno vrednost poslovni pobudi, če je splošno znano in sprejeto, da je ocenjevanje specifičnih ponovitev težko? kako je možno Razen redkih izjem to ni mogoče. Ne počni tega. Zdaj, ko smo ugotovili, česa ne smete storiti pri izračunu ROI, je tukaj nekaj točk, ki vam bodo pomagale vzpostaviti zanesljiv postopek za ocenjevanje vrednosti vaših prizadevanj BI.

Pridobitev soglasja ROI. Ne glede na vašo izbiro tehnike za ocenjevanje vrednosti vaših prizadevanj za poslovno inteligenco, se morajo z njo strinjati vse strani, vključno z načrtovalci projektov, sponzorji in direktorji podjetij.

Razdelite ROI na prepoznavne dele. Nujen korak k razumnemu izračunu ROI je osredotočanje tega izračuna na določen projekt. To vam nato omogoči oceno vrednosti na podlagi posebnih poslovnih zahtev, ki so izpolnjene

Določite stroške. Kot že omenjeno, je treba upoštevati številne stroške. Poleg tega morajo stroški vključevati ne le tiste, povezane s posamezno iteracijo, temveč tudi stroške, povezane z zagotavljanjem skladnosti s standardi podjetja.

Določite ugodnosti. Z jasno povezavo donosnosti naložbe s specifičnimi poslovnimi zahtevami bi morali biti sposobni prepoznati koristi, ki bodo vodile k izpolnjevanju zahtev.

Zmanjšajte stroške in koristi v neizbežnih dobičkih. To je najboljši način, da svoja vrednotenja utemeljite na neto sedanji vrednosti (NPV) v nasprotju s poskusom napovedovanja prihodnje vrednosti prihodnjih zaslužkov.

Naj bo čas za razdelitev donosnosti naložbe minimalen. Dolgoročno je dobro dokumentirano, da je bilo uporabljeno pri vaši donosnosti naložbe.

Uporabite več kot eno formulo ROI. Obstajajo številne metode za napovedovanje donosnosti naložbe in načrtujte uporabo ene ali več od njih, vključno z neto sedanjo vrednostjo, interno stopnjo donosa (IRR) in vračilom.

Določite ponovljivi proces. To je ključnega pomena za izračun kakršne koli dolgoročne vrednosti. En sam ponovljiv proces je treba dokumentirati za vsa naslednja projektna podzaporedja.

Našteti problemi so najpogostejši, ki so jih opredelili okoljski strokovnjaki za bivališča. Vztrajanje vodstva pri zagotavljanju »Big-Bang« ROI je zelo zmedeno. Če vse svoje izračune donosnosti naložbe začnete tako, da jih razdelite na prepoznavne, oprijemljive dele, imate dobre možnosti, da ocenite natančno oceno donosnosti naložbe.

Vprašanja o prednostih ROI

Ne glede na vaše prednosti, mehke ali trde, lahko uporabite nekaj osnovnih vprašanj, da določite njihovo vrednost. Na primer, z uporabo preprostega sistema lestvic, od 1 do 10, lahko izmerite učinek katerega koli truda z naslednjimi vprašanji:

Kako bi ocenili razumevanje Podatki spremljate ta projekt vašega podjetja?
Kako bi ocenili izboljšave procesov kot rezultat tega projekta?
Kako bi izmerili vpliv novih vpogledov in sklepov, ki so zdaj na voljo s to ponovitvijo
Kakšen je bil vpliv novih in boljših računalniških okolij kot rezultat naučenega? Če je odgovorov na ta vprašanja malo, je možno, da podjetje ni vredno naložbe. Vprašanja z visokimi točkami kažejo na pomembne pridobitve vrednosti in bi morala služiti kot vodilo za nadaljnjo preiskavo. Na primer, visoka ocena za izboljšave procesov bi morala voditi načrtovalce, da preučijo, kako so bili procesi izboljšani. Morda boste ugotovili, da so nekateri ali vsi doseženi dobički oprijemljivi in je zato denarno vrednost mogoče takoj uporabiti. Kako čim bolje izkoristiti prvo ponovitev skladišče Največji izkupiček truda vašega podjetja je pogosto v prvih nekaj ponovitvah. Ta zgodnja prizadevanja tradicionalno vzpostavljajo najbolj uporabno informacijsko vsebino za javnost in pomagajo vzpostaviti tehnološke temelje za nadaljnje aplikacije poslovne inteligence. Običajno vsako naslednje zaporedje Podatki skladiščnih projektov prinaša vse manj dodatne vrednosti podjetju kot celoti. To še posebej velja, če ponovitev ne dodaja novih tem ali ustreza potrebam nove skupnosti uporabnikov.

Ta funkcija shranjevanja velja tudi za rastoče sklade Podatki zgodovinarji. Ker kasnejši napori zahtevajo več Podatki in še kako Podatki se sčasoma zlijejo v skladišče, večina Podatki postane manj pomemben za uporabljeno analizo. te Podatki pogosto se imenujejo Podatki mirujejo in jih je vedno drago hraniti, ker se skoraj nikoli ne uporabljajo.

Kaj to pomeni za sponzorje projekta? V bistvu si prvi sponzorji delijo več kot stroške investicije. To je primarno, ker so spodbuda za ustanovitev široke plasti tehnološkega in virskega okolja skladišča, vključno z organskimi.

Toda ti prvi koraki imajo največjo vrednost in zato morajo načrtovalci projektov pogosto upravičiti naložbo.
Projekti, izvedeni po vaši BI pobudi, imajo lahko nižje (v primerjavi s prvimi) in neposredne stroške, vendar podjetju prinašajo manj vrednosti.

In lastniki organizacij morajo začeti razmišljati o tem, da bi se nakopičili Podatki in manj relevantne tehnologije.

Podatkovno rudarjenje: ekstrakcija Podarite

Številne arhitekturne komponente zahtevajo različne tehnologije in tehnike podatkovnega rudarjenja –
na primer različni "agenti" za preučevanje zanimivih točk stranke, operacijske sisteme podjetja in za isti dw. Ti agenti so lahko napredne nevronske mreže, usposobljene za trende, kot je prihodnje povpraševanje po izdelkih na podlagi pospeševanja prodaje; na pravilih temelječi motorji za odziv na nabor datotek okoliščin, na primer medicinska diagnoza in priporočila za zdravljenje; ali celo preprosti agenti z vlogo poročanja o izjemah najvišjim vodstvom. Na splošno ti postopki ekstrakcije Podatki si

preverjanje v realnem času; zato morajo biti popolnoma združeni z gibanjem Podatki sebe.

Spletna analitična obdelava Obdelava

Spletna analitika

Sposobnost rezanja, rezanja, valjanja, vrtanja in izvajanja analize
kaj-če je v obsegu IBM-ovega tehnološkega paketa. Na primer, obstajajo funkcije spletne analitične obdelave (OLAP) za DB2, ki prinaša dimenzijsko analizo v motor Baza podatkov enako .

Funkcije dodajo SQL dimenzionalno uporabnost, hkrati pa izkoristijo vse prednosti naravnega dela DB2. Drug primer integracije OLAP je orodje za ekstrakcijo, DB2 OLAP Analyzer Server. Ta tehnologija omogoča hitro in samodejno skeniranje kock DB2 OLAP Server za iskanje in poročanje o vrednostih Podatki nenavadno ali nepričakovano za katero koli kocko za analitika trgovanja. In končno, funkcije DW Center nudijo arhitektom sredstvo za preverjanje, med drugim, profila strežnika kocke DB2 OLAP kot naravnega dela procesov ETL.

Prostorska analiza Prostorska analiza

Prostor predstavlja polovico analitičnih sidrišč (prevodov), potrebnih za panoramo
široko analitično (čas predstavlja drugo polovico). Atomska raven skladišča, predstavljena na sliki 1.1, vključuje temelje za čas in prostor. Časovni žigi zasidrajo analize s časom, informacije o naslovu pa s prostorom. Časovni žigi izvajajo analizo po času, podatki o naslovu pa analizo po prostoru. Diagram prikazuje geokodiranje – postopek pretvorbe naslovov v točke na zemljevidu ali točke v prostoru, tako da se lahko v analizi uporabijo koncepti, kot sta razdalja in znotraj/zunaj – ki se izvaja na atomski ravni in prostorska analiza je na voljo analitiku. IBM zagotavlja prostorske razširitve, razvite z Inštitutom za raziskovanje okoljskih sistemov (ESRI), al Baza podatkov DB2, tako da se lahko prostorski objekti ohranijo kot običajni del Baza podatkov relacijski. db2

Spatial Extenders zagotavljajo tudi vse razširitve SQL za izkoriščanje prednosti prostorske analize. Na primer razširitve SQL za poizvedovanje
razdalja med naslovi ali ali je točka znotraj ali zunaj definiranega poligonalnega območja, so analitični standard s Spatial Extenderjem. Za več informacij glejte 16. poglavje.

Baze podatkov-Rezidentna orodja Orodja Baze podatkov-Stanovnik

DB2 ima veliko funkcij SQL BI, ki pomagajo pri razčlenjevanju. Tej vključujejo:

Rekurzijske funkcije za izvajanje analize, kot je »poišči vse možne poti leta iz San Francisco a NY".
Analitične funkcije za razvrščanje, kumulativne, kocke in funkcije združevanja za olajšanje nalog, ki se običajno pojavljajo samo s tehnologijo OLAP, so zdaj naravni del motorja Baza podatkov
Možnost ustvarjanja tabel, ki vsebujejo rezultate
Prodajalci od Baza podatkov Vodje mešajo več funkcij poslovne inteligence v Baza podatkov enako.
Glavni dobavitelji baza podatkov mešajo več funkcij BI v Baza podatkov enako.
To zagotavlja boljše delovanje in več možnosti izvajanja rešitev BI.
Lastnosti in funkcije DB2 V8 so podrobno obravnavane v naslednjih poglavjih:
Tehnična arhitektura in osnove upravljanja podatkov (5. poglavje)

Osnove DB2 BI (6. poglavje)
Materializirane poizvedbene tabele DB2 (7. poglavje)
Funkcije OLAP DB2 (13. poglavje)
Izboljšane lastnosti in funkcije BI DB2 (15. poglavje) Poenostavljen sistem dostave podatkov Sistem dostave Podatki poenostavljeno

Arhitektura, prikazana na sliki 1.1, vključuje številne strukture Podatki fizično. Eno je skladišče Podatki delovanje. Na splošno je ODS objektno usmerjen, integriran in aktualen. Zgradili bi ODS za podporo, na primer, prodajnemu uradu. Prodaja ODS bi dopolnila Podatki iz številnih različnih sistemov, vendar bi ohranil samo na primer današnje transakcije. ODS je mogoče posodobiti tudi večkrat na dan. Hkrati procesi potiskajo i Podatki integriran v druge aplikacije. Ta struktura je posebej zasnovana za integracijo Podatki trenutno in dinamično ter bi bil verjeten kandidat za podporo analitike v realnem času, kot je zagotavljanje servisnih agentov stranke kupčeve trenutne informacije o prodaji tako, da informacije o prodajnem trendu pridobijo iz samega inventarja. Druga struktura, prikazana na sliki 1.1, je formalno stanje za dw. Ne samo, da je to kraj za izvedbo potrebne integracije, kakovosti Podatki, in o preobrazbi Podatki vhodnega skladišča, ampak je tudi zanesljivo in začasno skladišče za Podatki ponovitve, ki bi jih lahko uporabili v analizi v realnem času. Če se odločite za uporabo ODS ali uprizoritvenega območja, je to eno najboljših orodij za zapolnitev teh struktur Podatki uporaba različnih operativnih virov je heterogena porazdeljena poizvedba DB2. To zmožnost zagotavlja izbirna funkcija DB2, imenovana DB2 Relational Connect (samo poizvedbe), in prek DB2 DataJoiner (ločen izdelek, ki zagotavlja zmožnost poizvedovanja, vstavljanja, posodabljanja in brisanja v heterogenih porazdeljenih RDBMS-jih).

Ta tehnologija arhitektom omogoča Podatki vezati Podatki proizvodnje z analitičnimi procesi. Ne samo, da se lahko tehnologija prilagodi skoraj vsem zahtevam po podvajanju, ki se lahko pojavijo pri analitiki v realnem času, ampak se lahko poveže tudi z najrazličnejšimi Podatki najbolj priljubljenih, vključno z DB2, Oracle, Sybase, SQL Server, Informix in drugimi. DB2 DataJoiner lahko uporabite za zapolnitev strukture Podatki formalne, kot je ODS ali celo stalna miza, predstavljena v skladišču, zasnovana za hitro obnovitev takojšnjih posodobitev ali za prodajo. Seveda te strukture same Podatki se lahko napolni z uporabo

še ena pomembna tehnologija, namenjena podvajanju Podatki, IBM DataPropagator Relational. (DataPropagator je ločen izdelek za centralne sisteme. DB2 UNIX, Linux, Windows in OS/2 vključujejo storitve podvajanja Podatki kot standardna funkcija).
Druga metoda premikanja Podatki v podjetju deluje integrator aplikacij za podjetja, znan tudi kot posrednik sporočil. Ta edinstvena tehnologija omogoča neprimerljiv nadzor za ciljanje in premikanje Podatki okoli podjetja. IBM ima najpogosteje uporabljenega posrednika sporočil MQSeries ali različico izdelka, ki vključuje zahteve za e-trgovina, IBM WebSphere MQ.
Per più discussione su come sfruttare MQ per sostenere un magazzino e un ambiente BI, visitare spletna stran del libro. Per ora, è sufficiente dire che questa tecnologia è un mezzo eccellente per catturare e trasformare (utilizzando MQSeries Integrator) Podatki ciljani operativci, zaposleni za rešitve poslovne inteligence. Tehnologija MQ je bila integrirana in zapakirana v UDB V8, kar pomeni, da je čakalne vrste sporočil zdaj mogoče upravljati, kot da bi bile tabele DB2. Koncept sporočil čakalne vrste za varjenje in vesolje Baza podatkov relacijski usmerja k močnemu okolju dostave Podatki.

Ničelna zakasnitev Ničelna zakasnitev

Končni strateški cilj za IBM je analiza brez zakasnitve. Kot je opredeljeno z
Gartner mora biti sistem poslovnega obveščanja sposoben sklepati, sprejemati in zagotavljati informacije analitikom na zahtevo. Izziv je seveda, kako mešati Podatki trenutno in v realnem času s potrebnimi zgodovinskimi informacijami, kot je i Podatki povezan trend/vzorec ali pridobljeni vpogled, kot je profiliranje strank.

Take informacije vključujejo na primer identifikacijo stranke visoko ali nizko tveganje ali kateri izdelki i stranke najverjetneje bodo kupili, če imajo sir že v nakupovalnem vozičku.

Doseganje ničelne zakasnitve je dejansko odvisno od dveh temeljnih mehanizmov:

Popolna zveza Podatki ki se analizirajo z uveljavljenimi tehnikami in z orodji, ki jih je ustvaril BI
Sistem dostave Podatki učinkovito zagotoviti, da je analitika v realnem času resnično na voljo. Ti predpogoji za ničelno zakasnitev se ne razlikujejo od dveh ciljev, ki ju je določil IBM in sta opisana zgoraj. Tesna povezanost Podatki je del IBM-ovega programa brezhibne integracije. In ustvarite sistem dostave Podatki Učinkovitost je popolnoma odvisna od razpoložljive tehnologije, ki poenostavlja postopek dostave Podatki. Posledično sta dva od treh IBM-ovih ciljev ključna za dosego tretjega. IBM zavestno razvija svojo tehnologijo, da bi zagotovil, da je ničelna zakasnitev resničnost za skladiščna prizadevanja. Povzetek / Sinteza Vaša organizacija BI nudi načrt za izgradnjo vašega okolja
iterativno. Prilagoditi ga je treba tako, da odraža potrebe vašega podjetja, sedanje in prihodnje. Brez široke arhitekturne vizije so iteracije skladišč le malo več kot naključne izvedbe osrednjega skladišča, ki le malo prispevajo k ustvarjanju velikega, informativnega podjetja. Prva ovira za vodje projektov je, kako upravičiti naložbo, potrebno za rast organizacije poslovne inteligence. Medtem ko so izračuni donosnosti naložbe ostali temelj dosežkov inventarja, je vse težje natančno napovedati. To je privedlo do drugih metod za ugotavljanje, ali ste vreden svojega denarja. Vrednost naložbe2 (VOI) je na primer nabavljena kot rešitev. To je dolžnost arhitektov Podatki in načrtovalci projektov namenoma ustvarjajo in zagotavljajo informacije združenjem uporabnikov in ne le zagotavljajo storitve Podatki. Med obema je velika razlika. Informacije so nekaj, kar vpliva na odločanje in učinkovitost; relativno, i Podatki so gradniki za pridobivanje teh informacij.

Tudi če je kritičen do vira Podatki da bi zadovoljili poslovne zahteve, bi moralo imeti BI okolje večjo vlogo pri ustvarjanju informacijskih vsebin. Sprejeti moramo dodatne korake za čiščenje, integracijo, preoblikovanje ali kako drugače ustvarjanje informacijske vsebine, po kateri lahko uporabniki ukrepajo, nato pa moramo zagotoviti, da se ta dejanja in odločitve, kjer so razumni, odražajo v okolju poslovne inteligence. Če skladišče prestavimo v službo samo na Podatki, bodite prepričani, da bodo združenja uporabnikov ustvarila informacijsko vsebino, potrebno za ukrepanje. To zagotavlja, da bo njihova skupnost lahko sprejemala boljše odločitve, vendar podjetje trpi zaradi pomanjkanja znanja, ki so ga uporabili. Datum da arhitekti in načrtovalci projektov sprožijo specifične projekte v okolju poslovne inteligence, ostajajo odgovorni podjetju kot celoti. Preprost primer te dvostranske lastnosti ponovitev BI najdete v viru Podatki. Vse Podatki prejete za posebne komercialne zahteve je treba vnesti v prvo atomsko plast. To zagotavlja razvoj informacijskega sredstva podjetja ter upravljanje in obravnavanje specifičnih zahtev uporabnikov, definiranih v ponovitvi.

Kaj je podatkovno skladišče?

Skladišče podatkov je srce arhitekture informacijskih sistemov od leta 1990 in podpira informacijske procese tako, da ponuja trdno integrirano platformo Podatki zgodovina vzeta kot osnova za nadaljnje analize. THE podatkovno skladišče ponujajo enostavno integracijo v svet nekompatibilnih aplikacijskih sistemov. Skladišče podatkov razvilo se je v modno muho. Skladišče podatkov organizirati in zapomniti i Podatki potrebnih za informacijske in analitične procese na podlagi dolge zgodovinske časovne perspektive. Vse to vključuje znatne in stalne napore pri izgradnji in vzdrževanju podatkovno skladišče.

Kaj je torej a podatkovno skladišče? podatkovno skladišče je:

▪ predmetno usmerjenost
▪ integriran sistem
▪ časovna sprememba
▪ nehlapen (ne prekliče)

zbirka Podatki uporablja za podporo managerskim odločitvam pri izvajanju procesov.
I Podatki vstavljen v podatkovno skladišče v večini primerov izhajajo iz operativnih okolij. The podatkovno skladišče izdelan je iz pomnilniške enote, fizično ločene od preostalega sistema, ki ga vsebuje Podatki predhodno preoblikovale aplikacije, ki delujejo na podlagi informacij, ki izhajajo iz operacijskega okolja.

Dobesedna definicija a podatkovno skladišče zasluži si temeljito razlago, saj obstajajo pomembni motivi in osnovni pomeni, ki opisujejo značilnosti skladišča.

PREDMETNA ORIENTACIJA ORIENTACIJA TEMATSKI

Prva značilnost a podatkovno skladišče je, da je usmerjen na glavne subjekte podjetja. Vodnik procesov skozi Podatki je v nasprotju z bolj klasično metodo, ki zagotavlja usmerjenost aplikacij k procesom in funkcijam, metodo, ki je večinoma skupna večini manj novejših sistemov upravljanja.

Operacijski svet je zasnovan okoli aplikacij in funkcij, kot so posojila, varčevanje, bančne kartice in zaupanje za finančno institucijo. Svet dw je organiziran okoli glavnih subjektov, kot so stranka, prodajalec, izdelek in dejavnost. Usklajevanje okoli tem vpliva na zasnovo in izvedbo Podatki najdeno v dw. Najpomembneje je, da glavna tema vpliva na najpomembnejši del ključne strukture.

Na svet aplikacij vplivata tako zasnova baze podatkov kot zasnova procesov. Svet dw je osredotočen izključno na video modeliranje Podatki in o oblikovanju Baza podatkov. Oblikovanje procesov (v klasični obliki) ni del okolja dw.

Razlike med izbiro aplikacije procesa/funkcije in izbiro predmeta se kažejo tudi kot razlike v vsebini Podatki na podrobni ravni. THE Podatki del dw ne vključujejo i Podatki ki ne bodo uporabljeni za obdelavo DSS med aplikacijami

operativno usmerjeni Podatki vsebujejo i Podatki za takojšnjo izpolnitev funkcionalnih zahtev/zahtev glede obdelave, ki so lahko ali pa tudi neuporabne za analitika DSS.
Drug pomemben način, da operativno usmerjene aplikacije za Podatki razlikovati od Podatki dw je v poročilih Podatki. Podatki operativci vzdržujejo stalno razmerje med dvema ali več tabelami na podlagi poslovnega pravila, ki je aktivno. THE Podatki dw zajemajo spekter časa in poročil, ki jih najdemo v dw, je veliko. Mnoga pravila trgovanja (in ustrezno mnoga poročila o Podatki ) so zastopani v zalogi Podatki med dvema ali več mizami.

(Za podrobno razlago, kako so razmerja med Podatki se upravljajo v DW, glejte tehnično temo o tem vprašanju.)
Ali obstaja velika razlika med operacijskimi sistemi in Podatki in DW.

INTEGRACIJA INTEGRACIJA

Najpomembnejši vidik okolja dw je, da i Podatki ki jih najdete v dw, se zlahka vključijo. NENEHNO. BREZ IZJEM. Samo bistvo dw okolja je, da i Podatki v mejah skladišča so integrirani.

Integracija se razkriva na veliko različnih načinov – v doslednih identificiranih konvencijah, v doslednem merjenju spremenljivk, v doslednih kodiranih strukturah, v fizičnih atributih Podatki dosledno in tako naprej.

Skozi leta so oblikovalci različnih aplikacij sprejeli veliko odločitev o tem, kako naj se aplikacija razvije. Slog in individualizirane oblikovalske odločitve aplikacij oblikovalcev se razkrijejo na sto načinov: v razlikah v kodiranju, ključni strukturi, fizičnih značilnostih, identifikacijskih konvencijah itd. Kolektivna sposobnost številnih oblikovalcev aplikacij, da ustvarijo nedosledne aplikacije, je legendarna. Slika 3 razkriva nekatere najpomembnejše razlike v oblikovanju aplikacij.

Kodiranje: Kodiraj:

Oblikovalci aplikacij so izbrali kodiranje polja – spol – na več načinov. Oblikovalec predstavlja spol kot "m" in "f". Drugi oblikovalec predstavlja spol kot "1" in "0". Drugi oblikovalec predstavlja spol kot "x" in "y". Drugi oblikovalec predstavlja spol kot "moški" in "ženski". Resnično ni pomembno, kako seks pride v DW. Črki »M« in »F« sta verjetno tako dobri kot katera koli upodobitev.

Pomembno je, da ne glede na vir, iz katerega prihaja spolno polje, to polje prispe v DW v doslednem integriranem stanju. Posledično, ko je polje naloženo v DW iz aplikacije, kjer je bilo predstavljeno zunaj v formatu "M" in "F", Podatki je treba pretvoriti v format DW.

Merjenje atributov: Merjenje Lastnosti:

Oblikovalci aplikacij so se skozi leta odločili za merjenje cevovoda na različne načine. Oblikovalska trgovina i Podatki cevovoda v centimetrih. Drug oblikovalec aplikacij shrani Podatki cevovoda v palcih. Drug oblikovalec aplikacij shrani Podatki cevovoda v milijonih kubičnih čevljev na sekundo. In drugi oblikovalec shranjuje informacije o cevovodu v smislu jardov. Ne glede na vir, ko informacije o cevovodu prispejo v DW, jih je treba izmeriti na enak način.

Kot je prikazano na sliki 3, vprašanja integracije vplivajo na skoraj vse vidike projekta – fizične značilnosti Podatki, dilema imeti več kot en vir Podatki, vprašanje nedoslednih ugotovljenih vzorcev, formatov Podatki nedosledno in tako naprej.

Ne glede na konstrukcijski argument je rezultat enak – tj Podatki morajo biti shranjeni v DW na edinstven in globalno sprejemljiv način, tudi če osnovni operacijski sistemi shranjujejo i Podatki.

Ko analitik DSS pogleda DW, bi se moral osredotočiti na izkoriščanje Podatki ki so v skladišču,

namesto da bi se spraševali o verodostojnosti ali doslednosti Podatki.

ČASOVNA VARIANCA

vsi Podatki v DW so točni do nekega trenutka. Ta osnovna lastnost Podatki v DW se zelo razlikuje od Podatki najdemo v delovnem okolju. THE Podatki operacijskega okolja so tako točni kot v času dostopa. Z drugimi besedami, v operacijskem okolju, ko se dostopa do enote Podatki, se pričakuje, da odraža vrednosti tako natančne kot v času dostopa. Zakaj jaz Podatki v DW so točni kot v neki točki v času (tj. ne "prav zdaj"), tj Podatki najdene v DW so "časovna varianca".
Časovno odstopanje od Podatki DW se omenja na številne načine.
Najenostavnejši način je, da i Podatki predstavljajo DW Podatki v daljšem časovnem obdobju – pet do deset let. Časovni horizont, prikazan za delovno okolje, je veliko krajši od današnjih trenutnih vrednosti do šestdeset in devetdeset
Aplikacije, ki morajo dobro delovati in morajo biti na voljo za obdelavo transakcij, morajo prinesti minimalno količino Podatki če dopuščajo kakršno koli stopnjo prilagodljivosti. Tako imajo operativne aplikacije kratek časovni horizont, kot je na primer tema oblikovanja zvočne aplikacije.
Drugi način, kako se 'časovna varianca' pojavi v DW, je struktura ključa. Vsaka ključna struktura v DW vsebuje, implicitno ali eksplicitno, časovni element, kot je dan, teden, mesec itd. Časovni element je skoraj vedno na dnu povezanega ključa, ki ga najdemo v DW. V teh primerih bo časovni element obstajal implicitno, na primer v primeru, ko se celotna datoteka podvoji ob koncu meseca ali četrtletja.
Tretji način prikaza časovne variance je, da i Podatki DW, samo pravilno registriran, ni mogoče posodobiti. THE Podatki DW so za vse praktične namene dolga serija posnetkov. Seveda, če je bil posnetek narejen nepravilno, se lahko posnetki spremenijo. Toda ob predpostavki, da so posnetki narejeni pravilno, se ne spremenijo takoj, ko so posneti. V nekaterih

primerih je morda neetično ali celo neveljavno, da se posnetki v DW spreminjajo. THE Podatki operativno, tako natančno kot v času dostopa, se lahko posodobi, ko se pojavi potreba.

NI HLAPLJIV

Četrta pomembna značilnost DW je, da je nehlapen.
Posodobitve, vstavitve, izbrisi in spremembe se redno izvajajo v operativnih okoljih za vsak zapis posebej. Toda osnovna manipulacija z Podatki potreben v DW je veliko lažji. Obstajata samo dve vrsti operacij, ki se zgodita v DW – začetno nalaganje datoteke Podatki in dostop do Podatki. Ni posodobitve za Podatki (v splošnem pomenu posodabljanja) v DW kot običajna operacija obdelave. Obstaja nekaj zelo močnih posledic te osnovne razlike med operativno obdelavo in obdelavo DW. Na ravni načrtovanja potreba po previdnosti pri posodabljanju zaradi zrušitve ni dejavnik v DW, saj posodobitev Podatki se ne izvaja. To pomeni, da si lahko na fizični ravni načrtovanja optimiramo dostop Podatki, predvsem pri obravnavanju tem normalizacije in fizične denormalizacije. Druga posledica preprostosti delovanja DW je v osnovni tehnologiji, ki se uporablja za izvajanje okolja DW. Potreba po podpori spletnih posodobitev od zapisa do zapisa (kot se pogosto zgodi pri operativni obdelavi) zahteva, da ima tehnologija zelo zapleteno osnovo pod navidezno preprostostjo.
Tehnologija, ki podpira varnostno kopiranje in obnovitev, transakcije in celovitost datotek Podatki odkrivanje in odpravljanje zastoja pa je precej zapleteno in nepotrebno za obdelavo DW. Značilnosti DW, oblikovalska usmerjenost, integracija Podatki znotraj DW, časovno odstopanje in enostavnost upravljanja Podatki, vse skupaj vodi v okolje, ki je zelo, zelo drugačno od klasičnega operacijskega okolja. Vir skoraj vseh Podatki DW so delovno okolje. Mamljivo je misliti, da obstaja velika odvečnost Podatki med obema okoljema.
Dejansko je prvi vtis, ki ga ima veliko ljudi, velika odvečnost Podatki med delovnim okoljem in okoljem

DW razširitev. Takšna interpretacija je površna in kaže na nerazumevanje dogajanja v DW.
Dejansko obstaja minimalna odvečnost Podatki med operacijskim okoljem in i Podatki od DW. Upoštevajte naslednje: I Podatki so filtrirani datotek da preklopite iz operacijskega okolja v okolje DW. Mnogi Podatki nikoli ne gredo izven delovnega okolja. Samo da i Podatki ki so potrebni za obdelavo DSS, se usmerijo v okolje

▪ časovni horizont Podatki je zelo različno od enega okolja do drugega. THE Podatki v delovnem okolju so zelo sveži. THE Podatki v DW so veliko starejši. Samo z vidika časovnega obzorja je zelo malo prekrivanja med operativnim okoljem in DW.

▪ DW vsebuje Podatki datoteke s povzetki, ki niso nikoli v okolju

▪ Jaz Podatki podvrženi temeljni preobrazbi, ko preidejo na Slika 3 prikazuje, da večina Podatki so bistveno spremenjeni, če so izbrani in premaknjeni v DW. Povedano drugače, večina Podatki se fizično in korenito spremeni, ko se preseli v DW. Z vidika integracije niso enaki Podatki ki prebivajo v delovnem okolju. Glede na te dejavnike je odvečnost Podatki med obema okoljema je redek dogodek, ki vodi do manj kot 1 % redundance med obema okoljema. STRUKTURA SKLADIŠČA DW imajo izrazito strukturo. Obstajajo različne ravni povzetkov in podrobnosti, ki razmejujejo DW.
Različne komponente DW so:

metapodatki
Podarite trenutne podrobnosti
Podarite starih detajlov
Podarite rahlo povzeto
Podarite zelo povzeto

Daleč glavna skrb je za i Podatki trenutne podrobnosti. To je glavna skrb, ker:

I Podatki Aktualne podrobnosti odražajo najnovejše dogodke, ki so vedno zelo zanimivi in
i Podatki trenutni podrobni podatki so obsežni, ker so shranjeni na najnižji stopnji razdrobljenosti in
i Podatki trenutnih podrobnosti so skoraj vedno shranjene v diskovnem pomnilniku, ki je hiter za dostop, vendar drag in zapleten od I Podatki podrobnosti so starejše Podatki ki so shranjeni v nekem spominu massa. Do njega se dostopa občasno in je shranjen na ravni podrobnosti, ki je združljiva z Podatki trenutne podrobnosti. Shranjevanje na alternativnem mediju za shranjevanje sicer ni obvezno zaradi velike količine Podatki združeno s sporadičnim dostopom Podatki, medij za shranjevanje Podatki starejših podrobnosti običajno ni shranjenih na disku. THE Podatki rahlo povzeti so Podatki ki so destilirani z ugotovljene nizke ravni podrobnosti na trenutno raven podrobnosti. Ta raven DW je skoraj vedno shranjena v pomnilniku diska. Problemi oblikovanja, ki se postavljajo pred arhitekta Podatki pri konstrukciji te ravni DW so:

Katera časovna enota je zgoraj opravljeno povzemanje
Kakšno vsebino, atributi bodo nekoliko povzeli vsebino Podatki Naslednja stopnja Podatki v DW je tisto od Podatki zelo povzeto. THE Podatki zelo povzeti so kompaktni in lahko dostopni. THE Podatki zelo povzeti včasih najdemo v okolju DW in drugih primerih i Podatki zelo abstrahirane najdemo zunaj neposrednih sten tehnologije, ki gosti DW. (v vsakem primeru, tj Podatki zelo povzeti so del DW ne glede na to, kje i Podatki so fizično nastanjeni). Zadnja komponenta DW je komponenta metapodatkov. V mnogih pogledih so metapodatki drugačna dimenzija kot drugi Podatki DW, ker metapodatki ne vsebujejo nobenega datotek neposredno iz operacijskega okolja. Metapodatki imajo v DW posebno in zelo pomembno vlogo. Metapodatki se uporabljajo kot:

imenik za pomoč analitiku DSS pri iskanju vsebine DW,
vodnik za kartiranje Podatki kako jaz Podatki preoblikovani iz operacijskega okolja v okolje DW,
vodnik po algoritmih, ki se uporabljajo za povzemanje med i Podatki trenutne podrobnosti ei Podatki rahlo povzeto, tj Podatki Če povzamemo, metapodatki igrajo veliko večjo vlogo v okolju DW kot kadar koli v operativnem okolju STAR DETAJL SHRANJEVALNI MEDIJA Za shranjevanje te vrste lahko uporabite magnetni trak Podatki. Dejansko obstaja veliko različnih medijev za shranjevanje, ki jih je treba upoštevati pri shranjevanju starih Podatki podrobnosti. Odvisno od količine Podatki, pogostost dostopa, stroške orodij in vrsto dostopa, je povsem verjetno, da bodo druga orodja potrebovala staro raven podrobnosti v DW. PRETOK PODATKOV Obstaja normalen in predvidljiv tok Podatki znotraj DW.
I Podatki v DW vstopajo iz operacijskega okolja. (OPOMBA: Obstaja nekaj zelo zanimivih izjem od tega pravila. Vendar pa skoraj vse Podatki vnesite DW iz operacijskega okolja). Datum da i Podatki vstopijo v DW iz operacijskega okolja, se transformira, kot je opisano zgoraj. Če vnesete DW, tj Podatki vnesite trenutno raven podrobnosti, kot je prikazano. Tam se nahaja in se uporablja, dokler se ne zgodi eden od treh dogodkov:

je prečiščen,
je povzet in/ali ▪je Zastareli proces znotraj DW se premakne i Podatki trenutne podrobnosti a Podatki podrobnosti staro, glede na starost Podatki. Postopek

povzemanje uporablja podrobnosti Podatki za izračun Podatki rahlo povzete in zelo povzete ravni Podatki. Pri prikazanem toku je nekaj izjem (o katerih bomo razpravljali kasneje). Vendar pa običajno za veliko večino Podatki najdemo v DW, tok Podatki je tako, kot je predstavljeno.

UPORABA PODATKOVNEGA SKLADIŠČA

Ni presenetljivo, da so različne ravni Podatki znotraj DW niso deležni različnih ravni uporabe. Praviloma velja, da višja kot je stopnja povzemanja, več i Podatki se uporabljajo.
Številne uporabe se pojavljajo v Podatki zelo povzeto, medtem ko star Podatki podrobnosti se skoraj nikoli ne uporabljajo. Obstaja dober razlog za preusmeritev organizacije na paradigmo uporabe virov. Bolj povzeto i Podatki, hitreje in učinkoviteje ga je mogoče doseči Podatki. Če trgovina ugotovi, da veliko obdela DW na ravni podrobnosti, potem se porabi ustrezno velika količina strojnih virov. V interesu vseh je, da čim prej obdelamo tako visoko raven povzetka.

Za številne trgovine je analitik DSS v okolju pred DW uporabil Podatki na ravni podrobnosti. V mnogih pogledih prihod na Podatki podroben je videti kot varnostna odeja, tudi če so na voljo druge ravni povzemanja. Ena od dejavnosti arhitekta Podatki je odvaditi uporabnika DSS stalne uporabe Podatki na najnižji ravni podrobnosti. Arhitektu sta na voljo dve motivaciji Podatki:

namestitev sistema povratnih stroškov, kjer končni uporabnik plača za porabljene vire e
ki kažejo, da je mogoče doseči zelo dober odzivni čas, ko je vedenje z i Podatki je na visoki stopnji povzemanja, medtem ko je slab odzivni čas posledica vedenja Podatki na nizki ravni DRUGA OBVESTILA Obstaja še nekaj premislekov o konstrukciji in upravljanju DW.
Prvi vidik so indeksi. THE Podatki na višjih stopnjah povzemanja jih je mogoče poljubno indeksirati, medtem ko i Podatki

na nižjih ravneh podrobnosti so tako obsežni, da jih je mogoče redko indeksirati. Iz istega leksema, tj Podatki na visokih ravneh podrobnosti je mogoče razmeroma enostavno prestrukturirati, medtem ko je obseg Podatki na nižjih ravneh je tako velik, da i Podatki jih ni mogoče zlahka obnoviti. Posledično je model Podatki in formalno delo, opravljeno z zasnovo, postavlja temelje za DW, ki se uporablja skoraj izključno za trenutno raven podrobnosti. Z drugimi besedami, manekenske dejavnosti Podatki skoraj v vsakem primeru ne veljajo za ravni povzemanja. Drug strukturni premislek je podrazdelitev Podatki od DW.

Razdelitev je možna na dveh ravneh – na ravni dbms in na ravni aplikacije. V diviziji na ravni dbms, dbms je obveščen o delitvah in jih ustrezno nadzoruje. V primeru delitve na ravni aplikacije se delitev zaveda le programer in odgovornost za njihovo upravljanje je prepuščena njemu.

Pod nivojem dbms, je veliko dela opravljenega samodejno. S samoupravljanjem oddelkov je povezanih veliko neprilagodljivosti. V primeru uporabe na ravni oddelka Podatki od podatkovno skladišče, je veliko dela na programerju, vendar je končni rezultat prilagodljivost pri upravljanju Podatki v podatkovno skladišče

DRUGE ANOMALIJE

Medtem ko sestavni deli podatkovno skladišče deluje kot je opisano za skoraj vse Podatki, obstaja nekaj uporabnih izjem, o katerih je treba razpravljati. Izjema je pri Podatki javni povzetki (javni zbirni podatki). To so Podatki povzetki, ki so bili izračunani iz podatkovno skladišče uporablja pa jih družba. THE Podatki javni povzetki se hranijo in upravljajo v podatkovno skladišče, čeprav so, kot je navedeno zgoraj, ugotovljeni. Računovodje si prizadevajo pripraviti takšne četrtletje Podatki kot so prihodki, četrtletni stroški, četrtletni dobiček itd. Delo, ki ga opravljajo računovodje, je zunanje podatkovno skladišče. Vendar, i Podatki uporabljajo »interno« znotraj podjetja – od trženje, prodaja itd. Druga anomalija, o kateri ne bomo razpravljali, je Podatki zunanji.

Še ena izjemna vrsta Podatki ki jih lahko najdete v a podatkovno skladišče je to stalnih podrobnih podatkov. To povzroča potrebo po trajnem shranjevanju Podatki na podrobni ravni iz etičnih ali pravnih razlogov. Če podjetje svoje delavce izpostavlja nevarnim snovem, je to potrebno Podatki podrobno in trajno. Če podjetje proizvaja izdelek, ki vključuje javno varnost, kot so deli za letalo, obstaja potreba po tem Podatki stalnih podrobnosti, pa tudi če podjetje sklepa nevarne pogodbe.

Podjetje si ne more privoščiti spregleda podrobnosti, saj v naslednjih nekaj letih v primeru tožbe, odpoklica, sporne gradbene napake itd. izpostavljenost podjetja bi lahko bila velika. Posledično obstaja edinstvena vrsta Podatki znani kot trajni podrobni podatki.

POVZETEK

Un podatkovno skladišče je objektno usmerjena, integrirana, napeta različica, zbirka Podatki nehlapen v podporo potrebam odločanja uprave. Vsaka od najpomembnejših funkcij a podatkovno skladišče ima svoje posledice. Poleg tega obstajajo še štiri stopnje Podatki od podatkovno skladišče:

Stare podrobnosti
Trenutne podrobnosti
Podarite rahlo povzeto
Podarite zelo povzeti metapodatki so prav tako pomemben del podatkovno skladišče. POVZETEK Koncept shranjevanja Podatki je v zadnjem času prejel veliko pozornosti in je postal trend 90. To je posledica sposobnosti podatkovno skladišče premagati omejitve sistemov za podporo upravljanju, kot so sistemi za podporo odločanju (DSS) in izvršni informacijski sistemi (EIS). Čeprav je koncept podatkovno skladišče izgleda obetavno, izvedba i podatkovno skladišče je lahko problematično zaradi obsežnih skladiščnih procesov. Kljub kompleksnosti skladiščnih projektov Podatki, številni dobavitelji in svetovalci, ki zaloge Podatki trdijo, da je hramba Podatki ne predstavlja nobene težave. Vendar pa na začetku tega raziskovalnega projekta ni bilo opravljenih skoraj nobenih neodvisnih, strogih in sistematičnih raziskav. Posledično je težko reči, kaj se dejansko dogaja v industriji, ko so zgrajeni podatkovno skladišče. Ta študija je raziskala prakso skladiščenja Podatki sodobnikov, katerega namen je razviti bogatejše razumevanje avstralske prakse. Pregled literature je zagotovil kontekst in podlago za empirično študijo. Rezultati te raziskave so številni. Prvič, ta študija je razkrila dejavnosti, ki so se zgodile med razvojem podatkovno skladišče. Na številnih področjih, tj Podatki zbrani so potrdili prakso, opisano v literaturi. Drugič, vprašanja in težave, ki lahko vplivajo na razvoj podatkovno skladišče so bile ugotovljene s to študijo. Nazadnje, koristi, ki so jih pridobile avstralske organizacije, povezane z uporabo podatkovno skladišče so bile razkrite.

1. poglavje

Kontekst iskanja

Koncept skladiščenja podatkov je bil široko izpostavljen in je postal nastajajoči trend v devetdesetih (McFadden 90, TDWI 1996, Shah in Milstein 1996, Shanks et al. 1997, Eckerson 1997, Adelman in Oates 1998). To je razvidno iz naraščajočega števila člankov o skladiščenju podatkov v strokovnih publikacijah (Little in Gibson 2000). Številni članki (glej na primer Fisher 1999, Hackathorn 1995, Morris 1995a, Bramblett in King 1995, Graham et al. 1996, Sakaguchi in Frolick 1996, Alvarez 1996, Brousell 1997, Clarke 1997, McCarthy 1997, O' Donnell 1997 1997, Edwards 1998, TDWI 1999) so poročali o pomembnih koristih organizacijam, ki izvajajo podatkovno skladišče. Svojo teorijo so podprli z anekdotičnimi dokazi o uspešnih implementacijah, visokimi podatki o donosnosti naložbe (ROI) in tudi z zagotavljanjem smernic ali metodologij za razvoj podatkovno skladišče

(Shanks et al. 1997, Seddon in Benjamin 1998, Little in Gibson 1999). V skrajnem primeru so Graham et al. (1996) poročajo o povprečni donosnosti triletne naložbe v višini 401 %.

Velik del trenutne literature pa je spregledal kompleksnost, ki je povezana z izvajanjem takih projektov. Projekti za podatkovno skladišče običajno so zapleteni in obsežni ter imajo zato veliko verjetnost neuspeha, če niso skrbno nadzorovani (Shah in Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs in Clymer 1998, Rao 1998). Za njihovo izgradnjo so potrebne ogromne količine človeških in finančnih virov, časa in truda (Hill 1998, Crofts 1998). Običajni potrebni čas in finančna sredstva so približno dve leti oziroma dva do tri milijone dolarjev (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Ta čas in finančna sredstva so potrebna za nadzor in konsolidacijo številnih različnih vidikov skladiščenja podatkov (Cafasso 1995, Hill 1998). Poleg premislekov o strojni in programski opremi so druge funkcije, ki se razlikujejo od pridobivanja Podatki na postopke nalaganja Podatki, zmogljivost pomnilnika za upravljanje posodobitev in meta Podatki za usposabljanje uporabnikov, je treba upoštevati.

V času, ko se je ta raziskovalni projekt začel, je bilo zelo malo akademskih raziskav na področju skladiščenja podatkov, zlasti v Avstraliji. To je bilo razvidno iz pomanjkanja člankov, objavljenih o skladiščenju podatkov v revijah ali drugih akademskih spisih tistega časa. Številni razpoložljivi akademski spisi opisujejo izkušnjo ZDA. Pomanjkanje akademskih raziskav na področju skladiščenja podatkov je povzročilo povpraševanje po strogih raziskavah in empiričnih študijah (McFadden 1996, Shanks et al. 1997, Little in Gibson 1999). Zlasti raziskave o procesu izvajanja podatkovno skladišče je treba razširiti splošno znanje o izvajanju podatkovno skladišče in bo služil kot podlaga za prihodnjo raziskovalno študijo (Shanks et al. 1997, Little in Gibson 1999).

Namen te študije je torej raziskati, kaj se dejansko zgodi, ko organizacije izvajajo in uporabljajo i podatkovno skladišče v Avstraliji. Natančneje, ta študija bo vključevala analizo celotnega procesa razvoja a podatkovno skladišče, začenši z začetkom in oblikovanjem prek načrtovanja in izvajanja ter kasnejše uporabe v avstralskih organizacijah. Poleg tega bo študija prispevala tudi k trenutni praksi z opredelitvijo področij, kjer je mogoče prakso še izboljšati, neučinkovitosti in tveganja pa zmanjšati ali se jim izogniti. Poleg tega bo služil kot osnova za druge študije o podatkovno skladišče v Avstraliji in bo zapolnil vrzel, ki trenutno obstaja v literaturi.

Raziskovalna vprašanja

Cilj te raziskave je preučiti dejavnosti, vključene v izvajanje podatkovno skladišče in njihovo uporabo s strani avstralskih organizacij. Preučujejo se zlasti elementi v zvezi z načrtovanjem projekta, razvojem, delovanjem, uporabo in vključenimi tveganji. Vprašanje te raziskave je torej:

»Kakšna je trenutna praksa podatkovno skladišče v Avstraliji?"

Za učinkovit odgovor na to vprašanje so potrebna številna pomožna raziskovalna vprašanja. Iz literature, ki je predstavljena v 2. poglavju, so bila opredeljena zlasti tri podvprašanja za vodenje tega raziskovalnega projekta: Kako so podatkovno skladišče avstralske organizacije? Kakšne so težave?

Kakšne so izkušnje?
Pri odgovorih na ta vprašanja je bila uporabljena raziskovalna raziskovalna zasnova z uporabo ankete. Kot raziskovalna študija odgovori na zgornja vprašanja niso popolni (Shanks et al. 1993, Denscombe 1998). V tem primeru je za izboljšanje odgovorov na ta vprašanja potrebna nekaj triangulacije. Vendar pa bo preiskava zagotovila trdne temelje za prihodnje delo pri preučevanju teh vprašanj. Podrobna razprava o utemeljitvi in zasnovi raziskovalne metode je predstavljena v 3. poglavju.

Struktura raziskovalnega projekta

Ta raziskovalni projekt je razdeljen na dva dela: kontekstualno študijo koncepta skladiščenja podatkov in empirično raziskavo (glej sliko 1.1), od katerih je vsak obravnavan spodaj.

I. del: Kontekstualna študija

Prvi del raziskave je obsegal pregled trenutne literature o različnih vrstah skladiščenja podatkov, vključno s sistemi za podporo odločanju (DSS), izvršnimi informacijskimi sistemi (EIS), študijami primerov podatkovno skladišče in koncepti podatkovno skladišče. Tudi rezultati forumov na podatkovno skladišče ter skupine strokovnjakov in praktikov, ki jih vodi raziskovalna skupina Monash DSS, so prispevale k tej fazi študije, katere namen je bil pridobiti vpogled v prakso podatkovno skladišče in prepoznati tveganja, povezana z njihovim sprejetjem. V tem obdobju kontekstualne študije je bilo vzpostavljeno razumevanje problemskega področja, ki je zagotovilo bazo znanja za nadaljnje empirične raziskave. Vendar je bil to stalen proces, ko je bila izvedena raziskovalna študija.

Del II: Empirične raziskave

Relativno nov koncept skladiščenja podatkov, zlasti v Avstraliji, je povzročil potrebo po anketi, da bi dobili široko sliko izkušenj z uporabo. Ta del je bil izveden, ko je bilo problemsko področje določeno z obsežnim pregledom literature. Koncept skladiščenja podatkov, oblikovan med fazo kontekstualne študije, je bil uporabljen kot vhodni podatek za začetni vprašalnik te študije. Po tem je bil vprašalnik pregledan. Ali ste strokovnjak za podatkovno skladišče sodeloval pri preizkusu. Namen testiranja začetnega vprašalnika je bil preveriti popolnost in točnost vprašanj. Na podlagi rezultatov testiranja je bil vprašalnik modificiran in spremenjena verzija poslana udeležencem ankete. Vrnjene vprašalnike smo nato analizirali za i Podatki v tabelah, diagramih in drugih oblikah. THE

rezultati analize Podatki ustvarite posnetek prakse skladiščenja podatkov v Avstraliji.

PREGLED SKLADIŠČA PODATKOV

Koncept skladiščenja podatkov se je razvil z izboljšavami računalniške tehnologije.
Namenjen je premagovanju težav, s katerimi se srečujejo skupine za podporo aplikacijam, kot sta sistem za podporo odločanju (DSS) in izvršni informacijski sistem (EIS).

V preteklosti je bila največja ovira teh aplikacij nezmožnost zagotavljanja a baza podatkov potrebno za analizo.
To je predvsem posledica narave dela uprave. Interesi vodstva podjetja se glede na področje, ki ga pokrivajo, nenehno spreminjajo. Zato i Podatki bistvenega pomena za te aplikacije se mora imeti možnost hitrega spreminjanja glede na del, ki ga je treba obdelati.
To pomeni, da i Podatki mora biti na voljo v ustrezni obliki za zahtevane analize. Pravzaprav je bilo skupinam za podporo aplikacij v preteklosti zelo težko zbirati in integrirati Podatki iz kompleksnih in raznolikih virov.

Preostanek tega razdelka predstavlja pregled koncepta skladiščenja podatkov in razpravlja o tem, kako podatkovno skladišče lahko premaga težave skupin za podporo aplikacij.
Izraz „Podatkovno skladiščeje populariziral William Inmon leta 1990. Njegova pogosto citirana definicija vidi Podatkovno skladišče kot zbirka Podatki predmetno usmerjena, integrirana, nehlapna in spremenljiva skozi čas, v podporo upravljavskim odločitvam.

Z uporabo te definicije Inmon poudarja, da i Podatki ki prebiva v a podatkovno skladišče mora imeti naslednje 4 lastnosti:

▪ Predmetno usmerjen
▪ Integrirano
▪ Nehlapno
▪ Spremenljiv skozi čas S predmetno usmerjenim Inmon pomeni, da i Podatki v podatkovno skladišče na največjih organizacijskih področjih, ki so bila

določeno v modelu Podatki. Na primer vse Podatki glede i stranke so v predmetnem področju STRANKE. Prav tako vse Podatki ki se nanašajo na izdelke, so vsebovane v predmetnem področju IZDELKI.

Integrirani Inmon pomeni, da i Podatki z različnih platform, sistemov in lokacij so združeni in shranjeni na enem mestu. Posledično Podatki podobne je treba preoblikovati v dosledne formate, da jih je mogoče zlahka dodati in primerjati.
Na primer, moški in ženski spol sta v enem sistemu predstavljena s črkama M in F, v drugem pa z 1 in 0. Za pravilno integracijo je treba enega ali oba formata preoblikovati tako, da sta oba formata enaka. V tem primeru bi lahko spremenili M v 1 in F v 0 ali obratno. Predmetno usmerjeni in integrirani kažejo, da je podatkovno skladišče je zasnovan tako, da zagotavlja funkcionalno in prečno vizijo Podatki s strani podjetja.

Z nehlapnim misli, da i Podatki v podatkovno skladišče ostati dosleden in posodabljati Podatki ni potrebno. Namesto tega vsaka sprememba v Podatki izvirniki so dodani Baza podatkov od podatkovno skladišče. To pomeni, da je zgodovinar na Podatki je vsebovan v podatkovno skladišče.

Za spremenljivke s časom Inmon kaže, da i Podatki v podatkovno skladišče vedno vsebujejo indikatorje tempa, npr Podatki običajno prečkajo določen časovni horizont. Na primer a
podatkovno skladišče lahko vsebuje 5 let zgodovinskih vrednosti stranke od 1993 do 1997. Razpoložljivost zgodovinskih in časovnih vrst Podatki omogoča analizo trendov.

Un podatkovno skladišče lahko zbira svoje Podatki iz sistemov OLTP; od izvora Podatki zunanji za organizacijo in/ali drugi posebni projekti sistema lovljenja Podatki.
I Podatki izvlečki lahko gredo skozi proces čiščenja, v tem primeru i Podatki se preoblikujejo in integrirajo, preden se shranijo v Baza podatkov od podatkovno skladišče. Potem jaz Podatki

ki prebiva znotraj Baza podatkov od podatkovno skladišče so na voljo za prijave končnih uporabnikov in orodja za obnovitev. Z uporabo teh orodij lahko končni uporabnik dostopa do integriranega pogleda organizacije Podatki.

I Podatki ki prebiva znotraj Baza podatkov od podatkovno skladišče shranjeni so tako v obliki podrobnosti kot povzetka.
Raven povzetka je lahko odvisna od narave Podatki. Podatki podrobno lahko vsebuje Podatki trenutni in Podatki zgodovinarji
I Podatki pravi niso vključeni v podatkovno skladišče dokler jaz Podatki v podatkovno skladišče se ponovno posodobijo.
Poleg shranjevanja Podatki sami, a podatkovno skladišče lahko shrani tudi drugačno vrsto datotek imenovan METADATOK, ki opisuje i Podatki ki prebiva v njegovem Baza podatkov.
Obstajata dve vrsti metapodatkov: razvojni metapodatki in analitični metapodatki.
Razvojni metapodatki se uporabljajo za upravljanje in avtomatizacijo postopkov ekstrahiranja, čiščenja, preslikave in nalaganja Podatki v podatkovno skladišče.
Informacije v razvojnih metapodatkih lahko vsebujejo podrobnosti o operacijskih sistemih, podrobnosti o elementih, ki jih je treba ekstrahirati, model Podatki od podatkovno skladišče in poslovna pravila za pretvorbo podatkov Podatki.

Druga vrsta metapodatkov, znana kot analitični metapodatki, omogoča končnemu uporabniku raziskovanje vsebine podatkovno skladišče najti Podatki na voljo in njihov pomen v jasnih, netehničnih izrazih.

Tako analitični metapodatki delujejo kot most med podatkovno skladišče in aplikacije za končne uporabnike. Ti metapodatki lahko vsebujejo poslovni model, opise Podatki ki ustrezajo poslovnemu modelu, vnaprej določene poizvedbe in poročila, informacije za uporabniški dostop in indeks.

Za pravilno delovanje je treba metapodatke o analizi in razvoju združiti v enega integriranega metapodatka zadrževanja.

Na žalost ima veliko obstoječih orodij lastne metapodatke in trenutno ni nobenih standardov za to

omogočajo orodjem za shranjevanje podatkov, da integrirajo te metapodatke. Da bi popravili to situacijo, je veliko prodajalcev vodilnih orodij za shranjevanje podatkov ustanovilo Svet za metapodatke, ki je kasneje postal Meta Data Coalition.

Cilj te koalicije je zgraditi standardni nabor metapodatkov, ki omogoča različnim orodjem za shranjevanje podatkov pretvorbo metapodatkov
Njihova prizadevanja so privedla do rojstva specifikacije za izmenjavo meta podatkov (MDIS), ki bo omogočila izmenjavo informacij med Microsoftovimi arhivi in povezanimi datotekami MDIS.

Obstoj oz Podatki tako povzeto/indeksirano kot podrobno, daje uporabniku možnost, da izvede DRILL DROWN (vrtanje) iz Podatki indeksirane v podrobne in obratno. Obstoj Podatki podrobna zgodovina omogoča ustvarjanje analiz trendov skozi čas. Poleg tega se metapodatki analize lahko uporabljajo kot imenik del Baza podatkov od podatkovno skladišče za pomoč končnim uporabnikom pri iskanju i Podatki potrebno.

V primerjavi s sistemi OLTP, s svojo sposobnostjo podpore analizi Podatki in poročanje, podatkovno skladišče obravnava se kot primernejši sistem za informacijske procese, kot so izdelava poizvedb in odgovarjanje nanje ter izdelava poročil. V naslednjem razdelku bodo podrobno poudarjene razlike med obema sistemoma.

PODATKOVNO SKLADIŠČE PROTI SISTEMOM OLTP

Številni informacijski sistemi v organizacijah so namenjeni podpori vsakodnevnega delovanja. Ti sistemi, znani kot OLTP SYSTEMS, zajemajo dnevne transakcije, ki se nenehno posodabljajo.

I Podatki znotraj teh sistemov so pogosto spremenjeni, dodani ali izbrisani. Na primer, naslov stranke se spremeni, ko se premika iz kraja v kraj. V tem primeru bo nov naslov registriran s spremembo naslovnega polja Baza podatkov. Glavni cilj teh sistemov je znižati transakcijske stroške in hkrati skrajšati procesne čase. Primeri sistemov OLTP vključujejo kritična dejanja, kot so beleženje naročil, plačilne liste, računi, proizvodnja, storitve za stranke stranke.

Za razliko od sistemov OLTP, ki so bili ustvarjeni za procese na podlagi transakcij in dogodkov, tj podatkovno skladišče so bili ustvarjeni za zagotavljanje podpore procesom, ki temelji na analitiki Podatki in o postopkih odločanja.

To se običajno doseže z integracijo i Podatki iz različnih OLTP in zunanjih sistemov v enem samem »vsebniku«. Podatki, kot je razloženo v prejšnjem razdelku.

Model procesa skladiščenja podatkov Monash

Procesni model za podatkovno skladišče Monash so razvili raziskovalci raziskovalne skupine Monash DSS in temelji na literaturi podatkovno skladišče, izkušnje na področjih podpornih razvojnih sistemov, pogovori s prodajalci aplikacij za uporabo na podatkovno skladišče, o skupini strokovnjakov za uporabo podatkovno skladišče.

Faze so: začetek, načrtovanje, razvoj, operacije in razlaga. Diagram pojasnjuje iterativno ali evolucijsko naravo razvoja a podatkovno skladišče postopek z dvosmernimi puščicami, nameščenimi med različnimi fazami. V tem kontekstu "iterativno" in "evolucijsko" pomenita, da se lahko na vsakem koraku procesa izvedbene dejavnosti vedno širijo nazaj na prejšnjo stopnjo. To je posledica narave projekta podatkovno skladišče pri katerem se kadarkoli pojavijo dodatne zahteve s strani končnega uporabnika. Na primer med razvojno fazo procesa podatkovno skladiščeČe končni uporabnik zahteva novo velikost predmeta ali površino, ki ni bila del prvotnega načrta, jo je treba dodati v sistem. To povzroči spremembo projekta. Posledica tega je, da mora oblikovalska ekipa med fazo načrtovanja spremeniti zahteve do sedaj ustvarjenih dokumentov. V mnogih primerih se mora trenutno stanje projekta vrniti vse do faze načrtovanja, kjer je treba dodati in dokumentirati nove zahteve. Končnemu uporabniku mora biti omogočen vpogled v specifično pregledano dokumentacijo in spremembe, ki so bile narejene v razvojni fazi. Na koncu tega razvojnega cikla mora projekt dobiti dobre povratne informacije tako od razvojne kot uporabniške ekipe. Povratne informacije se nato ponovno uporabijo za izboljšanje prihodnjega projekta.

Načrtovanje zmogljivosti
dw so ponavadi zelo velike in zelo hitro rastejo (Best 1995, Rudin 1997a) zaradi količine Podatki zgodovinske, ki jih ohranjajo iz svojega trajanja. Rast je lahko tudi posledica Podatki dodatki, ki jih zahtevajo uporabniki za povečanje vrednosti Podatki ki jih že imajo. Posledično so zahteve za shranjevanje za Podatki se lahko bistveno poveča (Eckerson 1997). Zato je bistveno zagotoviti z načrtovanjem zmogljivosti, da lahko sistem, ki ga je treba zgraditi, raste z rastjo potreb (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Pri načrtovanju razširljivosti podatkovnega skladišča je treba poznati pričakovano rast velikosti skladišča, vrste vprašanj, ki bodo verjetno postavljena, in število podprtih končnih uporabnikov (Best 1995, Rudin 1997b, Foley 1997a). Gradnja razširljivih aplikacij zahteva kombinacijo razširljivih strežniških tehnologij in tehnik načrtovanja razširljivih aplikacij (Best 1995, Rudin 1997b. Oboje je potrebno pri izdelavi visoko razširljive aplikacije. Razširljive strežniške tehnologije lahko olajšajo in stroškovno učinkovito dodajajo prostor za shranjevanje, pomnilnik in CPE brez slabša zmogljivost (Lang 1997, Telefonija 1997).

Obstajata dve glavni razširljivi strežniški tehnologiji: simetrično večkratno procesiranje (SMP) in masivno vzporedno procesiranje (MPP) (IDC 1997, Humphries et al. 1999). Strežnik SMP ima običajno več procesorjev, ki si delijo pomnilnik, sistemska vodila in druge vire (IDC 1997, Humphries et al. 1999). Za izboljšanje je mogoče dodati dodatne procesorje morda računski. Druga metoda za povečanje morda izračunavanje strežnika SMP je združiti številne stroje SMP. Ta tehnika je znana kot združevanje (Humphries et al. 1999). Strežnik MPP pa ima več procesorjev, od katerih ima vsak svoj pomnilnik, sistem vodila in druge vire (IDC 1997, Humphries et al. 1999). Vsak procesor se imenuje vozlišče. Povečanje v morda mogoče pridobiti računsko

dodajanje dodatnih vozlišč MPP strežnikom (Humphries et al. 1999).

Slabost strežnikov SMP je, da lahko preveč vhodno-izhodnih (I/O) operacij obremeni sistem vodila (IDC 1997). Ta težava se ne pojavi v strežnikih MPP, saj ima vsak procesor svoj sistem vodil. Vendar pa so medsebojne povezave med posameznimi vozlišči na splošno veliko počasnejše od sistema vodil SMP. Poleg tega lahko strežniki MPP razvijalcem aplikacij dodajo dodatno plast kompleksnosti (IDC 1997). Tako lahko na izbiro med strežniki SMP in MPP vpliva veliko dejavnikov, vključno s kompleksnostjo aplikacij, razmerjem med ceno in zmogljivostjo, zahtevano prepustnostjo, preprečenimi aplikacijami dw in povečanjem velikosti Baza podatkov dw in v številu končnih uporabnikov.

Pri načrtovanju zmogljivosti je mogoče uporabiti številne tehnike načrtovanja razširljivih aplikacij. Uporabljajo se različna obdobja poročanja, kot so dnevi, tedni, meseci in leta. Ob različnih rokih obveščanja, Baza podatkov lahko razdelimo na obvladljivo združene dele (Inmon et al. 1997). Druga tehnika je uporaba zbirnih tabel, ki so sestavljene s povzemanjem Podatki da Podatki podrobno. Tako, i Podatki povzetki so bolj kompaktni kot podrobni, kar zahteva manj pomnilniškega prostora. Torej Podatki podrobnosti je mogoče arhivirati v cenejšo enoto za shranjevanje, kar prihrani še več prostora. Medtem ko uporaba tabel s povzetki lahko prihrani prostor za shranjevanje, je treba vložiti veliko truda, da ostanejo posodobljene in v skladu s poslovnimi potrebami. Vendar se ta tehnika pogosto uporablja in se pogosto uporablja v povezavi s prejšnjo tehniko (Best 1995, Inmon 1996a, Chauduri in Dayal
1997).

Določitev Podatkovno skladišče Tehnične arhitekture Opredelitev tehnik arhitekture dw

Prvi uporabniki podatkovnega skladiščenja so si zamislili predvsem centralizirano implementacijo podatkovnega skladišča, kjer bi vsi Podatki, vključno z i Podatki zunanje, bile povezane v enotno,
fizični repozitorij (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Glavna prednost tega pristopa je, da lahko končni uporabniki dostopajo do pogleda celotnega podjetja Podatki organizacijski (Ovum 1998). Še en plus je, da ponuja standardizacijo Podatki v celotni organizaciji, kar pomeni, da obstaja samo ena različica ali definicija za vsako terminologijo, uporabljeno v metapodatkih repozitorija (Flanagan in Safdie 1997, Ovum 1998). Po drugi strani pa je slabost tega pristopa, da je drag in ga je težko zgraditi (Flanagan in Safdie 1997, Ovum 1998, Inmon et al. 1998). Kmalu po arhitekturi shranjevanja Podatki centralizirano je postalo priljubljeno, razvil se je koncept rudarjenja najmanjših podmnožic bogov Podatki za podporo potrebam posebnih aplikacij (Varney 1996, IDC 1997, Berson in Smith 1997, peacock 1998). Ti majhni sistemi izhajajo iz večjega podatkovno skladišče centralizirano. So imenovani podatkovno skladišče borze podatkov zaposlenih v oddelkih ali zaposlenih. Odvisna arhitektura podatkovnega trga je znana kot trinivojska arhitektura, kjer prvo raven sestavljajo podatkovno skladišče centralizirana, drugo sestavljajo depoziti Podatki oddelčni, tretjo pa sestavlja dostop do Podatki in z orodji za analizo (Demarest 1994, Inmon et al. 1997).

Podatkovne tržnice so običajno zgrajene po podatkovno skladišče centralizirana je bila zgrajena za izpolnjevanje potreb posebnih enot (White 1995, Varney 1996).
Podatkovne trgovine i Podatki pomembne za posamezne enote (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

Prednost te metode je, da ne bo datotek ni integriran in da i Podatki bo manj odveč v podatkovnih marcah, saj vsi Podatki prihajajo iz depozita v višini Podatki integrirano. Druga prednost je, da bo manj povezav med posameznim podatkovnim trgom in njegovimi viri Podatki ker ima vsak podatkovni boks samo en vir Podatki. Poleg tega lahko s to arhitekturo končni uporabniki še vedno dostopajo do Podatki

korporativne organizacije. Ta metoda je znana kot metoda od zgoraj navzdol, kjer so podatkovne vitrine zgrajene po podatkovno skladišče (pav 1998, Goff 1998).
Ker je potreba po zgodnjem prikazovanju rezultatov vedno večja, so nekatere organizacije začele graditi neodvisne podatkovne borze (Flanagan in Safdie 1997, White 2000). V tem primeru bodo podatkovne tržnice dobile svoje Podatki naravnost iz osnov Podatki OLTP in ne-OLTP iz centraliziranega in integriranega repozitorija, s čimer se odpravi potreba po osrednjem repozitoriju.

Vsak podatkovni boks zahteva vsaj eno povezavo do svojih virov Podatki. Ena od pomanjkljivosti več povezav do vsakega podatkovnega boksa je ta, da je v primerjavi s prejšnjima dvema arhitekturama preveliko število Podatki znatno poveča.

Vsaka podatkovna trgovina mora hraniti vse Podatki zahteva lokalno, da ne vpliva na sisteme OLTP. To povzroča i Podatki shranjeni so v različnih skladiščih podatkov (Inmon et al. 1997). Druga pomanjkljivost te arhitekture je, da vodi do ustvarjanja kompleksnih medsebojnih povezav med podatkovnimi marcami in njihovimi viri podatkov. Podatki ki jih je težko izvajati in nadzorovati (Inmon et al. 1997).

Druga pomanjkljivost je, da končni uporabniki morda ne bodo mogli dostopati do pregleda informacij o podjetju, ker i Podatki različnih podatkovnih vitrin niso integrirani (Ovum 1998).
Še ena pomanjkljivost je, da lahko obstaja več kot ena definicija za vsako terminologijo, uporabljeno v podatkovnih marcah, ki ustvarja nedoslednosti podatkov. Podatki v organizaciji (Ovum 1998).
Kljub zgoraj omenjenim pomanjkljivostim samostojni podatkovni trgi še vedno pritegnejo zanimanje mnogih organizacij (IDC 1997). Eden od dejavnikov, zaradi katerih so privlačni, je, da se hitreje razvijejo in zahtevajo manj časa in sredstev (Bresnahan 1996, Berson in Smith 1997, Ovum 1998). Posledično služijo predvsem kot testni načrti, ki jih je mogoče uporabiti za hitro prepoznavanje prednosti in/ali pomanjkljivosti v načrtu (Parsaye 1995, Braly 1995, Newing 1996). V tem primeru mora biti del, ki se izvaja v pilotnem projektu, majhen, a pomemben za organizacijo (Newing 1996, Mansell-Lewis 1996).

S pregledom prototipa se lahko končni uporabniki in vodstvo odločijo, ali bodo projekt nadaljevali ali ustavili (Flanagan in Safdie 1997).
Če naj se odločitev nadaljuje, je treba podatkovne borze za druge industrije graditi enega za drugim. Obstajata dve možnosti za končne uporabnike, ki temeljijo na njihovih potrebah pri izdelavi neodvisnih podatkovnih matrov: integrirano/zvezno in neintegrirano (Ovum 1998).

Pri prvi metodi je treba vsako novo podatkovno borzo zgraditi na podlagi trenutne podatkovne borze in modela Podatki ki jih uporablja podjetje (Varney 1996, Berson in Smith 1997, Peacock 1998). Potreba po uporabi modela Podatki podjetja pomeni, da je treba zagotoviti, da obstaja samo ena definicija za vsako terminologijo, ki se uporablja v podatkovnih borzah, tudi za zagotovitev, da je mogoče različne podatkovne borze združiti, da se zagotovi pregled informacij podjetja (Bresnahan 1996). To metodo imenujemo metoda od spodaj navzgor in jo je najbolje uporabiti, kadar so finančna sredstva in čas omejeni (Flanagan in Safdie 1997, Ovum 1998, peacock 1998, Goff 1998). Pri drugi metodi lahko zgrajeni podatkovni marti zadovoljijo samo potrebe določene enote. Različica zveznega podatkovnega trga je podatkovno skladišče razdeljen, v katerem je Baza podatkov Vmesna programska oprema strežnika zvezdišča se uporablja za združevanje številnih podatkovnih stojnic v en sam repozitorij Podatki porazdeljeno (White 1995). V tem primeru i Podatki podjetja so porazdeljena v več podatkovnih prodajalnah. Zahteve končnih uporabnikov se posredujejo Baza podatkov vmesna programska oprema strežnika zvezdišča, ki ekstrahira vse Podatki ki jih zahtevajo podatkovni borzi, in rezultate vrne aplikacijam končnih uporabnikov. Ta metoda zagotavlja poslovne informacije končnim uporabnikom. Težave neodvisnih podatkovnih borz pa še vedno niso odpravljene. Obstaja še ena arhitektura, ki se lahko uporablja in se imenuje podatkovno skladišče virtualno (White 1995). Vendar pa ta arhitektura, ki je prikazana na sliki 2.9, ni arhitektura za shranjevanje podatkov Podatki resnično, saj ne premakne obremenitve iz sistemov OLTP na podatkovno skladišče (Demarest 1994).

Pravzaprav zahteve za Podatki s strani končnih uporabnikov jih posreduje sistemom OLTP, ki vrnejo rezultate po obdelavi uporabniških zahtev. Čeprav ta arhitektura omogoča končnim uporabnikom ustvarjanje poročil in vlaganje zahtev, ne more zagotoviti i

Podatki zgodovina in pregled informacij podjetja od i Podatki ker različni sistemi OLTP niso integrirani. Zato ta arhitektura ne more zadovoljiti analize Podatki kot so napovedi.

Izbira aplikacij za dostop in obnovitev podatkov Podatki

Namen gradnje a podatkovno skladišče je posredovanje informacij končnim uporabnikom (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); eno ali več aplikacij za dostop in obnovitev Podatki je treba zagotoviti. Do danes je na voljo široka paleta takih aplikacij, med katerimi lahko uporabnik izbira (Hammergren 1998, Humphries et al. 1999). Izbrane aplikacije določajo uspešnost skladiščenja Podatki v organizaciji, ker so aplikacije najbolj viden del podatkovno skladišče do končnega uporabnika (Inmon et al. 1997, Poe 1996). Biti uspešen a podatkovno skladišče, mora biti sposoben podpirati dejavnosti analize podatkov Podatki končnega uporabnika (Poe 1996, Seddon in Benjamin 1998, Eckerson 1999). Zato je treba določiti "raven", kaj končni uporabnik želi (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

Na splošno lahko končne uporabnike razvrstimo v tri kategorije: vodilne uporabnike, poslovne analitike in napredne uporabnike (Poe 1996, Humphries et al. 1999). Izvršni uporabniki potrebujejo enostaven dostop do vnaprej določenih nizov poročil (Humphries et al. 1999). Do teh poročil je mogoče enostavno dostopati z navigacijo po meniju (Poe 1996). Poleg tega morajo poročila predstavljati informacije z uporabo grafične predstavitve, kot so tabele in predloge, da se informacije hitro posredujejo (Humphries et al. 1999). Poslovni analitiki, ki morda nimajo tehničnih zmožnosti, da bi sami razvili poročila iz nič, morajo imeti možnost prilagoditi trenutna poročila, da bodo ustrezala njihovim posebnim potrebam (Poe 1996, Humphries et al. 1999). Po drugi strani pa so napredni uporabniki tip končnega uporabnika, ki ima možnost ustvariti in napisati zahteve in poročila iz nič (Poe 1996, Humphries et al. 1999). Oni so tisti, ki

gradijo odnose za druge vrste uporabnikov (Poe 1996, Humphries et al. 1999).

Ko so zahteve končnega uporabnika določene, je treba izbrati aplikacije za dostop in obnovitev Podatki med vsemi razpoložljivimi (Poe 1996, Inmon et al. 1997).
Dostop do Podatki in orodja za iskanje lahko razvrstimo v 4 vrste: orodje OLAP, orodje EIS/DSS, orodje za poizvedovanje in poročanje ter orodje za rudarjenje podatkov.

Orodja OLAP uporabnikom omogočajo ustvarjanje ad hoc poizvedb, pa tudi tistih, narejenih na Baza podatkov od podatkovno skladišče. Poleg tega ti izdelki uporabnikom omogočajo, da se poglobijo Podatki splošno do podrobno.

Orodja EIS/DSS zagotavljajo izvršno poročanje, kot je analiza »kaj če« in dostop do poročil, ki temeljijo na menijih. Poročila morajo biti vnaprej določena in združena z meniji za lažjo navigacijo.
Orodja za poizvedbe in poročanje uporabnikom omogočajo izdelavo vnaprej določenih in specifičnih poročil.

Orodja za rudarjenje podatkov se uporabljajo za prepoznavanje odnosov, ki bi lahko osvetlili pozabljene operacije Podatki podatkovnega skladišča.

Poleg optimizacije zahtev vsakega tipa uporabnika morajo biti izbrana orodja intuitivna, učinkovita in enostavna za uporabo. Prav tako morajo biti združljivi z drugimi deli arhitekture in sposobni delati z obstoječimi sistemi. Priporočljivo je tudi, da izberete orodja za dostop in iskanje podatkov z razumno ceno in zmogljivostjo. Druga merila, ki jih je treba upoštevati, vključujejo zavezanost prodajalca orodja k podpori njihovega izdelka in razvoj, ki ga bo imel v prihodnjih izdajah. Da bi zagotovili sodelovanje uporabnikov pri uporabi podatkovnega skladišča, razvojna ekipa uporabnike vključi v postopek izbire orodja. V tem primeru je treba izvesti praktično oceno uporabnika.

Za povečanje vrednosti podatkovnega skladišča lahko razvojna ekipa zagotovi tudi spletni dostop do svojih podatkovnih skladišč. Spletno podatkovno skladišče omogoča uporabnikom dostop do Podatki iz oddaljenih krajev ali med potovanjem. Tudi informacije lahko

zagotoviti po nižji ceni z znižanjem stroškov usposabljanja.

2.4.3 Podatkovno skladišče Faza delovanja

To fazo sestavljajo tri aktivnosti: definiranje strategij osveževanja podatkov, nadzor nad aktivnostmi podatkovnega skladišča in upravljanje varnosti podatkovnega skladišča.

Opredelitev strategij osveževanja podatkov

Po začetnem nalaganju, tj Podatki v Baza podatkov podatkovnega skladišča je treba redno osveževati, da se ponovijo spremembe, narejene na Podatki originali. Zato se morate odločiti, kdaj osvežiti, kako pogosto naj bo osveževanje načrtovano in kako osvežiti Podatki. Priporoča se osvežitev Podatki ko je mogoče sistem preklopiti brez povezave. Hitrost osveževanja določi razvojna ekipa glede na zahteve uporabnikov. Obstajata dva pristopa za osveževanje podatkovnega skladišča: popolno osveževanje in stalno nalaganje sprememb.

Prvi pristop, popolna osvežitev, zahteva ponovno nalaganje vseh Podatki iz nič. To pomeni, da vse Podatki potrebno je treba ekstrahirati, očistiti, preoblikovati in vključiti v vsako osvežitev. Temu pristopu se je treba izogibati, kadar koli je to mogoče, saj zahteva veliko časa in sredstev.

Alternativni pristop je nenehno nalaganje sprememb. To doda i Podatki ki so se spremenili od zadnjega cikla osveževanja podatkovnega skladišča. Prepoznavanje novih ali spremenjenih zapisov bistveno zmanjša količino Podatki ki jih je treba pri vsaki posodobitvi propagirati v podatkovno skladišče kot le te Podatki bo dodano Baza podatkov podatkovnega skladišča.

Obstaja vsaj 5 pristopov, ki jih je mogoče uporabiti za umik i Podatki nov ali spremenjen. Za doseganje učinkovite strategije osveževanja videa Podatki uporabna je lahko mešanica teh pristopov, ki pridobijo vse spremembe v sistemu.

Prvi pristop, ki uporablja časovne žige, predvideva, da so vsi dodeljeni Podatki uredil in posodobil časovni žig, tako da lahko preprosto prepoznate vse Podatki spremenjeno in novo. Vendar ta pristop v večini današnjih operacijskih sistemov ni bil široko uporabljen.
Drugi pristop je uporaba delta datoteke, ustvarjene v aplikaciji, ki vsebuje samo spremembe, narejene v Podatki. Uporaba te datoteke tudi poveča cikel posodabljanja. Vendar tudi ta metoda ni bila uporabljena v mnogih aplikacijah.
Tretji pristop je skeniranje dnevniške datoteke, ki v bistvu vsebuje informacije, podobne delta datoteki. Edina razlika je v tem, da se dnevniška datoteka ustvari za postopek obnovitve in jo je težko razumeti.
Četrti pristop je spreminjanje kode aplikacije. Vendar je večina programske kode stara in krhka; zato se je treba tej tehniki izogibati.
Zadnji pristop je primerjava i Podatki vire z glavno datoteko dei Podatki.

Spremljanje dejavnosti podatkovnega skladišča

Ko je podatkovno skladišče izdano uporabnikom, ga je treba skozi čas spremljati. V tem primeru lahko skrbnik podatkovnega skladišča uporabi eno ali več orodij za upravljanje in nadzor za spremljanje uporabe podatkovnega skladišča. Zlasti se lahko zbirajo informacije o ljudeh in o času njihovega dostopa do podatkovnega skladišča. pridi no Podatki zbrani, se lahko ustvari profil opravljenega dela, ki se lahko uporabi kot vnos pri izvajanju povratne bremenitve uporabnika. Chargeback omogoča uporabnikom, da so obveščeni o stroških obdelave podatkovnega skladišča.

Poleg tega se lahko revizija podatkovnega skladišča uporablja tudi za identifikacijo vrst poizvedb, njihove velikosti, števila poizvedb na dan, reakcijskih časov poizvedbe, doseženih sektorjev in količine Podatki obdelan. Drugi namen izvajanja revizije podatkovnega skladišča je identificirati Podatki ki niso v uporabi. te Podatki jih je mogoče odstraniti iz podatkovnega skladišča, da izboljšajo čas

odziva na izvedbo poizvedbe in nadzirati rast Podatki ki prebivajo znotraj baza podatkov podatkovnega skladišča.

Upravljanje varnosti podatkovnega skladišča

Skladišče podatkov vsebuje Podatki integriran, kritičen, občutljiv, ki ga je mogoče zlahka doseči. Zaradi tega ga je treba zaščititi pred nepooblaščenimi uporabniki. Eden od načinov implementacije varnosti je uporaba funkcije del DBMS za dodelitev različnih privilegijev različnim vrstam uporabnikov. Na ta način je treba vzdrževati profil dostopa za vsako vrsto uporabnika. Drug način za zaščito podatkovnega skladišča je šifriranje, kot je zapisano v baza podatkov podatkovnega skladišča. Dostop do Podatki in orodja za iskanje morajo dešifrirati Podatki pred predstavitvijo rezultatov uporabnikom.

2.4.4 Podatkovno skladišče Faza uvajanja

Je zadnja faza v ciklu implementacije podatkovnega skladišča. Aktivnosti, ki jih bomo izvajali v tej fazi, vključujejo usposabljanje uporabnikov za uporabo podatkovnega skladišča in izvedbo pregledov podatkovnega skladišča.

Usposabljanje uporabnikov

Pred dostopom je treba izvesti usposabljanje uporabnikov Podatki podatkovnega skladišča in uporabo orodij za iskanje. Na splošno se morajo seje začeti z uvodom v koncept shranjevanja Podatki, vsebina podatkovnega skladišča, meta Podatki in osnovne značilnosti orodij. Nato lahko naprednejši uporabniki preučijo tudi fizične tabele in funkcije uporabnikov orodij za dostop do podatkov in iskanje.

Obstaja veliko pristopov za usposabljanje uporabnikov. Ena od teh vključuje izbor številnih uporabnikov ali analitikov, izbranih iz skupine uporabnikov, na podlagi njihovih vodstvenih in komunikacijskih sposobnosti. Ti so osebno usposobljeni za vse, kar morajo vedeti, da se seznanijo s sistemom. Po usposabljanju se vrnejo na svoja delovna mesta in začnejo učiti druge uporabnike o uporabi sistema. Na

Na podlagi tega, kar so se naučili, lahko drugi uporabniki začnejo raziskovati podatkovno skladišče.
Drug pristop je usposabljanje več uporabnikov hkrati, kot da bi se usposabljali v učilnici. Ta metoda je primerna, ko je veliko uporabnikov, ki jih je treba usposabljati hkrati. Še ena metoda je usposabljanje vsakega uporabnika posebej, enega za drugim. Ta metoda je primerna, če je malo uporabnikov.

Namen usposabljanja uporabnikov je seznanitev z dostopanjem Podatki in orodja za iskanje ter vsebino podatkovnega skladišča. Vendar pa bodo nekateri uporabniki morda preobremenjeni s količino informacij, ki so bile posredovane med vadbo. Nato je treba opraviti številne osvežitvene seje za stalno podporo in odgovoriti na določena vprašanja. V nekaterih primerih se za tovrstno podporo oblikuje uporabniška skupina.

Zbiranje povratnih informacij

Ko je podatkovno skladišče uvedeno, lahko uporabniki uporabljajo i Podatki ki se nahajajo v podatkovnem skladišču za različne namene. Večinoma analitiki ali uporabniki uporabljajo i Podatki v podatkovnem skladišču za:

1 Prepoznajte trende podjetja
2. Analizirajte nakupovalne profile stranke
3 Razdeli i stranke in i
4 Zagotovite najboljše storitve za stranke – prilagodite storitve
5 Oblikujte strategije trženje
6 Ustvarite konkurenčne ponudbe za analizo stroškov in pomoč pri nadzoru
7 Podpora strateškemu odločanju
8 Prepoznajte priložnosti, ki se bodo pojavile
9 Izboljšati kakovost tekočih poslovnih procesov
10 Preverite dobiček

V skladu z razvojno usmeritvijo podatkovnega skladišča bi lahko izvedli vrsto pregledov sistema, da bi pridobili povratne informacije

tako s strani razvojne ekipe kot s strani skupnosti končnih uporabnikov.
Dobljene rezultate lahko upoštevamo v naslednjem razvojnem ciklu.

Ker ima podatkovno skladišče postopen pristop, se je bistveno učiti iz uspehov in napak prejšnjega razvoja.

2.5 Povzetek

V tem poglavju so obravnavani pristopi, ki so prisotni v literaturi. V 1. razdelku je bil obravnavan koncept podatkovnega skladišča in njegova vloga v znanosti odločanja. V 2. razdelku so opisane glavne razlike med podatkovnimi skladišči in sistemi OLTP. V 3. razdelku je bil obravnavan model podatkovnega skladišča Monash, ki je bil uporabljen v 4. razdelku za opis dejavnosti, vključenih v proces razvoja podatkovnega skladišča, te trditve niso temeljile na temeljitih raziskavah. Kar se v resnici zgodi, se lahko zelo razlikuje od poročanja literature, vendar se lahko ti rezultati uporabijo za ustvarjanje osnovne prtljage, ki poudarja koncept podatkovnega skladišča za to raziskavo.

3. poglavje

Raziskovalne in oblikovalske metode

To poglavje obravnava raziskovalne in oblikovalske metode za to študijo. V prvem delu je prikazan splošen pogled na raziskovalne metode, ki so na voljo za iskanje informacij, poleg tega pa so obravnavana merila za izbiro najboljše metode za posamezno študijo. V razdelku 2 sta nato obravnavani dve metodi, izbrani z zgornjimi merili; eno od teh bo izbrano in sprejeto zaradi razlogov, določenih v oddelku 3, kjer so navedeni tudi razlogi za izključitev drugega merila. V 4. delu je predstavljen raziskovalni projekt, v 5. delu pa zaključki.

3.1 Raziskovanje informacijskih sistemov

Raziskave informacijskih sistemov niso zgolj omejene na tehnološko področje, ampak jih je treba razširiti tudi na vedenjske in organizacijske cilje.
To dolgujemo tezam različnih disciplin, od družboslovja do naravoslovja; to vodi do potrebe po določenem spektru raziskovalnih metod, ki vključujejo kvantitativne in kvalitativne metode, ki se uporabljajo za informacijske sisteme.
Pomembne so vse razpoložljive raziskovalne metode, pravzaprav več raziskovalcev, kot so Jenkins (1985), Nunamaker et al. (1991) in Galliers (1992) trdita, da ne obstaja posebna univerzalna metoda za izvajanje raziskav na različnih področjih informacijskih sistemov; dejansko je lahko metoda primerna za določeno raziskavo, za druge pa ne. To nas vodi do potrebe po izbiri metode, ki je primerna za naš poseben raziskovalni projekt: za to izbiro Benbasat et al. (1987) navajajo, da je treba upoštevati naravo in namen raziskave.

3.1.1 Narava raziskave

Različne raziskovalne metode, ki temeljijo na naravi, lahko razvrstimo v tri splošno znane tradicije v informacijski znanosti: pozitivistično, interpretativno in kritično raziskovanje.

3.1.1.1 Pozitivistične raziskave

Pozitivistična raziskava je znana tudi kot znanstvena ali empirična študija. Prizadeva si: "pojasniti in napovedati, kaj se bo zgodilo v družbenem svetu, s pogledom na pravilnosti in vzročno-posledične odnose med elementi, ki ga sestavljajo" (Shanks et al 1993).

Za pozitivistične raziskave so značilne tudi ponovljivost, poenostavitve in ovržbe. Poleg tega pozitivistične raziskave priznavajo obstoj apriornih odnosov med proučevanimi pojavi.
Po Galliersu (1992) je taksonomija raziskovalna metoda, vključena v pozitivistično paradigmo, ki pa ni omejena na to, v resnici obstajajo laboratorijski poskusi, terenski poskusi, študije primerov, demonstracije izrekov, napovedi in simulacije. Z uporabo teh metod raziskovalci priznavajo, da je mogoče proučevane pojave opazovati objektivno in dosledno.

3.1.1.2 Interpretativne raziskave

Neuman (1994) opisuje interpretativno raziskovanje, ki se pogosto imenuje fenomenologija ali antipozitivizem, kot »sistematično analizo družbenega pomena delovanja z neposrednim in podrobnim opazovanjem ljudi v naravnih situacijah, da bi prišli do razumevanja in interpretacija tega, kako ljudje ustvarjajo in vzdržujejo svoj družbeni svet«. Interpretativne študije zavračajo predpostavko, da je mogoče opazovane pojave opazovati objektivno. Pravzaprav temeljijo na subjektivnih interpretacijah. Poleg tega interpretativni raziskovalci fenomenom, ki jih preučujejo, ne vsiljujejo apriornih pomenov.

Ta metoda vključuje subjektivne/argumentativne študije, akcijske raziskave, deskriptivne/interpretativne študije, raziskave prihodnosti in igranje vlog. Poleg teh raziskav so lahko v ta pristop vključene tudi študije primerov, saj zadevajo študije posameznikov ali organizacij v zapletenih situacijah v realnem svetu.

3.1.1.3 Kritično raziskovanje

Kritično iskanje je najmanj poznan pristop v družbenih vedah, vendar je nedavno prejel pozornost raziskovalcev na področju informacijskih sistemov. Filozofska predpostavka, da družbeno realnost zgodovinsko proizvajajo in reproducirajo ljudje, pa tudi družbeni sistemi s svojimi dejanji in interakcijami. Njihova sposobnost pa je pogojena s številnimi družbenimi, kulturnimi in političnimi premisleki.

Tako kot interpretativne raziskave tudi kritične raziskave trdijo, da pozitivistične raziskave nimajo nič skupnega z družbenim kontekstom in zanemarjajo njihov vpliv na človeška dejanja.
Kritične raziskave na drugi strani kritizirajo interpretativne raziskave, ker so preveč subjektivne in ker niso namenjene ljudem pomagati izboljšati njihova življenja. Največja razlika med kritično raziskavo in drugima dvema pristopoma je njena evalvativna dimenzija. Medtem ko je objektivnost pozitivistične in interpretativne tradicije predvidevanje ali razlaga statusa quo ali družbene realnosti, je namen kritične raziskave kritično ovrednotiti in preoblikovati preučevano družbeno realnost.

Kritični raziskovalci običajno nasprotujejo statusu quo, da bi odpravili socialne razlike in izboljšali družbene razmere. Kritična raziskava se zavzema za procesni pogled na pojav, ki nas zanima, in je zato običajno longitudinalna. Primeri raziskovalnih metod so dolgoročne zgodovinske študije in etnografske študije. Kritično iskanje pa ni bilo široko uporabljeno v raziskavah informacijskih sistemov

3.1.2 Namen raziskave

Skupaj z naravo raziskave je njen namen lahko vodilo raziskovalca pri izbiri določene raziskovalne metode. Obseg raziskovalnega projekta je tesno povezan s položajem raziskave v raziskovalnem ciklu, ki je sestavljen iz treh faz: izgradnje teorije, testiranja teorije in izpopolnjevanja teorije. Tako ima lahko raziskovalni projekt na podlagi zagona glede na raziskovalni cikel pojasnjevalni, opisni, raziskovalni ali napovedni namen.

3.1.2.1 Raziskovalne raziskave

Raziskovalno raziskovanje je namenjeno raziskovanju popolnoma nove teme ter oblikovanju vprašanj in hipotez za prihodnje raziskave. Ta vrsta raziskave se uporablja pri izgradnji teorije za pridobitev začetnih referenc na novem področju. Običajno se uporabljajo kvalitativne raziskovalne metode, kot so študije primerov ali fenomenološke študije.

Vendar pa je mogoče uporabiti tudi kvantitativne tehnike, kot so raziskovalne raziskave ali poskusi.

3.1.3.3 Opisno iskanje

Deskriptivna raziskava je namenjena analizi in zelo podrobnemu opisu določene situacije ali organizacijske prakse. To je primerno za gradnjo teorij in se lahko uporablja tudi za potrditev ali izpodbijanje hipotez. Deskriptivna raziskava običajno vključuje uporabo meritev in vzorcev. Primerne raziskovalne metode vključujejo ankete in analize ozadja.

3.1.2.3 Razlagalne raziskave

Razlagalne raziskave poskušajo razložiti, zakaj se stvari dogajajo. Gradi na dejstvih, ki so bila že raziskana, in poskuša najti razloge za ta dejstva.
Tako je razlagalno raziskovanje običajno zgrajeno na vrhu raziskovalnega ali opisnega raziskovanja in je pomožno pri testiranju in izpopolnjevanju teorij. Razlagalne raziskave običajno uporabljajo študije primerov ali raziskovalne metode, ki temeljijo na raziskavah.

3.1.2.4 Preventivne raziskave

Namen preventivnih raziskav je predvideti opazovane dogodke in vedenja, ki se proučujejo (Marshall in Rossman 1995). Napoved je standardni znanstveni test resnice. Ta vrsta raziskav običajno uporablja ankete ali analizo podatkov Podatki zgodovinarji. (Yin 1989)

Zgornja razprava dokazuje, da obstaja več možnih raziskovalnih metod, ki jih je mogoče uporabiti v določeni študiji. Vendar mora obstajati posebna metoda, ki je primernejša od drugih za določeno vrsto raziskovalnega projekta. (Galliers 1987, Yin 1989, De Vaus 1991). Zato mora vsak raziskovalec skrbno ovrednotiti prednosti in slabosti različnih metod, da izbere najprimernejšo raziskovalno metodo, ki je združljiva z raziskovalnim projektom. (Jenkins 1985, Pervan in Klass 1992, Bonomia 1985, Yin 1989, Himilton in Ives 1992).

3.2. Možni načini iskanja

Cilj tega projekta je bil preučiti izkušnje avstralskih organizacij z i Podatki shranjeno z razvojem podatkovno skladišče. Datum Ker je trenutno v Avstraliji premalo raziskav na področju podatkovnih skladišč, je ta raziskovalni projekt še vedno v teoretični fazi raziskovalnega cikla in ima raziskovalni namen. Raziskovanje izkušenj avstralskih organizacij, ki sprejemajo skladiščenje podatkov, zahteva interpretacijo resnične družbe. Posledično filozofska predpostavka, na kateri temelji raziskovalni projekt, sledi tradicionalni interpretaciji.

Po natančni preučitvi razpoložljivih metod sta bili identificirani dve možni raziskovalni metodi: ankete in študije primerov, ki se lahko uporabijo za raziskovalne raziskave (Shanks et al. 1993). Galliers (1992) utemeljuje primernost teh dveh metod za to posebno študijo v svoji revidirani taksonomiji z besedami, da sta primerni za teoretično konstrukcijo. Naslednja dva pododdelka podrobno obravnavata vsako metodo.

3.2.1 Anketna raziskovalna metoda

Anketna raziskovalna metoda izhaja iz starodavne popisne metode. Pri popisu gre za zbiranje informacij celotne populacije. Ta metoda je draga in nepraktična, zlasti če je populacija velika. Tako je anketa v primerjavi s popisom običajno osredotočena na zbiranje informacij za majhno število ali vzorec predstavnikov prebivalstva (Fowler 1988, Neuman 1994). Vzorec odraža populacijo, iz katere je vzet, z različnimi stopnjami natančnosti, odvisno od strukture vzorca, velikosti in uporabljene izbirne metode (Fowler 1988, Babbie 1982, Neuman 1994).

Metoda raziskave je opredeljena kot "posnetki praks, situacij ali pogledov v določenem trenutku, narejeni z uporabo vprašalnikov ali intervjujev, iz katerih je mogoče sklepati
narejeno« (Galliers 1992:153) [fotografija praks, situacij ali pogledov v določenem trenutku, posneta z vprašalniki ali intervjuji, iz katerih je mogoče sklepati]. Ankete se ukvarjajo z zbiranjem informacij o določenih vidikih študije od številnih udeležencev s postavljanjem vprašanj (Fowler 1988). Ti vprašalniki in intervjuji, ki vključujejo osebne telefonske intervjuje in strukturirane intervjuje, so tudi tehnike zbiranja Podatki ki se uporablja v anketah (Blalock 1970, Nachmias in Nachmias 1976, Fowler 1988), se lahko uporabijo opazovanja in analize (Gable 1994). Od vseh teh metod zbiranja god Podatki, je uporaba vprašalnika najbolj priljubljena tehnika, saj zagotavlja i Podatki

zbrani so strukturirani in oblikovani ter tako olajšajo klasifikacijo informacij (Hwang 1987, de Vaus 1991).

Pri analizi i Podatki, strategija raziskave pogosto uporablja kvantitativne tehnike, kot je statistična analiza, lahko pa se uporabijo tudi kvalitativne tehnike (Galliers 1992, Pervan

in Klass 1992, Gable 1994). Običajno, i Podatki zbrani se uporabljajo za analizo distribucij in vzorcev asociacij (Fowler 1988).

Čeprav so ankete na splošno primerne za iskanja, ki obravnavajo vprašanje "kaj?" (kaj) ali izhajajo iz njega, kot sta 'quanto' (koliko) in 'quant'è' (koliko), jih je mogoče postaviti z vprašanjem 'zakaj' (Sonquist in Dunkelberg 1977, Yin 1989). Po Sonquistu in Dunkelbergu (1977) je raziskovalno poizvedovanje namenjeno trdim hipotezam, programom vrednotenja, opisovanju populacije in razvoju modelov človeškega vedenja. Poleg tega se lahko ankete uporabljajo za preučevanje mnenj, pogojev, prepričanj, značilnosti, pričakovanj in celo preteklega ali sedanjega vedenja določene populacije (Neuman 1994).

Ankete omogočajo raziskovalcu, da odkrije populacijske odnose, rezultati pa so običajno bolj splošni od drugih metod (Sonquist in Dunkelberg 1977, Gable 1994). Ankete omogočajo raziskovalcem, da pokrijejo širše geografsko območje in dosežejo veliko število anketirancev (Blalock 1970, Sonquist in Dunkelberg 1977, Hwang in Lin 1987, Gable 1994, Neuman 1994). Končno lahko raziskave zagotovijo informacije, ki niso na voljo drugje ali v obliki, ki je potrebna za analize (Fowler 1988).

Vendar pa obstajajo nekatere omejitve pri izvedbi ankete. Pomanjkljivost je, da raziskovalec ne more pridobiti veliko informacij o proučevanem predmetu. To je posledica dejstva, da se ankete izvajajo samo ob določenem času in zato obstaja omejeno število spremenljivk in ljudi, ki jih raziskovalec lahko

študija (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Druga pomanjkljivost je, da je izvajanje ankete lahko zelo drago v smislu časa in sredstev, zlasti če vključuje osebne intervjuje (Fowler 1988).

3.2.2. Poizvedovalna raziskovalna metoda

Poizvedovalna raziskovalna metoda vključuje poglobljeno preučevanje določene situacije znotraj njenega dejanskega konteksta v določenem časovnem obdobju, brez kakršnih koli intervencij s strani raziskovalca (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Večinoma se ta metoda uporablja za opis odnosov med spremenljivkami, ki se proučujejo v določeni situaciji (Galliers 1992). Preiskave lahko vključujejo en sam ali več primerov, odvisno od analiziranega pojava (Franz in Robey 1987, Eisenhardt 1989, Yin 1989).

Poizvedovalna raziskovalna metoda je opredeljena kot "empirična preiskava, ki raziskuje sodobni pojav v njegovem dejanskem kontekstu, z uporabo več virov, izločenih iz ene ali več entitet, kot so ljudje, skupine ali organizacije" (Yin 1989). Med pojavom in njegovim kontekstom ni jasne ločitve in ni nadzora ali eksperimentalne manipulacije spremenljivk (Yin 1989, Benbasat et al. 1987).

Obstajajo različne tehnike zbiranja bogov Podatki ki jih je mogoče uporabiti pri metodi poizvedovanja, ki vključuje neposredna opazovanja, preglede arhivskih zapisov, vprašalnike, pregled dokumentacije in strukturirane intervjuje. Raznolik nabor tehnik žetve Podatki, ankete omogočajo raziskovalcem, da se ukvarjajo z obema Podatki kvalitativno in kvantitativno hkrati (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Tako kot pri anketni metodi, raziskovalec v raziskavi deluje kot opazovalec ali raziskovalec in ne kot aktivni udeleženec v proučevani organizaciji.

Benbasat in drugi (1987) trdijo, da je raziskovalna metoda še posebej primerna za konstrukcijo raziskovalne teorije, ki se začne z raziskovalnim vprašanjem in nadaljuje z usposabljanjem.

teorije med postopkom zbiranja Podatki. Primeren tudi za oder

za gradnjo teorije Franz in Robey (1987) predlagata, da se raziskovalna metoda lahko uporablja tudi za fazo kompleksne teorije. V tem primeru se na podlagi zbranih dokazov preveri ali ovrže podana teorija ali hipoteza. Poleg tega je poizvedovanje primerno tudi za raziskave, ki se ukvarjajo z vprašanji "kako" ali "zakaj" (Yin 1989).

V primerjavi z drugimi metodami ankete omogočajo raziskovalcu, da bolj podrobno zajame bistvene informacije (Galliers 1992, Shanks et al. 1993). Poleg tega raziskave omogočajo raziskovalcu razumevanje narave in kompleksnosti proučevanih procesov (Benbasat et al. 1987).

S poizvedovalno metodo so povezane štiri glavne pomanjkljivosti. Prvi je pomanjkanje nadzorovanih odbitkov. Subjektivnost raziskovalca lahko spremeni rezultate in zaključke študije (Yin 1989). Druga pomanjkljivost je pomanjkanje nadzorovanega opazovanja. V nasprotju z eksperimentalnimi metodami preiskovalni raziskovalec ne more nadzorovati preučevanih pojavov, saj se preučujejo v njihovem naravnem kontekstu (Gable 1994). Tretja pomanjkljivost je pomanjkanje ponovljivosti. To je posledica dejstva, da raziskovalec verjetno ne bo opazoval istih dogodkov in ne more preveriti rezultatov določene študije (Lee 1989). Končno je zaradi neponovljivosti težko posplošiti rezultate, pridobljene iz ene ali več raziskav (Galliers 1992, Shanks et al. 1993). Vse te težave pa niso nepremostljive in jih lahko raziskovalec z ustreznimi ukrepi zmanjša (Lee 1989).

3.3. Utemelji raziskovalno metodologijo sprejeti

Izmed dveh možnih raziskovalnih metod za to študijo je anketna metoda najprimernejša. Preiskovalnega po temeljitem premisleku o sorodnih zavrnili

prednosti in slabosti. Primernost ali neprimernost posamezne metode za to študijo je obravnavana spodaj.

3.3.1. Neprimerna raziskovalna metoda poizvedbe

Metoda poizvedovanja zahteva poglobljeno študijo določene situacije v eni ali več organizacijah v določenem časovnem obdobju (Eisenhardt 1989). V tem primeru lahko obdobje preseže časovni okvir, določen za to študijo. Drugi razlog, zakaj ne bi uporabili metode poizvedovanja, je, da rezultati morda trpijo zaradi pomanjkanja natančnosti (Yin 1989). Subjektivnost raziskovalca lahko vpliva na rezultate in zaključke. Drugi razlog je, da je ta metoda bolj primerna za raziskovalna vprašanja tipa "kako" ali "zakaj" (Yin 1989), medtem ko je raziskovalno vprašanje za to študijo tipa "kaj". Nenazadnje je težko posploševati ugotovitve le ene ali nekaj raziskav (Galliers 1992, Shanks et al. 1993). Na podlagi te utemeljitve anketna raziskovalna metoda ni bila izbrana, saj je bila neprimerna za to študijo.

3.3.2. Priročnost metode iskanja preiskavo

Ko je bila ta raziskava izvedena, avstralske organizacije še niso široko sprejele prakse skladiščenja podatkov. Zato ni bilo veliko informacij o njihovem izvajanju v avstralskih organizacijah. Razpoložljive informacije so prišle od organizacij, ki so izvajale ali uporabljale a podatkovno skladišče. V tem primeru je najprimernejša anketna raziskovalna metoda, saj omogoča pridobivanje informacij, ki niso na voljo drugje ali v obliki, ki je potrebna za analizo (Fowler 1988). Poleg tega poizvedovalna raziskovalna metoda omogoča raziskovalcu dober vpogled v prakse, situacije ali poglede v določenem času (Galliers 1992, Denscombe 1998). Za ozaveščanje o avstralski izkušnji s skladiščenjem podatkov je bil zahtevan pregled.

Poleg tega Sonquist in Dunkelberg (1977) navajata, da so rezultati anketnih raziskav bolj splošni od drugih metod.

3.4. Raziskovalno načrtovanje ankete

Raziskava o praksi skladiščenja podatkov je bila izvedena leta 1999. Ciljno populacijo so sestavljale avstralske organizacije, ki jih zanimajo študije skladiščenja podatkov, saj so se verjetno že zavedale Podatki ki jih shranjujejo in bi zato lahko zagotovili koristne informacije za to študijo. Ciljna populacija je bila identificirana z začetno raziskavo vseh avstralskih članov 'The Data Warehousing Institute' (Tdwi-aap). Ta razdelek obravnava zasnovo empirične raziskovalne faze te študije.

3.4.1. Tehnika zbiranja Podatki

Od treh tehnik, ki se običajno uporabljajo v anketnih raziskavah (tj. vprašalnik po pošti, telefonski intervju in osebni intervju) (Nachmias 1976, Fowler 1988, de Vaus 1991), je bil za to študijo sprejet vprašalnik po pošti. Prvi razlog za sprejetje slednjega je, da lahko doseže geografsko razpršeno populacijo (Blalock 1970, Nachmias in Nachmias 1976, Hwang in Lin 1987, de Vaus 1991, Gable 1994). Drugič, poštni vprašalnik je primeren za visoko izobražene udeležence (Fowler 1988). Poštni vprašalnik za to študijo je bil naslovljen na sponzorje projekta skladiščenja podatkov, direktorje in/ali vodje projektov. Tretjič, poštni vprašalniki so primerni, če je na voljo varen seznam naslovov (Salant in Dilman 1994). TDWI, v tem primeru zaupanja vredno združenje za shranjevanje podatkov, je zagotovilo poštni seznam svojih avstralskih članov. Druga prednost vprašalnika po pošti pred telefonskimi vprašalniki ali osebnimi intervjuji je, da anketirancem omogoča natančnejši odgovor, zlasti kadar morajo anketiranci pregledati zapise ali razpravljati o vprašanjih z drugimi ljudmi (Fowler 1988).

Morebitna pomanjkljivost je lahko čas, potreben za izdelavo vprašalnikov po pošti. Običajno se vprašalnik po pošti izvaja v tem zaporedju: pošiljanje pisem po pošti, čakanje na odgovore in pošiljanje potrditve (Fowler 1988, Bainbridge 1989). Tako je lahko skupni čas daljši od časa, potrebnega za osebne razgovore ali telefonske razgovore. Vendar pa je skupni čas lahko znan vnaprej (Fowler 1988, Denscombe 1998). Časa, porabljenega za izvajanje osebnih intervjujev, ni mogoče vedeti vnaprej, saj se razlikuje od intervjuja do intervjuja (Fowler 1988). Telefonski intervjuji so lahko hitrejši od vprašalnikov po pošti in osebnih intervjujev, vendar imajo lahko visoko stopnjo neodgovorjenih zaradi nedosegljivosti nekaterih ljudi (Fowler 1988). Poleg tega so telefonski intervjuji na splošno omejeni na relativno kratek seznam vprašanj (Bainbridge 1989).

Druga slabost vprašalnika, poslanega po pošti, je visoka stopnja neodgovora (Fowler 1988, Bainbridge 1989, Neuman 1994). Vendar pa so bili sprejeti protiukrepi s povezovanjem te študije z zaupanja vredno institucijo za shranjevanje podatkov (tj. TDWI) (Bainbridge 1989, Neuman 1994), ki izda dve opominki tistim, ki se ne odzovejo (Fowler 1988, Neuman 1994) in vključuje tudi dodatno pismo, ki pojasnjuje, namen študije (Neuman 1994).

3.4.2. Enota za analizo

Namen te študije je pridobiti informacije o izvajanju skladiščenja podatkov in njegovi uporabi v avstralskih organizacijah. Ciljna populacija so vse avstralske organizacije, ki so izvajale ali izvajajo, tj podatkovno skladišče. Posamezne organizacije se nato registrirajo. Vprašalnik je bil poslan organizacijam, ki se zanimajo za posvojitev podatkovno skladišče. Ta metoda zagotavlja, da zbrane informacije izvirajo iz najustreznejših virov vsake sodelujoče organizacije.

3.4.3. Anketni vzorec

Dopisni seznam udeležencev ankete smo pridobili pri TDWI. S tega seznama je bilo kot osnova za vzorčenje izbranih 3000 avstralskih organizacij. Vzorcu je bilo poslano naknadno pismo z obrazložitvijo projekta in namena raziskave, skupaj z obrazcem za odgovore in predplačniško ovojnico za vračilo izpolnjenega vprašalnika. Od 3000 organizacij se jih je 198 strinjalo s sodelovanjem v študiji. Tako majhno število odzivov je bilo pričakovano datotek veliko število avstralskih organizacij, ki so takrat sprejele ali sprejemajo strategijo skladiščenja podatkov v svojih organizacijah. Tako ciljno populacijo te študije sestavlja samo 198 organizacij.

3.4.4. Vsebina vprašalnika

Zasnova vprašalnika je temeljila na modelu podatkovnega skladišča Monash (o katerem smo govorili prej v delu 2.3). Vsebina vprašalnika je temeljila na pregledu literature, predstavljenem v 2. poglavju. Kopija vprašalnika, poslanega udeležencem raziskave, je na voljo v dodatku B. Vprašalnik je sestavljen iz šestih razdelkov, ki sledijo korakom zajetega modela. Naslednjih šest odstavkov na kratko povzema vsebino vsakega razdelka.

Razdelek A: Osnovne informacije o organizaciji
Ta razdelek vsebuje vprašanja v zvezi s profilom sodelujočih organizacij. Poleg tega se nekatera vprašanja nanašajo na status udeleženčevega projekta skladiščenja podatkov. Zaupni podatki, kot je ime organizacije, niso bili razkriti v analizi ankete.

Odsek B: Začetek
Vprašanja v tem razdelku se nanašajo na začetek uporabe skladiščenja podatkov. Zastavljena so bila vprašanja o pobudnikih projekta, sponzorjih, potrebnih veščinah in znanjih, ciljih razvoja podatkovnih skladišč in pričakovanjih končnih uporabnikov.

Oddelek C: Oblikovanje
Ta razdelek vsebuje vprašanja v zvezi z dejavnostmi načrtovanja podatkovno skladišče. Predvsem so bila vprašanja o obsegu izvedbe, trajanju projekta, stroških projekta in analizi stroškov in koristi.

Oddelek D: Razvoj
V razdelku o razvoju so vprašanja v zvezi z razvojnimi aktivnostmi podjetja podatkovno skladišče: zbirka zahtev končnega uporabnika, viri Podatki, logični model Podatki, prototipi, načrtovanje zmogljivosti, tehnične arhitekture in izbor orodij za razvoj podatkovnih skladišč.

Oddelek E: Delovanje
Operativna vprašanja v zvezi z delovanjem in razširljivostjo podatkovno skladišče, saj se razvija v naslednji razvojni fazi. tam kakovosti podatkov, strategije osveževanja Podatki, zrnatost Podatki, razširljivost podatkovno skladišče in varnostna vprašanja podatkovno skladišče so bila med vrstami zastavljenih vprašanj.

Oddelek F: Razvoj
Ta razdelek vsebuje vprašanja v zvezi z uporabo podatkovno skladišče s strani končnih uporabnikov. Raziskovalca sta zanimala namen in uporabnost podatkovno skladišče, sprejete strategije pregleda in usposabljanja ter strategija nadzora podatkovno skladišče sprejeti.

3.4.5. Stopnja odziva

Čeprav so ankete po pošti kritizirane zaradi nizke stopnje odziva, so bili sprejeti ukrepi za povečanje stopnje donosa (kot je opisano zgoraj v razdelku 3.4.1). Izraz 'stopnja odziva' se nanaša na odstotek ljudi v določenem vzorcu raziskave, ki odgovorijo na vprašalnik (Denscombe 1998). Za izračun stopnje odziva za to študijo je bila uporabljena naslednja formula:

Število ljudi, ki so se odzvali
Stopnja odziva = —————————————————————————– X 100 Skupno število poslanih vprašalnikov

3.4.6. Testni pilot

Preden je bil vprašalnik poslan vzorcu, so bila vprašanja testirana z izvedbo pilotnih poskusov, kot sta predlagala Luck in Rubin (1987), Jackson (1988) in de Vaus (1991). Namen pilotnih poskusov je razkriti morebitne nerodne, dvoumne izraze in vprašanja, ki jih je težko razlagati, razjasniti vse uporabljene definicije in izraze ter določiti približen čas, potreben za izpolnjevanje vprašalnika (Warwick in Lininger 1975, Jackson 1988, Salant in Dilman 1994). Pilotni poskusi so bili izvedeni tako, da so bili izbrani subjekti z značilnostmi, podobnimi tistim končnih subjektov, kot je predlagal Davis e. Cosenza (1993). V tej študiji je bilo za pilotne subjekte izbranih šest strokovnjakov za shranjevanje podatkov. Po vsakem pilotnem preizkusu so bili izvedeni potrebni popravki. Iz izvedenih pilotnih testov so udeleženci prispevali k preoblikovanju in ponastavitvi končne različice vprašalnika.

3.4.7. Metode analize Podarite

I Podatki Anketni podatki, zbrani iz vprašalnikov zaprtega tipa, so bili analizirani s statističnim programskim paketom SPSS. Veliko odgovorov je bilo analiziranih z uporabo deskriptivne statistike. Številni vprašalniki so bili vrnjeni nepopolni. Ti so bili obravnavani bolj skrbno, da bi zagotovili, da i Podatki manjkajoče niso bile posledica napak pri vnosu podatkov, temveč zato, ker vprašanja niso bila primerna za registracijskega zavezanca ali pa se je registracijski zavezanec odločil, da ne bo odgovoril na eno ali več specifičnih vprašanj. Ti manjkajoči odgovori so bili pri razčlenjevanju podatkov prezrti Podatki in so bili kodirani kot '-9', da se zagotovi njihova izključitev iz procesa analize.

Pri pripravi vprašalnika smo zaprta vprašanja vnaprej kodirali tako, da smo vsaki možnosti dodelili številko. Številka je bila nato uporabljena za usposabljanje i Podatki med analizo (Denscombe 1998, Sapsford in Jupp 1996). Na primer, v vprašanju 1 razdelka B je bilo navedenih šest možnosti: upravni odbor, višji vodstveni delavec, oddelek IT, poslovna enota, svetovalci in drugi. V datoteki Podatki SPSS je bila ustvarjena spremenljivka za 'pobudnika projekta' s šestimi vrednostnimi oznakami: '1' za 'odbor', '2' za 'višji vodstveni delavec' in tako naprej Street. Uporaba Likertinove lestvice pri nekaterih zaprtih vprašanjih je prav tako omogočila enostavno identifikacijo z uporabo ustreznih številskih vrednosti, vnesenih v SPSS. Pri vprašanjih z neizčrpnimi odgovori, ki se medsebojno ne izključujejo, je bila vsaka možnost obravnavana kot ena sama spremenljivka z dvema oznakama vrednosti: '1' za 'preverjeno' in '2' za 'nepreverjeno'.

Odprta vprašanja so bila obravnavana drugače kot zaprta. Odgovori na ta vprašanja niso bili vneseni v SPSS. Namesto tega so jih analizirali ročno. Uporaba te vrste vprašanj omogoča pridobivanje informacij o svobodno izraženih idejah in osebnih izkušnjah anketirancev (Bainbridge 1989, Denscombe 1998). Kjer je bilo mogoče, je bila narejena kategorizacija odgovorov.

Za analizo Podatkiuporabljene so metode preproste statistične analize, kot so pogostost odgovorov, povprečje, standardna deviacija in mediana (Argyrous 1996, Denscombe 1998).
Gamma test je bil učinkovit za pridobitev kvantitativnih mer povezav med Podatki ordinali (Norusis 1983, Argyrous 1996). Ti testi so bili primerni, ker uporabljene ordinalne lestvice niso imele veliko kategorij in bi jih bilo mogoče prikazati v tabeli (Norusis 1983).

3.5 Povzetek

V tem poglavju sta bili obravnavani raziskovalna metodologija in zasnova, sprejeta za to študijo.

Izbira najprimernejše raziskovalne metode za določeno študijo traja
upoštevanje številnih pravil, vključno z naravo in vrsto raziskave, pa tudi prednosti in slabosti vsake možne metode (Jenkins 1985, Benbasat et al. 1097, Galliers in Land 1987, yin 1989, Hamilton in ives 1992, Galliers 1992, neuman 1994). Glede na pomanjkanje obstoječega znanja in teorije v zvezi s sprejetjem skladiščenja podatkov v Avstraliji ta raziskovalna študija zahteva interpretativno raziskovalno metodo z raziskovalno sposobnostjo raziskovanja izkušenj avstralskih organizacij. Izbrana raziskovalna metoda je bila izbrana za zbiranje informacij v zvezi s sprejetjem koncepta hrambe podatkov v avstralskih organizacijah. Kot tehnika zbiranja je bila izbrana poštna anketa Podatki. Utemeljitev raziskovalne metode in tehnike zbiranja Podatki izbori bodo na voljo v tem poglavju. Predstavljena je bila tudi razprava o enoti analize, uporabljenem vzorcu, odzivnosti, vsebini vprašalnika, predtestu vprašalnika in metodi analize vprašalnika. Podatki.

Oblikovanje a Podatkovno skladišče:

Združevanje odnosov entitet in dimenzijskega modeliranja

POVZETEK
Trgovina i Podatki je velik trenutni problem za mnoge organizacije. Ključni problem pri razvoju skladiščenja Podatki to je njegov dizajn.
Risba mora podpirati zaznavanje pojmov v podatkovno skladišče starega sistema in drugih virov Podatki ter tudi enostavno razumevanje in učinkovitost pri izvajanju podatkovno skladišče.
Velik del literature o shranjevanju Podatki priporoča uporabo modeliranja odnosov entitet ali dimenzijskega modeliranja za predstavitev zasnove podatkovno skladišče.
V tem prispevku prikazujemo, kako lahko obe predstavitvi združimo v pristopu k oblikovanju podatkovno skladišče. Uporabljen pristop je sistematičen

preučeno v študiji primera in je prepoznano v številnih pomembnih posledicah s strokovnjaki.

SKLADIŠČENJE PODATKOV

Un podatkovno skladišče običajno je opredeljena kot »predmetno usmerjena, integrirana, časovno spremenljiva in nehlapna zbirka podatkov v podporo odločitvam vodstva« (Inmon in Hackathorn, 1994). Predmetno usmerjeno in integrirano kaže, da je podatkovno skladišče je zasnovan tako, da prestopa funkcionalne meje podedovanih sistemov in ponudi integrirano perspektivo Podatki.
Časovna različica se ukvarja z zgodovinsko ali časovno serijsko naravo videa Podatki v a podatkovno skladišče, ki omogoča analizo trendov. Nehlapno pomeni, da je podatkovno skladišče se ne posodablja nenehno kot a Baza podatkov OLTP. Namesto tega se občasno posodablja, s Podatki iz notranjih in zunanjih virov. The podatkovno skladišče zasnovan je posebej za raziskave in ne za posodobitev celovitosti in učinkovitosti delovanja.
Zamisel o shranjevanju i Podatki ni novost, to je bil eden od namenov upravljanja Podatki od šestdesetih (Il Martin, 1982).
I podatkovno skladišče ponujajo infrastrukturo Podatki za sisteme za podporo upravljanju. Sistemi za podporo upravljanju vključujejo sisteme za podporo odločanju (DSS) in izvršne informacijske sisteme (EIS). DSS je računalniško podprt informacijski sistem, ki je zasnovan za izboljšanje procesa in posledično človeškega odločanja. EIS je običajno sistem dostave Podatki ki vodstvenim delavcem omogoča enostaven dostop do pogleda Podatki.
Splošna arhitektura a podatkovno skladišče izpostavlja vlogo podatkovno skladišče v podporo vodstvu. Poleg ponudbe infrastrukture Podatki za EIS in DSS, al podatkovno skladišče do njega lahko dostopate neposredno prek poizvedb. THE Podatki vključeno v a podatkovno skladišče temeljijo na analizi zahtev po upravljavskih informacijah in so pridobljeni iz treh virov: notranjih podedovanih sistemov, sistemov za zajem podatkov za posebne namene in zunanjih virov podatkov. THE Podatki v notranjih podedovanih sistemih so pogosto odvečni, nedosledni, nizke kakovosti in shranjeni v različnih formatih, zato jih je treba uskladiti in očistiti, preden jih je mogoče naložiti v

podatkovno skladišče (Inmon, 1992; McFadden, 1996). THE Podatki iz sistemov za shranjevanje Podatki ad hoc in iz virov Podatki zunanji se pogosto uporabljajo za povečanje (posodobitev, zamenjavo) i Podatki iz podedovanih sistemov.

Obstaja veliko tehtnih razlogov za razvoj a podatkovno skladišče, ki vključujejo izboljšano odločanje z učinkovito uporabo več informacij (Ives 1995), podporo za osredotočanje na celotne zadeve (Graham 1996) in zmanjšanje stroškov odločanja. Podatki za EIS in DSS (Graham 1996, McFadden 1996).

Nedavna empirična študija je v povprečju pokazala donosnost naložbe za i podatkovno skladišče za 401 % po treh letih (Graham, 1996). Vendar pa druge empirične študije o podatkovno skladišče odkrili pomembne težave, vključno s težavami pri merjenju in dodeljevanju koristi, pomanjkanjem jasnega namena, podcenjevanjem obsega in kompleksnosti procesa shranjevanja. Podatki, še posebej glede virov in čistosti Podatki. Trgovina i Podatki lahko obravnavamo kot rešitev problema upravljanja Podatki med organizacijami. Manipulacija z Podatki kot družbeni vir že vrsto let ostaja eden ključnih problemov pri upravljanju informacijskih sistemov po vsem svetu (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Priljubljen pristop k upravljanju premoženja Podatki v osemdesetih je bil razvoj modela Podatki socialni. Model Podatki socialno je bilo zasnovano tako, da nudi stabilno osnovo za razvoj novih aplikacijskih sistemov e Baza podatkov ter rekonstrukcija in integracija podedovanih sistemov (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kim in Everest 1994). Vendar pa obstaja več težav s tem pristopom, zlasti kompleksnost in stroški vsake naloge ter dolg čas, ki je potreben za doseganje oprijemljivih rezultatov (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il podatkovno skladišče gre za ločeno zbirko podatkov, ki obstaja sočasno s podedovanimi bazami podatkov, namesto da bi jih nadomestila. Zato vam omogoča usmerjanje upravljanja Podatki in se izognili dragi obnovi starih sistemov.

OBSTOJEČI PRISTOPI K OBLIKOVANJU PODATKOV

SKLADIŠČE

Proces gradnje in izpopolnjevanja a podatkovno skladišče je treba razumeti bolj kot evolucijski proces in ne kot tradicionalni življenjski cikel razvoja sistemov (Desio, 1995, Shanks, O'Donnell in Arnott 1997a ). V projekt je vključenih veliko procesov podatkovno skladišče kot je inicializacija, razporejanje; informacije, pridobljene na podlagi zahtev, ki jih zahtevajo vodje podjetij; viri, transformacije, čiščenje Podatki in sinhronizacijo iz podedovanih sistemov in drugih virov Podatki; sistemi dostave v razvoju; spremljanje podatkovno skladišče; in nesmiselnost evolucijskega procesa in gradnje a podatkovno skladišče (Stinchi, O'Donnell in Arnott 1997b). V tej reviji se osredotočamo na risanje i Podatki shranjeni v kontekstu teh drugih procesov. Obstaja več predlaganih pristopov k video arhitekturi podatkovno skladišče v literaturi (Inmon 1994, Ives 1995, Kimball 1994, McFadden 1996). Vsaka od teh metodologij ima kratek pregled z analizo njihovih prednosti in slabosti.

Inmonov (1994) pristop k Podatkovno skladišče Oblikovanje

Inmon (1994) je predlagal štiri iterativne korake za načrtovanje a podatkovno skladišče (glej sliko 2). Prvi korak je oblikovanje predloge Podatki socialno, da razumem, kako sem Podatki se lahko integrirajo med funkcionalna področja znotraj organizacije z razdelitvijo i Podatki hranite na območjih. Model Podatki narejen je za shranjevanje Podatki ki se nanašajo na odločanje, vključno z Podatki zgodovinski in vključeni Podatki odšteti in sešteti. Drugi korak je opredelitev vsebinskih področij za izvedbo. Te temeljijo na prioritetah, ki jih določi določena organizacija. Tretji korak vključuje risanje a Baza podatkov za predmetno področje bodite še posebej pozorni na vključitev ustreznih stopenj razdrobljenosti. Inmon priporoča uporabo modela entitete in odnosa. Četrti korak je identifikacija izvornih sistemov Podatki potrebno in razviti procese transformacije za zajemanje, čiščenje in formatiranje i Podatki.

Prednosti Inmonovega pristopa so, da model Podatki socialne ponuja osnovo za integracijo Podatki v okviru organizacije in načrtovanja podpira iterativni razvoj podatkovno skladišče. Njegove pomanjkljivosti so težavnost in stroški oblikovanja modela Podatki socialne, težave pri razumevanju modelov entitet in odnosov, uporabljenih v obeh modelih, to Podatki socialno in to od Podatki shranjenih po tematskih področjih in ustreznosti Podatki risbe podatkovno skladišče za uresničitev Baza podatkov relacijski, vendar ne za Baza podatkov večdimenzionalen.

Ives' (1995) Pristop k Podatkovno skladišče Oblikovanje

Ives (1995) predlaga štiristopenjski pristop k načrtovanju informacijskega sistema, za katerega meni, da je uporaben za načrtovanje podatkovno skladišče (glej sliko 3). Pristop v veliki meri temelji na informacijskem inženiringu za razvoj informacijskih sistemov (Martin 1990). Prvi korak je določitev vaših ciljev, uspeha in kritičnih dejavnikov ter ključnih kazalnikov uspešnosti. Ključni poslovni procesi in potrebne informacije so modelirani, da nas pripeljejo do modela Podatki socialni. Drugi korak vključuje razvoj definicijske arhitekture Podatki shranjeno po območjih, Baza podatkov di podatkovno skladišče, tehnološke komponente, ki so potrebne, nabor organizacijske podpore, potrebne za implementacijo in delovanje podatkovno skladišče. Tretji korak zajema izbiro potrebnih programskih paketov in orodij. Četrti korak je podrobna zasnova in izdelava podatkovno skladišče. Ives ugotavlja, da trgovina Podatki je omejen iterativni proces.

Prednosti pristopa Ives so uporaba tehničnih specifikacij za določanje informacijskih zahtev, uporaba strukturiranega procesa za podporo integracije podatkovno skladišče, ustrezno izbiro strojne in programske opreme ter uporabo večpredstavnih tehnik za podatkovno skladišče. Njegove pomanjkljivosti so neločljivo povezane s kompleksnostjo. Druge vključujejo težave pri razvoju številnih stopenj Baza podatkov all'interno del podatkovno skladišče v razumnem času in z razumnimi stroški.

Kimballov (1994) pristop k Podatkovno skladišče Oblikovanje

Kimball (1994) je predlagal pet ponavljajočih se korakov za načrtovanje a podatkovno skladišče (glej slike 4). Njegov pristop je še posebej posvečen risbi sola podatkovno skladišče in o uporabi dimenzionalnih modelov pred modeli entitet in odnosov. Kimball analizira te dimenzionalne modele, ker vodje podjetij lažje razumejo poslovanje, učinkovitejši so pri zapletenih posvetovanjih in oblikovanju Baza podatkov fizično je učinkovitejše (Kimball 1994). Kimball priznava, da razvoj a podatkovno skladišče je iterativno in to podatkovno skladišče ločene je mogoče integrirati z razdelitvijo v tabele skupnih dimenzij.

Prvi korak je opredelitev določenega predmetnega področja, ki ga je treba izpopolniti. Drugi in tretji korak vključujeta dimenzijsko oblikovanje. V drugem koraku meritve identificirajo zanimive stvari na predmetnem področju in jih združijo v tabelo dejstev. Na primer, na predmetnem področju prodaje lahko meritve zanimanja vključujejo količino prodanih predmetov in dolar kot prodajno valuto. Tretji korak vključuje identifikacijo dimenzij, ki so načini, na katere je mogoče združiti dejstva. Na predmetnem področju prodaje lahko ustrezne dimenzije vključujejo predmet, lokacijo in časovno obdobje. Tabela dejstev ima večdelni ključ za povezavo z vsako dimenzijsko tabelo in običajno vsebuje zelo veliko dejstev. Nasprotno pa tabele dimenzij vsebujejo opisne informacije o dimenzijah in drugih atributih, ki jih je mogoče uporabiti za združevanje dejstev. Predlagana povezana tabela dejstev in dimenzij tvori tako imenovano zvezdno shemo zaradi svoje oblike. Četrti korak vključuje gradnjo a Baza podatkov večdimenzionalen, da izpopolni vzorec zvezde. Zadnji korak je identifikacija izvornih sistemov Podatki potrebno in razviti procese transformacije za zajemanje, čiščenje in formatiranje i Podatki.

Prednosti Kimballovega pristopa vključujejo uporabo dimenzijskih modelov za predstavitev i Podatki shranjeno, kar olajša razumevanje in vodi do učinkovite fizične zasnove. Dimenzionalni model, ki prav tako zlahka uporablja oba sistema Baza podatkov relacijski se lahko izpopolnijo ali sistemi Baza podatkov večdimenzionalen. Njegove pomanjkljivosti vključujejo pomanjkanje nekaterih tehnik za lažje načrtovanje ali integracijo številnih zvezdnih shem znotraj a podatkovno skladišče in težavnost načrtovanja iz skrajne denormalizirane strukture v dimenzionalnem modelu a Podatki v podedovanih sistemih.

McFaddenov (1996) pristop k podatkom Oblikovanje skladišča

McFadden (1996) predlaga petstopenjski pristop k risanju a podatkovno skladišče (glej sliko 5).
Njegov pristop temelji na sintezi idej iz literature in je osredotočen na oblikovanje singla podatkovno skladišče. Prvi korak vključuje analizo zahtev. Čeprav tehnične specifikacije niso predpisane, McFaddenove opombe identificirajo subjekte Podatki specifikacije in njihove lastnosti ter napotuje bralce Watsona in Frolicka (1993) za zajemanje zahtev.
V drugem koraku se nariše model odnosa entitete podatkovno skladišče nato pa jih potrdi vodstvo podjetja. Tretji korak vključuje določanje preslikave iz podedovanih sistemov in zunanjih virov podatkovno skladišče. Četrti korak vključuje procese pri razvoju, uvajanju in sinhronizaciji Podatki v podatkovno skladišče. V zadnjem koraku se razvije dobava sistema s poudarkom na uporabniškem vmesniku. McFadden ugotavlja, da je postopek risanja na splošno iterativen.

Prednosti McFaddenovega pristopa so vključenost poslovnih vodij v določanje zahtev in pomen virov. Podatkinjihovo čiščenje in zbiranje. Njegove pomanjkljivosti so pomanjkanje postopka za razdelitev velikega projekta podatkovno skladišče v številnih integriranih fazah in tam

težave z razumevanjem modelov entitet in odnosov, uporabljenih pri oblikovanju podatkovno skladišče.

Ne izbirajo nas samo tisti, ki so nam blizu.

0/5 (0 ocen)

Več o spletni agenciji Online

Naročite se na prejemanje najnovejših člankov po e-pošti.

admin CEO

👍Spletna spletna agencija | Spletna agencija strokovnjak za digitalni marketing in SEO. Spletna agencija Online je spletna agencija. Za Agenzia Web Online uspeh pri digitalni transformaciji temelji na temeljih Iron SEO različice 3. Posebnosti: sistemska integracija, integracija poslovnih aplikacij, storitveno usmerjena arhitektura, računalništvo v oblaku, podatkovno skladišče, poslovna inteligenca, veliki podatki, portali, intraneti, spletne aplikacije Oblikovanje in upravljanje relacijskih in večdimenzionalnih baz podatkov Oblikovanje vmesnikov za digitalne medije: uporabnost in grafika. Spletna spletna agencija ponuja podjetjem naslednje storitve: -SEO na Google, Amazon, Bing, Yandex; - Spletna analitika: Google Analytics, Google Tag Manager, Yandex Metrica; -Konverzije uporabnikov: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM na Google, Bing, Amazon Ads; - Trženje na družbenih medijih (Facebook, Linkedin, Youtube, Instagram).

Oglejte si celotno biografijo

Digitalni marketing Baze podatkov DBMS Podatkovno skladišče Znanost podatki spletno oglaševanje Informacijska tehnologija Spletna agencija Oglaševalska agencija Trženje

Povej naprej:

Všeč mi je:

Več o spletni agenciji Online