https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

Dátové sklady a plánovanie podnikových zdrojov | DWH a ERP

ARCHÍV ÚDAJE CENTRÁLNE: HISTÓRIA ED EVOLÚCIE

Dve dominantné témy podnikových technológií v 90. rokoch boli i dátový sklad a ERP. Po dlhú dobu boli tieto dva silné prúdy súčasťou podnikového IT bez toho, aby sa niekedy pretínali. Bolo to skoro, ako keby to boli hmota a antihmota. Rast oboch fenoménov však nevyhnutne viedol k ich prieniku. Firmy dnes stoja pred problémom, čo s ERP a dátový sklad. Tento článok načrtne, o aké problémy ide a ako ich spoločnosti riešia.

NA ZAČIATKU…

Na začiatku bolo dátový sklad. Dátový sklad bol vytvorený s cieľom pôsobiť proti aplikačnému systému spracovania transakcií. V prvých dňoch zapamätanie dať malo to byť len protipól k aplikáciám na spracovanie transakcií. Ale v súčasnosti existujú oveľa sofistikovanejšie vízie toho, čo a dátový sklad. V dnešnom svete dátový sklad je vložená do štruktúry, ktorú možno nazvať podniková informačná továreň.

FIREMNÁ INFORMAČNÁ fabrika (CIF)

Corporate Information Factory má štandardné architektonické komponenty: úroveň transformácie a integrácie kódu, ktorá integruje dať kým dať prechádzajú z prostredia aplikácie do prostredia dátový sklad spoločnosti; a dátový sklad spoločnosti, kde je dať podrobné a integrované histórie. The dátový sklad spoločnosti slúži ako základ, na ktorom možno stavať všetky ostatné časti prostredia spoločnosti dátový sklad; prevádzkový dátový sklad (ODS). ODS je hybridná štruktúra, ktorá obsahuje niektoré aspekty dátový sklad a ďalšie aspekty prostredia OLTP; data marts, kde rôzne oddelenia môžu mať svoju vlastnú verziu dátový sklad; a dátový sklad prieskumu, v ktorom môžu „filozofovia“ spoločnosti zadávať svoje 72-hodinové otázky bez škodlivého vplyvu na dátový sklad; a takmer riadková pamäť, v ktorej dať staré a dať veľkoobjemové detaily možno skladovať lacno.

KDE SA ERP SPOJE S LA FIREMNÁ INFORMAČNÁ fabrika

ERP sa na dvoch miestach spája s Corporate Information Factory. Najprv ako základná aplikácia (základná línia), ktorá poskytuje i dať žiadosti na dátový sklad. V tomto prípade i dať, generované ako vedľajší produkt transakčného procesu, sú integrované a načítané do dátový sklad spoločnosti. Druhý bod spojenia medzi ERP a CIF a ODS. V skutočnosti sa v mnohých prostrediach ERP používa ako klasický ODS.

V prípade, že sa ako základná aplikácia používa ERP, možno rovnaký ERP použiť aj v CIF ako ODS. V každom prípade, ak sa má ERP používať v oboch rolách, medzi týmito dvoma subjektmi musí byť jasné rozlíšenie. Inými slovami, keď ERP hrá úlohu základnej aplikácie a ODS, musia byť tieto dve architektonické entity rozlíšené. Ak sa jedna implementácia ERP pokúsi vykonávať obe úlohy súčasne, nevyhnutne nastanú problémy pri návrhu a implementácii tejto štruktúry.

SAMOSTATNÉ ODSTRAŇOVANIE A ZÁKLADNÉ APLIKÁCIE

Existuje mnoho dôvodov, ktoré vedú k rozdeleniu architektonických komponentov. Snáď najvýraznejším problémom pri oddeľovaní rôznych komponentov architektúry je, že každý komponent architektúry má svoj vlastný pohľad. Základná aplikácia slúži na iný účel ako ODS. Skúste sa prekrývať

základný aplikačný pohľad na svet ODS alebo naopak nie je správny spôsob práce.

V dôsledku toho je prvým problémom ERP v CIF overiť, či existuje rozdiel medzi základnými aplikáciami a ODS.

DÁTOVÉ MODELY V KORPORÁTE INFORMAČNÁ fabrika

Na dosiahnutie súdržnosti medzi rôznymi komponentmi architektúry CIF musí existovať model dať. Modely z dať slúžia ako prepojenie medzi rôznymi komponentmi architektúry, ako sú základné aplikácie a ODS. Modely z dať stávajú sa „intelektuálnou cestovnou mapou“, aby získali správny význam z rôznych architektonických komponentov CIF.

Ruka v ruke s touto myšlienkou je myšlienka, že by mal existovať jeden veľký a jediný model dať. Je zrejmé, že musí existovať vzor dať pre každý z komponentov a tiež musí existovať rozumná cesta spájajúca rôzne modely. Každý komponent architektúry – ODS, základné aplikácie, dátový sklad spoločnosti a pod.. – potrebuje vlastný model dať. A preto musí existovať presná definícia toho, ako tieto modely dať sa navzájom prepájajú.

POHYB I ÚDAJE AKTUÁLNEHO ERP WAREHOUSE

Ak pôvod dať je základná aplikácia a/alebo ODS, keď ERP vloží i dať v dátový sklad, toto vloženie sa musí uskutočniť na najnižšej úrovni "zrnitosti". Jednoducho sumarizujte alebo agregujte i dať ako vychádzajú zo základnej aplikácie ERP alebo ERP ODS nie je správna vec. THE dať podrobnosti sú potrebné v dátový sklad tvoriť základ procesu DSS. Takéto dať bude mnohými spôsobmi pretvorený dátovými trhmi a ich prieskumom dátový sklad.

Vytesnenie dať od základného aplikačného prostredia ERP po dátový sklad spoločnosti sa vykonáva primerane uvoľneným spôsobom. Tento presun sa uskutoční približne 24 hodín po aktualizácii alebo vytvorení v ERP. Skutočnosť mať "lenivý" pohyb dať v dátový sklad spoločnosti umožňuje dať prichádzajúce z ERP do „zálohy“. Raz i dať sú uložené v základnej aplikácii, potom ich môžete bezpečne presúvať dať ERP vo firme. Ďalší cieľ dosiahnuteľný vďaka „lenivému“ pohybu dať je to jasné vymedzenie medzi prevádzkovými procesmi a DSS. S „rýchlym“ pohybom dať deliaca čiara medzi DSS a operačným zostáva nejasná.

Pohyb o dať z ERP ODS do dátový sklad spoločnosti sa vykonáva pravidelne, zvyčajne týždenne alebo mesačne. V tomto prípade pohyb dať vychádza z potreby „upratovania“ starého dať historikov. Samozrejme, ODS obsahuje i dať ktoré sú oveľa novšie ako dať historici našli v dátový sklad.

Vytesnenie dať v dátový sklad takmer nikdy sa nerobí „veľkoobchodne“ (veľkoobchodne). Skopírujte tabuľku z prostredia ERP do dátový sklad nedáva to zmysel. Oveľa realistickejší prístup je presunúť vybrané jednotky dať. Len dať ktoré sa od poslednej aktualizácie zmenili dátový sklad oni sú tí, ktorí by sa mali presunúť do dátový sklad. Jeden spôsob, ako zistiť, ktoré dať zmenili od poslednej aktualizácie je pozrieť sa na časové pečiatky dať nachádza v prostredí ERP. Návrhár vyberie všetky zmeny, ktoré nastali od poslednej aktualizácie. Ďalším prístupom je použitie techník zachytávania zmien dať. Pomocou týchto techník sa analyzujú protokoly a žurnálové pásky s cieľom určiť, ktoré z nich dať sa musí presunúť z prostredia ERP do prostredia ERP dátový sklad. Tieto techniky sú najlepšie, pretože protokoly a žurnálové pásky možno čítať zo súborov ERP bez ďalšieho ovplyvnenia iných zdrojov ERP.

INÉ KOMPLIKÁCIE

Jedným z problémov ERP v CIF je to, čo sa stane s inými zdrojmi aplikácií alebo s dať ODS, ktorá musí prispieť dátový sklad ale nie sú súčasťou prostredia ERP. Vzhľadom na uzavretý charakter ERP, najmä SAP, pokus o integráciu kľúčov z externých zdrojov dať s i dať ktoré pochádzajú z ERP pri presune dať v dátový sklad, je to veľká výzva. A presne aké sú pravdepodobnosti, že i dať aplikácií alebo ODS mimo prostredia ERP budú integrované do dátový sklad? Šance sú v skutočnosti veľmi vysoké.

NÁJSŤ ÚDAJE HISTORICKÉ Z ERP

Ďalší problém s i dať ERP vychádza z potreby mať dať historici v rámci dátový sklad. Zvyčajne dátový sklad potreby dať historikov. A tieto technológie ERP zvyčajne neukladajú dať historické, aspoň nie do takej miery, že by to bolo nevyhnutné dátový sklad. Pri veľkom množstve dať v prostredí ERP sa začína sčítavať história, treba to prostredie vyčistiť. Predpokladajme napríklad, že a dátový sklad musí byť zaťažený piatimi rokmi dať historické údaje, pričom ERP z nich uchováva maximálne šesť mesiacov dať. Pokiaľ je spoločnosť spokojná so zberom série dať historikov ako plynie čas, potom nie sú problémy s používaním ERP ako zdroja pre dátový sklad. Ale keď dátový sklad musí sa vrátiť v čase a získať bohov dať histórie, ktoré predtým ERP nezozbieralo a neuložilo, potom sa prostredie ERP stáva neefektívnym.

ERP A METADÁTA

Ďalšia úvaha o ERP e dátový sklad je ten na metaúdajoch existujúcich v prostredí ERP. Rovnako ako metadáta prechádzajú z prostredia ERP do prostredia IT dátový sklad, metadáta sa musia presunúť rovnakým spôsobom. Okrem toho musia byť metaúdaje transformované do formátu a štruktúry, ktorú vyžaduje infraštruktúra dátový sklad. Medzi prevádzkovými metaúdajmi a metaúdajmi DSS je veľký rozdiel. Prevádzkové metadáta sú primárne pre vývojárov a

programátor. Metadáta DSS sú primárne pre koncového používateľa. Existujúce metadáta v aplikáciách ERP alebo ODS je potrebné konvertovať a táto konverzia nie je vždy jednoduchá a priamočiara.

ZÍSKAVANIE ÚDAJOV ERP

Ak sa ERP používa ako poskytovateľ dať per il dátový sklad musí existovať pevné rozhranie, ktoré pohybuje dať z prostredia ERP do prostredia dátový sklad. Rozhranie musí:

▪ byť ľahko použiteľný
▪ povoliť prístup k dať ERP
▪ pochopiť význam dať ktoré sa chystajú presunúť do dátový sklad
▪ poznať obmedzenia ERP, ktoré môžu vzniknúť pri prístupe k dať z ERP:
▪ referenčná integrita
▪ hierarchické vzťahy
▪ implicitné logické vzťahy
▪ aplikačná konvencia
▪ všetky štruktúry dať podporované ERP a tak ďalej...
▪ byť efektívny v prístupe dať, poskytovaním:
▪ priamy pohyb dať
▪ získanie zmeny dať
▪ podporovať včasný prístup k dať
▪ rozumieť formátu dať, a tak ďalej… PREPOJENIE SO SAPOM Rozhranie môže byť dvoch typov, domáce alebo komerčné. Niektoré z hlavných obchodných rozhraní zahŕňajú:

▪ SAV
▪ Prims Solutions
▪ D2k a tak ďalej… VIAC TECHNOLÓGIÍ ERP Zaobchádzať s prostredím ERP ako s jednou technológiou je veľká chyba. Existuje mnoho technológií ERP, z ktorých každá má svoje silné stránky. Najznámejší predajcovia na trhu sú:

▪ SAP
▪ Oracle Financials
▪ PeopleSoft
▪ JD Edwards
▪ Baan SAP SAP je najväčší a najkompletnejší ERP softvér. Aplikácie SAP zahŕňajú mnoho typov aplikácií v mnohých oblastiach. SAP má povesť:

▪ veľmi veľké
▪ veľmi náročná a nákladná implementácia
▪ na implementáciu potrebuje veľa ľudí a konzultantov
▪ vyžaduje špecializovaných ľudí na implementáciu
▪ potrebuje dlhý čas na implementáciu Okrem toho má SAP povesť toho, že si zapamätá svoje vlastné dať veľmi opatrne, čo sťažuje prístup osoby mimo oblasti SAP. Sila SAP je v tom, že dokáže zachytiť a uložiť veľké množstvo dať. Nedávno SAP oznámil svoj zámer rozšíriť svoje aplikácie na dátový sklad. Používanie SAP ako predajcu má veľa výhod a nevýhod dátový sklad. Výhodou je, že SAP je už nainštalovaný a väčšina konzultantov už SAP pozná.
Nevýhody mať SAP ako dodávateľa dátový sklad je ich veľa: SAP nemá vo svete žiadne skúsenosti dátový sklad Ak je SAP dodávateľom dátový sklad, je potrebné „vyniesť“ i dať zo SAP do dátový sklad. Dato záznamom o uzavretom systéme SAP, je nepravdepodobné, že bude ľahké do neho dostať i zo SAP (???). Existuje mnoho starších prostredí, ktoré poháňajú SAP, ako napríklad IMS, VSAM, ADABAS, ORACLE, DB2 atď. SAP trvá na prístupe „nevynájdené tu“. SAP nechce spolupracovať s inými dodávateľmi pri používaní alebo vytváraní dátový sklad. SAP trvá na tom, že si všetok svoj softvér vytvorí sám.

Hoci je SAP veľká a výkonná spoločnosť, ktorá sa snaží prepísať technológiu ELT, OLAP, správu systému a dokonca aj základný kód dbms je to proste šialené. Namiesto kooperatívneho postoja s dodávateľmi dátový sklad SAP sa dlhodobo riadi prístupom „oni vedia najlepšie“. Tento postoj bráni úspechu, ktorý by SAP mohol dosiahnuť v tejto oblasti dátový sklad.
Odmietnutie spoločnosti SAP umožniť externým predajcom rýchly a bezproblémový prístup k nim dať. Samotná podstata používania a dátový sklad je ľahký prístup dať. Celá história SAP je založená na sťažení prístupu dať.
Nedostatok skúseností spoločnosti SAP pri riešení veľkých objemov dať; v oblasti dátový sklad existujú objemy dať nikdy nevidel SAP a spravovať tieto veľké množstvá dať musíte mať vhodnú technológiu. SAP si zjavne nie je vedomý tejto technologickej bariéry, ktorá existuje na vstup do tejto oblasti dátový sklad.
Firemná kultúra SAP: Spoločnosť SAP vytvorila podnikanie zo získania dať zo systému. Ale na to musíte mať inú mentalitu. Tradične softvérové spoločnosti, ktoré boli dobré v získavaní údajov do prostredia, neboli dobré v získavaní údajov na druhú stranu. Ak sa spoločnosti SAP podarí uskutočniť tento typ prechodu, bude prvou spoločnosťou, ktorej sa to podarí.

Je skrátka otázne, či by si firma mala vybrať SAP ako svojho dodávateľa dátový sklad. Na jednej strane sú veľmi vážne riziká a na druhej strane veľmi málo odmien. Je tu však ďalší dôvod, ktorý odrádza od výberu SAP ako dodávateľa dátový sklad. Pretože každá firma by mala mať rovnaké dátový sklad ako všetky ostatné spoločnosti? The dátový sklad je jadrom konkurenčnej výhody. Keby každá spoločnosť prijala to isté dátový sklad bolo by ťažké, aj keď nie nemožné, dosiahnuť konkurenčnú výhodu. Zdá sa, že SAP si myslí, že a dátový sklad možno ho považovať za súbor cookie, čo je ďalším znakom ich mentality „dostať údaje do“ aplikácií.

Žiadny iný dodávateľ ERP nie je taký dominantný ako SAP. Nepochybne sa nájdu spoločnosti, ktoré pôjdu cestou SAP za svojou dátový sklad ale asi tieto dátový sklad Vytvorenie SAP bude veľké, drahé a časovo náročné.

Tieto prostredia zahŕňajú také činnosti, ako je spracovanie bankových pokladníc, procesy rezervácie leteckých spoločností, procesy poistných nárokov atď. Čím výkonnejší bol transakčný systém, tým očividnejšia bola potreba oddelenia medzi operačným procesom a DSS (Decision Support System). S HR a personálnymi systémami sa však nikdy nestretnete s veľkým objemom transakcií. A samozrejme, keď je osoba najatá alebo opúšťa spoločnosť, je to záznam o transakcii. Ale v porovnaní s inými systémami, HR a personálne systémy jednoducho nemajú veľa transakcií. Preto v HR a personálnych systémoch nie je úplne zrejmé, že existuje potreba DataWarehouse. V mnohých ohľadoch tieto systémy predstavujú zlúčenie systémov DSS.

Ale je tu ďalší faktor, ktorý treba zvážiť, ak máte čo do činenia s dátovými skladmi a PeopleSoftom. V mnohých prostrediach, t.j dať ľudských a personálnych zdrojov sú druhoradé v porovnaní s primárnou činnosťou spoločnosti. Väčšina spoločností sa zaoberá výrobou, predajom, poskytovaním služieb atď. Ľudské zdroje a personálne systémy sú zvyčajne sekundárne (alebo podporujúce) hlavný predmet podnikania spoločnosti. Preto je to nejednoznačné a nepohodlné dátový sklad oddelené pre ľudské zdroje a personálnu podporu.

PeopleSoft je v tomto ohľade veľmi odlišný od SAP. Pri systéme SAP je povinné, aby existoval dátový sklad. S PeopleSoftom to nie je také jednoznačné. S PeopleSoftom je dátový sklad voliteľný.

To najlepšie, čo sa dá povedať o i dať PeopleSoft je to dátový sklad možno použiť na archiváciu i dať týkajúce sa starých ľudských a osobných zdrojov. Druhý dôvod, prečo by spoločnosť chcela použiť a dátový sklad a

škodou prostredia PeopleSoft je umožniť prístup a voľný prístup k analytickým nástrojom, k dať od PeopleSoft. Okrem týchto dôvodov však môžu nastať prípady, kedy je lepšie nemať dátový sklad dať PeopleSoft.

V súhrne

Existuje veľa nápadov týkajúcich sa výstavby a dátový sklad v rámci ERP softvéru.
Niektoré z nich sú:

▪ Dáva zmysel mať a dátový sklad to je podobné ako ktokoľvek iný v tomto odvetví?
▪ Aké flexibilné je ERP dátový sklad softvér?
▪ ERP dátový sklad softvér zvládne množstvo dať ktorá sa nachádza v adátový sklad aréna“?
▪ Aké je zaznamenávanie sledovania, ktoré robí dodávateľ ERP, keď je z hľadiska času jednoduché a lacné, dať? (Aké sú záznamy predajcov ERP pri dodaní lacných, včasných a ľahko dostupných údajov?)
▪ Ako rozumie dodávateľ ERP architektúre DSS a podnikovej informačnej továrni?
▪ Dodávatelia ERP rozumejú tomu, ako to dosiahnuť dať v rámci prostredia, ale rozumejú aj tomu, ako ich exportovať?
▪ Ako otvorený je dodávateľ ERP nástrojom na skladovanie údajov?
Všetky tieto úvahy je potrebné vziať do úvahy pri určovaní, kam umiestniť dátový sklad ktorý bude hostiť i dať ERP a iné dať. Vo všeobecnosti, pokiaľ neexistuje presvedčivý dôvod urobiť inak, odporúča sa budovať dátový sklad mimo prostredia dodávateľa ERP. KAPITOLA 1 Prehľad kľúčových bodov organizácie BI:
Informačné úložiská fungujú opačne ako architektúra business intelligence (BI):
Firemná kultúra a IT môžu obmedziť úspech pri budovaní BI organizácií.

Technológia už nie je limitujúcim faktorom pre BI organizácie. Otázkou pre architektov a projektantov nie je, či technológia existuje, ale či dokážu efektívne implementovať dostupnú technológiu.

Pre mnohé spoločnosti a dátový sklad je to o niečo viac ako pasívny vklad, ktorý distribuuje dať používateľom, ktorí to potrebujú. THE dať sú extrahované zo zdrojových systémov a sú naplnené do cieľových štruktúr dátový sklad. Ja dať pri troche šťastia sa dajú aj vyčistiť. Spoločnosť však nepridáva ani nezbiera žiadnu dodatočnú hodnotu dať počas tohto procesu.

V podstate pasívne Dw v najlepšom prípade poskytuje iba i dať čisté a funkčné pre združenia užívateľov. Vytváranie informácií a analytické porozumenie sú výlučne na používateľoch. Posúďte, či DW (Dátový sklad) je úspech subjektívny. Ak úspech posudzujeme podľa schopnosti efektívne zbierať, integrovať a čistiť dať korporátne na predvídateľnom základe, potom áno, DW je úspech. Na druhej strane, ak sa pozrieme na zhromažďovanie, konsolidáciu a využívanie informácií v organizácii ako celku, potom je DW zlyhaním. DW poskytuje malú alebo žiadnu informačnú hodnotu. V dôsledku toho sú používatelia nútení vystačiť si, čím sa vytvárajú informačné silá. Táto kapitola predstavuje komplexnú víziu zhrňujúcu architektúru BI (Business Intelligence) spoločnosti. Začneme popisom BI a potom prejdeme k diskusiám o dizajne a vývoji informácií, na rozdiel od jednoduchého poskytovania informácií. dať používateľom. Diskusie sa potom zamerajú na výpočet hodnoty vášho úsilia v oblasti BI. Na záver definujeme, ako IBM rieši požiadavky vašej organizácie na architektúru BI.

Popis architektúry Organizácia BI

Výkonné transakčne orientované informačné systémy sú dnes samozrejmosťou v každom veľkom podniku a efektívne vyrovnávajú podmienky pre spoločnosti na celom svete.

Udržanie konkurencieschopnosti si však teraz vyžaduje analyticky orientované systémy, ktoré môžu spôsobiť revolúciu v schopnosti spoločnosti znovu objaviť a využiť informácie, ktoré už majú. Tieto analytické systémy pochádzajú z pochopenia bohatstva dať k dispozícii. BI môže zlepšiť výkon v rámci celého podniku. Spoločnosti môžu zlepšiť vzťahy medzi zákazníkmi a dodávateľmi, zlepšiť ziskovosť produktov a služieb, generovať nové a lepšie ponuky, kontrolovať riziko a okrem mnohých iných ziskov výrazne znížiť náklady. S BI vaša spoločnosť konečne začína využívať informácie o zákazníkoch ako konkurenčné aktívum vďaka aplikáciám, ktoré majú trhové ciele.

Mať správne obchodné nástroje znamená mať definitívne odpovede na kľúčové otázky, ako napríklad:

▪ Ktorý z našich zákazníci nútia nás zarábať viac, alebo nás nútia prísť o peniaze?
▪ Kde žijú naši najlepší zákazníci vo vzťahu k predajňa/ sklad, ktorý často navštevujú?
▪ Ktoré z našich produktov a služieb možno predávať najefektívnejšie a komu?
▪ Aké produkty možno predávať najefektívnejšie a komu?
▪ Ktorá predajná kampaň je najúspešnejšia a prečo?
▪ Ktoré predajné kanály sú pre ktoré produkty najúčinnejšie?
▪ Ako môžeme zlepšiť vzťahy s našimi najlepšími ľuďmi zákazníci? Väčšina spoločností má dať hrubé spôsoby, ako odpovedať na tieto otázky.
Operačné systémy generujú veľké množstvá produktov, zákazníkov a dať z miest predaja, rezervácií, zákazníckeho servisu a systémov technickej podpory. Výzvou je získať a využiť tieto informácie. Mnohé spoločnosti profitujú len z ich malých zlomkov dať pre strategické analýzy.
I dať zostávajúce, často spojené s i dať odvodené z externých zdrojov, ako sú vládne správy a iné zakúpené informácie, sú zlatou baňou, ktorá len čaká na preskúmanie dať len ich treba doladiť v rámci informačného kontextu vašej organizácie.

Tieto znalosti je možné aplikovať viacerými spôsobmi, od návrhu celkovej firemnej stratégie až po osobnú komunikáciu s dodávateľmi, cez call centrá, fakturáciu, Internet a ďalšie body. Dnešné obchodné prostredie diktuje, že DW a súvisiace BI riešenia sa vyvíjajú nad rámec bežných obchodných štruktúr. dať ktorý i dať normalizované na atómovej úrovni a „hviezdne/kockové farmy“.

Na zachovanie konkurencieschopnosti je potrebné spojenie tradičných a pokročilých technológií v snahe podporiť rozsiahle analytické prostredie.
Na záver, všeobecné prostredie musí zlepšiť znalosti o spoločnosti ako celku a zabezpečiť, aby opatrenia prijaté na základe vykonaných analýz boli užitočné, aby z nich mali úžitok všetci.

Povedzme napríklad, že klasifikujete svoje zákazníci do kategórií vysokého alebo nízkeho rizika.
Ak sú tieto informácie generované modelovou ťažbou alebo inými prostriedkami, musia byť vložené do DW a sprístupnené komukoľvek pomocou akéhokoľvek prístupového nástroja, ako sú statické zostavy, tabuľky, tabuľky alebo online analytické spracovanie (OLAP).

V súčasnosti však väčšina tohto typu informácií zostáva v silách dať jednotlivcov alebo oddelení, ktoré generujú analýzu. Organizácia ako celok má malú alebo žiadnu viditeľnosť pre pochopenie. Iba zmiešaním tohto typu informačného obsahu do vášho podnikového DW môžete eliminovať informačné silá a pozdvihnúť svoje DW prostredie.
Existujú dve hlavné prekážky rozvoja BI organizácie.
Po prvé, máme problém samotnej organizácie a jej disciplíny.
Aj keď nemôžeme pomôcť so zmenami organizačnej politiky, môžeme pomôcť pochopiť komponenty BI organizácie, jej architektúru a ako technológia IBM uľahčuje jej vývoj.
Druhou prekážkou, ktorú treba prekonať, je nedostatok integrovanej technológie a znalosti metódy, ktorá zahŕňa celý priestor BI, nie len malý komponent.

IBM sa vyrovnáva so zmenami v integračnej technológii. Je vašou zodpovednosťou poskytnúť premyslený dizajn. Táto architektúra musí byť vyvinutá s technológiou zvolenou pre neobmedzenú integráciu alebo prinajmenšom s technológiou, ktorá dodržiava otvorené štandardy. Okrem toho musí vedenie vašej spoločnosti zabezpečiť, aby sa podnik BI vykonával podľa plánu a neumožnil rozvoj informačných síl, ktoré vyplývajú zo samoúčelných programov alebo cieľov.
To neznamená, že prostredie BI nie je citlivé na reakcie na rôzne potreby a požiadavky rôznych používateľov; namiesto toho to znamená, že implementácia týchto individuálnych potrieb a požiadaviek sa vykonáva v prospech celej organizácie BI.
Popis architektúry organizácie BI nájdete na obrázku 9 na strane 1.1. Architektúra demonštruje bohatú zmes technológií a techník.
Z tradičného pohľadu architektúra zahŕňa nasledujúce skladové komponenty

Atómová vrstva.

Toto je základ, srdce celého DW a teda aj strategického reportingu.
I dať uložené tu si zachovajú historickú celistvosť, vzťahy z dať a zahŕňajú odvodené metriky, ako aj čistenie, integráciu a uloženie pomocou extrahovaných modelov.
Všetky ich následné použitie dať a súvisiace informácie sú odvodené z tejto štruktúry. Je to vynikajúci zdroj pre ťažbu dať a pre zostavy so štruktúrovanými SQL dotazmi

Prevádzkové depo o dať alebo nahlásiť na základe dať(Prevádzkové úložisko dát (ODS) alebo reporting databázy.)

Toto je štruktúra dať špeciálne navrhnuté pre technické správy.

I dať uložené a nahlásené nad týmito štruktúrami sa môžu nakoniec rozšíriť do skladu cez odkladací priestor, kde by sa mohli použiť na strategickú signalizáciu.

Oblasť inscenácie.

Prvá zastávka pre väčšinu dať určená pre skladové prostredie je oblasť organizácie.
Tu som dať sú integrované, čistené a transformované na dať zisky, ktoré zaplnia štruktúru skladu

Dátové trhy.

Táto časť architektúry predstavuje štruktúru dať používa sa špeciálne pre OLAP. Prítomnosť datamartov, ak i dať sú uložené v prekrývajúcich sa hviezdicových schémach dať multidimenzionálne v relačnom prostredí, alebo v súboroch dať Dôverné informácie používané špecifickou technológiou OLAP, ako je napríklad server DB2 OLAP, nie sú relevantné.

Jediným obmedzením je, že architektúra uľahčuje používanie dať viacrozmerný.
Architektúra zahŕňa aj kritické technológie a techniky BI, ktoré vynikajú ako:

Priestorová analýza

Priestor predstavuje pre analytika neočakávané informácie a je rozhodujúci pre úplné riešenie. Priestor môže predstavovať informácie o ľuďoch, ktorí žijú na určitom mieste, ako aj informácie o tom, kde je toto miesto fyzicky relatívne k zvyšku sveta.

Ak chcete vykonať túto analýzu, musíte začať spojením informácií so súradnicami zemepisnej šírky a dĺžky. Toto sa označuje ako „geokódovanie“ a musí byť súčasťou procesu extrakcie, transformácie a načítania (ETL) na atómovej úrovni vášho skladu.

Dolovanie dát.

Extrakcia dať umožňuje našim spoločnostiam zvyšovať počet zákazníci, predpovedať trendy predaja a umožniť riadenie vzťahov s zákazníci (CRM), medzi inými iniciatívami BI.

Extrakcia dať musí byť preto integrovaný so štruktúrami dať DWhouse a podporované skladovými procesmi, aby sa zabezpečilo efektívne a efektívne využitie technológie a súvisiacich techník.

Ako je uvedené v architektúre BI, atómová úroveň Dwhouse, ako aj datamartov, sú vynikajúcim zdrojom dať na extrakciu. Tie isté zariadenia musia byť príjemcami výsledkov extrakcie, aby sa zabezpečila dostupnosť pre najširšie publikum.

Agenti.

Existujú rôzni "agenti", ktorí skúmajú zákazníka pre každý bod, ako napríklad operačné systémy spoločnosti a samotné dw. Týmito agentmi môžu byť pokročilé neurónové siete trénované tak, aby sa dozvedeli o trendoch v každom bode, ako je budúci dopyt po produktoch založený na podpore predaja, motory založené na pravidlách, aby reagovali na daný súbor okolností, alebo dokonca jednoduchí agenti, ktorí hlásia výnimky „vrcholovým manažérom“. Tieto procesy vo všeobecnosti prebiehajú v reálnom čase, a preto musia byť úzko spojené s ich pohybom dať. Všetky tieto štruktúry dať, technológie a techniky zaručujú, že nebudete tráviť noc generovaním organizácie vášho BI.

Táto aktivita sa bude rozvíjať v postupných krokoch pre malé body.
Každý krok je nezávislým projektovým úsilím a vo vašej iniciatíve DW alebo BI sa označuje ako iterácia. Iterácie môžu zahŕňať implementáciu nových technológií, počnúc novými technikami, pridávanie nových štruktúr dať , načítanie i dať dodatočne alebo s rozšírením analýzy vášho prostredia. Tento odsek je podrobnejšie rozobraný v kapitole 3.

Okrem tradičných štruktúr DW a nástrojov BI existujú ďalšie funkcie vašej organizácie BI, pre ktoré musíte navrhnúť, ako napríklad:

Dotykové body zákazníka (dotyk zákazníka body).

Ako v každej modernej organizácii, aj tu existuje množstvo kontaktných bodov so zákazníkmi, ktoré naznačujú, ako získať pre vás pozitívnu skúsenosť zákazníci. Existujú tradičné kanály, ako sú maloobchodníci, operátori ústrední, direct mail, multimediálna a tlačená reklama, ako aj aktuálnejšie kanály, ako sú e-mail a web, dať výrobky s určitým kontaktným bodom sa musia získať, prepraviť, vyčistiť, spracovať a potom umiestniť do zariadení dať BI.

Základy dať prevádzkové a užívateľské združenia (operačné

databázy a komunity používateľov).
Na konci kontaktných bodov zákazníci sa nachádzajú základy dať aplikačných a používateľských komunít spoločnosti. THE dať existujúce sú dať tradičné, ktoré sa musia spojiť a zlúčiť s dať ktoré plynú z kontaktných bodov na uspokojenie potrebných informácií.

Analytici. (Analytici)

Primárnym príjemcom prostredia BI je analytik. Práve on profituje zo súčasnej ťažby o dať funkčné, integrované s rôznymi zdrojmi dať , rozšírené o funkcie, ako je geografická analýza (geokódovanie) a prezentované v technológiách BI, ktoré umožňujú extrakciu, OLAP, pokročilé výkazníctvo SQL a geografickú analýzu. Primárnym analytickým rozhraním pre reportovacie prostredie je portál BI.

Analytik však nie je jediný, kto ťaží z architektúry BI.
Manažéri, veľké užívateľské združenia a dokonca aj členovia, dodávatelia a zákazníci mali by nájsť výhody v podnikovej BI.

Slučka spätného prívodu.

Architektúra BI je vzdelávacie prostredie. Charakteristickým princípom rozvoja je umožniť trvalé štruktúry dať aktualizovať použitou technológiou BI a akciami vykonanými používateľom. Príkladom je zákaznícke bodovanie.

Ak obchodné oddelenie modeluje skóre zákazníkov na používanie novej služby, potom by obchodné oddelenie nemalo byť jedinou skupinou, ktorá bude mať zo služby prospech.

Namiesto toho by sa extrakcia modelov mala vykonávať ako prirodzená súčasť toku údajov v rámci podniku a skóre zákazníkov by sa malo stať integrovanou súčasťou kontextu informácií o sklade, ktorý je viditeľný pre všetkých používateľov. Bi-bI-centric Suite od IBM vrátane DB2 UDB, DB2 OLAP Server obsahuje väčšinu hlavných technologických komponentov definovaných na obrázku 1.1.

Používame architektúru tak, ako je znázornená na tejto ilustrácii z knihy, aby sme získali určitú úroveň kontinuity a ukázali, ako každý produkt IBM zapadá do celkovej schémy BI.

Poskytovanie informačného obsahu (poskytovanie Informačný obsah)

Návrh, vývoj a implementácia vášho prostredia BI je náročná úloha. Návrh musí zahŕňať súčasné aj budúce obchodné požiadavky. Architektonický výkres musí byť úplný, aby zahŕňal všetky závery zistené počas fázy návrhu. Realizácia musí zostať zameraná na jediný účel: vývoj architektúry BI, ako je formálne prezentovaná v návrhu a založená na obchodných požiadavkách.

Je obzvlášť ťažké tvrdiť, že disciplína zabezpečí relatívny úspech.
Je to jednoduché, pretože prostredie BI nevyvíjate naraz, ale postupne po malých krokoch.

Identifikácia komponentov BI vašej architektúry je však dôležitá z dvoch dôvodov: Budete viesť všetky následné rozhodnutia o technickej architektúre.
Budete si môcť vedome naplánovať konkrétne využitie technológie, aj keď sa vám môže stať, že nebudete potrebovať technológiu opakovane niekoľko mesiacov.

Dostatočné pochopenie vašich obchodných požiadaviek ovplyvní typ produktov, ktoré získate pre vašu architektúru.
Navrhovanie a vývoj vašej architektúry zaisťuje, že váš sklad bude

nie náhodná udalosť, ale skôr starostlivo vybudovaná „premyslená“. obsluhovať umenia ako mozaiky zmiešanej technológie.

Navrhnite obsah informácií

Celý počiatočný návrh sa musí zamerať a identifikovať kľúčové komponenty BI, ktoré budú potrebné pre celkové prostredie teraz aj v budúcnosti.
Je dôležité poznať obchodné požiadavky.

Dokonca ešte pred začatím formálneho návrhu môže plánovač projektu často identifikovať jednu alebo dve zložky hneď.
Rovnováha komponentov, ktoré môžu byť potrebné pre vašu architektúru, sa však nedá ľahko nájsť. Počas fázy návrhu hlavná časť architektúry spája zasadnutie vývoja aplikácií (JAD) s výskumom na identifikáciu obchodných požiadaviek.

Niekedy môžu byť tieto požiadavky zverené nástrojom na dopytovanie a vytváranie prehľadov.
Používatelia napríklad uvádzajú, že ak chcú automatizovať aktuálnu správu, musia ju vygenerovať manuálne integrovaním dvoch aktuálnych správ a pridaním výpočtov odvodených z kombinácie dať.
Hoci je táto požiadavka jednoduchá, definuje určitú funkčnosť funkcie, ktorú musíte zahrnúť pri nákupe nástrojov na vytváranie prehľadov pre vašu organizáciu.

Dizajnér musí splniť aj ďalšie požiadavky, aby získal úplný obraz. Chcú sa používatelia prihlásiť na odber tohto prehľadu?
Generujú sa podmnožiny prehľadov a odosielajú sa e-mailom rôznym používateľom? Chcú vidieť túto správu na firemnom portáli? Všetky tieto požiadavky sú súčasťou jednoduchej potreby nahradiť manuálnu správu podľa požiadaviek používateľov. Výhodou týchto typov požiadaviek je, že každý, používatelia aj dizajnéri, rozumejú konceptu správ.

Existujú však aj iné typy podnikov, ktoré musíme plánovať. Keď sú obchodné požiadavky uvedené vo forme strategických obchodných otázok, je pre odborného dizajnéra ľahké rozlíšiť požiadavky na mieru/skutočnosť a rozmery.

Ak používatelia JAD nevedia, ako vyjadriť svoje požiadavky vo forme obchodného problému, návrhár často poskytne príklady na rýchle spustenie relácie zhromažďovania požiadaviek.
Odborný dizajnér môže pomôcť používateľom pochopiť nielen strategické obchodovanie, ale aj spôsob jeho formovania.
Prístup zhromažďovania požiadaviek je diskutovaný v kapitole 3; zatiaľ chceme len poukázať na potrebu návrhu pre všetky typy požiadaviek BI.

Strategický obchodný problém nie je len obchodnou požiadavkou, ale aj dizajnovým kľúčom. Ak máte odpovedať na multidimenzionálnu otázku, potom si musíte zapamätať, prezentovať i dať rozmerné, a ak potrebujete uložiť dať multidimenzionálne, musíte sa rozhodnúť, aký typ technológie alebo techniky použijete.

Implementujete vyhradenú hviezdnu schému kocky alebo oboje? Ako vidíte, aj jednoduchý obchodný problém môže výrazne ovplyvniť dizajn. Ale tieto typy obchodných požiadaviek sú bežné a pochopené, aspoň dizajnérmi a plánovačmi so skúsenosťami s projektmi.

O technológiách a podpore OLAP sa dostatočne diskutovalo a k dispozícii je široká škála riešení. Doteraz sme sa zmienili o potrebe spojiť jednoduchý reporting s obchodnými rozmerovými požiadavkami a ako tieto požiadavky ovplyvňujú technické architektonické rozhodnutia.

Aké sú však požiadavky, ktorým používatelia alebo tím Dw nerozumejú? Budete niekedy potrebovať priestorovú analýzu?
Extrakčné modely dať budú nevyhnutnou súčasťou vašej budúcnosti? Kto vie?

Je dôležité poznamenať, že tieto typy technológií nie sú dobre známe všeobecným užívateľským komunitám a členom Dw tímu, čiastočne to môže byť spôsobené tým, že ich zvyčajne ovládajú niektorí interní technickí experti alebo technickí experti tretích strán. Ide o extrémny prípad problémov, ktoré tieto typy technológií vytvárajú. Ak používatelia nedokážu opísať obchodné požiadavky alebo ich sformulovať spôsobom, ktorý poskytuje návrhárom návod, môžu zostať nepovšimnutí alebo, čo je horšie, jednoducho ignorovaní.

Problematickejšie sa stáva, keď dizajnér a vývojár nedokážu rozpoznať aplikáciu jednej z týchto pokročilých, ale kritických technológií.
Ako sme často počuli dizajnérov povedať: „No, prečo to neodložíme, kým nedostaneme túto ďalšiu vec? „Naozaj ich zaujímajú priority, alebo sa jednoducho vyhýbajú požiadavkám, ktorým nerozumejú? S najväčšou pravdepodobnosťou je to posledná hypotéza. Povedzme, že váš predajný tím oznámil obchodnú požiadavku, ako je uvedené na obrázku 1.3, ako vidíte, požiadavka je zarámovaná vo forme obchodného problému. Rozdiel medzi týmto problémom a typickým rozmerovým problémom je vzdialenosť. V tomto prípade chce predajný tím mesačne poznať celkové tržby z produktov, skladov a predajní zákazníci ktorí bývajú do 5 míľ od skladu, kde nakupujú.

Žiaľ, dizajnéri alebo architekti môžu jednoducho ignorovať priestorový komponent tým, že povedia: „Máme zákazníka, produkt a dať vkladu. Ponechajme si vzdialenosť až do ďalšej iterácie.

"Zlá odpoveď. Tento typ obchodného problému je o BI. Predstavuje hlbšie pochopenie nášho podnikania a robustný analytický priestor pre našich analytikov. BI je nad rámec jednoduchého dotazovania alebo štandardného vykazovania alebo dokonca OLAP. To neznamená, že tieto technológie nie sú dôležité pre vaše BI, ale samy osebe nereprezentujú prostredie BI.

Dizajn pre informačný kontext (Navrhovanie pre informačný obsah)

Teraz, keď sme identifikovali obchodné požiadavky, ktoré odlišujú rôzne základné komponenty, musia byť zahrnuté do celkového architektonického návrhu. Niektoré komponenty BI sú súčasťou nášho počiatočného úsilia, zatiaľ čo niektoré nebudú implementované až o niekoľko mesiacov.

Všetky známe požiadavky sú však premietnuté do návrhu, takže keď potrebujeme implementovať konkrétnu technológiu, sme na to pripravení. Niečo na projekte bude odrážať tradičné myslenie.

Táto sada dať sa používa na podporu následného použitia dať dimenzionálne riadené obchodnými problémami, ktoré sme identifikovali. Ako ďalšie dokumenty sú generované, ako je vývoj dizajnu dať, začneme formalizovať, ako i dať šíria sa v prostredí. Zistili sme potrebu zastupovať i dať dimenzionálnym spôsobom ich rozdelením (podľa špecifických špecifických potrieb) na dátové trhy.

Ďalšia otázka na zodpovedanie znie: ako budú tieto dátové trhy postavené?
Staviate hviezdy na podporu kociek, alebo len kocky, alebo len hviezdy? (alebo pravé kocky, alebo pravé hviezdy). Vytvorte architektúru pre závislé dátové trhy, ktoré vyžadujú atómovú vrstvu pre všetkých dať získané? Umožnite nezávislým dátovým trhom získavať i dať priamo z operačných systémov?

Akú technológiu kocky sa pokúsite štandardizovať?

Máte obrovské množstvo dať potrebné na rozmerovú analýzu alebo potrebujete kocky od vášho národného predajcu na týždennej báze alebo oboje? Vytvárate niečo tak výkonné, ako je DB2 OLAP Server pre financie alebo kocky Cognos PowerPlay pre vašu predajnú organizáciu, alebo oboje? Toto sú veľké rozhodnutia o architektonickom dizajne, ktoré odteraz ovplyvnia vaše prostredie BI. Áno, potvrdili ste potrebu OLAP. Ako teraz vykonáte tento typ techniky a technológie?

Ako niektoré z najpokročilejších technológií ovplyvňujú vaše návrhy? Predpokladajme, že ste identifikovali potrebu priestoru vo vašej organizácii. Teraz si musíte spomenúť na edície architektonických výkresov, aj keď neplánujete robiť priestorové komponenty niekoľko mesiacov. Architekt musí dnes navrhovať na základe toho, čo je potrebné. Predvídať potrebu priestorovej analýzy, ktorá generuje, ukladá, vykonáva a poskytuje prístup dať priestorové. To by malo slúžiť ako obmedzenie týkajúce sa typu softvérovej technológie a špecifikácií platformy, ktoré môžete v súčasnosti zvážiť. Napríklad systém administrácie databázy relačná vrstva (RDBMS), ktorú vykonávate pre svoju atómovú vrstvu, musí mať k dispozícii robustný priestorový rozsah. To by zabezpečilo maximálny výkon pri používaní geometrie a priestorových objektov vo vašich analytických aplikáciách. Ak váš RDBMS nedokáže zvládnuť dať (priestorovo-centrické) interne, takže budete musieť založiť a databázy (priestorovo-centrické) vonkajšie. To komplikuje správu problémov a ohrozuje váš celkový výkon, nehovoriac o dodatočných problémoch vytvorených pre vašich DBA, pretože pravdepodobne len minimálne rozumejú základom dať aj priestorové. Na druhej strane, ak váš modul RDMBS spracováva všetky priestorové komponenty a jeho optimalizátor si je vedomý špeciálnych potrieb (napríklad indexovanie) priestorových objektov, potom vaši správci databáz môžu ľahko zvládnuť správu problémov a môžete maximalizovať výkon.

Okrem toho musíte upraviť oblasť prípravy a vrstvu atómového prostredia tak, aby zahŕňali čistenie adries (a

kľúčový prvok priestorovej analýzy), ako aj následné šetrenie vesmírnych objektov. Postupnosť edícií kreslenia pokračuje teraz, keď sme zaviedli pojem jasného smerovania. Po prvé, táto aplikácia bude diktovať typ softvéru potrebného pre vaše ETL úsilie.

Potrebujete produkty ako Trillium, ktoré mu poskytnú čistú adresu, alebo ETL predajcu podľa vášho výberu, ktorý vám poskytne túto funkciu?
Nateraz je dôležité, aby ste ocenili úroveň dizajnu, ktorý musí byť dokončený predtým, ako začnete s realizáciou vášho skladu. Vyššie uvedené príklady by mali demonštrovať množstvo rozhodnutí o dizajne, ktoré musia nasledovať po identifikácii akejkoľvek konkrétnej obchodnej požiadavky. Ak sú tieto rozhodnutia o dizajne urobené správne, podporujú vzájomnú závislosť medzi fyzickými štruktúrami vášho prostredia, výberom použitej technológie a tokom šírenia informačného obsahu. Bez tejto konvenčnej architektúry BI bude vaša organizácia vystavená chaotickej zmesi existujúcich technológií, prinajlepšom voľne spojených, aby poskytovali zdanlivú stabilitu.

Udržujte informačný obsah

Priniesť hodnotu informácií do vašej organizácie je veľmi náročná úloha. Bez dostatočného porozumenia a skúseností alebo správneho plánovania a dizajnu zlyhajú aj tie najlepšie tímy. Na druhej strane, ak máte skvelú intuíciu a detailné plánovanie, ale nemáte disciplínu pri realizácii, len ste premrhali peniaze a čas, pretože vaše úsilie je odsúdené na neúspech. Správa by mala byť jasná: Ak vám chýba jedna alebo viacero z týchto zručností, porozumenie/skúsenosť alebo disciplína plánovania/návrhu alebo implementácie, ochromí to alebo zničí budovanie organizácie BI.

Je váš tím dostatočne pripravený? Je vo vašom tíme BI niekto, kto rozumie rozsiahlemu analytickému prostrediu dostupnému v prostrediach BI a technikám a technológiám potrebným na udržanie tohto prostredia? Je vo vašom tíme niekto, kto dokáže rozpoznať rozdiel medzi pokročilými aplikáciami

statické výkazníctvo a OLAP, alebo rozdiely medzi ROLAP a OLAP? Vie jeden z členov vášho tímu jasne vedieť, ako extrahovať a ako to môže ovplyvniť sklad, alebo ako môže sklad podporovať výkon extrakcie? Člen tímu chápe hodnotu dať vesmírna alebo agentská technológia? Máte niekoho, kto oceňuje jedinečnú aplikáciu nástrojov ETL oproti technológii sprostredkovateľa správ? Ak ho nemáte, zaobstarajte si ho. BI je oveľa väčšia ako normalizovaná atómová vrstva, OLAP, hviezdne schémy a ODS.

Porozumenie a skúsenosti s rozpoznávaním požiadaviek BI a ich riešení sú nevyhnutné pre vašu schopnosť správne formalizovať potreby používateľov a navrhnúť a implementovať ich riešenia. Ak má vaša komunita používateľov ťažkosti s popisom požiadaviek, je úlohou skladového tímu poskytnúť toto pochopenie. Ale ak tým sklad

nepozná špecifickú aplikáciu BI - napríklad dolovanie údajov - potom nie je najlepšie, že prostredia BI sú často obmedzené na pasívne úložiská. Ignorovanie týchto technológií však neznižuje ich dôležitosť a vplyv, ktorý majú na vznik schopností vašej organizácie v oblasti business intelligence, ako aj informačného prostredia, ktoré plánujete podporovať.

Plánovanie musí zahŕňať pojem kreslenia a oboje si vyžaduje kompetentnú osobu. Okrem toho si návrh vyžaduje filozofiu tímového skladu a dodržiavanie noriem. Ak napríklad vaša spoločnosť zriadila štandardnú platformu alebo identifikovala konkrétny RDBMS, ktorý chcete štandardizovať na celej platforme, je povinnosťou každého v tíme dodržiavať tieto štandardy. Vo všeobecnosti tím vystavuje potrebu štandardizácie (komunitám používateľov), ale samotný tím nie je ochotný dodržiavať štandardy zavedené aj v iných oblastiach v spoločnosti alebo možno dokonca v podobných spoločnostiach. Nielenže je to pokrytecké, ale zároveň to potvrdzuje, že spoločnosť nie je schopná využívať existujúce zdroje a investície. Neznamená to, že neexistujú situácie, ktoré si vyžadujú neštandardizovanú platformu alebo technológiu; však skladové úsilie

mali by žiarlivo chrániť štandardy spoločnosti, kým obchodné požiadavky nebudú diktovať inak.

Tretím kľúčovým komponentom potrebným na vybudovanie BI organizácie je disciplína.
Závisí to celkovo, rovnako od jednotlivcov a prostredia. Projektanti, sponzori, architekti a používatelia musia oceniť disciplínu potrebnú na vybudovanie informačnej štruktúry spoločnosti. Dizajnéri musia nasmerovať svoje dizajnérske úsilie tak, aby dopĺňali ostatné nevyhnutné snahy v spoločnosti.

Povedzme napríklad, že vaša spoločnosť vytvorí aplikáciu ERP, ktorá obsahuje komponent skladu.
Preto je zodpovednosťou dizajnérov ERP spolupracovať s tímom skladového prostredia, aby nekonkurovali alebo neduplikovali už začatú prácu.

Disciplína je tiež témou, ktorej sa musí venovať celá organizácia a je zvyčajne ustanovená a zverená výkonnej úrovni.
Sú manažéri ochotní dodržiavať navrhnutý prístup? Prístup, ktorý sľubuje vytvorenie informačného obsahu, ktorý v konečnom dôsledku prinesie hodnotu všetkým oblastiam podniku, ale možno ohrozuje agendy jednotlivcov alebo oddelení? Pamätajte na príslovie: „Premýšľať o všetkom je dôležitejšie ako myslieť len na jednu vec“. Toto príslovie platí pre organizácie BI.

Bohužiaľ, mnoho skladov zameriava svoje úsilie na snahu zacieliť a priniesť hodnotu konkrétnemu oddeleniu alebo konkrétnym používateľom, bez ohľadu na organizáciu ako celok. Predpokladajme, že výkonný pracovník požiada o pomoc tím ubytovne. Tím odpovedá 90-dňovým úsilím, ktoré zahŕňa nielen doručenie požiadaviek na oznamovanie definovaných manažérom, ale aj zabezpečenie toho, aby všetky dať bázy sa zmiešajú na atómovej úrovni pred zavedením do navrhovanej technológie kocky.
Tento inžiniersky doplnok zaisťuje, že z toho bude mať prospech aj podnik v bývalom domove dať potrebné pre manažéra.
Výkonný riaditeľ však hovoril s externými poradenskými spoločnosťami, ktoré navrhli podobnú aplikáciu s doručením za menej ako 4 týždne.

Za predpokladu, že tím interného skladu je kompetentný, výkonný pracovník má na výber. Kto môže podporovať dodatočnú inžiniersku disciplínu potrebnú na kultiváciu podniku s informačnými aktívami, alebo sa môže rozhodnúť rýchlo vybudovať svoje vlastné riešenie. Zdá sa, že posledný z nich je vyberaný príliš často a slúži len na vytváranie zásobníkov informácií, z ktorých má úžitok len málokto alebo jednotlivec.

Krátkodobé a dlhodobé ciele

Architekti a projektanti musia formalizovať dlhodobú víziu celkovej architektúry a plány rastu v organizácii BI. Táto kombinácia krátkodobého zisku a dlhodobého plánovania predstavuje dve strany úsilia BI. Krátkodobý zisk je aspekt BI, ktorý je spojený s iteráciami vášho skladu.

Tu sa plánovači, architekti a sponzori zameriavajú na splnenie špecifických komerčných požiadaviek. Na tejto úrovni sa budujú fyzické štruktúry, nakupuje sa technológia a implementujú sa techniky. V žiadnom prípade nie sú vytvorené tak, aby riešili špecifické požiadavky, ako ich definujú konkrétne komunity používateľov. Všetko sa robí s cieľom riešiť špecifické požiadavky definované konkrétnou komunitou.
Dlhodobé plánovanie je však ďalším aspektom BI. Práve tu plány a návrhy zabezpečili, že akákoľvek fyzická štruktúra bola postavená, technológie boli vybrané a techniky implementované s ohľadom na podnik. Je to dlhodobé plánovanie, ktoré poskytuje súdržnosť potrebnú na zabezpečenie toho, aby obchodné výhody vyplývali z akýchkoľvek zistených krátkodobých ziskov.

Zdôvodnite svoje úsilie BI

Un dátový sklad sama o sebe nemá žiadnu vlastnú hodnotu. Inými slovami, medzi skladovými technológiami a implementačnými technikami neexistuje žiadna inherentná hodnota.

Hodnota akéhokoľvek úsilia v sklade sa nachádza v činnostiach vykonaných v dôsledku prostredia skladu a v informačnom obsahu kultivovanom v priebehu času. Toto je kritický bod, ktorému treba porozumieť skôr, ako sa vôbec pokúsite odhadnúť hodnotu akejkoľvek iniciatívy v dome.

Architekti a dizajnéri sa príliš často pokúšajú aplikovať hodnotu na fyzické a technické komponenty skladu, pričom v skutočnosti je hodnota založená na obchodných procesoch, ktoré sú skladom pozitívne ovplyvnené, a na dobre získaných informáciách.

V tom spočíva výzva založenia BI: Ako zdôvodníte investíciu? Ak samotný sklad nemá žiadnu vnútornú hodnotu, projektanti musia preskúmať, definovať a formalizovať výhody dosiahnuté tými jednotlivcami, ktorí budú sklad používať na zlepšenie špecifických obchodných procesov alebo hodnoty chránených informácií alebo oboch.

Aby sa veci skomplikovali, akýkoľvek obchodný proces ovplyvnený úsilím o skladovanie by mohol poskytnúť „značné“ alebo „nepatrné“ výhody. Značné výhody poskytujú hmatateľnú metriku na meranie návratnosti investícií (ROI) – napríklad obrat zásob dodatočne počas určitého obdobia alebo nižšie prepravné náklady na zásielku. Je ťažšie definovať jemné výhody, ako je lepší prístup k informáciám, z hľadiska hmatateľnej hodnoty.

Pripojte svoj projekt a dozviete sa viac o Obchodné požiadavky

Plánovači projektov sa príliš často pokúšajú spojiť hodnotu skladu s amorfnými podnikovými cieľmi. Vyhlásením, že „hodnota skladu je založená na našej schopnosti uspokojiť strategické požiadavky“ otvárame diskusiu príjemným spôsobom. Len to však nestačí na to, aby sme zistili, či má investícia do zásob zmysel. Najlepšie je prepojiť iterácie skladu so špecifickými, známymi obchodnými požiadavkami.

Meranie ROI

Výpočet ROI v prostredí skladu môže byť obzvlášť náročný. Je obzvlášť ťažké, ak výhodu

princíp konkrétneho opakovania je niečo, čo nie je hmatateľné alebo ľahko merateľné. Jedna štúdia zistila, že používatelia vnímajú dve hlavné výhody iniciatív BI:

▪ Vytvorte schopnosť vytvárať rozhodnutia
▪ Vytvoriť prístup k informáciám
Tieto výhody sú mäkké (alebo mierne) výhody. Je ľahké vidieť, ako môžeme vypočítať ROI na základe tvrdej (alebo veľkej) výhody, ako sú znížené náklady na dopravu, ale ako zmeriame schopnosť robiť lepšie rozhodnutia?
Toto je určite výzva pre projektantov, keď sa snažia presvedčiť spoločnosť, aby investovala do konkrétneho skladového úsilia. Zvyšovanie predaja alebo znižovanie nákladov už nie sú ústrednými motívmi prostredia BI.
Namiesto toho sa pozeráte na obchodné požiadavky na lepší prístup k informáciám, aby sa konkrétne oddelenie mohlo rozhodovať rýchlejšie. Ide o strategické faktory, ktoré sú pre podnik rovnako dôležité, ale sú nejednoznačnejšie a ťažšie sa dajú charakterizovať v konkrétnej metrike. V tomto prípade môže byť výpočet ROI zavádzajúci, ak nie irelevantný.
Projektanti musia byť schopní preukázať hmatateľnú hodnotu pre manažérov, aby mohli rozhodnúť, či sa investícia do konkrétnej iterácie oplatí. Nebudeme však navrhovať nový spôsob výpočtu ROI, ani nebudeme uvádzať žiadne argumenty pre alebo proti.
Existuje veľa článkov a kníh, ktoré pojednávajú o základoch výpočtu návratnosti investícií. Existujú špeciálne hodnotové ponuky, ako napríklad hodnota investovania (VOI), ktoré ponúkajú skupiny ako Gartner, ktoré si môžete vyhľadať. Namiesto toho sa zameriame na základné aspekty akejkoľvek návratnosti investícií alebo iných hodnotových návrhov, ktoré musíte zvážiť. Uplatňuje sa návratnosť investícií Okrem argumentu o „tvrdých“ výhodách verzus „mäkkých“ výhodách spojených s úsilím BI existujú aj ďalšie otázky, ktoré je potrebné zvážiť pri uplatňovaní návratnosti investícií. Napríklad:

Pripisujte príliš veľa úspor úsiliu DW, ktoré by aj tak prišlo
Povedzme, že vaša spoločnosť prešla z architektúry sálového počítača na distribuované prostredie UNIX. Takže akékoľvek úspory, ktoré sa môžu (alebo nemusia) dosiahnuť týmto úsilím, by sa nemali pripisovať výlučne, ak vôbec (?), skladu.

Neúčtovať všetko je nákladné. A treba brať do úvahy veľa vecí. Zvážte nasledujúci zoznam:

▪ Počiatočné náklady vrátane realizovateľnosti.
▪ Náklady na vyhradený hardvér so súvisiacim úložiskom a komunikáciou
▪ Náklady na softvér vrátane správy dať a rozšírenia klient/server, ETL softvér, DSS technológie, vizualizačné nástroje, aplikácie na plánovanie a workflow a monitorovací softvér, .
▪ Náklady na návrh štruktúry dať, s vytvorením a optimalizáciou
▪ Náklady na vývoj softvéru priamo spojené s úsilím BI
▪ Náklady na domácu podporu vrátane optimalizácie výkonu vrátane kontroly verzie softvéru a operácií pomocníka Použite ROI „Big-Bang“. Vybudovanie skladu ako jediného obrovského úsilia je odsúdené na neúspech, takže aj vypočítať návratnosť investícií pre iniciatívu veľkého podniku Ponuka je prekvapivá a plánovači sa aj naďalej pokúšajú odhadnúť hodnotu celého úsilia. Prečo sa plánovači snažia pripísať podnikateľskej iniciatíve peňažnú hodnotu, ak je všeobecne známe a akceptované, že odhadovanie konkrétnych opakovaní je ťažké? Ako je to možné? Nie je to možné, až na pár výnimiek. Nerob to. Teraz, keď sme stanovili, čo nerobiť pri výpočte návratnosti investícií, tu je niekoľko bodov, ktoré nám pomôžu vytvoriť spoľahlivý proces odhadu hodnoty vášho úsilia v oblasti BI.

Získanie konsenzu ROI. Bez ohľadu na váš výber techniky na odhadnutie hodnoty vášho úsilia BI, musia s ňou súhlasiť všetky strany vrátane projektantov, sponzorov a obchodných manažérov.

Znížte ROI na identifikovateľné časti. Nevyhnutným krokom k rozumnému výpočtu ROI je zamerať tento výpočet na konkrétny projekt. To vám potom umožňuje odhadnúť hodnotu na základe konkrétnych obchodných požiadaviek, ktoré sú splnené

Definujte náklady. Ako už bolo spomenuté, je potrebné zvážiť množstvo nákladov. Okrem toho náklady musia zahŕňať nielen tie, ktoré sú spojené s jednou iteráciou, ale aj náklady spojené so zabezpečením súladu s podnikovými normami.

Definujte výhody. Jasným prepojením ROI s konkrétnymi obchodnými požiadavkami by sme mali byť schopní identifikovať výhody, ktoré povedú k splneniu požiadaviek.

Znížiť náklady a prínosy v hroziacich ziskoch. Je to najlepší spôsob, ako založiť svoje ocenenia na čistej súčasnej hodnote (NPV), na rozdiel od snahy predpovedať budúcu hodnotu budúcich príjmov.

Udržujte načasovanie rozdelenia návratnosti investícií na minimum. Je dobre zdokumentovaný počas dlhého obdobia, počas ktorého sa používa vo vašej návratnosti investícií.

Použite viac ako jeden vzorec ROI. Existuje množstvo metód na predpovedanie návratnosti investícií a mali by ste si naplánovať, či použijete jednu alebo viacero z nich, vrátane čistej súčasnej hodnoty, vnútornej miery návratnosti (IRR) a návratnosti.

Definujte opakovateľný proces. To je rozhodujúce pre výpočet akejkoľvek dlhodobej hodnoty. Pre všetky následné postupnosti projektu by mal byť zdokumentovaný jeden opakovateľný proces.

Uvedené problémy sú najbežnejšie definované odborníkmi v prostredí ubytovní. Naliehanie manažmentu na dosiahnutie ROI „veľkého tresku“ je veľmi dezorientujúce. Ak začnete všetky svoje výpočty návratnosti investícií tak, že ich rozdelíte na identifikovateľné, hmatateľné časti, máte veľkú šancu odhadnúť presné hodnotenie návratnosti investícií.

Otázky týkajúce sa výhod návratnosti investícií

Nech už sú vaše výhody akékoľvek, mäkké alebo tvrdé, na určenie ich hodnoty môžete použiť niekoľko základných otázok. Napríklad pomocou jednoduchého škálovacieho systému od 1 do 10 môžete merať dopad akéhokoľvek úsilia pomocou nasledujúcich otázok:

Ako by ste ohodnotili pochopenie dať sleduje tento projekt vašej spoločnosti?
Ako by ste odhadli zlepšenia procesov v dôsledku tohto projektu?
Ako by ste zmerali vplyv nových poznatkov a záverov, ktoré sú teraz sprístupnené touto iteráciou?
Aký bol vplyv nových, vysokovýkonných počítačových prostredí v dôsledku toho, čo sme sa naučili? Ak je odpovedí na tieto otázky málo, je možné, že spoločnosť nestojí za investíciu. Otázky s vysokým skóre poukazujú na významné zisky hodnoty a mali by slúžiť ako návod na ďalšie skúmanie. Napríklad vysoké skóre za zlepšenia procesov by malo viesť dizajnérov k tomu, aby preskúmali, ako sa procesy zlepšili. Možno zistíte, že niektoré alebo všetky dosiahnuté zisky sú hmatateľné, a preto sa dá ľahko použiť peňažná hodnota. Vyťaženie maxima z prvej iterácie sklad Najväčší výsledok vášho podnikového úsilia je často v prvých niekoľkých iteráciách. Tieto počiatočné snahy tradične vytvárajú najužitočnejší informačný obsah pre verejnosť a pomáhajú vytvoriť technologický základ pre následné aplikácie BI. Zvyčajne každá ďalšia následná sekvencia dať skladových projektov prinášajú spoločnosti vo všeobecnosti čoraz menšiu pridanú hodnotu. Platí to najmä vtedy, ak iterácia nepridáva nové témy alebo nespĺňa potreby novej používateľskej komunity.

Táto funkcia ukladania sa vzťahuje aj na rastúce hromady dať historikov. Keďže následné úsilie si vyžaduje viac dať a ako viac dať sa v priebehu času naleje do skladu väčšina dať sa stáva menej relevantným pre použitú analýzu. Títo dať často sa nazývajú dať nečinné a ich udržiavanie je vždy drahé, pretože sa takmer vôbec nepoužívajú.

Čo to znamená pre sponzorov projektu? Skorí sponzori v podstate zdieľajú viac, než koľko stojí investícia. Je to primárne, pretože sú impulzom pre vytvorenie širokého technologického prostredia skladu a vrstvy zdrojov, vrátane organických.

Tieto prvé kroky však prinášajú najvyššiu hodnotu, a preto musia projektanti často zdôvodňovať investíciu.
Projekty realizované po vašej iniciatíve BI môžu mať nižšie (v porovnaní s prvým) a priame náklady, ale prinášajú spoločnosti menšiu hodnotu.

A majitelia organizácií musia začať uvažovať o vyhadzovaní akumulácie dať a menej relevantné technológie.

Data mining: Extrakcia dati

Početné architektonické komponenty vyžadujú variácie v technológiách a technikách dolovania údajov –
napríklad rôzni „agenti“ na skúmanie bodov záujmu zákazníci, operačné systémy spoločnosti a pre samotný dw. Týmito agentmi môžu byť pokročilé neurónové siete trénované na trendoch POT, ako je budúci dopyt po produktoch založený na podpore predaja; motory založené na pravidlách, aby reagovali na súbor daný okolnosti, napríklad lekárska diagnóza a odporúčania na liečbu; alebo dokonca jednoduchých agentov s úlohou hlásiť výnimky vrcholovým manažérom. Vo všeobecnosti tieto extrakčné procesy dať si

overiť v reálnom čase; preto musia byť úplne zjednotené s pohybom dať sami.

Online analytické spracovanie

Online Analytics

Možnosť krájania, krájania, kotúľania, vŕtania a vykonávania analýzy
what-if, je v rámci rozsahu, na ktorý sa zameriava technologický balík IBM. Napríklad pre DB2 existujú funkcie online analytického spracovania (OLAP), ktoré prinášajú dimenzionálnu analýzu do softvérového nástroja. databázy rovnaký .

Funkcie pridávajú do SQL rozmerovú užitočnosť a zároveň využívajú všetky výhody prirodzenej súčasti DB2. Ďalším príkladom integrácie OLAP je extrakčný nástroj DB2 OLAP Server Analyzer. Táto technológia umožňuje, aby kocky servera DB2 OLAP boli rýchlo a automaticky analyzované s cieľom lokalizovať a hlásiť hodnoty hodnôt dať neobvyklé alebo neočakávané v celej kocke pre obchodného analytika. A nakoniec, funkcie DW Center poskytujú architektom prostriedky na ovládanie, okrem iného, profilu serverovej kocky DB2 OLAP ako prirodzenej súčasti procesov ETL.

Priestorová analýza Priestorová analýza

Priestor predstavuje polovicu analytických kotiev (zvodov) potrebných pre panorámu
široký analytický (čas predstavuje druhú polovicu). Atómová úroveň skladu, znázornená na obrázku 1.1, zahŕňa základy času a priestoru. Časové pečiatky ukotvujú analýzy podľa času a analýzy informácií o adresách podľa priestoru. Časové pečiatky vykonávajú analýzu podľa času a informácie o adrese vykonávajú analýzu podľa priestoru. Diagram ukazuje geokódovanie – proces premeny adries na body na mape alebo body v priestore, aby bolo možné v analýze použiť pojmy ako vzdialenosť a vnútro/vonku – vykonávané na atómovej úrovni a priestorovú analýzu, ktorá je sprístupnená analytik. IBM poskytuje priestorové rozšírenia vyvinuté v spolupráci s Environmental System Research Institute (ESRI). databázy DB2, takže priestorové objekty môžu byť uložené ako normálna súčasť databázy vzťahový. DB2

Priestorové rozšírenia tiež poskytujú všetky rozšírenia SQL na využitie priestorovej analýzy. Napríklad rozšírenia SQL na dopytovanie
vzdialenosť medzi adresami alebo či je bod vnútri alebo mimo definovanej polygonálnej oblasti, sú analytickým štandardom pre Spatial Extender. Viac informácií nájdete v kapitole 16.

databázy-Nástroje rezidentných nástrojov databázy-Obyvateľ

DB2 má mnoho BI-rezidentných funkcií SQL, ktoré pomáhajú pri akcii analýzy. Tie obsahujú:

Funkcie rekurzie na vykonanie analýzy, ako napríklad „nájdenie všetkých možných dráh letu z San Francisco a New York".
Analytické funkcie na klasifikáciu, kumulatívne funkcie, kocky a súhrny na uľahčenie úloh, ktoré sa bežne vyskytujú iba s technológiou OLAP, sú teraz prirodzenou súčasťou motora. databázy
Schopnosť vytvárať tabuľky, ktoré obsahujú výsledky
Predajcovia z databázy lídri kombinujú viac možností BI do databázy to isté.
Hlavnými dodávateľmi databázy miešajú viac možností BI do databázy to isté.
To poskytuje lepší výkon a viac možností vykonávania riešení BI.
Vlastnosti a funkcie DB2 V8 sú podrobne popísané v nasledujúcich kapitolách:
Základy technickej architektúry a správy údajov (kapitola 5)

Základy DB2 BI (kapitola 6)
Tabuľky materializovaných dotazov DB2 (kapitola 7)
Funkcie DB2 OLAP (kapitola 13)
DB2 Enhanced BI Features and Functions (kapitola 15) Zjednodušený systém doručovania údajov Systém doručenia dať zjednodušené

Architektúra znázornená na obrázku 1.1 obsahuje množstvo štruktúr dať fyzické. Jedným z nich je sklad dať prevádzkové. Vo všeobecnosti je ODS subjektovo orientovaný, integrovaný a aktuálny objekt. Postavili by ste ODS na podporu napríklad obchodnej kancelárie. Predaje ODS by doplnili dať z mnohých rôznych systémov, ale zachovali by sa napríklad len dnešné transakcie. ODS je možné aktualizovať aj mnohokrát za deň. Zároveň procesy tlačia na dať integrované do iných aplikácií. Táto štruktúra je špeciálne navrhnutá na integráciu dať aktuálne a dynamické a boli by pravdepodobným kandidátom na podporu analýzy v reálnom čase, ako napríklad poskytovanie servisným agentom zákazníci aktuálne informácie o predaji zákazníka extrahovaním informácií o trendoch predaja zo samotného skladu. Ďalšia štruktúra zobrazená na obrázku 1.1 je formálny stav pre dw. Nielenže je to miesto na vykonanie potrebnej integrácie, kvality daťa o transformácii dať vstupného skladu, ale je to aj spoľahlivý a dočasný sklad pre dať replikáty, ktoré by sa dali použiť v analýzach v reálnom čase. Ak sa rozhodnete použiť ODS alebo fázovú oblasť, jeden z najlepších nástrojov na osídlenie týchto štruktúr dať Použitie rôznych operačných zdrojov je heterogénny distribuovaný dotaz DB2. Túto schopnosť poskytuje voliteľná funkcia DB2 s názvom DB2 Relational Connect (iba dotaz) a prostredníctvom DB2 DataJoiner (samostatný produkt, ktorý poskytuje možnosť dotazovania, vkladania, aktualizácie a vymazávania heterogénnym distribuovaným systémom RDBMS).

Táto technológia umožňuje architektom dať zviazať dať výroba s analytickými procesmi. Nielen, že sa technológia dokáže prispôsobiť prakticky akýmkoľvek požiadavkám na replikáciu, ktoré môžu vzniknúť pri analýze v reálnom čase, ale môže sa tiež pripojiť k širokej škále základní. dať najpopulárnejšie, vrátane DB2, Oracle, Sybase, SQL Server, Informix a ďalších. DB2 DataJoiner možno použiť na vyplnenie štruktúry dať formálne ako ODS alebo dokonca stály stôl zastúpený v sklade určený na rýchle obnovenie okamžitých aktualizácií alebo na predaj. Samozrejme, tieto isté štruktúry dať možno osídliť pomocou

ďalšia dôležitá technológia určená na replikáciu dať, IBM DataPropagator Relational. (DataPropagator je samostatný produkt pre centrálne systémy. DB2 UNIX, Linux, Windows a OS/2 zahŕňajú služby replikácie údajov dať ako štandardná funkcia).
Ďalší spôsob pohybu dať Okolo podniku je integrátor podnikových aplikácií, inak známy ako sprostredkovateľ správ. Táto jedinečná technológia umožňuje bezkonkurenčnú kontrolu pri zacielení a presúvaní dať okolo firmy. IBM má najpoužívanejšieho sprostredkovateľa správ, MQSeries, alebo variáciu produktu, ktorá zahŕňa požiadavky e-commerce, IBM WebSphere MQ.
Pre viac diskusií o tom, ako využiť MQ na podporu prostredia skladu a BI, navštívte webové stránky knihy. Nateraz stačí povedať, že táto technológia je vynikajúcim prostriedkom na zachytenie a transformáciu (pomocou integrátora MQSeries) dať centrovaní (cielení) operátori prijatí pre BI riešenia. Technológia MQ bola integrovaná a zabalená do UDB V8, čo znamená, že fronty správ je teraz možné spravovať, ako keby to boli tabuľky DB2. Koncept zvárania vo fronte správ a vesmír databázy relačné smeruje k výkonnému doručovaciemu prostrediu dať.

Zero-Latency Nulová latencia

Konečným strategickým cieľom IBM je analýza s nulovou latenciou. Podľa definície
Gartner, BI systém musí byť schopný odvodiť, asimilovať a poskytnúť informácie analytikom na požiadanie. Výzvou, samozrejme, je, ako miešať dať aktuálne a v reálnom čase s potrebnými historickými informáciami, ako napr dať súvisiaci vzor/trend alebo extrahované porozumenie, ako napríklad profilovanie zákazníkov.

Medzi takéto informácie patrí napríklad identifikácia zákazníci s vysokým alebo nízkym rizikom alebo ktoré produkty i zákazníci s najväčšou pravdepodobnosťou nakúpia, ak už majú syr vo svojich nákupných košíkoch.

Dosiahnutie nulovej latencie v skutočnosti závisí od dvoch základných mechanizmov:

Kompletné spojenie dať ktoré sú analyzované pomocou zavedených techník a nástrojov vytvorených BI
Systém doručenia dať Tieto predpoklady pre nulovú latenciu sa nelíšia od dvoch cieľov stanovených IBM a popísaných vyššie. Úzke spojenie dať Je súčasťou bezproblémového integračného programu IBM. A vytvorte systém doručovania dať efektívna je úplne závislá od dostupnej technológie, ktorá zjednodušuje proces dodávky dať. V dôsledku toho sú dva z troch cieľov IBM rozhodujúce pre realizáciu tretieho. IBM vedome vyvíja svoju technológiu, aby zabezpečila, že nulová latencia bude realitou pre skladové práce. Zhrnutie / Syntéza Organizácia BI poskytuje plán na vytvorenie vášho prostredia
iteratívne. Musí byť upravený tak, aby odrážal potreby vášho podnikania, súčasné aj budúce. Bez širokej architektonickej vízie sú iterácie skladov o niečo viac ako náhodné implementácie centrálneho skladu, ktoré málo vytvárajú široký a informatívny podnik. Prvou prekážkou pre projektových manažérov je, ako zdôvodniť investície potrebné na rozvoj BI organizácie. Zatiaľ čo výpočet ROI zostal základom implementácií skladov, je čoraz ťažšie presne predpovedať. To viedlo k ďalším metódam na určenie, či dostávate svoje peniaze. Ako riešenie sa propaguje napríklad hodnota investície2 (VOI). Je to povinnosťou architektov z dať a plánovači projektov zámerne generujú a poskytujú informácie združeniam užívateľov a nielen im poskytujú službu dať. Je medzi nimi obrovský rozdiel. Informácie sú niečo, čo robí rozdiel v rozhodovacích procesoch a efektívnosti; relatívne, t.j dať sú stavebnými kameňmi na odvodenie týchto informácií.

Aj keď som kritický voči zdroju dať Na riešenie obchodných požiadaviek by prostredie BI malo zohrávať väčšiu úlohu pri vytváraní informačného obsahu. Musíme podniknúť ďalšie kroky na čistenie, integráciu, transformáciu alebo iné vytváranie informačného obsahu, na základe ktorého môžu používatelia konať, a potom musíme zabezpečiť, aby sa tieto akcie a rozhodnutia, ak je to primerané, premietli do prostredia BI. Ak sklad odsunieme, aby slúžil iba ďalej dať, je zabezpečené, že združenia používateľov vytvoria informačný obsah potrebný na prijatie opatrení. To zaisťuje, že ich komunita bude môcť robiť lepšie rozhodnutia, ale spoločnosť trpí nedostatkom vedomostí, ktoré použili. Dato že architekti a projektanti iniciujú konkrétne projekty v prostredí BI, zostávajú zodpovední voči podniku ako celku. Jednoduchý príklad tejto obojstrannej charakteristiky iterácií BI sa nachádza v zdroji dať. Všetko dať prijaté pre špecifické obchodné požiadavky musia byť vyplnené v prvej atómovej vrstve. To zaisťuje vývoj podnikových informačných aktív, ako aj správu a riešenie špecifických požiadaviek používateľov definovaných v iterácii.

Čo je DataWarehouse?

Dátový sklad je srdcom architektúry informačných systémov od roku 1990 a podporuje informačné procesy tým, že ponúka solídnu integrovanú platformu dať historické údaje použité ako základ pre následné analýzy. THE dátový sklad ponúkajú jednoduchú integráciu vo svete nekompatibilných aplikačných systémov. Dátový sklad sa vyvinul do trendu. Dátový sklad organizovať a skladovať i dať potrebné pre informačné a analytické procesy založené na dlhej historickej časovej perspektíve. To všetko znamená značné a neustále nasadenie pri výstavbe a údržbe dátový sklad.

Čo je teda a dátový sklad? dátový sklad A:

▪ predmetovo
▪ integrovaný systém
▪ čas variantu
▪ neprchavý (nevymaže sa)

zbierka dať slúži na podporu manažérskych rozhodnutí pri implementácii procesov.
I dať vložené do dátový sklad vo väčšine prípadov pochádzajú z prevádzkových prostredí. The dátový sklad tvorí ho úložná jednotka, fyzicky oddelená od zvyšku systému, ktorý obsahuje dať predtým transformované aplikáciami, ktoré pracujú s informáciami odvodenými z operačného prostredia.

Doslovná definícia a dátový sklad si zaslúži podrobné vysvetlenie, pretože existujú dôležité motivácie a základné významy, ktoré opisujú vlastnosti skladu.

PREDMETOVÁ ORIENTÁCIA ORIENTÁCIA TEMATICKÝ

Prvá charakteristika a dátový sklad je, že je orientovaný na hlavných hráčov v spoločnosti. Sprievodca skúškami cez dať je to na rozdiel od klasickejšej metódy, ktorá zahŕňa orientáciu aplikácií na procesy a funkcie, metódu väčšinou zdieľanú väčšinou menej novších systémov riadenia.

Operačný svet je navrhnutý okolo aplikácií a funkcií, ako sú pôžičky, úspory, bankové karty a dôvera pre finančnú inštitúciu. Svet dw je organizovaný okolo hlavných predmetov, akými sú zákazník, predajca, produkt a činnosť. Zosúladenie okolo tém ovplyvňuje návrh a implementáciu dať nájdené v dw. Ešte dôležitejšie je, že hlavná téma ovplyvňuje najdôležitejšiu časť kľúčovej štruktúry.

Svet aplikácie je ovplyvnený návrhom databázy aj návrhom procesov. Svet dw je zameraný výhradne na modeling dať a na dizajne databázy. Návrh procesu (vo svojej klasickej podobe) nie je súčasťou prostredia dw.

Rozdiely medzi výberom aplikácie procesu/funkcie a výberom predmetu sa prejavujú aj ako rozdiely v obsahu dať na podrobnej úrovni. THE dať z dw nezahŕňajú i dať ktoré sa nepoužijú pre proces DSS počas aplikácií

prevádzkovo orientovaný dať obsahujú i dať okamžite uspokojiť funkčné/spracovateľské požiadavky, ktoré môžu alebo nemusia mať pre analytika DSS žiadne využitie.
Ďalším dôležitým spôsobom, akým prevádzkovo orientované aplikácie dať líšiť sa od dať dw je v správach dei dať. Ja dať operácie udržiavajú nepretržitý vzťah medzi dvoma alebo viacerými tabuľkami na základe obchodného pravidla, ktoré je aktívne. THE dať dw prechádza spektrom času a vzťahov nájdených v dw je mnoho. Mnoho obchodných pravidiel (a zodpovedajúcim spôsobom mnoho vzťahov s dať ) sú zastúpené v sklade o dať medzi dvoma alebo viacerými stolmi.

(Pre podrobné vysvetlenie toho, ako sú vzťahy medzi dať sú spracované v DW, odkazujeme na technickú tému o tomto probléme.)
Zo žiadneho iného hľadiska, než z pohľadu základného rozdielu medzi výberom funkčnej/procesnej aplikácie a výberom predmetu, nie je väčší rozdiel medzi operačnými systémami a dať a DW.

INTEGRÁCIA INTEGRÁCIA

Najdôležitejším aspektom prostredia dw je, že i dať nachádzajúce sa v dw sú ľahko integrované. VŽDY. BEZ VÝNIMEK. Samotná podstata prostredia dw je v tom, že i dať v rámci skladových limitov sú integrované.

Integrácia sa prejavuje mnohými rôznymi spôsobmi – v konzistentných identifikovaných konvenciách, v konzistentnom meraní premenných, v konzistentných kódovaných štruktúrach, vo fyzických atribútoch dať konzistentné a tak ďalej.

V priebehu rokov dizajnéri rôznych aplikácií urobili veľa rozhodnutí o tom, ako by mala byť aplikácia vyvinutá. Štýl a individualizované rozhodnutia o dizajne aplikácií dizajnérov sa odhaľujú stovkami spôsobov: v rozdieloch v kódovaní, štruktúre kľúča, fyzikálnych vlastnostiach, identifikácii konvencií atď. Kolektívna schopnosť mnohých dizajnérov aplikácií vytvárať nekonzistentné aplikácie je legendárna. Obrázok 3 uvádza niektoré z najdôležitejších rozdielov v spôsoboch navrhovania aplikácií.

Kódovanie: Kódovanie:

Dizajnéri aplikácií zvolili kódovanie poľa – sex – rôznymi spôsobmi. Dizajnér predstavuje sex ako „m“ a „f“. Ďalší dizajnér predstavuje pohlavie ako „1“ a „0“. Ďalší dizajnér predstavuje sex ako „x“ a „y“. Ďalší dizajnér predstavuje sex ako „muž“ a „žena“. Nezáleží na tom, ako sa sex dostane do DW. „M“ a „F“ sú pravdepodobne rovnako dobré ako celá hra.

Dôležité je, že z akéhokoľvek pôvodu pochádza pohlavné pole, toto pole prichádza do DW v konzistentnom integrovanom stave. V dôsledku toho, keď je pole načítané do DW z aplikácie, kde bolo reprezentované vo formáte „M“ a „F“, dať musí byť prevedený do formátu DW.

Meranie atribútov: Meranie Vlastnosti:

Dizajnéri aplikácií sa v priebehu rokov rozhodli merať potrubia rôznymi spôsobmi. Dizajnér ukladá dať potrubia v centimetroch. Ďalší návrhár aplikácií ukladá súbor dať potrubia z hľadiska palcov. Ďalší návrhár aplikácií ukladá súbor dať potrubia v miliónoch kubických stôp za sekundu. A ďalší dizajnér ukladá informácie o potrubí z hľadiska yardov. Bez ohľadu na zdroj, keď informácie o potrubí prichádzajú do DW, musia sa merať rovnakým spôsobom.

Podľa údajov na obrázku 3 problémy integrácie ovplyvňujú takmer každý aspekt projektu – fyzické vlastnosti dať, dilema mať viac ako jeden zdroj dať, problematika nejednotných identifikovaných vzoriek, formátov dať nekonzistentné a pod.

Bez ohľadu na tému dizajnu, výsledok je rovnaký – t.j dať musia byť uložené v DW jednotným a globálne prijateľným spôsobom, aj keď ich základné operačné systémy ukladajú inak dať.

Keď sa analytik DSS pozrie na DW, cieľom analytika by malo byť využitie dať ktoré sú v sklade,

skôr než sa zaujímať o dôveryhodnosť alebo konzistentnosť dať.

ČASOVÁ VARIANTA

všetko dať v DW sú presné do určitého bodu v čase. Táto základná charakteristika dať v DW je veľmi odlišný od tých dať nájdené v operačnom prostredí. THE dať operačného prostredia sú rovnako presné ako v momente prístupu. Inými slovami, v operačnom prostredí pri prístupe k jednotke daťočakáva sa, že bude odrážať presné hodnoty v čase prístupu. Pretože ja dať v DW sú presné v určitom okamihu (t. j. nie „práve teraz“), hovorí sa, že dať nájdené v DW sú „časové odchýlky“.
Časový rozptyl dať DW sa označuje mnohými spôsobmi.
Najjednoduchší spôsob je, že i dať DW predstavuje dať v dlhom časovom horizonte – päť až desať rokov. Časový horizont reprezentovaný pre operačné prostredie je oveľa kratší ako dnešné súčasné hodnoty do šesťdesiatdeväťdesiatich
Aplikácie, ktoré musia dobre fungovať a musia byť dostupné na spracovanie transakcií, musia obsahovať minimálne množstvo dať ak umožňujú akúkoľvek mieru flexibility. Prevádzkové aplikácie majú teda krátky časový horizont, ako napríklad téma dizajnu zvukových aplikácií.
Druhý spôsob, ako sa „časový rozptyl“ objavuje v DW, je v kľúčovej štruktúre. Každá kľúčová štruktúra v DW obsahuje, implicitne alebo explicitne, časový prvok, ako je deň, týždeň, mesiac atď. Časový prvok je takmer vždy v spodnej časti zreťazeného kľúča nájdeného v DW. Pri týchto príležitostiach bude prvok času existovať implicitne, ako napríklad v prípade, keď je celý súbor duplikovaný na konci mesiaca alebo štvrťroka.
Tretí spôsob zobrazenia časového rozptylu je, že i dať DW po správnom zaregistrovaní nie je možné aktualizovať. THE dať DW sú pre všetky praktické účely dlhým radom snímok. Samozrejme, ak boli snímky urobené nesprávne, snímky je možné upraviť. Ale za predpokladu, že sú snímky urobené správne, nezmenia sa hneď po ich zhotovení. V niektorých

V niektorých prípadoch môže byť úprava snímok v DW neetické alebo dokonca neplatné. THE dať funkčné, pričom sú presné v momente prístupu, môžu byť aktualizované podľa potreby.

NEPRCHAVÝ

Štvrtou dôležitou charakteristikou DW je, že je neprchavý.
Aktualizácie, vkladanie, mazanie a úpravy sa pravidelne vykonávajú v prevádzkových prostrediach na základe záznamu po zázname. Ale základná manipulácia s dať ktoré sú potrebné v DW je oveľa jednoduchšie. V DW sa vyskytujú len dva druhy operácií – počiatočné načítanie dať a prístup k dať. Neexistuje žiadna aktualizácia dať (vo všeobecnom zmysle aktualizácie) v DW ako bežnú operáciu spracovania. Tento základný rozdiel medzi operačným spracovaním a spracovaním DW má niekoľko veľmi silných dôsledkov. Na úrovni návrhu nie je potreba byť opatrný v súvislosti s anomálnou aktualizáciou faktorom DW, pretože aktualizácia dať sa nevykonáva. To znamená, že na úrovni fyzického dizajnu je možné využiť slobodu na optimalizáciu prístupu dať, najmä pri riešení tém fyzickej normalizácie a denormalizácie. Ďalší dôsledok jednoduchosti operácií DW je v základnej technológii používanej na spustenie prostredia DW. Podpora inline aktualizácií záznam po zázname (ako je to často v prípade operačného spracovania) vyžaduje, aby technológia mala veľmi komplexný základ pod zdanlivou jednoduchosťou.
Technológia, ktorá podporuje zálohovanie a obnovu, transakcie a integritu dať a detekcia a náprava stavu uviaznutia je pomerne zložitá a nie je potrebná na spracovanie DW. Charakteristiky DW, zameranie dizajnu, integrácia dať v rámci DW, časový rozptyl a jednoduchosť riadenia dať, všetko smeruje do prostredia, ktoré je veľmi, veľmi odlišné od klasického operačného prostredia. Zdroj takmer všetkých dať DW sú operačné prostredie. Je lákavé myslieť si, že existuje obrovská nadbytočnosť dať medzi dvoma prostrediami.
V skutočnosti prvý dojem, ktorý má veľa ľudí, je veľká nadbytočnosť dať medzi operačným prostredím a operačným prostredím

DW. Takáto interpretácia je povrchná a demonštruje nepochopenie toho, čo sa deje v DW.
V skutočnosti je tu minimum redundancie dať medzi operačným prostredím a i dať z DW. Zvážte nasledovné: I dať sú filtrované daný ktorý prechádza z operačného prostredia do prostredia DW. veľa dať nikdy neprechádzajú mimo prevádzkového prostredia. Okrem toho, že i dať ktoré sú potrebné pre spracovanie DSS, nachádzajú svoj smer v prostredí

▪ časový horizont dať je veľmi odlišné od jedného prostredia k druhému. THE dať v prevádzkovom prostredí sú veľmi cool. THE dať v DW sú oveľa staršie. Len z hľadiska časového horizontu sa prevádzkové prostredie a DW len veľmi málo prekrývajú.

▪ DW obsahuje dať súhrn, ktoré sa v prostredí nikdy nenachádzajú

▪ I dať prechádzajú zásadnou transformáciou, keď prechádzajú na obrázok 3, čo ilustruje väčšina dať sú výrazne upravené za predpokladu, že sú vybraté a presunuté do DW. Inak povedané, väčšina z nich dať pri presune do DW sa fyzicky a radikálne mení. Z integračného hľadiska nie sú rovnaké dať ktoré sa nachádzajú v prevádzkovom prostredí. Vo svetle týchto faktorov je nadbytočnosť dať medzi týmito dvoma prostrediami je zriedkavá udalosť, ktorá vedie k menej ako 1% redundancii medzi týmito dvoma prostrediami. ŠTRUKTÚRA SKLADU DW majú výraznú štruktúru. Existujú rôzne úrovne súhrnu a podrobností, ktoré vymedzujú DW.
Rôzne komponenty DW sú:

Metadáta
dati aktuálne detaily
dati starých detailov
dati mierne zhrnuté
dati vysoko zhrnuté

Zďaleka hlavnou starosťou je o dať aktuálne detaily. Je to hlavný problém, pretože:

I dať aktuálne detaily odrážajú najnovšie udalosti, o ktoré je vždy veľký záujem a
i dať aktuálnych detailov je objemný, pretože je uložený na najnižšej úrovni granularity a
i dať Aktuálne podrobnosti sú takmer vždy uložené na diskovej pamäti, ku ktorej je rýchly prístup, no jej používanie je drahé a zložité dať detailov, čím sú staršie dať ktoré sú uložené v nejakej pamäti hmota. Je prístupný sporadicky a je uložený na úrovni detailov kompatibilnej s dať aktuálne detaily. Aj keď nie je povinné ukladať na alternatívne pamäťové médium z dôvodu veľkého objemu dať v kombinácii so sporadickým prístupom dať, podpora pamäte pre dať staršie podrobné údaje sa zvyčajne neukladajú na disk. THE dať mierne zhrnuté sú dať ktoré sa destilujú od zistenej nízkej úrovne detailov po súčasnú úroveň detailov. Táto úroveň DW je takmer vždy uložená na disku. Problémy s dizajnom, ktoré vznikajú pre architekta dať pri konštrukcii tejto úrovne DW sú:

Aká časová jednotka je zhrnutie urobené vyššie
Ktorý obsah, atribúty mierne zhrnú obsah dať Ďalšia úroveň dať nájdený v DW je ten z dať vysoko zhrnuté. THE dať vysoko zhrnuté sú kompaktné a ľahko dostupné. THE dať vysoko zhrnuté sa niekedy nachádzajú v prostredí DW a v iných prípadoch i dať vysoko zhrnuté sa nachádzajú mimo bezprostredných stien technológie, v ktorej sa nachádza DW. (v každom prípade, t.j dať vysoko zhrnuté sú súčasťou DW bez ohľadu na to, kde i dať sú fyzicky umiestnené). Posledným komponentom DW sú metadáta. V mnohých ohľadoch sú metadáta v inej dimenzii ako ostatné dať DW, pretože metadáta neobsahujú žiadne daný prevzaté priamo z operačného prostredia. Metadáta majú v DW špeciálnu a veľmi dôležitú úlohu. Metadáta sa používajú ako:

adresár, ktorý pomôže analytikovi DSS identifikovať obsah DW,
sprievodca mapovaním dať ako som dať boli transformované z operačného prostredia do prostredia DW,
sprievodca algoritmami používanými na sumarizáciu medzi dať aktuálnych detailov a i dať mierne zhrnuté, t.j dať Ak to zhrnieme, metaúdaje zohrávajú v prostredí DW oveľa väčšiu úlohu, ako kedykoľvek predtým v operačnom prostredí STARÉ ÚLOŽNÉ MÉDIUM DETAIL Magnetická páska môže byť použitá na uloženie tohto druhu dať. V skutočnosti existuje široká škála pamäťových médií, ktoré by sa mali považovať za staré úložisko dať detailov. V závislosti od objemu dať, frekvencia prístupu, náklady na nástroje a typ prístupu, je celkom pravdepodobné, že iné nástroje budú potrebovať starú úroveň podrobností v DW. TOK DÁT Existuje normálny a predvídateľný tok dať vnútri DW.
I dať zadajte DW z operačného prostredia. (POZNÁMKA: Existuje niekoľko veľmi zaujímavých výnimiek z tohto pravidla. Avšak takmer všetky dať zadajte DW z operačného prostredia). Dato že i dať vstúpi do DW z operačného prostredia, transformuje sa tak, ako je opísané vyššie. Pod podmienkou vstupu do DW, t.j dať zadajte aktuálnu úroveň podrobností, ako je znázornené. Nachádza sa tam a používa sa, kým nenastane jedna z troch udalostí:

je očistený,
je zhrnutý, a/alebo ▪è Zastaraný proces v rámci presunov DW i dať aktuálne podrobnosti a dať starých detailov na základe veku dať. Proces

zhrnutie využíva detail dať vypočítať i dať mierne zhrnuté a vysoko zhrnuté úrovne dať. V zobrazenom toku existuje niekoľko výnimiek (o ktorých sa bude diskutovať neskôr). Zvyčajne však pre veľkú väčšinu dať nachádza v DW, toku dať je to ako na obrázku.

POUŽÍVANIE DATOVÉHO SKLADU

Niet divu, že rôzne úrovne dať v rámci DW nedostávajú rôzne úrovne využitia. Spravidla platí, že čím vyššia úroveň sumarizácie, tým viac i dať sú používané.
Mnoho použití sa vyskytuje v dať vysoko zhrnuté, kým tie staré dať detailov sa takmer nepoužívajú. Existuje dobrý dôvod presunúť organizáciu do paradigmy využívania zdrojov. Viac zhrnuté i dať, tým rýchlejšie a efektívnejšie je dostať sa do dať. Ak predajňa zistí, že robí veľa procesov na úrovni detailov DW, potom sa spotrebuje zodpovedajúce veľké množstvo strojových zdrojov. Je v najlepšom záujme každého spracovať čo najvyššiu úroveň súhrnu čo najskôr.

V mnohých obchodoch použil analytik DSS v prostredí pred DW dať na úrovni detailov. V mnohých ohľadoch príchod na dať podrobné zhrnutie pripomína bezpečnostnú prikrývku, aj keď sú k dispozícii iné úrovne zhrnutia. Jedna z architektových činností dať je odnaučiť používateľa DSS od neustáleho používania dať na najnižšej úrovni detailov. Architekt má k dispozícii dve motivácie dať:

inštaláciou systému chargeback, kde koncový užívateľ platí za spotrebované zdroje napr
čo naznačuje, že veľmi dobrý čas odozvy možno dosiahnuť, keď sa správanie s i dať je na vysokej úrovni sumarizácie, zatiaľ čo zlý čas odozvy pochádza zo správania sa dať na nízkej úrovni ĎALŠIE ÚVAHY Existuje niekoľko ďalších úvah o konštrukcii a správe DW.
Prvou úvahou sú indexy. THE dať na vyšších úrovniach sumarizácie ich možno voľne indexovať, pričom i dať

pri nižších úrovniach detailov sú také objemné, že sa dajú indexovať šetrne. Z toho istého tokenu, t.j dať pri vysokej úrovni detailov je možné relatívne ľahko reštrukturalizovať, pričom objem dať na nižších úrovniach je taká veľká, že i dať nedajú sa ľahko zrenovovať. V dôsledku toho model dať a formálna práca vykonaná dizajnom položila základ pre DW aplikovaný takmer výlučne na súčasnej úrovni detailov. Inými slovami, modelovacie aktivity o dať takmer v každom prípade sa nevzťahujú na úrovne sumarizácie. Ďalším štrukturálnym aspektom je rozčlenenie dať od DW.

Rozdelenie je možné vykonať na dvoch úrovniach – na úrovni dbms a na aplikačnej úrovni. V divízii na úrovni dbmssa dbms je informovaný o divíziách a podľa toho ich riadi. V prípade rozdelenia na aplikačnej úrovni je o divíziách informovaný iba programátor a zodpovednosť za ich správu je ponechaná na ňom

Pod úrovňou dbms, veľa práce sa robí automaticky. S automatickou správou divízií je spojená veľká nepružnosť. V prípade divízií na aplikačnej úrovni dať del dátový skladProgramátora zaťažuje veľa práce, no konečným výsledkom je flexibilita pri správe dať v dátový sklad

ALTRE ANOMÁLIE

Zatiaľ čo zložky dátový sklad Fungujú tak, ako je popísané pre takmer všetky dať, existuje niekoľko užitočných výnimiek, o ktorých je potrebné diskutovať. Výnimkou je dať verejné súhrnné údaje. Toto sú dať súhrny, ktoré boli vypočítané z dátový sklad ale spoločnosť ich používa. THE dať Verejné súhrny sú uložené a spravované v dátový sklad, aj keď, ako už bolo uvedené, sú vypočítané. Účtovníci pracujú na výrobe takýchto štvrťročne dať ako sú príjmy, štvrťročné výdavky, štvrťročný zisk a pod. Práca účtovníkov je externá dátový sklad. Avšak i dať sa používajú „interne“ v rámci spoločnosti – od marketing, predaj atď. Ďalšou anomáliou, o ktorej nebude reč, je anomália dať externé.

Ďalší výnimočný druh dať ktoré možno nájsť v a dátový sklad ide o trvalé podrobné údaje. Tie spôsobujú potrebu trvalého uskladnenia dať na podrobnej úrovni z etických alebo právnych dôvodov. Ak spoločnosť vystavuje svojich pracovníkov nebezpečným látkam, je to potrebné dať podrobné a trvalé. Ak spoločnosť vyrába produkt, ktorý zahŕňa verejnú bezpečnosť, ako sú časti lietadiel, je to potrebné dať trvalé detaily, ako aj ak spoločnosť uzatvára nebezpečné zmluvy.

Spoločnosť si nemôže dovoliť prehliadať detaily, pretože v priebehu niekoľkých nasledujúcich rokov v prípade súdneho sporu, odvolania, spornej konštrukčnej chyby atď. expozícia spoločnosti môže byť veľká. Výsledkom je jedinečný typ dať známe ako trvalé podrobné údaje.

PREHĽAD

Un dátový sklad je objektovo orientovaný, integrovaný, časový variant, zbierka dať nevolatilné na podporu rozhodovacích potrieb administratívy. Každá z hlavných funkcií a dátový sklad má svoje dôsledky. Okrem toho existujú štyri úrovne dať del dátový sklad:

Starý detail
Aktuálny detail
dati mierne rekapitulované
dati Vysoko zhrnuté metadáta sú tiež dôležitou súčasťou dátový sklad. ABSTRAKT Koncept skladovania dať V poslednej dobe sa mu dostalo veľkej pozornosti a stal sa trendom 90. rokov. dátový sklad na prekonanie obmedzení systémov podpory administrácie, ako sú systémy na podporu rozhodovania (DSS) a výkonné informačné systémy (EIS). Aj keď koncept o dátový sklad vyzerá sľubne, implementujte i dátový sklad môže byť problematické kvôli rozsiahlym skladovým procesom. Napriek zložitosti projektov skladovania o dať, veľa dodávateľov a konzultantov, ktorí skladujú dať tvrdiť, že skladovanie dať prúd nespôsobuje žiadne problémy. Na začiatku tohto výskumného projektu sa však neuskutočnil takmer žiadny nezávislý, rigorózny a systematický výskum. V dôsledku toho je ťažké povedať, čo sa vlastne v odvetví deje, keď sú postavené dátový sklad. Táto štúdia skúmala prax skladovania dať contemporaries, ktorého cieľom je rozvíjať bohatšie pochopenie austrálskej praxe. Prehľad literatúry poskytol kontext a základ pre empirickú štúdiu. Z tohto výskumu vyplýva množstvo zistení. Po prvé, táto štúdia odhalila aktivity, ktoré vznikli počas vývoja dátový sklad. V mnohých oblastiach, t.j dať zhromaždené potvrdili prax uvádzanú v literatúre. Po druhé, problémy a problémy, ktoré môžu ovplyvniť vývoj dátový sklad boli identifikované touto štúdiou. Napokon, výhody získané austrálskymi organizáciami spojené s používaním dátový sklad boli odhalené.

Kapitola 1

Výskumný kontext

Koncepcia skladovania údajov sa rozšírila a stala sa novým trendom v 90. rokoch (McFadden 1996, TDWI 1996, Shah a Milstein 1997, Shanks a kol. 1997, Eckerson 1998, Adelman a Oates 2000). Vidno to z rastúceho počtu článkov o skladovaní údajov v odborných publikáciách (Little a Gibson 1999). Mnoho článkov (pozri napríklad Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett a King 1996, Graham a kol. 1996, Sakaguchi a Frolick 1996, Alvarez 1997, Brousell 1997, Don1997llarthy 1997 Edwards 1997, TDWI 1998) uvádzajú významné výhody získané organizáciami, ktoré implementujú i dátový sklad. Svoju teóriu podporili neoficiálnymi dôkazmi o úspešných implementáciách, údajmi o vysokej návratnosti investícií (ROI) a tiež poskytnutím usmernení alebo metodík na vývoj dátový sklad

(Shanks a kol. 1997, Seddon a Benjamin 1998, Little a Gibson 1999). V extrémnom prípade Graham a spol. (1996) uviedli priemernú návratnosť trojročnej investície 401 %.

Veľká časť súčasnej literatúry však prehliada zložitosť realizácie takýchto projektov. Projekty z dátový sklad zvyčajne sú zložité a rozsiahle, a preto majú vysokú pravdepodobnosť zlyhania, ak nie sú starostlivo kontrolované (Shah a Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs a Clymer 1998, Rao 1998). Vyžadujú obrovské množstvo ľudských a finančných zdrojov a čas a úsilie na ich vybudovanie (Hill 1998, Crofts 1998). Typický požadovaný čas a finančné prostriedky sú približne dva roky, respektíve dva až tri milióny dolárov (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Tento čas a finančné prostriedky sú potrebné na kontrolu a konsolidáciu mnohých rôznych aspektov skladovania údajov (Cafasso 1995, Hill 1998). Popri úvahách o hardvéri a softvéri existujú aj ďalšie funkcie, ktoré sa líšia od extrakcie dať k procesom načítania dať, kapacita pamäte na správu aktualizácií a meta dať na školenie používateľov, treba zvážiť.

V čase, keď sa tento výskumný projekt začal, sa v oblasti skladovania údajov, najmä v Austrálii, robil veľmi malý akademický výskum. Bolo to zrejmé z nedostatku publikovaných článkov o skladovaní údajov z časopisov alebo iných akademických prác tej doby. Mnohé z dostupných akademických spisov popisovali skúsenosti z USA. Nedostatok akademického výskumu v oblasti dátového skladu vyvolal potrebu rigorózneho výskumu a empirických štúdií (McFadden 1996, Shanks a kol. 1997, Little a Gibson 1999). Najmä výskumné štúdie o procese implementácie dátový sklad je potrebné vykonať na rozšírenie všeobecných vedomostí o implementácii dátový sklad a bude slúžiť ako základ pre budúcu výskumnú štúdiu (Shanks a kol. 1997, Little a Gibson 1999).

Účelom tejto štúdie je preto študovať, čo sa v skutočnosti deje, keď organizácie vykonávajú a používajú i dátový sklad v Austrálii. Konkrétne bude táto štúdia zahŕňať analýzu celého procesu vývoja a dátový sklad, počnúc iniciáciou a plánovaním cez návrh a implementáciu a následné použitie v austrálskych organizáciách. Štúdia okrem toho prispeje aj k súčasnej praxi tým, že identifikuje oblasti, v ktorých je možné prax ďalej zlepšovať a minimalizovať neefektívnosť a riziká alebo im predchádzať. Okrem toho bude slúžiť ako základ pre ďalšie štúdie o dátový sklad v Austrálii a vyplní medzeru, ktorá v súčasnosti existuje v literatúre.

Výskumné otázky

Cieľom tohto výskumu je študovať aktivity spojené s implementáciou dátový sklad a ich používanie austrálskymi organizáciami. Študujú sa najmä prvky týkajúce sa plánovania projektu, vývoja, prevádzky, používania a súvisiacich rizík. Otázka tohto výskumu teda znie:

„Aká je súčasná prax dátový sklad v Austrálii?"

Na efektívne zodpovedanie tejto otázky je potrebných niekoľko pomocných výskumných otázok. V literatúre, ktorá je uvedená v kapitole 2, boli identifikované tri podotázky, ktoré slúžia na usmernenie tohto výskumného projektu: Ako sú dátový sklad z austrálskych organizácií? S akými problémami ste sa stretli?

Aké sú skúsenosti?
Pri odpovedi na tieto otázky bol použitý exploračný výskumný dizajn využívajúci prieskum. Ako prieskumná štúdia nie sú odpovede na vyššie uvedené otázky úplné (Shanks et al. 1993, Denscombe 1998). V tomto prípade je na zlepšenie odpovedí na tieto otázky potrebná triangulácia. Vyšetrovanie však poskytne pevný základ pre budúcu prácu skúmajúcu tieto otázky. Podrobná diskusia o odôvodnení a návrhu výskumnej metódy je uvedená v kapitole 3.

Štruktúra výskumného projektu

Tento výskumný projekt je rozdelený na dve časti: kontextovú štúdiu konceptu dátového skladu a empirický výskum (pozri obrázok 1.1), pričom každá z nich je diskutovaná nižšie.

Časť I: Kontextová štúdia

Prvá časť výskumu pozostávala z preskúmania súčasnej literatúry o rôznych typoch skladovania údajov vrátane systémov na podporu rozhodovania (DSS), výkonných informačných systémov (EIS), prípadových štúdií dátový sklad a koncepty dátový sklad. Ďalej výsledky fór dátový sklad a skupiny odborníkov a odborníkov z praxe vedené výskumným tímom Monash DSS prispeli k tejto fáze štúdie, ktorej cieľom bolo získať poznatky o praxi dátový sklad a identifikovať riziká spojené s ich prijatím. Počas tohto kontextuálneho študijného obdobia sa zistilo porozumenie problémovej oblasti, aby sa poskytli základné poznatky pre následné empirické výskumy. Bol to však pokračujúci proces počas vykonávania výskumnej štúdie.

Časť II: Empirický výskum

Relatívne nová koncepcia skladovania údajov, najmä v Austrálii, vyvolala potrebu prieskumu na získanie širokého obrazu o používateľskej skúsenosti. Táto časť bola vykonaná po tom, čo bola prostredníctvom rozsiahleho prehľadu literatúry stanovená problémová oblasť. Koncept skladovania údajov vytvorený počas fázy kontextovej štúdie bol použitý ako vstup pre počiatočný dotazník tejto štúdie. Potom bol dotazník preskúmaný. Vy ste odborníci v dátový sklad zúčastnili testu. Účelom testovania úvodného dotazníka bola kontrola úplnosti a správnosti otázok. Na základe výsledkov testovania bol dotazník upravený a upravená verzia bola zaslaná účastníkom prieskumu. Vrátené dotazníky sa potom analyzovali na i dať v tabuľkách, diagramoch a iných formátoch. THE

výsledky analýzy dať tvoria prehľad praxe skladovania údajov v Austrálii.

PREHĽAD ÚDAJOVÝCH SKLADOV

Koncepcia dátových skladov sa vyvinula spolu s vylepšeniami výpočtovej techniky.
Zameriava sa na prekonanie problémov, ktorým čelia skupiny na podporu aplikácií, ako sú Systém na podporu rozhodovania (DSS) a Výkonný informačný systém (EIS).

V minulosti bola najväčšou prekážkou týchto aplikácií neschopnosť týchto aplikácií poskytovať a databázy potrebné na analýzu.
Je to spôsobené najmä charakterom práce manažmentu. Záujmy manažmentu spoločnosti sa neustále menia v závislosti od pokrytej oblasti. Preto i dať Základom týchto aplikácií je, že sa musia dať rýchlo meniť v závislosti od spracovávanej časti.
To znamená, že i dať musia byť dostupné vo vhodnej forme pre požadované analýzy. V skutočnosti bolo pre skupiny na podporu aplikácií v minulosti veľmi ťažké zhromažďovať a integrovať dať z komplexných a rôznorodých zdrojov.

Zostávajúca časť tejto časti predstavuje prehľad konceptu dátového skladu a rozoberá, ako dátový sklad môže prekonať problémy skupín aplikačnej podpory.
Výraz „Dátový sklad“ spopularizoval William Inmon v roku 1990. Jeho často citovaná definícia vidí Dátový sklad ako zbierka dať tematicky orientované, integrované, nevolatilné a premenlivé v priebehu času na podporu manažérskych rozhodnutí.

Použitím tejto definície Inmon zdôrazňuje, že i dať s bydliskom v a dátový sklad musia mať tieto 4 vlastnosti:

▪ Predmetovo orientované
▪ Integrované
▪ Neprchavý
▪ Meniace sa v čase Podľa predmetu Inmon znamená, že i dať v dátový sklad v najväčších organizačných oblastiach, ktoré boli

definované v modeli dať. Napríklad všetky dať týkajúci sa i zákazníci sú obsiahnuté v predmetnej oblasti ZÁKAZNÍCI. Rovnako aj všetky dať týkajúce sa produktov sú obsiahnuté v tematickej oblasti PRODUKTY.

Integrovaný Inmon znamená, že i dať prichádzajúce z rôznych platforiem, systémov a miest sú kombinované a uložené na jednom mieste. V dôsledku toho dať podobné musia byť transformované do konzistentných formátov, aby sa dali ľahko pridávať a porovnávať.
Napríklad mužské a ženské pohlavie sú v jednom systéme reprezentované písmenami M a F a v druhom 1 a 0. Na ich správnu integráciu je potrebné transformovať jeden alebo oba formáty tak, aby boli rovnaké. V tomto prípade môžeme zmeniť M na 1 a F na 0 alebo naopak. Predmetovo orientované a integrované naznačujú, že dátový sklad je navrhnutý tak, aby poskytoval funkčné a priečne videnie dať spoločnosťou.

Pod pojmom Neprchavý rozumie, že i dať v dátový sklad zostať konzistentné a aktualizovať dať nie je to potrebné. Namiesto toho každá zmena v dať originály sa pridávajú k databázy del dátový sklad. To znamená, že historické dei dať je obsiahnutá v dátový sklad.

Pre premenné s časom Inmon uvádza, že i dať v dátový sklad vždy obsahujú časové ukazovatele a i dať zvyčajne prekračujú určitý časový horizont. Napríklad a
dátový sklad môže obsahovať 5 rokov historických hodnôt zákazníci od roku 1993 do roku 1997. Dostupnosť histórie a časového radu dať umožňuje analyzovať trendy.

Un dátový sklad môže zbierať svoje vlastné dať zo systémov OLTP, zo zdrojov dať mimo organizácie a/alebo inými projektmi špeciálnych systémov zachytávania dať.
I dať extrakty môžu prejsť procesom čistenia, v tomto prípade t.j dať sú transformované a integrované pred uložením do databázy del dátový sklad. Potom som dať

obyvateľov v rámci databázy del dátový sklad sú sprístupnené nástrojom na prihlásenie a obnovu koncových používateľov. Pomocou týchto nástrojov má koncový používateľ prístup k integrovanému pohľadu na organizáciu dať.

I dať obyvateľov v rámci databázy del dátový sklad sú uložené v podrobných aj súhrnných formátoch.
Úroveň súhrnu môže závisieť od povahy dať. Ja dať podrobné môžu pozostávať z dať aktuálny e dať historikov
I dať autorské poplatky nie sú zahrnuté v dátový sklad kým i dať v dátový sklad sú aktualizované.
Okrem uloženia i dať seba, a dátový sklad môže tiež uložiť iný typ daný nazývané METADÁTA popisujúce dať obyvateľov v jeho databázy.
Existujú dva typy metaúdajov: vývojové metaúdaje a analytické metaúdaje.
Metadáta vývoja sa používajú na riadenie a automatizáciu procesov extrakcie, čistenia, mapovania a načítania dať v dátový sklad.
Informácie obsiahnuté v metaúdajoch vývoja môžu obsahovať podrobnosti o operačných systémoch, podrobnosti o prvkoch, ktoré sa majú extrahovať, o modeli dať del dátový sklad a obchodné pravidlá pre konverziu dať.

Druhý typ metadát, známy ako analytické metadáta, umožňuje koncovému používateľovi preskúmať obsah súboru dátový sklad nájsť dať dostupné a ich význam v jasných, netechnických pojmoch.

Preto analytické metadáta fungujú ako most medzi dátový sklad a aplikácií pre koncových používateľov. Tieto metadáta môžu obsahovať obchodný model, popisy dať zodpovedajúce obchodnému modelu, preddefinované dotazy a zostavy, informácie pre užívateľský prístup a index.

Analytické a vývojové metadáta musia byť skombinované do jedného integrovaného kontajnmentu, aby správne fungovali.

Bohužiaľ, mnohé z existujúcich nástrojov majú svoje vlastné metadáta a v súčasnosti na to neexistujú žiadne štandardy

umožňujú nástrojom na skladovanie údajov integrovať tieto metadáta. Na nápravu tejto situácie mnohí obchodníci s hlavnými nástrojmi na skladovanie údajov vytvorili Radu pre metaúdaje, z ktorej sa neskôr stala koalícia metaúdajov.

Cieľom tejto koalície je vytvoriť štandardný súbor metadát, ktorý umožní rôznym nástrojom na skladovanie údajov konvertovať metadáta.
Ich úsilie vyústilo do zrodu špecifikácie Meta Data Interchange Specification (MDIS), ktorá umožní výmenu informácií medzi archívmi Microsoftu a súvisiacimi súbormi MDIS.

Existencia dať zhrnuté/indexované aj podrobné dávajú používateľovi možnosť vykonať VŔTANIE VRTANIE (vŕtanie) z dať indexované na podrobné a naopak. Existencia dať podrobné histórie umožňujú vytváranie analýz trendov v čase. Okrem toho môžu byť analytické metadáta použité ako adresár databázy del dátový sklad pomôcť koncovým používateľom nájsť dať nevyhnutné.

V porovnaní so systémami OLTP s ich schopnosťou podporovať analýzu dať a spravodajstvo, dátový sklad považuje sa za vhodnejší systém pre informačné procesy, ako je vytváranie a odpovedanie na otázky a vytváranie správ. Nasledujúca časť podrobne poukáže na rozdiely medzi týmito dvoma systémami.

DÁTOVÝ SKLAD PROTI SYSTÉMOM OLTP

Mnohé informačné systémy v rámci organizácií sú určené na podporu každodenných operácií. Tieto systémy známe ako OLTP SYSTEMS zachytávajú priebežne aktualizované denné transakcie.

I dať v rámci týchto systémov sa často upravujú, pridávajú alebo vymazávajú. Napríklad adresa zákazníka sa zmení hneď, ako sa presunie z jedného miesta na druhé. V tomto prípade bude nová adresa zaregistrovaná úpravou poľa adresy databázy. Hlavným cieľom týchto systémov je zníženie transakčných nákladov a zároveň skrátenie doby spracovania. Príklady systémov OLTP zahŕňajú kritické akcie, ako je zadanie objednávky, mzdy, faktúra, výroba, zákaznícky servis zákazníci.

Na rozdiel od systémov OLTP, ktoré boli vytvorené pre procesy založené na transakciách a udalostiach, t.j dátový sklad boli vytvorené na poskytovanie podpory pre procesy založené na analýze dať a rozhodovacie procesy.

To sa bežne dosiahne integráciou i dať z rôznych OLTP a externých systémov v jedinom „kontajneri“. dať, ako je uvedené v predchádzajúcej časti.

Monash Data Warehousing Process Model

Procesný model pre dátový sklad Monash bol vyvinutý výskumníkmi z Monash DSS Research Group a je založený na literatúre z dátový sklad, o skúsenostiach s podporou rozvoja systémových oblastí, o diskusiách s predajcami aplikácií na použitie na dátový sklad, o skupine odborníkov na používanie dátový sklad.

Fázy sú: iniciácia, plánovanie, vývoj, operácie a vysvetlenia. Diagram vysvetľuje iteratívny alebo evolučný charakter vývoja a dátový sklad proces pomocou obojsmerných šípok umiestnených medzi rôznymi fázami. V tomto kontexte „iteratívny“ a „evolučný“ znamená, že v každom kroku procesu sa realizačné aktivity môžu vždy posunúť späť smerom k predchádzajúcej fáze. Je to spôsobené povahou projektu dátový sklad v ktorom kedykoľvek vzniknú dodatočné požiadavky od koncového používateľa. Napríklad vo fáze vývoja procesu dátový sklad, koncový užívateľ požaduje novú dimenziu alebo predmet, ktorý nebol súčasťou pôvodného plánu, musí byť do systému pridaný. To spôsobí zmenu v projekte. Výsledkom je, že dizajnérsky tím musí vo fáze návrhu zmeniť požiadavky doteraz vytvorených dokumentov. V mnohých prípadoch sa aktuálny stav projektu musí vrátiť do fázy návrhu, kde sa musí pridať a zdokumentovať nová požiadavka. Koncový používateľ musí mať možnosť vidieť preskúmanú konkrétnu dokumentáciu a zmeny, ktoré boli vykonané vo fáze vývoja. Na konci tohto vývojového cyklu musí projekt získať vynikajúcu spätnú väzbu od vývojárskeho aj používateľského tímu. Spätná väzba sa potom znova použije na zlepšenie budúceho projektu.

Plánovanie kapacity
Dw majú tendenciu byť veľmi veľké a rastú veľmi rýchlo (Best 1995, Rudin 1997a) v dôsledku množstva dať histórie, ktoré si uchovávajú od svojho trvania. Rast môže byť spôsobený aj dať doplnky požadované používateľmi na zvýšenie hodnoty dať že už majú. V súlade s tým požiadavky na skladovanie pre dať môže byť výrazne posilnená (Eckerson 1997). Preto je nevyhnutné prostredníctvom plánovania kapacity zabezpečiť, aby budovaný systém mohol rásť s rastom potrieb (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Pri plánovaní škálovateľnosti databázy je potrebné poznať očakávaný nárast veľkosti skladu, typy dopytov, ktoré sa budú pravdepodobne robiť, a počet podporovaných koncových používateľov (Best 1995, Rudin 1997b, Foley 1997a). Vytváranie škálovateľných aplikácií si vyžaduje kombináciu škálovateľných serverových technológií a škálovateľných techník návrhu aplikácií (Best 1995, Rudin 1997b. Obe sú nevyhnutné pri budovaní vysoko škálovateľnej aplikácie. Škálovateľné serverové technológie môžu zjednodušiť a zvýhodniť pridávanie úložného priestoru, pamäte a CPU bez zníženia kvality predstavenie (Lang 1997, Telefónia 1997).

Existujú dve hlavné škálovateľné serverové technológie: symetrické viacnásobné spracovanie (SMP) a masívne paralelné spracovanie (MPP) (IDC 1997, Humphries et al. 1999). Server SMP má zvyčajne viacero procesorov, ktoré zdieľajú pamäť, systémovú zbernicu a iné zdroje (IDC 1997, Humphries et al. 1999). Na zvýšenie jeho výkonu je možné pridať ďalšie procesory energie výpočtový. Ďalšia metóda na zvýšenie energie SMP servera, je kombinovať početné SMP stroje. Táto technika je známa ako zhlukovanie (Humphries et al. 1999). Na druhej strane MPP server má viacero procesorov, z ktorých každý má svoju vlastnú pamäť, zbernicový systém a iné zdroje (IDC 1997, Humphries et al. 1999). Každý procesor sa nazýva uzol. Zvýšenie v energie výpočtové možno dosiahnuť

pridanie ďalších uzlov k MPP serverom (Humphries et al. 1999).

Slabinou serverov SMP je, že príliš veľa vstupno-výstupných (I/O) operácií môže zahltiť systémovú zbernicu (IDC 1997). Tento problém sa nevyskytuje na serveroch MPP, pretože každý procesor má svoj vlastný zbernicový systém. Prepojenia medzi každým uzlom sú však vo všeobecnosti oveľa pomalšie ako zbernicový systém SMP. Okrem toho môžu servery MPP pridať vývojárom aplikácií ďalšiu úroveň zložitosti (IDC 1997). Výber medzi servermi SMP a MPP môže byť teda ovplyvnený mnohými faktormi, vrátane zložitosti aplikácií, pomeru cena/výkon, požadovanej kapacity spracovania, bránených aplikácií dw a nárastu veľkosti databázy dw a v počte koncových užívateľov.

Pri plánovaní kapacity možno použiť množstvo techník škálovateľného návrhu aplikácií. Jeden používa rôzne oznamovacie lehoty, ako sú dni, týždne, mesiace a roky. Majú rôzne oznamovacie lehoty, databázy možno ho rozdeliť na zvládnuteľne zoskupené časti (Inmon et al. 1997). Ďalšou technikou je použitie súhrnných tabuliek, ktoré sú zostavené súhrnom dať da dať podrobne. Takže ja dať zhrnuté sú kompaktnejšie ako podrobné, čo si vyžaduje menej miesta v pamäti. Takže dať detailov je možné uložiť do menej nákladnej úložnej jednotky, čo ešte viac ušetrí úložný priestor. Hoci používanie súhrnných tabuliek môže ušetriť miesto v pamäti, vyžaduje si veľa úsilia, aby boli aktualizované a v súlade s obchodnými potrebami. Táto technika je však široko používaná a často používaná v spojení s predchádzajúcou technikou (Best 1995, Inmon 1996a, Chauduri a Dayal
1997).

definovanie Dátový sklad Technické architektúry Definícia techník dw architektúry

Prví používatelia dátových skladov boli primárne koncipovaní ako centralizovaná implementácia dw, v ktorej sú všetky dať, vrátane i dať externé, boli integrované do jedného,
fyzického skladovania (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Hlavnou výhodou tohto prístupu je, že koncoví používatelia majú prístup k celopodnikovému pohľadu dať organizačné (Ovum 1998). Ďalšou výhodou je, že ponúka štandardizáciu dať prostredníctvom organizácie, čo znamená, že pre každú terminológiu používanú v dw úložisku (metaúdaje) existuje len jedna verzia alebo definícia (Flanagan a Safdie 1997, Ovum 1998). Nevýhodou tohto prístupu na druhej strane je, že je drahý a náročný na konštrukciu (Flanagan a Safdie 1997, Ovum 1998, Inmon et al. 1998). Nie dlho po architektúre úložiska dať centralizovaný sa stal populárnym, koncept extrahovania menších podmnožín evolúcie dať na podporu potrieb špecifických aplikácií (Varney 1996, IDC 1997, Berson a Smith 1997, páv 1998). Tieto malé systémy sú derivátmi väčšieho systému dátový sklad centralizované. Sú pomenované dátový sklad závislé oddelenie alebo závislé dátové trhy. Závislá architektúra dátového trhu je známa ako trojvrstvová architektúra, kde prvá vrstva pozostáva z dátový sklad centralizované, druhú tvoria vklady o dať rezortný a tretí pozostáva z prístupu k dať a analytickými nástrojmi (Demarest 1994, Inmon a kol. 1997).

Dátové predajne sú zvyčajne postavené po dátový sklad centralizovaná bola postavená tak, aby vyhovovala potrebám špecifických jednotiek (White 1995, Varney 1996).
Dátové trhy ukladajú dať veľmi relevantné týkajúce sa konkrétnych jednotiek (Inmon a kol. 1997, Inmon a kol. 1998, IA 1998).

Výhodou tejto metódy je, že nebude žiadne daný nie je integrovaný a že i dať budú menej nadbytočné v rámci dátových trhov, pretože všetky dať pochádzajú zo skladu dať integrovaný. Ďalšou výhodou je, že medzi každým dátovým trhom a jeho zdrojmi bude len málo spojení dať pretože každý dátový trh má len jeden zdroj dať. Navyše s touto architektúrou majú koncoví používatelia stále prístup k prehľadu dať

firemné organizácie. Táto metóda je známa ako metóda zhora nadol, kde sa dátové trhy vytvárajú po dátový sklad (páv 1998, Goff 1998).
Vzhľadom na potrebu skorého zobrazovania výsledkov začali niektoré organizácie budovať nezávislé dátové trhy (Flanagan a Safdie 1997, White 2000). V tomto prípade dátové trhy dostanú svoje dať priamo od základov dať OLTP a nie z centralizovaného a integrovaného skladu, čím sa eliminuje potreba mať centrálny sklad na mieste.

Každý dátový trh vyžaduje aspoň jeden odkaz na jeho zdroje dať. Nevýhodou viacerých pripojení pre každý dátový trh je to, že v porovnaní s predchádzajúcimi dvoma architektúrami je nadbytok dať výrazne zvyšuje.

Každý dátový obchod musí uchovávať všetky dať vyžaduje lokálne, aby nemal žiadny vplyv na systémy OLTP. To spôsobuje, že i dať sú uložené v rôznych dátových trhoch (Inmon et al. 1997). Ďalšou nevýhodou tejto architektúry je, že vedie k vytváraniu zložitých prepojení medzi dátovými trhmi a ich dátovými zdrojmi. dať ktoré sa ťažko uskutočňujú a kontrolujú (Inmon et al. 1997).

Ďalšou nevýhodou je, že koncoví používatelia nemajú prístup k prehľadu firemných informácií, pretože i dať z rôznych dátových trhov nie sú integrované (Ovum 1998).
Ďalšou nevýhodou je, že pre každú terminológiu používanú v dátových trhoch môže existovať viac ako jedna definícia, čo spôsobuje nekonzistentnosť dať v organizácii (Ovum 1998).
Napriek vyššie uvedeným nevýhodám nezávislé dátové trhy stále priťahujú záujem mnohých organizácií (IDC 1997). Jedným z faktorov, ktorý ich robí atraktívnymi, je, že sa rýchlejšie rozvíjajú a vyžadujú menej času a zdrojov (Bresnahan 1996, Berson a Smith 1997, Ovum 1998). Následne slúžia predovšetkým ako testovacie projekty, ktoré možno použiť na rýchlu identifikáciu výhod a/alebo nedostatkov v projekte (Parsaye 1995, Braly 1995, Newing 1996). V tomto prípade musí byť časť implementovaná v pilotnom projekte malá, ale dôležitá pre organizáciu (Newing 1996, Mansell-Lewis 1996).

Po preskúmaní prototypu sa koncoví používatelia a administratíva môžu rozhodnúť, či budú pokračovať alebo zastaviť projekt (Flanagan a Safdie 1997).
Ak má rozhodnutie pokračovať, dátové trhy pre iné odvetvia by sa mali budovať jeden po druhom. Pre koncových používateľov existujú dve možnosti na základe ich potrieb pri vytváraní nezávislých dátových matíc: integrované/federované a neintegrované (Ovum 1998)

V prvej metóde by mal byť každý nový dátový trh vytvorený na základe aktuálnych dátových trhov a modelu dať používa spoločnosť (Varney 1996, Berson a Smith 1997, Peacock 1998). Potreba použiť model dať o spoločnosti znamená, že je potrebné zabezpečiť, aby existovala len jedna definícia pre každú terminológiu používanú v rámci dátových trhov, aby sa tiež zabezpečilo, že rôzne dátové burzy možno kombinovať a poskytnúť prehľad informácií o spoločnosti (Bresnahan 1996). Táto metóda sa nazýva zdola nahor a je najlepšia, keď sú obmedzené finančné prostriedky a čas (Flanagan a Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). V druhej metóde môžu skonštruované dátové trhy uspokojiť len potreby konkrétnej jednotky. Variantom federatívneho dátového trhu je dátový sklad distribuovaný, v ktorom sa databázy Middleware Hub Server sa používa na zlúčenie mnohých dátových trhov do jedného úložiska dať distribuovaný (White 1995). V tomto prípade, t.j dať spoločnosti sú distribuované v niekoľkých dátových trhoch. Požiadavky koncových používateľov sa prenášajú na databázy middleware serverového hubu, ktorý extrahuje všetky dať vyžiadané dátovými trhmi a vráti výsledky do aplikácií koncových používateľov. Táto metóda poskytuje koncovým používateľom obchodné informácie. Problémy nezávislých datamartov však stále nie sú odstránené. Existuje ďalšia architektúra, ktorú možno použiť, ktorá sa nazýva dátový sklad virtuálne (White 1995). Táto architektúra, ktorá je opísaná na obrázku 2.9, však nie je architektúrou ukladania údajov. dať skutočné, pretože nepresúva načítanie zo systémov OLTP do dátový sklad (Demarest 1994).

V skutočnosti žiadosti o dať koncovými používateľmi prechádzajú do systémov OLTP, ktoré vracajú výsledky po spracovaní požiadaviek používateľov. Hoci táto architektúra umožňuje koncovým používateľom generovať správy a zadávať požiadavky, nemôže poskytnúť

dať historické a prehľadové informácie o firme ako i dať z rôznych systémov OLTP nie sú integrované. Preto táto architektúra nemôže uspokojiť analýzu dať komplexné, ako sú prognózy.

Výber aplikácií na prístup a obnovu dať

Účelom výstavby a dátový sklad je sprostredkovať informácie koncovým používateľom (Inmon a kol. 1997, Poe 1996, McFadden 1996, Shanks a kol. 1997, Hammergren 1998); jednu alebo viac aplikácií na prístup a obnovu dať musia byť poskytnuté. K dnešnému dňu existuje široká škála týchto aplikácií, z ktorých si používateľ môže vybrať (Hammergren 1998, Humphries et al. 1999). Aplikácie, ktoré si vyberiete, rozhodujú o úspechu vášho skladového úsilia dať v organizácii, pretože aplikácie sú najviditeľnejšou časťou dátový sklad koncovému užívateľovi (Inmon a kol. 1997, Poe 1996). Byť úspešný a dátový sklad, musí byť schopný podporovať analytické činnosti dať koncového užívateľa (Poe 1996, Seddon a Benjamin 1998, Eckerson 1999). Preto musí byť identifikovaná „úroveň“ toho, čo konečný užívateľ chce (Poe 1996, Mattison 1996, Inmon a kol. 1997, Humphries a kol. 1999).

Vo všeobecnosti možno koncových používateľov rozdeliť do troch kategórií: výkonní používatelia, obchodní analytici a výkonní používatelia (Poe 1996, Humphries et al. 1999). Výkonní používatelia potrebujú jednoduchý prístup k preddefinovaným súborom správ (Humphries et al. 1999). K týmto pomerom možno ľahko pristupovať pomocou navigácie v ponuke (Poe 1996). Okrem toho by správy mali prezentovať informácie pomocou grafického znázornenia, ako sú tabuľky a šablóny na rýchle sprostredkovanie informácií (Humphries et al. 1999). Obchodní analytici, ktorí nemusia mať technické možnosti na to, aby sami vytvorili správy od nuly, musia byť schopní modifikovať aktuálne správy tak, aby vyhovovali ich špecifickým potrebám (Poe 1996, Humphries et al. 1999). Na druhej strane pokročilí používatelia sú typ koncových používateľov, ktorí majú schopnosť generovať a písať požiadavky a správy od začiatku (Poe 1996, Humphries et al. 1999). Sú to tí, ktorí

vypracúvajú správy pre iné typy používateľov (Poe 1996, Humphries et al. 1999).

Po určení požiadaviek koncového používateľa je potrebné vykonať výber aplikácií na prístup a obnovu dať medzi všetkými dostupnými (Poe 1996, Inmon et al. 1997).
Prístup k dať a vyhľadávacie nástroje možno rozdeliť do 4 typov: nástroje OLAP, nástroje EIS/DSS, nástroje na vyhľadávanie a vytváranie správ a nástroje na dolovanie údajov.

Nástroje OLAP umožňujú používateľom vytvárať ad hoc dopyty, ako aj dopyty vytvorené na databázy del dátový sklad. Okrem toho tieto produkty umožňujú používateľom hĺbkovú analýzu dať všeobecné až po podrobné.

Nástroje EIS/DSS poskytujú výkonné výkazy, ako napríklad analýzu „čo ak“ a prístup k výkazom riadeným menu. Prehľady by mali byť preddefinované a zlúčené s ponukami pre jednoduchšiu navigáciu.
Dotazovacie nástroje a nástroje na vytváranie prehľadov umožňujú používateľom vytvárať preddefinované a špecifické prehľady.

Nástroje na dolovanie údajov sa používajú na identifikáciu vzťahov, ktoré by mohli vrhnúť nové svetlo na zabudnuté operácie v dať dátového skladu.

Popri optimalizácii požiadaviek každého typu užívateľa musia byť zvolené nástroje intuitívne, efektívne a ľahko použiteľné. Musia byť tiež kompatibilné s ostatnými časťami architektúry a schopné pracovať s existujúcimi systémami. Odporúča sa tiež zvoliť nástroje na prístup a vyhľadávanie údajov s rozumnými cenami a výkonom. Medzi ďalšie kritériá, ktoré treba zvážiť, patrí záväzok dodávateľa nástroja podporovať ich produkt a vývoj, ktorý bude mať rovnaký v budúcich vydaniach. Aby sa zabezpečilo zapojenie používateľov do používania dátového skladu, vývojársky tím zapája používateľov do procesu výberu nástroja. V tomto prípade by sa malo vykonať praktické hodnotenie používateľa.

Na zvýšenie hodnoty dátového skladu môže vývojový tím poskytnúť aj webový prístup k svojmu dátovému skladu. Webový dátový sklad umožňuje používateľom prístup k dať zo vzdialených miest alebo počas cestovania. Ďalšie informácie môžu

za nižšie náklady prostredníctvom zníženia nákladov na školenie.

2.4.3 Dátový sklad Fáza prevádzky

Táto fáza pozostáva z troch činností: definovanie stratégií obnovy dát, kontrola činností dátového skladu a riadenie bezpečnosti dátového skladu.

Definícia stratégií obnovy údajov

Po počiatočnom zaťažení, t.j dať v databázy dátového skladu sa musia pravidelne obnovovať, aby sa v nich reprodukovali vykonané zmeny dať originály. Musíte sa preto rozhodnúť, kedy sa má obnovovať, ako často sa má obnovovanie plánovať a ako obnovovať údaje dať. Odporúča sa obnoviť dať kedy je možné systém prepnúť do režimu offline. Frekvencia obnovovania je určená vývojovým tímom na základe požiadaviek používateľov. Existujú dva prístupy k obnoveniu dátového skladu: úplné obnovenie a nepretržité načítavanie zmien.

Prvý prístup, úplné obnovenie, vyžaduje opätovné načítanie všetkých dať od nuly. To znamená, že všetky dať potrebné sa musia extrahovať, vyčistiť, transformovať a integrovať do každého obnovenia. Tomuto prístupu by sa malo, pokiaľ je to možné, vyhnúť, pretože si vyžaduje veľa času a zdrojov.

Alternatívnym prístupom je priebežné nahrávanie zmien. Toto pridáva i dať ktoré sa od posledného cyklu obnovy dátového skladu zmenili. Identifikácia nových alebo upravených záznamov výrazne znižuje množstvo dať ktoré sa musia šíriť do dátového skladu pri každej aktualizácii, pretože iba tieto dať bude pridaný do databázy dátového skladu.

Existuje najmenej 5 prístupov, ktoré možno použiť na stiahnutie i dať nové alebo upravené. Na získanie efektívnej stratégie obnovy údajov dať užitočná môže byť zmes týchto prístupov, ktorá zachytáva všetky zmeny v systéme.

Prvý prístup, ktorý používa časové pečiatky, predpokladá, že všetky sú priradené dať upravili a aktualizovali časovú pečiatku, aby ste ich mohli ľahko identifikovať dať upravené a nové. Tento prístup sa však vo väčšine dnešných operačných systémov veľmi nepoužíva.
Druhým prístupom je použitie delta súboru generovaného aplikáciou, ktorá obsahuje iba zmeny vykonané v súbore dať. Použitie tohto súboru tiež zosilňuje cyklus aktualizácie. Ani táto metóda však nebola v mnohých aplikáciách použitá.
Tretím prístupom je skenovanie súboru denníka, ktorý v podstate obsahuje informácie podobné súboru delta. Jediný rozdiel je v tom, že protokolový súbor je vytvorený pre proces obnovy a môže byť ťažké pochopiť.
Štvrtým prístupom je úprava kódu aplikácie. Väčšina aplikačného kódu je však stará a krehká; preto sa tejto technike treba vyhnúť.
Posledným prístupom je porovnanie dať zdrojov s hlavným súborom dei dať.

Kontrola činností dátového skladu

Po uvoľnení dátového skladu pre používateľov je potrebné ho priebežne monitorovať. V tomto prípade môže správca dátového skladu použiť jeden alebo viac nástrojov na správu a kontrolu na monitorovanie používania dátového skladu. Najmä je možné zbierať informácie o ľuďoch a čase, v ktorom pristupujú do dátového skladu. Poď dať zhromaždené, možno vytvoriť profil vykonanej práce, ktorý možno použiť ako vstup pri implementácii kompenzácie používateľa. Chargeback umožňuje používateľom byť informovaní o nákladoch na spracovanie dátového skladu.

Okrem toho možno audit dátového skladu použiť aj na identifikáciu typov dopytov, ich veľkosti, počtu dopytov za deň, reakčných časov dopytu, dosiahnutých sektorov a množstva dopytov. dať spracované. Ďalším účelom auditu dátového skladu je identifikovať dať ktoré sa nepoužívajú. Títo dať môžu byť odstránené z dátového skladu, aby sa zlepšil čas

odozvy na vykonanie dotazu a sledovať rast dať ktorí bývajú v databázy dátového skladu.

Riadenie bezpečnosti dátového skladu

Dátový sklad obsahuje dať integrované, kritické, citlivé, ktoré možno ľahko dosiahnuť. Z tohto dôvodu by mal byť chránený pred neoprávnenými používateľmi. Jedným zo spôsobov implementácie zabezpečenia je použitie funkcie del DBMS na pridelenie rôznych privilégií rôznym typom používateľov. Týmto spôsobom musí byť udržiavaný prístupový profil pre každý typ používateľa. Ďalším spôsobom, ako zabezpečiť dátový sklad, je zašifrovať ho tak, ako je napísané v databázy dátového skladu. Prístup k dať a nástroje na vyhľadávanie musia dešifrovať dať pred prezentovaním výsledkov používateľom.

2.4.4 Dátový sklad Fáza nasadenia

Je to posledná fáza v cykle implementácie dátového skladu. Činnosti, ktoré sa majú vykonať v tejto fáze, zahŕňajú školenie používateľov na používanie dátového skladu a vykonávanie kontrol dátového skladu.

Školenie používateľov

Pred prístupom k službe by sa malo vykonať školenie používateľov dať dátového skladu a používanie nástrojov na vyhľadávanie. Vo všeobecnosti by stretnutia mali začať úvodom do konceptu skladovania dať, obsah dátového skladu, meta dať a základné vlastnosti nástrojov. Potom by pokročilejší používatelia mohli študovať aj fyzické tabuľky a používateľské funkcie nástrojov na prístup a vyhľadávanie údajov.

Existuje mnoho prístupov k školeniu používateľov. Jeden z nich zahŕňa výber mnohých používateľov alebo analytikov vybraných zo skupiny používateľov na základe ich vodcovských a komunikačných schopností. Sú osobne vyškolení na všetko, čo potrebujú vedieť, aby sa zoznámili so systémom. Po skončení školenia sa vrátia k svojej práci a začnú učiť ostatných používateľov, ako systém používať. Na

Na základe toho, čo sa naučili, môžu ostatní používatelia začať skúmať dátový sklad.
Ďalším prístupom je trénovať veľa používateľov súčasne, ako keby ste absolvovali kurz v triede. Táto metóda je vhodná, keď je súčasne veľa používateľov, ktorých treba zaškoliť. Ďalšou metódou je trénovať každého používateľa individuálne, jedného po druhom. Táto metóda je vhodná, keď je málo používateľov.

Účelom školenia používateľov je oboznámiť vás s prístupom k dať a nástroje na vyhľadávanie, ako aj obsah dátového skladu. Niektorí používatelia však môžu byť preťažení množstvom informácií poskytnutých počas školenia. Preto je potrebné vykonať určitý počet opakovacích sedení, aby bolo možné neustále pomáhať a odpovedať na konkrétne otázky. V niektorých prípadoch je vytvorená používateľská skupina, ktorá poskytuje tento typ podpory.

Zhromažďovanie spätnej väzby

Po zavedení dátového skladu môžu používatelia používať i dať ktoré sa nachádzajú v dátovom sklade na rôzne účely. Analytici alebo používatelia väčšinou používajú i dať v dátovom sklade pre:

1 Identifikujte trendy spoločnosti
2 Analyzujte nákupné profily zákazníci
3 Rozdeliť i zákazníci ed i
4 Poskytujte tie najlepšie služby zákazníci - prispôsobenie služieb
5 Formulujte stratégie marketing
6 Vytvorte konkurenčné cenové ponuky pre analýzy nákladov a pomôžte kontrolovať
7 Podporujte strategické rozhodovanie
8 Identifikujte príležitosti, ako vyniknúť
9 Zlepšiť kvalitu súčasných obchodných procesov
10 Skontrolujte zisk

Podľa smerovania vývoja dátového skladu by sa v systéme mohla vykonať séria kontrol na získanie spätnej väzby

od vývojárskeho tímu aj od komunity koncových používateľov.
Získané výsledky možno vziať do úvahy pre ďalší vývojový cyklus.

Keďže dátový sklad má inkrementálny prístup, je dôležité poučiť sa z úspechov a chýb predchádzajúceho vývoja.

2.5 Zhrnutie

V tejto kapitole sa diskutuje o prístupoch v literatúre. V časti 1 sa diskutovalo o koncepte dátového skladu a jeho úlohe v rozhodovacej vede. Časť 2 popisuje hlavné rozdiely medzi dátovými skladmi a systémami OLTP. V časti 3 sme diskutovali o modeli dátového skladu Monash, ktorý bol použitý v časti 4 na popis činností spojených s procesom vývoja dátového skladu, tieto tézy neboli založené na rigoróznom výskume. To, čo sa deje v skutočnosti, sa môže veľmi líšiť od toho, čo uvádza literatúra, avšak tieto výsledky možno použiť na vytvorenie základného pozadia, ktoré podčiarkuje koncept dátového skladu pre tento výskum.

Kapitola 3

Metódy výskumu a dizajnu

Táto kapitola sa zaoberá metódami výskumu a návrhu tejto štúdie. Prvá časť ukazuje všeobecný pohľad na dostupné výskumné metódy na získavanie informácií a rozoberá kritériá na výber najlepšej metódy pre konkrétnu štúdiu. V časti 2 sú potom diskutované dve metódy vybrané podľa práve uvedených kritérií; z nich sa vyberie a prijme jedno s dôvodmi uvedenými v oddiele 3, kde sú uvedené aj dôvody na vylúčenie druhého kritéria. Časť 4 predstavuje návrh výskumu a časť 5 závery.

3.1 Výskum v informačných systémoch

Výskum informačných systémov sa neobmedzuje len na technologickú oblasť, ale musí sa rozšíriť aj na behaviorálne a organizačné účely.
Vďačíme za to tézam rôznych disciplín od spoločenských až po prírodné vedy; to vedie k potrebe určitého spektra výskumných metód zahŕňajúcich kvantitatívne a kvalitatívne metódy pre informačné systémy.
Dôležité sú všetky dostupné výskumné metódy, v skutočnosti viacerí výskumníci ako Jenkins (1985), Nunamaker et al. (1991) a Galliers (1992) tvrdia, že neexistuje žiadna špecifická univerzálna metóda na vykonávanie výskumu v rôznych oblastiach informačných systémov; v skutočnosti môže byť metóda vhodná pre konkrétny výskum, ale nie pre iné. To nám prináša potrebu vybrať metódu, ktorá je vhodná pre náš konkrétny výskumný projekt: pre túto voľbu Benbasat et al. (1987) uvádzajú, že treba zvážiť povahu a účel výskumu.

3.1.1 Povaha výskumu

Rôzne metódy založené na povahe výskumu možno rozdeliť do troch tradícií všeobecne známych v informačnej vede: pozitivistický, interpretačný a kritický výskum.

3.1.1.1 Pozitivistický výskum

Pozitivistický výskum je známy aj ako vedecká alebo empirická štúdia. Snaží sa: „vysvetliť a predpovedať, čo sa stane v sociálnom svete, na základe zákonitostí a vzťahov príčin a následkov medzi prvkami, ktoré ho tvoria“ (Shanks a kol. 1993).

Pozitivistický výskum sa vyznačuje aj opakovateľnosťou, zjednodušením a vyvrátením. Pozitivistický výskum navyše pripúšťa existenciu apriórnych vzťahov medzi skúmanými javmi.
Podľa Galliersa (1992) je taxonómia výskumnou metódou zaradenou do pozitivistickej paradigmy, ktorá sa však neobmedzuje len na toto, v skutočnosti ide o laboratórne experimenty, terénne experimenty, prípadové štúdie, demonštrácie teorémov, predpovede a simulácie. Použitím týchto metód výskumníci pripúšťajú, že skúmané javy možno pozorovať objektívne a dôsledne.

3.1.1.2 Interpretačný výskum

Interpretačný výskum, ktorý sa často nazýva fenomenológia alebo antipozitivizmus, popisuje Neuman (1994) ako „systematický rozbor sociálneho významu konania prostredníctvom priameho a podrobného pozorovania ľudí v prirodzených situáciách s cieľom dospieť k porozumeniu a k interpretácii toho, ako ľudia vytvárajú a udržiavajú svoj sociálny svet“. Interpretačné štúdie odmietajú predpoklad, že pozorované javy možno pozorovať objektívne. V skutočnosti sú založené na subjektívnych interpretáciách. Okrem toho interpretujúci výskumníci nevnucujú fenoménom, ktoré skúmajú, a priori význam.

Táto metóda zahŕňa subjektívne/argumentatívne štúdie, akčný výskum, deskriptívne/interpretačné štúdie, budúci výskum a hranie rolí. Okrem týchto prieskumov a prípadových štúdií možno do tohto prístupu zahrnúť aj štúdie jednotlivcov alebo organizácií v zložitých situáciách reálneho sveta.

3.1.1.3 Kritický výskum

Kritické skúmanie je najmenej známym prístupom v spoločenských vedách, ale nedávno si získalo pozornosť výskumníkov informačných systémov. Filozofický predpoklad, že sociálnu realitu historicky vytvárajú a reprodukujú ľudia, ako aj sociálne systémy svojimi činmi a interakciami. Ich schopnosť je však sprostredkovaná množstvom sociálnych, kultúrnych a politických úvah.

Podobne ako interpretačný výskum, aj kritický výskum tvrdí, že pozitivistický výskum nemá nič spoločné so sociálnym kontextom a ignoruje jeho vplyv na ľudské činy.
Kritický výskum na druhej strane kritizuje interpretačný výskum za to, že je príliš subjektívny a jeho cieľom nie je pomôcť ľuďom zlepšiť ich život. Najväčší rozdiel medzi kritickým výskumom a ostatnými dvoma prístupmi je jeho hodnotiaci rozmer. Zatiaľ čo objektivitou pozitivistických a interpretačných tradícií je predpovedať alebo vysvetliť status quo alebo sociálnu realitu, kritický výskum sa zameriava na kritické hodnotenie a transformáciu skúmanej sociálnej reality.

Kritici sa zvyčajne stavajú proti status quo s cieľom odstrániť sociálne rozdiely a zlepšiť sociálne podmienky. Kritický výskum sa zaväzuje k procesuálnemu pohľadu na fenomény záujmu, a preto je zvyčajne dlhodobý. Príkladom výskumných metód sú dlhodobé historické štúdie a etnografické štúdie. Kritický výskum sa však vo výskume informačných systémov veľmi nepoužíva

3.1.2 Účel výskumu

Spolu s povahou výskumu môže byť jeho účel použitý na usmernenie výskumníka pri výbere konkrétnej výskumnej metódy. Účel výskumného projektu úzko súvisí s pozíciou výskumu vo vzťahu k výskumnému cyklu, ktorý pozostáva z troch fáz: budovanie teórie, testovanie teórie a spresňovanie teórie. Na základe načasovania výskumného cyklu teda môže mať výskumný projekt vysvetľujúci, popisný, prieskumný alebo prediktívny účel.

3.1.2.1 Prieskumný výskum

Prieskumný výskum má za cieľ preskúmať úplne novú tému a formulovať otázky a hypotézy pre budúci výskum. Tento typ výskumu sa používa pri budovaní teórie na získanie počiatočných referencií v novej oblasti. Typicky sa používajú kvalitatívne výskumné metódy, ako sú prípadové štúdie alebo fenomenologické štúdie.

Je však tiež možné použiť kvantitatívne techniky, ako sú prieskumné prieskumy alebo experimenty.

3.1.3.3 Deskriptívny výskum

Cieľom deskriptívneho výskumu je analyzovať a veľmi podrobne opísať konkrétnu organizačnú situáciu alebo prax. To je vhodné pre budovanie teórií a môže sa použiť aj na potvrdenie alebo spochybnenie hypotéz. Deskriptívny výskum zvyčajne zahŕňa použitie mier a vzoriek. Najvhodnejšie metódy výskumu zahŕňajú prieskumy a analýzy predchodcov.

3.1.2.3 Vysvetľujúci výskum

Vysvetľujúci výskum sa snaží vysvetliť, prečo sa veci dejú. Je postavená na už preštudovaných faktoch a snaží sa nájsť dôvody týchto faktov.
Vysvetľujúci výskum je teda zvyčajne založený na prieskumnom alebo deskriptívnom výskume a je doplnkom k testovaniu a zdokonaľovaniu teórií. Vysvetľujúci výskum zvyčajne využíva prípadové štúdie alebo výskumné metódy založené na prieskumoch.

3.1.2.4 Preventívny výskum

Preventívny výskum sa zameriava na predpovedanie sledovaných udalostí a správania, ktoré sa skúmajú (Marshall a Rossman 1995). Predpoveď je štandardný vedecký test pravdy. Tento typ výskumu vo všeobecnosti využíva prieskumy alebo analýzy dať historikov. (Yin 1989)

Vyššie uvedená diskusia ukazuje, že existuje množstvo možných výskumných metód, ktoré možno použiť v konkrétnej štúdii. Musí však existovať jedna špecifická metóda, ktorá je pre konkrétny typ výskumného projektu vhodnejšia ako ostatné. (Galliers 1987, Yin 1989, De Vaus 1991). Každý výskumník preto musí starostlivo zhodnotiť silné a slabé stránky rôznych metód, aby si osvojil najvhodnejšiu a kompatibilnú výskumnú metódu s výskumným projektom. (Jenkins 1985, Pervan a Klass 1992, Bonomia 1985, Yin 1989, Himilton a Ives 1992).

3.2. Možné metódy výskumu

Cieľom tohto projektu bolo študovať skúsenosti v austrálskych organizáciách s i dať uložené s vývojom dátový sklad. Dato že v súčasnosti v Austrálii chýba výskum v oblasti skladovania údajov, tento výskumný projekt je stále v teoretickej fáze výskumného cyklu a má prieskumný účel. Skúmanie skúseností v austrálskych organizáciách prijímajúcich dátové sklady si vyžaduje interpretáciu reálnej spoločnosti. V dôsledku toho sa filozofický predpoklad, ktorý je základom výskumného projektu, riadi tradičnou interpretáciou.

Po dôslednom preskúmaní dostupných metód boli identifikované dve možné výskumné metódy: prieskumy a prípadové štúdie, ktoré možno použiť na exploračný výskum (Shanks et al. 1993). Galliers (1992) vo svojej revidovanej taxonómii argumentuje vhodnosťou týchto dvoch metód pre túto konkrétnu štúdiu tým, že sú vhodné na vytváranie teórie. Nasledujúce dve podkapitoly podrobne rozoberajú každú metódu.

3.2.1 Metóda prieskumu

Metóda zisťovacieho výskumu pochádza zo starodávnej metódy sčítania ľudu. Sčítanie pozostáva zo zberu informácií od celej populácie. Táto metóda je drahá a nepraktická, najmä ak je populácia veľká. V porovnaní so sčítaním sa teda prieskum zvyčajne zameriava na zber informácií pre malý počet alebo vzorku zástupcov populácie (Fowler 1988, Neuman 1994). Vzorka odráža populáciu, z ktorej je odobratá, s rôznou úrovňou presnosti v závislosti od štruktúry vzorky, veľkosti a použitej metódy výberu (Fowler 1988, Babbie 1982, Neuman 1994).

Metóda prieskumu je definovaná ako „snímky praktík, situácií alebo názorov v určitom časovom bode, urobené pomocou dotazníkov alebo rozhovorov, z ktorých možno vyvodiť závery.
urobené“ (Galliers 1992:153) [snímka praktík, situácií alebo názorov v určitom časovom bode, uskutočnená pomocou dotazníkov alebo rozhovorov, z ktorých možno vyvodiť závery]. Prieskumy sa zaoberajú zhromažďovaním informácií o niektorých aspektoch štúdie od určitého počtu účastníkov kladením otázok (Fowler 1988). Tieto dotazníky a rozhovory, ktoré zahŕňajú osobné telefonické rozhovory a štruktúrované rozhovory, sú tiež technikami zberu dať najčastejšie používané pri výskumoch (Blalock 1970, Nachmias a Nachmias 1976, Fowler 1988), možno použiť pozorovania a analýzy (Gable 1994). Zo všetkých týchto metód zberu dať, používanie dotazníka je najobľúbenejšou technikou, pretože zabezpečuje, že i dať

zhromaždené sú štruktúrované a formátované, a preto uľahčuje klasifikáciu informácií (Hwang 1987, de Vaus 1991).

Pri analýze i dať, stratégia vyšetrovania často využíva kvantitatívne techniky, ako je štatistická analýza, ale možno použiť aj kvalitatívne techniky (Galliers 1992, Pervan

a Klass 1992, Gable 1994). Normálne, t.j dať zozbierané sa používajú na analýzu distribúcií a vzorcov asociácií (Fowler 1988).

Zatiaľ čo prieskumy sú vo všeobecnosti vhodné pre otázky, ktoré sa týkajú alebo vychádzajú z otázky „čo?“, ako napríklad „koľko“ a „koľko“, možno ich položiť prostredníctvom otázky „prečo“ (Sonquist a Dunkelberg 1977, Yin 1989). . Podľa Sonquista a Dunkelberga (1977) sa prieskumný výskum zameriava na spochybňovanie hypotéz, hodnotenie programov, popis populácie a vývoj modelov ľudského správania. Okrem toho možno prieskumy použiť na štúdium určitého názoru obyvateľstva, podmienok, názorov, charakteristík, očakávaní a dokonca aj minulého alebo súčasného správania (Neuman 1994).

Prieskumy umožňujú výskumníkom objaviť vzťahy medzi populáciou a výsledky sú zvyčajne všeobecnejšie ako iné metódy (Sonquist a Dunkelberg 1977, Gable 1994). Prieskumy umožňujú výskumníkom pokryť väčšiu geografickú oblasť a osloviť mnoho respondentov (Blalock 1970, Sonquist a Dunkelberg 1977, Hwang a Lin 1987, Gable 1994, Neuman 1994). Napokon, prieskumy môžu poskytnúť informácie, ktoré nie sú dostupné inde alebo vo forme požadovanej pre analýzy (Fowler 1988).

Pri vykonávaní prieskumu však existujú určité obmedzenia. Nevýhodou je, že výskumník nemôže získať veľa informácií o skúmanom objekte. Je to spôsobené tým, že prieskumy sa vykonávajú len v určitom čase, a preto existuje obmedzený počet premenných a ľudí, ktorých môže výskumník

štúdia (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Ďalšou nevýhodou je, že uskutočnenie prieskumu môže byť veľmi nákladné z hľadiska času a zdrojov, najmä ak zahŕňa osobné rozhovory (Fowler 1988).

3.2.2. Metóda prieskumu prieskumu

Metóda skúmania zahŕňa hĺbkové štúdium konkrétnej situácie v rámci jej reálneho kontextu počas definovaného časového obdobia bez akéhokoľvek zásahu zo strany výskumníka (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Táto metóda sa používa najmä na opis vzťahov medzi premennými, ktoré sa skúmajú v konkrétnej situácii (Galliers 1992). Vyšetrovania môžu zahŕňať jeden alebo viacero prípadov v závislosti od analyzovaného javu (Franz a Robey 1987, Eisenhardt 1989, Yin 1989).

Metóda skúmania je definovaná ako „empirické skúmanie, ktoré študuje súčasný fenomén v jeho aktuálnom kontexte pomocou viacerých zdrojov získaných od jednej alebo viacerých entít, ako sú ľudia, skupiny alebo organizácie“ (Yin 1989). Neexistuje jasné oddelenie medzi javom a jeho kontextom a neexistuje žiadna experimentálna kontrola alebo manipulácia s premennými (Yin 1989, Benbasat a ďalší, 1987).

Existuje množstvo techník zbierania bohov dať ktoré možno použiť v metóde zisťovania, ktorá zahŕňa priame pozorovania, kontroly archívnych záznamov, dotazníky, previerku dokumentácie a štruktúrované rozhovory. Disponuje rôznymi technikami zberu daťvýskumy umožňujú výskumníkom zaoberať sa oboma dať kvalitatívne a kvantitatívne zároveň (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Ako je to v prípade metódy prieskumu, výskumný pracovník slúži ako pozorovateľ alebo výskumník a nie ako aktívny účastník v skúmanej organizácii.

Benbasat a kol., (1987) tvrdia, že metóda skúmania je obzvlášť vhodná na konštrukciu teórie výskumu, ktorá začína výskumnou otázkou a pokračuje formovaním

teórie počas procesu zberu dať. Vhodné aj na javisko

z budovania teórie Franz a Robey (1987) navrhujú, že metódu skúmania možno použiť aj pre fázu komplexnej teórie. V tomto prípade je na základe zozbieraných dôkazov daná teória alebo hypotéza overená alebo vyvrátená. Okrem toho je prieskum vhodný aj pre výskum, ktorý sa zaoberá otázkami „ako“ alebo „prečo“ (Yin 1989).

V porovnaní s inými metódami prieskumy umožňujú výskumníkovi podrobnejšie zachytiť podstatné informácie (Galliers 1992, Shanks et al. 1993). Okrem toho prieskumy umožňujú výskumníkovi pochopiť povahu a zložitosť skúmaných procesov (Benbasat et al. 1987).

S metódou prieskumu sú spojené štyri hlavné nevýhody. Prvým je nedostatok kontrolovaných odpočtov. Subjektivita výskumníka môže zmeniť výsledky a závery štúdie (Yin 1989). Druhou nevýhodou je chýbajúce kontrolované pozorovanie. Na rozdiel od experimentálnych metód výskumný pracovník nemôže kontrolovať skúmané javy, pretože sú skúmané v ich prirodzenom kontexte (Gable 1994). Treťou nevýhodou je nedostatočná replikovateľnosť. Je to preto, že je nepravdepodobné, že by výskumník pozoroval rovnaké udalosti a nemôže overiť výsledky konkrétnej štúdie (Lee 1989). Napokon, v dôsledku nereplikovateľnosti je ťažké zovšeobecniť výsledky získané z jedného alebo viacerých výskumov (Galliers 1992, Shanks a kol. 1993). Všetky tieto problémy však nie sú neprekonateľné a výskumník ich môže v skutočnosti minimalizovať aplikáciou vhodných opatrení (Lee 1989).

3.3. Zdôvodnite metodiku výskumu prijali

Z dvoch možných výskumných metód pre túto štúdiu je metóda prieskumu považovaná za najvhodnejšiu. Vyšetrovanie bolo po dôkladnom zvážení relevantných zahodené

prednosti a slabosti. Vhodnosť alebo nevhodnosť každej metódy pre túto štúdiu je diskutovaná nižšie.

3.3.1. Nevhodnosť výskumnej metódy vyšetrovania

Metóda prieskumu vyžaduje hĺbkové štúdium konkrétnej situácie v rámci jednej alebo viacerých organizácií počas určitého časového obdobia (Eisenhardt 1989). V tomto prípade môže toto obdobie presiahnuť časový rámec stanovený pre túto štúdiu. Ďalším dôvodom neprijatia metódy prieskumu je, že výsledky môžu trpieť nedostatočnou presnosťou (Yin 1989). Subjektivita výskumníka môže ovplyvniť výsledky a závery. Ďalším dôvodom je, že táto metóda je vhodnejšia na výskum otázok typu „ako“ alebo „prečo“ (Yin 1989), pričom výskumná otázka pre túto štúdiu je typu „čo“. V neposlednom rade je ťažké zovšeobecniť zistenia len z jedného alebo niekoľkých výskumov (Galliers 1992, Shanks et al. 1993). Na základe tohto zdôvodnenia nebola zvolená metóda prieskumu, pretože bola pre túto štúdiu nevhodná.

3.3.2. Pohodlie spôsobu vyhľadávania vyšetrovanie

Keď sa tento výskum robil, prax dátového skladu nebola široko prijatá austrálskymi organizáciami. Preto nebolo veľa informácií o ich implementácii v austrálskych organizáciách. Dostupné informácie pochádzali od organizácií, ktoré zaviedli alebo použili a dátový sklad. V tomto prípade je najvhodnejšia metóda prieskumu, pretože umožňuje získať informácie, ktoré nie sú dostupné inde alebo vo forme potrebnej na analýzu (Fowler 1988). Okrem toho výskumná metóda prieskumu umožňuje výskumníkovi získať dobrý prehľad o postupoch, situáciách alebo názoroch v konkrétnom čase (Galliers 1992, Denscombe 1998). Na zvýšenie vedomostí o skúsenostiach s austrálskym skladovaním údajov bol potrebný prehľad.

Ďalej Sonquist a Dunkelberg (1977) uvádzajú, že výsledky prieskumného výskumu sú všeobecnejšie ako iné metódy.

3.4. Návrh prieskumu

Prieskum o postupoch skladovania údajov sa uskutočnil v roku 1999. Cieľovú populáciu tvorili austrálske organizácie zaujímajúce sa o štúdie skladovania údajov, keďže pravdepodobne už boli informované o dať ktoré uchovávajú, a preto by mohli poskytnúť užitočné informácie pre túto štúdiu. Cieľová populácia bola identifikovaná počiatočným prieskumom všetkých austrálskych členov The Data Warehousing Institute (Tdwi-aap). Táto časť sa zaoberá návrhom fázy empirického výskumu tejto štúdie.

3.4.1. Technika zberu dať

Z troch techník bežne používaných v prieskumnom výskume (t. j. poštový dotazník, telefonický rozhovor a osobný rozhovor) (Nachmias 1976, Fowler 1988, de Vaus 1991) bol pre túto štúdiu prijatý poštový dotazník. Prvým dôvodom pre prijatie druhého je, že môže osloviť geograficky rozptýlenú populáciu (Blalock 1970, Nachmias a Nachmias 1976, Hwang a Lin 1987, de Vaus 1991, Gable 1994). Po druhé, poštový dotazník je vhodný pre vysoko vzdelaných účastníkov (Fowler 1988). E-mailový dotazník pre túto štúdiu bol adresovaný sponzorom projektu skladovania údajov, riaditeľom a/alebo projektovým manažérom. Po tretie, poštové dotazníky sú vhodné, ak je k dispozícii bezpečný zoznam adries (Salant a Dilman 1994). TDWI, v tomto prípade dôveryhodné združenie pre skladovanie údajov, poskytlo zoznam adresátov svojich austrálskych členov. Ďalšou výhodou poštového dotazníka oproti telefonickému dotazníku alebo osobným rozhovorom je to, že umožňuje respondentom odpovedať presnejšie, najmä keď si respondenti musia prezerať poznámky alebo diskutovať o otázkach s inými ľuďmi (Fowler 1988).

Potenciálnou nevýhodou môže byť čas potrebný na vyplnenie dotazníkov poštou. Normálne sa poštový prieskum vykonáva v tomto poradí: e-mailové listy, čakanie na odpovede a zaslanie potvrdenia (Fowler 1988, Bainbridge 1989). Celkový čas teda môže byť dlhší ako čas potrebný na osobné pohovory alebo telefonické pohovory. Celkový čas však môže byť známy vopred (Fowler 1988, Denscombe 1998). Čas strávený vedením osobných rozhovorov nie je možné vopred poznať, pretože sa líši od jedného rozhovoru k druhému (Fowler 1988). Telefonické rozhovory môžu byť rýchlejšie ako poštové dotazníky a osobné rozhovory, ale môžu mať vysokú mieru neodpovedania kvôli nedostupnosti niektorých ľudí (Fowler 1988). Okrem toho sú telefonické rozhovory vo všeobecnosti obmedzené na relatívne krátke zoznamy otázok (Bainbridge 1989).

Ďalšou slabinou poštového dotazníka je vysoká miera neodpovedania (Fowler 1988, Bainbridge 1989, Neuman 1994). Boli však prijaté protiopatrenia spojením tejto štúdie s dôveryhodnou inštitúciou na skladovanie údajov (t. j. TDWI) (Bainbridge 1989, Neuman 1994), ktorá posiela dva upomienky neodpovedajúcim (Fowler 1988, Neuman 1994) a obsahuje aj ďalší list vysvetlenie účelu štúdie (Neuman 1994).

3.4.2. Jednotka analýzy

Cieľom tejto štúdie je získať informácie o implementácii dátového skladu a jeho využití v rámci austrálskych organizácií. Cieľovú populáciu tvoria všetky austrálske organizácie, ktoré implementovali, alebo realizujú, t.j dátový sklad. Jednotlivé organizácie sú potom registrované na meno. Dotazník bol zaslaný poštou organizáciám, ktoré mali záujem o adopciu dátový sklad. Táto metóda zabezpečuje, že zozbierané informácie pochádzajú z najvhodnejších zdrojov každej zúčastnenej organizácie.

3.4.3. Vzorka prieskumu

„Zoznam adresátov“ účastníkov prieskumu bol získaný od TDWI. Z tohto zoznamu bolo vybraných 3000 3000 austrálskych organizácií ako základ pre výber vzorky. Vzorke bol zaslaný dodatočný list vysvetľujúci projekt a účel prieskumu spolu s odpoveďovým hárkom a predplatenou obálkou na vrátenie vyplneného dotazníka. Z 198 organizácií súhlasilo s účasťou na štúdii XNUMX. Očakával sa taký malý počet odpovedí daný veľký počet austrálskych organizácií, ktoré vtedy prijali alebo prijímali stratégiu skladovania údajov v rámci svojich organizácií. Cieľovú populáciu tejto štúdie teda tvorí iba 198 organizácií.

3.4.4. Obsah dotazníka

Štruktúra dotazníka bola založená na modeli skladovania údajov Monash (o ktorom sa hovorilo skôr v časti 2.3). Obsah dotazníka vychádzal z analýzy literatúry uvedenej v kapitole 2. Kópiu dotazníka zaslaného účastníkom prieskumu možno nájsť v prílohe B. Dotazník pozostáva zo šiestich častí, ktoré sledujú jednotlivé fázy modelu. Nasledujúcich šesť odsekov stručne sumarizuje obsah každej časti.

Časť A: Základné informácie o organizácii
Táto časť obsahuje otázky týkajúce sa profilu zúčastnených organizácií. Okrem toho niektoré z otázok súvisia so stavom projektu dátového skladu účastníka. Dôverné informácie, ako napríklad názov organizácie, neboli v analýze prieskumu odhalené.

Časť B: Začiatok
Otázky v tejto časti súvisia s inicializáciou skladovania údajov. Boli položené otázky týkajúce sa iniciátorov projektu, garantov, požadovaných zručností a znalostí, cieľov rozvoja dátového skladu a očakávaní koncových používateľov.

Časť C: Dizajn
Táto časť obsahuje otázky týkajúce sa plánovania činností dátový sklad. Otázky sa týkali najmä rozsahu realizácie, trvania projektu, nákladov na projekt a analýzy nákladov a výnosov.

Sekcia D: Rozvoj
V sekcii rozvoja sú otázky týkajúce sa rozvojových aktivít spoločnosti dátový sklad: zbierka požiadaviek koncových používateľov, zdroje dať, logický model dať, prototypy, kapacitné plánovanie, technické architektúry a výber nástrojov na vývoj dátových skladov.

Časť E: Prevádzka
Prevádzkové otázky súvisiace s prevádzkou a rozšíriteľnosťou dátový sklad, ako sa vyvinie v ďalšej fáze vývoja. Tam kvalita údajov, obnovovacie stratégie spoločnosti dať, zrnitosť dať, škálovateľnosť dátový sklad a bezpečnostné otázky dátový sklad patrili medzi typy kladených otázok.

Sekcia F: Rozvoj
Táto časť obsahuje otázky týkajúce sa používania dátový sklad koncovými používateľmi. Výskumníka zaujímal účel a užitočnosť dátový sklad, prijaté stratégie preskúmania a školenia a stratégia kontroly dátový sklad prijali.

3.4.5. Rýchlosť odpovede

Aj keď sú prieskumy pošty kritizované za nízku mieru odozvy, prijali sa opatrenia na zvýšenie miery návratnosti (ako bolo uvedené vyššie v časti 3.4.1). Pojem „miera odpovedí“ sa týka percenta ľudí v konkrétnej vzorke prieskumu, ktorí odpovedali na dotazník (Denscombe 1998). Na výpočet miery odozvy pre túto štúdiu bol použitý nasledujúci vzorec:

Počet ľudí, ktorí odpovedali
Miera odpovedí = ———————————————————————————– X 100 Celkový počet odoslaných dotazníkov

3.4.6. Pilotný test

Pred odoslaním dotazníka do vzorky boli otázky preskúmané vykonaním pilotných testov, ako navrhli Luck a Rubin (1987), Jackson (1988) a de Vaus (1991). Účelom pilotných testov je odhaliť akékoľvek nepríjemné, nejednoznačné výrazy a otázky, ktoré sa ťažko interpretujú, objasniť akékoľvek použité definície a pojmy a určiť približný čas potrebný na vyplnenie dotazníka (Warwick a Lininger 1975, Jackson 1988, Salant a Dilman 1994). Pilotné testy sa uskutočnili výberom subjektov s charakteristikami podobnými charakteristikám finálnych subjektov, ako navrhol Davis e Cosenza (1993). V tejto štúdii bolo ako pilotné subjekty vybratých šesť odborníkov na skladovanie údajov. Po každom pilotnom teste boli vykonané potrebné korekcie. Z uskutočnených pilotných testov prispeli účastníci k prepracovaniu a resetovaniu konečnej verzie dotazníka.

3.4.7. Analytické metódy By dati

I dať prieskumov zozbieraných z uzavretých dotazníkov bolo analyzovaných pomocou balíka štatistických programov s názvom SPSS. Mnohé z odpovedí boli analyzované pomocou deskriptívnej štatistiky. Niekoľko dotazníkov sa vrátilo neúplných. S týmito sa zaobchádzalo s väčšou starostlivosťou, aby sa zabezpečilo, že i dať chýbajúce neboli dôsledkom chýb pri zadávaní údajov, ale preto, že otázky neboli pre registrujúceho vhodné, alebo sa registrujúci rozhodol neodpovedať na jednu alebo viacero konkrétnych otázok. Tieto chýbajúce odpovede boli počas analýzy ignorované dať a boli označené ako „- 9“, aby sa zabezpečilo ich vylúčenie z procesu analýzy.

Pri príprave dotazníka boli uzavreté otázky predkódované priradením čísla ku každej možnosti. Číslo sa potom použilo na prípravu dať počas analýzy (Denscombe 1998, Sapsford a Jupp 1996). Napríklad v otázke 1 oddielu B bolo uvedených šesť možností: predstavenstvo, vedúci pracovníci, oddelenie IT, obchodná jednotka, konzultanti a iné. V súbore dať SPSS bola vygenerovaná premenná označujúca „iniciátora projektu“ so šiestimi štítkami hodnôt: „1“ pre „predstavenstvo“, „2“ pre „vyššieho výkonného pracovníka“ atď. Použitie Likertinovej škály v niektorých uzavretých otázkach tiež umožnilo jednoduchú identifikáciu vzhľadom na použitie zodpovedajúcich číselných hodnôt zadaných do SPSS. V prípade otázok s neúplnými odpoveďami, ktoré sa navzájom nevylučovali, sa každá možnosť považovala za jednu premennú s dvoma označeniami hodnôt: „1“ pre „označené“ a „2“ pre „neoznačené“.

S otvorenými otázkami sa zaobchádzalo inak ako s uzavretými otázkami. Odpovede na tieto otázky neboli vložené do SPSS. Namiesto toho boli analyzované ručne. Použitie tohto typu otázok nám umožňuje získať informácie o voľne vyjadrených predstavách a osobných skúsenostiach respondentov (Bainbridge 1989, Denscombe 1998). Tam, kde to bolo možné, bola vykonaná kategorizácia odpovedí.

Na analýzu daťpoužívajú sa jednoduché metódy štatistickej analýzy, ako je frekvencia odozvy, priemer, štandardná odchýlka a medián (Argyrous 1996, Denscombe 1998).
Gamma test fungoval dobre na získanie kvantitatívnych meraní asociácií medzi nimi dať radové (Norusis 1983, Argyrous 1996). Tieto testy boli vhodné, pretože používané poradové škály nemali veľa kategórií a mohli byť zobrazené v tabuľke (Norusis 1983).

3.5 Zhrnutie

V tejto kapitole sa diskutuje o metodológii výskumu a návrhu prijatom pre túto štúdiu.

Zohľadňuje sa výber najvhodnejšej výskumnej metódy pre konkrétnu štúdiu
zváženie množstva pravidiel vrátane povahy a typu výskumu, ako aj predností a slabín každej možnej metódy (Jenkins 1985, Benbasat a kol. 1097, Galliers a Land 1987, yin 1989, Hamilton a Ives 1992, Galliers 1992, Neuman 1994). Vzhľadom na nedostatok existujúcich znalostí a teórie o prijatí skladovania údajov v Austrálii si táto výskumná štúdia vyžaduje interpretačnú výskumnú metódu s prieskumnou schopnosťou preskúmať skúsenosti austrálskych organizácií. Zvolená výskumná metóda bola vybraná na zber informácií týkajúcich sa prijatia konceptu skladovania údajov austrálskymi organizáciami. Ako technika zberu bol zvolený poštový dotazník dať. Zdôvodnenie výskumnej metódy a techniky zberu dať vybrané budú uvedené v tejto kapitole. Ďalej bola prezentovaná diskusia o jednotke analýzy, použitej vzorke, percentách odpovedí, obsahu dotazníka, predbežnom teste dotazníka a spôsobe analýzy výsledkov. dať.

Navrhovanie a Dátový sklad:

Kombinácia vzťahu entít a dimenzionálneho modelovania

Abstrakt
Ukladanie i dať je hlavným aktuálnym problémom mnohých organizácií. Kľúčová otázka vo vývoji skladovania potravín dať je to jeho dizajn.
Návrh musí podporovať detekciu konceptov v dátový sklad na starý systém a iné zdroje dať a tiež ľahké pochopenie a efektívnosť pri implementácii dátový sklad.
Veľká časť skladovacej literatúry z dať odporúča použitie modelovania vzťahov entít alebo rozmerového modelovania na reprezentáciu návrhu dátový sklad.
V tomto článku ukážeme, ako možno obe zobrazenia kombinovať v jednom prístupe pre kreslenie dátový sklad. Použitý prístup je systematický

skúmaný v prípadovej štúdii a je identifikovaný v mnohých dôležitých dôsledkoch s odborníkmi z praxe.

SKLADOVANIE ÚDAJOV

Un dátový sklad zvyčajne sa definuje ako „subjektovo orientovaný, integrovaný, časovo variabilný a nestály zber údajov na podporu rozhodnutí manažmentu“ (Inmon a Hackathorn, 1994). Predmetovo orientovaný a integrovaný naznačuje, že dátový sklad je navrhnutý tak, aby prekračoval funkčné hranice systémov Legaci a ponúkal integrovanú perspektívu dať.
Časový variant ovplyvňuje historický alebo časový rad dať v dátový sklad, ktorý umožňuje analyzovať trendy. Neprchavý znamená, že dátový sklad nie je priebežne aktualizovaný ako a databázy OLTP. Skôr sa pravidelne aktualizuje s dať pochádzajúce z interných a externých zdrojov. The dátový sklad je špeciálne navrhnutý na vyhľadávanie, nie na aktualizáciu integrity a výkonu operácie.
Myšlienka uloženia i dať nie je nový, bol to jeden z účelov riadenia dať od šesťdesiatych rokov (Martin, 1982).
I dátový sklad ponúkajú infraštruktúru dať pre systémy na podporu riadenia. Systémy na podporu riadenia zahŕňajú systémy na podporu rozhodovania (DSS) a výkonné informačné systémy (EIS). DSS je počítačový informačný systém, ktorý je určený na zlepšenie ľudského rozhodovania. EIS je typicky doručovací systém dať čo umožňuje obchodným lídrom jednoduchý prístup k pohľadu dať.
Všeobecná architektúra a dátový sklad zdôrazňuje úlohu dátový sklad v podpore manažmentu. Okrem ponuky infraštruktúry dať pre EIS a DSS, spol dátový sklad dá sa k nemu dostať priamo cez dopyty. THE dať zahrnuté v a dátový sklad sú založené na analýze požiadaviek na manažérske informácie a získavajú sa z troch zdrojov: interné staršie systémy, špeciálne systémy zberu údajov a externé zdroje údajov. THE dať v interných starších systémoch sú často nadbytočné, nekonzistentné, majú nízku kvalitu a sú uložené v rôznych formátoch, takže ich treba pred vložením do

dátový sklad (Inmon, 1992; McFadden, 1996). THE dať pochádzajúce z úložných systémov dať ad hoc a zo zdrojov dať externé sa často používajú na rozšírenie (aktualizáciu, nahradenie) i dať zo starších systémov.

Existuje mnoho presvedčivých dôvodov na rozvoj a dátový sklad, ktoré zahŕňajú lepšie rozhodovanie prostredníctvom efektívneho využívania väčšieho množstva informácií (Ives 1995), podporu zamerania sa na celé obchody (Graham 1996) a zníženie dať pre EIS a DSS (Graham 1996, McFadden 1996).

Nedávna empirická štúdia zistila v priemere návratnosť investície dátový sklad o 401 % po troch rokoch (Graham, 1996). Avšak ostatné empirické štúdie o dátový sklad zistili závažné problémy vrátane ťažkostí pri meraní a priraďovaní výhod, chýbajúceho jasného účelu, podceňovania účelu a zložitosti procesu ukladania výhod dať, najmä pokiaľ ide o zdroje a čistotu dať. Ukladanie i dať možno považovať za riešenie problému riadenia dať medzi organizáciami. Manipulácia s dať ako sociálny zdroj zostáva jedným z kľúčových problémov pri riadení informačných systémov na celom svete už mnoho rokov (Brancheau a kol. 1996, Galliers a kol. 1994, Niederman a kol. 1990, Pervan 1993).

Populárny prístup k riadeniu dať v osemdesiatych rokoch to bol vývoj modelu dať sociálna. Model dať social bol navrhnutý tak, aby ponúkal stabilný základ pre vývoj nových aplikačných systémov a databázy a rekonštrukcia a integrácia starších systémov (Brancheau a kol.

1989, Goodhue a kol. 1988:1992, Kim a Everest 1994). S týmto prístupom je však veľa problémov, najmä zložitosť a cena každej úlohy a dlhý čas potrebný na dosiahnutie hmatateľných výsledkov (Beynon-Davies 1994, Earl 1993, Goodhue a kol. 1992, Periasamy 1994, Shanks 1997 ).

Il dátový sklad ide o samostatnú databázu, ktorá existuje skôr so staršími databázami, než aby ich nahrádzala. Umožňuje vám teda riadiť správu dať a vyhnúť sa nákladnej rekonštrukcii starých systémov.

EXISTUJÚCE PRÍSTUPY K NÁVRHU ÚDAJOV

WAREHOUSE

Proces budovania a zdokonaľovania a dátový sklad treba ho chápať skôr ako evolučný proces než ako životný cyklus vývoja tradičných systémov (Desio, 1995, Shanks, O'Donnell a Arnott 1997a). V projekte je zahrnutých veľa procesov dátový sklad ako je inicializácia, plánovanie; informácie získané z požiadaviek od manažérov spoločností; zdroje, premeny, čistenie o dať a synchronizácia zo starších systémov a iných zdrojov dať; doručovacie systémy vo vývoji; monitorovanie dátový sklad; a nezmyselnosť evolučného procesu a konštrukcie a dátový sklad (Stinchi, O'Donnell a Arnott 1997b). V tomto časopise sa zameriame na to, ako nakresliť dať uložené v kontexte týchto iných procesov. Existuje množstvo navrhovaných prístupov k architektúre dátový sklad v literatúre (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Každá z týchto metodík má stručný prehľad s analýzou ich silných a slabých stránok.

Inmon's (1994) Approach for Dátový sklad dizajn

Inmon (1994) navrhol štyri iteratívne kroky na návrh a dátový sklad (pozri obrázok 2). Prvým krokom je navrhnúť šablónu dať sociálne pochopiť, ako i dať môžu byť integrované naprieč funkčnými oblasťami v rámci organizácie rozdelením dať skladovať v priestoroch. Model dať je vyrobený na uskladnenie dať týkajúce sa rozhodovania, vrátane dať historikov a vrátane dať odvodené a agregované. Druhým krokom je identifikácia tematických oblastí na implementáciu. Tie sú založené na prioritách určených konkrétnou organizáciou. Tretí krok zahŕňa kreslenie a databázy pre predmetnú oblasť venujte osobitnú pozornosť zahrnutiu vhodných úrovní podrobnosti. Inmon odporúča používať model entít a vzťahov. Štvrtým krokom je identifikácia zdrojových systémov dať vyžadujú a rozvíjajú transformačné procesy na zachytávanie, čistenie a formátovanie i dať.

Silnou stránkou Inmonovho prístupu je model dať sociálne ponúka základ pre integráciu dať v rámci organizácie a plánovania podpôr pre iteračný rozvoj dátový sklad. Jeho nedostatky sú obtiažnosť a cena pri navrhovaní modelu dať sociálne, ťažkosti s pochopením modelov entít a vzťahov používaných v oboch modeloch, že dať sociálne a to dať uložené podľa predmetnej oblasti a vhodnosti dať z výkresu dátový sklad na realizáciu databázy vzťahové, ale nie pre databázy viacrozmerný.

Ivesov (1995) Prístup k Dátový sklad dizajn

Ives (1995) navrhuje štvorstupňový prístup k návrhu informačného systému, ktorý je podľa neho použiteľný pri návrhu dátový sklad (pozri obrázok 3). Tento prístup je vo veľkej miere založený na informačnom inžinierstve pre vývoj informačných systémov (Martin 1990). Prvým krokom je určenie cieľov, kritických faktorov a faktorov úspechu a kľúčových ukazovateľov výkonnosti. Kľúčové obchodné procesy a potrebné informácie sú modelované tak, aby nás priviedli k modelu dať sociálna. Druhý krok zahŕňa vytvorenie definujúcej architektúry dať uložené podľa oblastí, databázy di dátový sklad, technologické komponenty, ktoré sa vyžadujú, súbor organizačnej podpory potrebnej na implementáciu a prevádzku dátový sklad. Tretí krok zahŕňa výber požadovaných softvérových balíkov a nástrojov. Štvrtým krokom je detailný návrh a konštrukcia dátový sklad. Ives poznamenáva, že ukladanie dať je to obmedzený iteračný proces.

Silnou stránkou prístupu Ives je použitie špecifických techník na určenie požiadaviek na informácie, použitie štruktúrovaného procesu na podporu integrácie dátový sklad, výber vhodného hardvéru a softvéru a použitie viacerých techník reprezentácie dátový sklad. Jeho nedostatky sú spojené so zložitosťou. Iné zahŕňajú ťažkosti s rozvojom mnohých úrovní databázy all'interno del dátový sklad v primeraných časoch a nákladoch.

Kimballov (1994) Approach to Dátový sklad dizajn

Kimball (1994) navrhol päť iteračných krokov na návrh a dátový sklad (pozri obrázky 4). Jeho prístup sa venuje najmä dizajnu sóla dátový sklad a o využívaní rozmerových modelov pred modelmi entít a vzťahov. Kimball analyzuje tieto dimenzionálne modely, pretože pre obchodných lídrov je jednoduchšie porozumieť podnikaniu, je efektívnejší pri komplexných konzultáciách a návrhu databázy fyzická je efektívnejšia (Kimball 1994). Kimball uznáva, že vývoj a dátový sklad je iteratívny a to dátový sklad samostatné stoly je možné integrovať ich rozdelením na tabuľky bežných rozmerov.

Prvým krokom je identifikácia konkrétnej oblasti, ktorá sa má zdokonaliť. Druhý a tretí krok sa týkajú rozmerového modelovania. V druhom kroku merania identifikujú zaujímavé veci v danej oblasti a zoskupia ich do tabuľky faktov. Napríklad v oblasti predaja môžu miery záujmu zahŕňať množstvo predaných položiek a dolár ako menu predaja. Tretí krok zahŕňa identifikáciu dimenzií, čo sú spôsoby, akými možno zoskupovať fakty. V oblasti predmetu predaja môžu relevantné dimenzie zahŕňať položku, miesto a časové obdobie. Tabuľka faktov má viacdielny kľúč na prepojenie s každou z tabuliek dimenzií a zvyčajne obsahuje veľmi veľké množstvo faktov. Naproti tomu tabuľky dimenzií obsahujú popisné informácie o dimenziách a iných atribútoch, ktoré možno použiť na zoskupenie faktov. Súvisiaca navrhovaná tabuľka faktov a rozmerov tvorí to, čo sa kvôli svojmu tvaru nazýva hviezdicová schéma. Štvrtý krok zahŕňa vybudovanie a databázy multidimenzionálny pre dokonalý vzor hviezdy. Posledným krokom je identifikácia zdrojových systémov dať vyžadujú a rozvíjajú transformačné procesy na zachytávanie, čistenie a formátovanie i dať.

Medzi silné stránky Kimballovho prístupu patrí použitie rozmerových modelov na znázornenie dať uložené, čo uľahčuje pochopenie a vedie k efektívnemu fyzickému dizajnu. Rozmerový model, ktorý tiež ľahko využíva oba systémy databázy relačné možno zdokonaliť alebo systémy databázy viacrozmerný. Medzi jeho nedostatky patrí nedostatok niektorých techník na uľahčenie plánovania alebo integrácie mnohých hviezdnych vzorov v rámci a dátový sklad a ťažkosti pri navrhovaní z extrémnej denormalizovanej štruktúry do rozmerového modelu dať v starom systéme.

McFaddenov (1996) Approach to Data Dizajn skladu

McFadden (1996) navrhuje päťstupňový prístup k navrhovaniu a dátový sklad (pozri obrázok 5).
Jeho prístup je založený na syntéze myšlienok z literatúry a je zameraný na dizajn singla dátový sklad. Prvým krokom je analýza požiadaviek. Hoci technické špecifikácie nie sú predpísané, McFaddenove poznámky identifikujú entity dať špecifikácie a ich atribúty, a odkazuje na čitateľov Watsona a Frolicka (1993) pre zachytávanie požiadaviek.
V druhom kroku je navrhnutý model vzťahov entít dátový sklad a následne overené konateľmi spoločnosti. Tretí krok zahŕňa určenie mapovania zo starších systémov a externých zdrojov dátový sklad. Štvrtý krok zahŕňa procesy vo vývoji, nasadzovaní a synchronizácii dať v dátový sklad. V poslednom kroku je vyvinutá dodávka systému s osobitným dôrazom na používateľské rozhranie. McFadden poznamenáva, že proces kreslenia je vo všeobecnosti iteratívny.

Silné stránky McFaddenovho prístupu poukazujú na účasť obchodných lídrov pri určovaní požiadaviek a tiež na dôležitosť zdrojov. dať, ich čistenie a zber. Medzi jeho nedostatky patrí chýbajúci proces rozloženia veľkého projektu dátový sklad v mnohých integrovaných štádiách a

ťažkosti s pochopením modelov entity a vzťahov použitých pri návrhu dátový sklad.

Nevyberajú si nás iba tí, ktorí sú nám blízki.

0/5 (0 recenzií)

Zistite viac od online webovej agentúry

Prihláste sa na odber najnovších článkov e-mailom.

admin Generálny riaditeľ

👍Online webová agentúra | Odborník webovej agentúry v oblasti digitálneho marketingu a SEO. Web Agency Online je webová agentúra. Úspech Agenzia Web Online v digitálnej transformácii je založený na základoch Iron SEO verzie 3. Špecializácie: Systémová integrácia, integrácia podnikových aplikácií, architektúra orientovaná na služby, cloud computing, dátový sklad, business intelligence, veľké dáta, portály, intranety, webové aplikácie Návrh a správa relačných a viacrozmerných databáz Navrhovanie rozhraní pre digitálne médiá: použiteľnosť a grafika. Online Web Agency ponúka spoločnostiam nasledujúce služby: -SEO na Google, Amazon, Bing, Yandex; -Webová analýza: Google Analytics, Správca značiek Google, Yandex Metrica; -Konverzie používateľov: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM na Google, Bing, Amazon Ads; - Marketing na sociálnych sieťach (Facebook, Linkedin, Youtube, Instagram).

Pozrite si celý životopis

Zdieľať:

Páči sa mi:

Zistite viac od online webovej agentúry