fbpx

Datový sklad a plánování podnikových zdrojů | DWH a ERP

ARCHIV DATA CENTRÁLNÍ: HISTORIE ED EVOLUCE

Dvěma dominantními tématy podnikové technologie v 90. letech byly např datový sklad a ERP. Po dlouhou dobu byly tyto dva silné proudy součástí podnikového IT, aniž by se kdy protínaly. Bylo to skoro, jako by to byla hmota a antihmota. Růst obou jevů však nevyhnutelně vedl k jejich průniku. Firmy dnes stojí před problémem, co s ERP a datový sklad. Tento článek nastíní, o jaké problémy jde a jak je společnosti řeší.

NA ZAČÁTKU…

Na začátku byla datový sklad. Datový sklad byl vytvořen, aby působil proti aplikačnímu systému zpracování transakcí. V prvních dnech memorování dát měl to být jen protipól k aplikacím pro zpracování transakcí. Ale v dnešní době existují mnohem sofistikovanější názory na to, co a datový sklad. V dnešním světě datový sklad je vložen do struktury, kterou lze nazvat Corporate Information Factory.

FIREMNÍ INFORMAČNÍ TOVÁRNA (CIF)

Corporate Information Factory má standardní architektonické komponenty: úroveň transformace a integrace kódu, která integruje dát zatímco já dát přecházejí z aplikačního prostředí do prostředí datový sklad společnosti; A datový sklad společnosti, kde i dát podrobné a integrované historie. The datový sklad společnosti slouží jako základ, na kterém lze stavět všechny ostatní části životního prostředí datový sklad; úložiště provozních dat (ODS). ODS je hybridní struktura, která obsahuje některé aspekty datový sklad a další aspekty prostředí OLTP; data marts, kde mohou mít různá oddělení svou vlastní verzi datový sklad; A datový sklad průzkumu, ve kterém mohou „filosofové“ společnosti zadávat své dotazy po dobu 72 hodin bez škodlivého vlivu na datový sklad; a téměř řádkovou paměť, ve které dát starý a dát hromadné detaily lze levně skladovat.

KDE ERP KOMBINUJE S FIRMA PRO FIREMNÍ INFORMACE

ERP se na dvou místech spojuje s Corporate Information Factory. Nejprve jako základní aplikace (baseline), která poskytuje i dát aplikace do datový sklad. V tomto případě i dát, generované jako vedlejší produkt transakčního procesu, jsou integrovány a načteny do datový sklad společnosti. Druhý bod spojení mezi ERP a CIF a ODS. Ve skutečnosti se v mnoha prostředích ERP používá jako klasický ODS.

V případě, že je jako základní aplikace použit ERP, lze stejný ERP použít i v CIF jako ODS. V každém případě, pokud má být ERP využíván v obou rolích, musí být mezi těmito dvěma subjekty jasné rozlišení. Jinými slovy, když ERP hraje roli základní aplikace a ODS, musí být tyto dvě architektonické entity rozlišeny. Pokud se jediná implementace ERP pokouší vykonávat obě role současně, nevyhnutelně nastanou problémy při návrhu a implementaci této struktury.

ODDĚLENÉ ODS A ZÁKLADNÍ APLIKACE

Důvodů, které vedou k rozdělení architektonických prvků, je mnoho. Snad nejvýmluvnějším problémem pro oddělení různých komponent architektury je to, že každá komponenta architektury má svůj vlastní pohled. Základní aplikace slouží jinému účelu než ODS. Zkuste se překrývat

základní aplikační pohled na svět ODS nebo naopak není správný způsob práce.

V důsledku toho je prvním problémem ERP v CIF ověřit, zda existuje rozdíl mezi základními aplikacemi a ODS.

DATOVÉ MODELY VE FIRMĚ INFORMAČNÍ TOVÁRNA

K dosažení soudržnosti mezi různými složkami architektury CIF musí existovat model dát. Modely z dát slouží jako spojovací článek mezi různými součástmi architektury, jako jsou základní aplikace a ODS. Modely z dát stávají se „intelektuální cestovní mapou“, aby získali správný význam z různých architektonických složek CIF.

Ruku v ruce s touto myšlenkou je myšlenka, že by měl existovat jeden velký a jediný model dát. Samozřejmě musí existovat model dát pro každou z komponent a také musí existovat rozumná cesta spojující různé modely. Každá komponenta architektury – ODS, základní aplikace, datový sklad společnosti a tak dále.. – potřebuje svůj vlastní model dát. A tak musí existovat přesná definice toho, jak tyto modely dát vzájemně se propojují.

POHYB I DATA DATUM ERP SKLAD

Pokud je původ dát je základní aplikace a/nebo ODS, když ERP vloží dát v datový sklad, toto vložení musí proběhnout na nejnižší úrovni "zrnitosti". Jednoduše shrňte nebo agregujte i dát protože vycházejí ze základní aplikace ERP nebo ERP ODS není správná věc. THE dát podrobnosti jsou potřeba v datový sklad tvořit základ procesu DSS. Takový dát budou mnoha způsoby přetvářeny datovými tržišti a jejich průzkumy datový sklad.

Posunutí dát od základního aplikačního prostředí ERP až po datový sklad společnosti se provádí přiměřeně uvolněným způsobem. K tomuto přesunu dojde přibližně 24 hodin po aktualizaci nebo vytvoření v ERP. Skutečnost mít "líný" pohyb dát v datový sklad společnosti umožňuje dát pocházející z ERP do „zálohy“. Jednou jsem dát jsou uloženy v základní aplikaci, pak je můžete bezpečně přesunout dát ERP v podniku. Další cíl dosažitelný díky "línému" pohybu dát je to jasné vymezení mezi provozními procesy a DSS. S „rychlým“ pohybem dát dělicí čára mezi DSS a operačním zůstává nejasná.

Pohyb dát z ODS ERP do datový sklad společnosti se provádí pravidelně, obvykle týdně nebo měsíčně. V tomto případě pohyb dát vychází z potřeby „vyčistit“ staré dát historiků. ODS samozřejmě obsahuje i dát které jsou mnohem novější než dát historici našli v datový sklad.

Posunutí dát v datový sklad téměř nikdy se nedělá „velkoobchodně“ (velkoobchodně). Zkopírujte tabulku z prostředí ERP do datový sklad nedává to smysl. Mnohem realističtější přístup je přesunout vybrané jednotky dát. Pouze dát které se od poslední aktualizace změnily datový sklad oni jsou ti, kteří by měli být přesunuti do datový sklad. Jeden způsob, jak zjistit, které dát se od poslední aktualizace změnily, je podívat se na časová razítka dát nachází v prostředí ERP. Návrhář vybere všechny změny, ke kterým došlo od poslední aktualizace. Dalším přístupem je použití technik zachycení změn dát. Pomocí těchto technik jsou protokoly a žurnálové pásky analyzovány, aby bylo možné určit, které z nich dát musí být přesunuta z prostředí ERP do prostředí ERP datový sklad. Tyto techniky jsou nejlepší, protože protokoly a žurnálové pásky lze číst ze souborů ERP bez dalšího ovlivnění ostatních zdrojů ERP.

DALŠÍ KOMPLIKACE

Jedním z problémů ERP v CIF je to, co se stane s jinými zdroji aplikací nebo s nimi dát ODS, ke kterému musí přispět datový sklad ale nejsou součástí prostředí ERP. Vzhledem k uzavřené povaze ERP, zejména SAP, se snaží integrovat klíče z externích zdrojů dát s i dát které pocházejí z ERP při přesunu dát v datový sklad, je to velká výzva. A jaké jsou přesně pravděpodobnosti, že i dát aplikací nebo ODS mimo prostředí ERP budou integrovány do datový sklad? Šance jsou ve skutečnosti velmi vysoké.

NALÉZT DATA HISTORICKÉ INFORMACE Z ERP

Další problém s dát ERP vychází z potřeby mít dát historické v rámci datový sklad. Obvykle datový sklad potřeby dát historiků. A technologie ERP je obvykle neukládá dát historické, alespoň ne do té míry, kdy je to nutné datový sklad. Při velkém množství dát v prostředí ERP se začíná sčítat historie, je potřeba toto prostředí vyčistit. Předpokládejme například, že a datový sklad musí být nabito pěti lety dát historické, zatímco ERP z nich uchovává maximálně šest měsíců dát. Dokud je společnost spokojená se sběrem řady dát historiků, jak plyne čas, pak není problém používat ERP jako zdroj pro datový sklad. Ale když datový sklad musí se vrátit v čase a získat bohy dát historie, které nebyly dříve shromážděny a uloženy v ERP, pak se prostředí ERP stává neefektivním.

ERP A METADATA

Další úvaha o ERP a datový sklad je ta na metadatech existujících v prostředí ERP. Stejně jako metadata proudí z prostředí ERP do datový sklad, metadata musí být přesunuta stejným způsobem. Kromě toho musí být metadata převedena do formátu a struktury požadované infrastrukturou datový sklad. Mezi provozními metadaty a metadaty DSS je velký rozdíl. Provozní metadata jsou primárně pro vývojáře a

programátor. Metadata DSS jsou primárně pro koncového uživatele. Stávající metadata v aplikacích ERP nebo ODS je třeba převést a tento převod není vždy snadný a přímočarý.

ZDROJOVÁNÍ DAT ERP

Pokud je ERP používán jako poskytovatel dát pro datový sklad musí existovat pevné rozhraní, které pohybuje dát z prostředí ERP do prostředí datový sklad. Rozhraní musí:

  • ▪ být snadno použitelný
  • ▪ povolit přístup k dát ERP
  • ▪ chápat význam dát které se chystají přesunout do datový sklad
  • ▪ znát omezení ERP, která mohou nastat při přístupu k dát ERP:
  • ▪ referenční integrita
  • ▪ hierarchické vztahy
  • ▪ implicitní logické vztahy
  • ▪ aplikační konvence
  • ▪ všechny struktury dát podporováno ERP atd. ...
  • ▪ být efektivní v přístupu dát, poskytnutím:
  • ▪ přímý pohyb dát
  • ▪ akvizice změny dát
  • ▪ podporovat včasný přístup k dát
  • ▪ rozumět formátu dát, a tak dále… ROZHRANÍ SE SAPEM Rozhraní může být dvou typů, domácí nebo komerční. Některé z hlavních obchodních rozhraní zahrnují:
  • ▪ SAS
  • ▪ Řešení Prims
  • ▪ D2k a tak dále… VÍCE TECHNOLOGIÍ ERP Zacházet s prostředím ERP jako s jedinou technologií je velká chyba. Existuje mnoho technologií ERP, z nichž každá má své vlastní silné stránky. Nejznámější prodejci na trhu jsou:
  • ▪ SAP
  • ▪ Oracle Financials
  • ▪ PeopleSoft
  • ▪ JD Edwards
  • ▪ Baan SAP SAP je největší a nejúplnější ERP software. Aplikace SAP zahrnují mnoho typů aplikací v mnoha oblastech. SAP má pověst:
  • ▪ velmi velké
  • ▪ implementace je velmi obtížná a nákladná
  • ▪ potřebuje k implementaci mnoho lidí a konzultantů
  • ▪ vyžaduje specializované lidi pro implementaci
  • ▪ trvá dlouho, než se implementuje Kromě toho má SAP pověst toho, že si je zapamatuje dát velmi opatrně, což znesnadňuje přístup k nim pro někoho mimo oblast SAP. Síla SAP spočívá v tom, že je schopen zachytit a uložit velké množství dát. Nedávno SAP oznámil svůj záměr rozšířit své aplikace na datový sklad. Používání SAP jako dodavatele má mnoho pro a proti datový sklad. Výhodou je, že SAP je již nainstalován a většina konzultantů již SAP zná.
    Nevýhody mít SAP jako dodavatele datový sklad existuje mnoho: SAP nemá ve světě žádné zkušenosti datový sklad Pokud je SAP dodavatelem datový sklad, je nutné „vyndat“ i dát od společnosti SAP al datový sklad. Dato Vzhledem k historii uzavřeného systému SAP je nepravděpodobné, že bude snadné do něj dostat i ze SAP (???). Existuje mnoho starších prostředí, která pohání SAP, jako jsou IMS, VSAM, ADABAS, ORACLE, DB2 a tak dále. SAP trvá na přístupu „nevynalezeno zde“. SAP nechce spolupracovat s jinými dodavateli za účelem použití nebo vytvoření datový sklad. SAP trvá na tom, že si veškerý svůj software vygeneruje sám.

Přestože je SAP velká a výkonná společnost, která se snaží přepsat technologii ELT, OLAP, správu systému a dokonce i základní kód dbms je to prostě šílené. Namísto kooperativního přístupu s dodavateli datový sklad Společnost SAP dlouhodobě sleduje přístup „oni vědí nejlépe“. Tento postoj brzdí úspěch, který by SAP mohl v této oblasti dosáhnout datový sklad.
Odmítnutí společnosti SAP umožnit externím prodejcům rychlý a bezproblémový přístup dát. Samotná podstata použití a datový sklad je snadný přístup k dát. Celá historie SAP je založena na ztížení přístupu dát.
Nedostatek zkušeností SAP při řešení velkých objemů dát; v oblasti datový sklad existují objemy dát nikdy neviděl SAP a spravovat tato velká množství dát musíte mít vhodnou technologii. SAP si zjevně není vědom této technologické bariéry, která existuje, aby mohla vstoupit na pole datový sklad.
Firemní kultura společnosti SAP: Společnost SAP se rozhodla získat dát ze systému. Ale k tomu je potřeba mít jinou mentalitu. Tradičně softwarové společnosti, které byly dobré v získávání dat do prostředí, nebyly dobré v získávání dat jiným směrem. Pokud se SAPu podaří tento typ přechodu provést, bude první společností, které se to podaří.

Je zkrátka otázkou, zda by si společnost měla vybrat SAP jako svého dodavatele datový sklad. Na jedné straně jsou velmi vážná rizika a na straně druhé velmi málo odměn. Je tu ale ještě jeden důvod, který odrazuje od výběru SAP jako dodavatele datový sklad. Protože každá firma by to měla mít stejně datový sklad ze všech ostatních společností? The datový sklad je srdcem konkurenční výhody. Kdyby každá společnost přijala totéž datový sklad bylo by obtížné, i když ne nemožné, dosáhnout konkurenční výhody. Zdá se, že SAP si myslí, že a datový sklad lze na něj pohlížet jako na soubor cookie, což je další známkou jejich mentality aplikací „získat data“.

Žádný jiný dodavatel ERP není tak dominantní jako SAP. Nepochybně se najdou společnosti, které půjdou cestou SAP za svou datový sklad ale asi tyhle datový sklad SAP bude velký, drahý a jeho vytvoření bude časově náročné.

Tato prostředí zahrnují takové činnosti, jako je zpracování bankovních pokladen, procesy rezervace leteckých společností, procesy pojistných událostí a tak dále. Čím výkonnější byl transakční systém, tím zjevnější byla potřeba oddělení provozního procesu od DSS (Decision Support System). S HR a personálními systémy se však nikdy nepotýkáte s velkými objemy transakcí. A samozřejmě, když je osoba přijata nebo opouští společnost, je to záznam transakce. Ale ve srovnání s jinými systémy, HR a personální systémy prostě nemají mnoho transakcí. V HR a personálních systémech tedy není zcela zřejmé, že je potřeba DataWarehouse. V mnoha ohledech tyto systémy představují sloučení systémů DSS.

Existuje však další faktor, který je třeba vzít v úvahu, pokud se zabýváte datovými sklady a PeopleSoft. V mnoha prostředích, tj dát lidské a personální zdroje jsou ve srovnání s primární činností společnosti až na druhém místě. Většina společností se zabývá výrobou, prodejem, poskytováním služeb a tak dále. Lidské zdroje a personální systémy jsou obvykle sekundární (nebo podporují) hlavní předmět podnikání společnosti. Proto je to nejednoznačné a nepohodlné datový sklad samostatné pro lidské zdroje a personální podporu.

PeopleSoft je v tomto ohledu velmi odlišný od SAP. U SAP je povinné, aby existovala datový sklad. U PeopleSoft to není tak jednoznačné. Datový sklad je u PeopleSoft volitelný.

Nejlepší věc, kterou lze říci pro dát PeopleSoft je to datový sklad lze použít k archivaci i dát týkající se starých lidských a osobních zdrojů. Druhý důvod, proč by společnost chtěla používat a datový sklad a

škodou prostředí PeopleSoft je umožnit přístup a volný přístup k analytickým nástrojům, k dát od PeopleSoft. Kromě těchto důvodů však mohou nastat případy, kdy je lepší datový sklad nemít dát PeopleSoft.

celkem

Existuje mnoho nápadů ohledně výstavby a datový sklad v rámci softwaru ERP.
Některé z nich jsou:

  • ▪ Má smysl mít a datový sklad to je jako něco jiného v oboru?
  • ▪ Jak flexibilní je ERP datový sklad software?
  • ▪ ERP datový sklad software zvládne svazek dát který se nachází v „datový sklad aréna"?
  • ▪ Jaké je zaznamenávání trasování, které dodavatel ERP provádí tváří v tvář snadnému a levnému, z hlediska času, dát? (Jaké jsou záznamy prodejců ERP o poskytování levných, včasných a snadno dostupných dat?)
  • ▪ Jak dodavatel ERP rozumí architektuře DSS a podnikové informační továrně?
  • ▪ Prodejci ERP rozumí tomu, jak toho dosáhnout dát v rámci životního prostředí, ale také pochopit, jak je exportovat?
  • ▪ Jak otevřený je dodavatel ERP nástrojům pro datové sklady?
    Všechny tyto úvahy je třeba vzít v úvahu při rozhodování, kam umístit datový sklad který bude hostit i dát ERP a další dát. Obecně platí, že pokud neexistuje pádný důvod k opakování, doporučuje se stavět datový sklad mimo prostředí dodavatele ERP. KAPITOLA 1 Přehled klíčových bodů organizace BI:
    Informační úložiště fungují obráceně k architektuře business intelligence (BI):
    Firemní kultura a IT mohou omezit úspěch při budování BI organizací.

Technologie již nejsou limitujícím faktorem pro BI organizace. Otázkou pro architekty a projektanty není, zda technologie existuje, ale zda dokážou dostupné technologie efektivně implementovat.

Pro mnoho společností a datový sklad je to o něco víc než pasivní vklad, který distribuuje dát uživatelům, kteří to potřebují. THE dát jsou extrahovány ze zdrojových systémů a jsou obsazeny do cílových struktur datový sklad. Já dát dají se s trochou štěstí také vyčistit. Společnost však nepřidává ani nevybírá žádnou další hodnotu dát během tohoto procesu.

V podstatě pasivní Dw v nejlepším případě poskytuje pouze i dát čisté a funkční pro uživatelská sdružení. Vytváření informací a analytické porozumění je zcela na uživatelích. Posuďte, zda DW (Datový sklad) je úspěch subjektivní. Posuzujeme-li úspěch podle schopnosti efektivně shromažďovat, integrovat a čistit dát firemní na předvídatelném základě, pak ano, DW je úspěch. Na druhou stranu, pokud se podíváme na shromažďování, konsolidaci a využívání informací organizací jako celkem, pak je DW selháním. DW poskytuje malou nebo žádnou informační hodnotu. V důsledku toho jsou uživatelé nuceni vystačit si a vytvářejí tak informační sila. Tato kapitola představuje komplexní pohled na shrnutí architektury BI (Business Intelligence) společnosti. Začneme popisem BI a poté přejdeme k diskusím o návrhu a vývoji informací, na rozdíl od pouhého poskytování informací. dát uživatelům. Diskuse se pak zaměří na výpočet hodnoty vašeho BI úsilí. Na závěr definujeme, jak IBM řeší požadavky vaší organizace na architekturu BI.

Popis architektury organizace BI

Výkonné transačně orientované informační systémy jsou nyní samozřejmostí v každém velkém podniku a účinně vyrovnávají podmínky pro společnosti po celém světě.

Zůstat konkurenceschopný však nyní vyžaduje analyticky orientované systémy, které mohou převratně změnit schopnost společnosti znovu objevit a používat informace, které již mají. Tyto analytické systémy vycházejí z pochopení bohatství dát dostupný. BI může zlepšit výkon v celém podniku. Společnosti mohou zlepšit vztahy mezi zákazníky a dodavateli, zlepšit ziskovost produktů a služeb, vytvářet nové a lepší nabídky, kontrolovat rizika a kromě mnoha dalších zisků dramaticky snížit náklady. S BI vaše společnost konečně začíná používat informace o zákaznících jako konkurenční aktivum díky aplikacím, které mají tržní cíle.

Mít ty správné obchodní nástroje znamená mít definitivní odpovědi na klíčové otázky, jako jsou:

  • ▪ Který z našich zákazníci nutí nás vydělávat více, nebo nás nutí přijít o peníze?
  • ▪ Kde žijí naši nejlepší zákazníci ve vztahu k negozio/ sklad, který často navštěvují?
  • ▪ Které naše produkty a služby lze nejefektivněji prodat a komu?
  • ▪ Které produkty lze nejefektivněji prodat a komu?
  • ▪ Která prodejní kampaň je nejúspěšnější a proč?
  • ▪ Které prodejní kanály jsou pro které produkty nejúčinnější?
  • ▪ Jak můžeme zlepšit vztahy s našimi nejlepšími lidmi zákazníci? Většina společností má dát hrubé způsoby, jak odpovědět na tyto otázky.
    Operační systémy generují velké množství produktů, zákazníků a dát trhu z prodejních míst, rezervací, zákaznických služeb a systémů technické podpory. Úkolem je získat a využít tyto informace. Mnoho společností profituje pouze z jejich malých zlomků dát pro strategické analýzy.
    I dát zbývající, často spojené s i dát odvozené z externích zdrojů, jako jsou vládní zprávy a další zakoupené informace, je zlatým dolem, který čeká na prozkoumání a dát jen je třeba je upřesnit v rámci informačního kontextu vaší organizace.

Tyto znalosti lze uplatnit několika způsoby, od návrhu celkové firemní strategie až po osobní komunikaci s dodavateli, přes call centra, fakturaci, Internet a další body. Dnešní obchodní prostředí diktuje, že DW a související BI řešení se vyvíjejí nad rámec tradičních obchodních struktur. dát který i dát normalizované na atomové úrovni a „hvězdné/krychlové farmy“.

K udržení konkurenceschopnosti je zapotřebí spojení tradičních a pokročilých technologií ve snaze podpořit rozsáhlé analytické prostředí.
Závěrem lze říci, že obecné prostředí musí zlepšit znalosti společnosti jako celku a zajistit, aby opatření přijatá na základě provedených analýz byla užitečná, aby z ní měli prospěch všichni.

Řekněme například, že hodnotíte své zákazníci do vysoce nebo nízkorizikových kategorií.
Pokud jsou tyto informace generovány extraktorem modelů nebo jinými prostředky, musí být vloženy do DW a zpřístupněny komukoli prostřednictvím jakéhokoli přístupového nástroje, jako jsou statické sestavy, tabulky, tabulky nebo online analytické zpracování (OLAP). .

V současné době však mnoho z tohoto typu informací zůstává v silech dát jednotlivců nebo oddělení generujících analýzu. Organizace jako celek má malou nebo žádnou viditelnost pro pochopení. Pouze smícháním tohoto typu informačního obsahu do vašeho podnikového DW můžete odstranit informační sila a pozvednout své DW prostředí.
Existují dvě hlavní překážky rozvoje BI organizace.
Za prvé, máme problém samotné organizace a její disciplíny.
I když nemůžeme pomoci se změnami organizačních zásad, můžeme pomoci porozumět komponentám BI organizace, její architektuře a tomu, jak technologie IBM usnadňuje její vývoj.
Druhou překážkou, kterou je třeba překonat, je nedostatek integrované technologie a znalost metody, která řeší celý prostor BI, nikoli jen malou komponentu.

IBM se vyrovnává se změnami v integrační technologii. Je vaší odpovědností poskytnout promyšlený design. Tato architektura musí být vyvinuta s technologií zvolenou pro neomezenou integraci, nebo alespoň s technologií, která dodržuje otevřené standardy. Kromě toho musí vedení vaší společnosti zajistit, aby podnik BI probíhal podle plánu a nedovolil rozvoj informačních sil, které vyplývají ze samoúčelných agend nebo cílů.
To neznamená, že prostředí BI není citlivé na reakce na různé potřeby a požadavky různých uživatelů; místo toho to znamená, že implementace těchto individuálních potřeb a požadavků se provádí ve prospěch celé organizace BI.
Popis architektury organizace BI lze nalézt na obrázku 9 na straně 1.1. Architektura demonstruje bohatou kombinaci technologií a technik.
Z tradičního pohledu zahrnuje architektura následující skladové komponenty

Atomová vrstva.

To je základ, srdce celého DW a tedy i strategického reportingu.
I dát zde uložené si udrží historickou integritu, zprávy o dát a zahrnují odvozené metriky, stejně jako čištění, integraci a ukládání pomocí extrakce modelu.
Veškeré jejich následné použití dát a související informace jsou odvozeny z této struktury. To je vynikající zdroj pro těžbu dát a pro sestavy se strukturovanými dotazy SQL

Provozní vklad ve výši dát nebo nahlásit základnu dát(Úložiště provozních dat (ODS) nebo hlášení databáze.)

Toto je struktura dát speciálně navržený pro technický reporting.

I dát uložené a hlášené nad těmito strukturami se mohou nakonec rozšířit do skladu přes shromažďovací oblast, kde by mohly být použity pro strategickou signalizaci.

Pracovní plocha.

První zastávka pro většinu dát určená pro skladové prostředí je organizační zóna.
Tady dát jsou integrovány, vyčištěny a transformovány do dát zisky, které zaplní skladovou strukturu

Datum trhů.

Tato část architektury představuje strukturu dát používá se speciálně pro OLAP. Přítomnost datamartů, pokud i dát jsou uloženy v překrývajících se hvězdných schématech dát multidimenzionální v relačním prostředí nebo v souborech dát Důvěrné informace používané konkrétní technologií OLAP, jako je server DB2 OLAP Server, nejsou relevantní.

Jediným omezením je, že architektura usnadňuje použití dát vícerozměrný.
Architektura také zahrnuje kritické Bi technologie a techniky, které vynikají jako:

Prostorová analýza

Prostor je pro analytika neočekávanou informací a je rozhodující pro úplné vyřešení. Prostor může představovat informace o lidech, kteří žijí na určitém místě, a také informace o tom, kde je toto místo fyzicky ve vztahu ke zbytku světa.

Chcete-li provést tuto analýzu, musíte začít spojením svých informací se souřadnicemi zeměpisné šířky a délky. Toto se nazývá „geokódování“ a musí být součástí procesu extrahování, transformace a načtení (ETL) na atomové úrovni vašeho skladu.

Dolování dat.

Těžba dát umožňuje našim společnostem růst počtu zákazníci, předpovídat trendy prodeje a umožnit řízení vztahů s zákazníci (CRM), mimo jiné iniciativy BI.

Těžba dát musí být proto integrován do struktur dát společnosti Dwhouse a podporované skladovými procesy, aby bylo zajištěno jak efektivní, tak efektivní využití příslušných technologií a technik.

Jak je uvedeno v architektuře BI, atomová úroveň Dwhouse, stejně jako datamarts, je vynikajícím zdrojem dát pro extrakci. Stejná zařízení musí být také příjemci výsledků extrakce, aby byla zajištěna dostupnost pro nejširší publikum.

Agenti.

Existují různí „agenti“, kteří prozkoumají klienta pro každý bod, jako jsou operační systémy společnosti a samotné dw. Těmito agenty mohou být pokročilé neuronové sítě vycvičené k tomu, aby se dozvěděli o trendech v každém bodě, jako je budoucí poptávka po produktech založená na podpoře prodeje, motory založené na pravidlech, které reagují na dat soubor okolností, nebo dokonce jednoduché agenty, kteří hlásí výjimky „top manažerům“. Tyto procesy obecně probíhají v reálném čase, a proto musí být úzce spojeny s jejich pohybem dát. Všechny tyto struktury dát, technologie a techniky zaručují, že nebudete trávit noc generováním organizace vašeho BI.

Tato aktivita bude vyvíjena v postupných krocích pro malé body.
Každý krok je nezávislým projektovým úsilím a ve vaší iniciativě DW nebo BI je označován jako iterace. Iterace mohou zahrnovat implementaci nových technologií, počínaje novými technikami, přidáním nových struktur dát , načítání i dát další nebo s rozšířením analýzy vašeho prostředí. Tento odstavec je podrobněji rozebrán v kapitole 3.

Kromě tradičních struktur DW a nástrojů BI existují další funkce vaší organizace BI, pro které musíte navrhnout, jako například:

Dotyková místa zákazníka (Dotyk zákazníka body).

Stejně jako u každé moderní organizace existuje řada kontaktních bodů pro zákazníky, které naznačují, jak mít pro vás pozitivní zkušenost zákazníci. Existují tradiční kanály, jako jsou maloobchodníci, operátoři ústředny, direct mail, multimediální a tištěná reklama, stejně jako aktuálnější kanály, jako je e-mail a web, dát produkty s určitým styčným bodem musí být získávány, přepravovány, čištěny, zpracovávány a poté umístěny v zařízeních dát BI.

Základy dát provozní a uživatelská sdružení (provozní

databáze a uživatelské komunity).
Na konci kontaktních míst zákazníci najdete základy dát aplikace společnosti a uživatelských komunit. THE dát existující jsou dát tradiční, které musí být smířeny a sloučeny s dát které plynou z kontaktních míst k uspokojení potřebných informací.

Analytici. (Analytici)

Primárním příjemcem BI prostředí je analytik. Je to on, kdo těží ze současné těžby dát funkční, integrovaný s různými zdroji dát , rozšířené o funkce, jako je geografická analýza (geokódování) a prezentované v technologiích BI, které umožňují extrakci, OLAP, pokročilé hlášení SQL a geografickou analýzu. Primárním analytickým rozhraním pro prostředí sestav je portál BI.

Analytik však není jediný, kdo těží z architektury BI.
Vedoucí pracovníci, velká sdružení uživatelů a dokonce i partneři, dodavatelé a i zákazníci měli by najít výhody v podnikové BI.

Zpětná smyčka.

Architektura BI je prostředí pro výuku. Charakteristickým principem vývoje je umožnit trvalé struktury dát aktualizovat podle použité technologie BI a akcí provedených uživatelem. Příkladem je bodování zákazníků.

Pokud obchodní oddělení modeluje skóre zákazníků pro použití nové služby, pak by obchodní oddělení nemělo být jedinou skupinou, která má ze služby prospěch.

Namísto toho by se extrakce modelu měla provádět jako přirozená součást toku dat v rámci podniku a skóre zákazníků by se mělo stát integrovanou součástí kontextu informací o skladu, viditelným všem uživatelům. Bi-bI-centric IBM Suite včetně DB2 UDB, DB2 OLAP Server obsahuje většinu hlavních technologických komponent definovaných na obrázku 1.1.

Používáme architekturu, jak je vidět na tomto obrázku z knihy, abychom získali určitou úroveň kontinuity a ukázali, jak každý produkt IBM zapadá do celkového schématu BI.

Poskytování informačního obsahu (Poskytování Informační obsah)

Návrh, vývoj a implementace vašeho BI prostředí je náročný úkol. Návrh musí zahrnovat současné i budoucí obchodní požadavky. Architektonický výkres musí být úplný, aby zahrnoval všechny závěry zjištěné během fáze návrhu. Realizace musí zůstat oddána jedinému účelu: vývoji architektury BI, jak je formálně prezentována v návrhu a zakotvena v obchodních požadavcích.

Je obzvláště obtížné tvrdit, že disciplína zajistí relativní úspěch.
To je jednoduché, protože prostředí BI nevyvíjíte najednou, ale děláte to po malých krocích v průběhu času.

Identifikace komponent BI vaší architektury je však důležitá ze dvou důvodů: Budete provázet všechna následná rozhodnutí o technické architektuře.
Budete schopni vědomě naplánovat konkrétní použití technologie, i když se vám možná nebude opakovat potřeba technologie po dobu několika měsíců.

Dostatečné porozumění vašim obchodním požadavkům ovlivní typ produktů, které si pro svou architekturu pořídíte.
Návrh a vývoj vaší architektury zajistí, že váš sklad bude

ne náhodná událost, ale spíše pečlivě zkonstruovaná „promyšlená“. opera umění jako mozaika smíšené technologie.

Navrhněte informační obsah

Veškerý počáteční návrh se musí zaměřit a identifikovat klíčové komponenty BI, které bude nyní i v budoucnu potřebovat celkové prostředí.
Znát obchodní požadavky je důležité.

Dokonce ještě před zahájením formálního návrhu může plánovač projektu často okamžitě identifikovat jednu nebo dvě součásti.
Rovnováhu komponent, které mohou být potřebné pro vaši architekturu, však nelze snadno najít. Během fáze návrhu hlavní část architektury spojuje relaci vývoje aplikací (JAD) s cílem identifikovat obchodní požadavky.

Někdy mohou být tyto požadavky svěřeny dotazovacím a reportovacím nástrojům.
Uživatelé například uvádějí, že pokud chtějí automatizovat aktuální sestavu, musí ji ručně vygenerovat integrací dvou aktuálních sestav a přidáním výpočtů odvozených z kombinace dát.
Ačkoli je tento požadavek jednoduchý, definuje určitou funkcionalitu funkce, kterou musíte zahrnout při nákupu nástrojů pro vytváření sestav pro vaši organizaci.

Návrhář musí také splnit další požadavky, aby získal úplný obrázek. Chtějí uživatelé tento přehled odebírat?
Generují se podmnožiny přehledů a zasílají se e-mailem různým uživatelům? Chtějí tuto zprávu vidět na firemním portálu? Všechny tyto požadavky jsou součástí jednoduché potřeby nahradit ruční sestavu podle požadavků uživatelů. Výhodou těchto typů požadavků je, že každý, uživatelé i návrháři, rozumí konceptu sestav.

Existují však další typy podniků, které musíme plánovat. Když jsou obchodní požadavky uvedeny ve formě strategických obchodních otázek, je pro experta návrháře snadné rozeznat požadavky na míru/skutečnost a rozměry.

Pokud uživatelé JAD nevědí, jak vyjádřit své požadavky ve formě obchodního problému, návrhář často poskytne příklady, aby nastartoval relaci shromažďování požadavků.
Odborný designér může pomoci uživatelům porozumět nejen strategickému obchodování, ale také tomu, jak jej vytvořit.
Přístup shromažďování požadavků je diskutován v kapitole 3; prozatím chceme poukázat na nutnost navrhovat pro všechny typy požadavků BI.

Strategický obchodní problém není jen obchodním požadavkem, ale také designovým vodítkem. Pokud musíte odpovědět na multidimenzionální otázku, musíte si zapamatovat, prezentovat i dát rozměry a pokud potřebujete uložit i dát multidimenzionální, musíte se rozhodnout, jaký typ technologie nebo techniky použijete.

Implementujete vyhrazené hvězdicové schéma krychle nebo obojí? Jak vidíte, i jednoduchý obchodní problém může výrazně ovlivnit design. Ale tyto typy obchodních požadavků jsou běžné a srozumitelné, alespoň návrháři a plánovači se zkušenostmi s projekty.

O technologiích a podpoře OLAP se dostatečně diskutovalo a je k dispozici široká škála řešení. Doposud jsme se zmínili o potřebě spojit jednoduchý reporting s požadavky na obchodní dimenzi a jak tyto požadavky ovlivňují technická architektonická rozhodnutí.

Jaké jsou však požadavky, kterým uživatelé nebo tým Dw nerozumí? Budete někdy potřebovat prostorovou analýzu?
Těžařské modely dát budou nezbytnou součástí vaší budoucnosti? Kdo ví?

Je důležité poznamenat, že tyto typy technologií nejsou dobře známy obecným uživatelským komunitám a členům Dw týmu, částečně to může být proto, že je obvykle ovládají někteří interní technici nebo techničtí odborníci třetích stran. Je to extrémní případ problémů, které tyto typy technologií generují. Pokud uživatelé nedokážou popsat obchodní požadavky nebo je zarámovat způsobem, který poskytuje návrhářům vodítko, mohou zůstat bez povšimnutí, nebo v horším případě jednoduše ignorováni.

Problematičtější se stává, když návrhář a vývojář nemohou rozpoznat aplikaci jedné z těchto pokročilých, ale kritických technologií.
Jak jsme často slyšeli designéry říkat: „No, proč to neodložíme, dokud nedostaneme tuto další věc? „Skutečně je zajímají priority, nebo se jednoduše vyhýbají požadavkům, kterým nerozumějí? S největší pravděpodobností je to poslední hypotéza. Řekněme, že váš prodejní tým sdělil obchodní požadavek, jak je uvedeno na obrázku 1.3, jak vidíte, požadavek je zarámován ve formě obchodního problému. Rozdíl mezi tímto problémem a typickým rozměrovým problémem je vzdálenost. V tomto případě chce prodejní tým měsíčně znát celkové tržby z produktů, skladů a zákazníci kteří bydlí do 5 mil od skladu, kde nakupují.

Je smutné, že designéři nebo architekti mohou jednoduše ignorovat prostorovou složku tím, že říkají: „Máme zákazníka, produkt a dát vkladu. Nechme si vzdálenost do další iterace.

"Špatná odpověď. Tento typ obchodních problémů je celý o BI. Představuje hlubší porozumění našemu podnikání a robustní analytický prostor pro naše analytiky. BI je nad rámec jednoduchého dotazování nebo standardního reportingu nebo dokonce OLAP. To neznamená, že tyto technologie nejsou důležité pro vaše BI, ale samy o sobě nepředstavují prostředí BI.

Design pro informační kontext (Navrhování informačního obsahu)

Nyní, když jsme identifikovali obchodní požadavky, které odlišují různé základní komponenty, musí být zahrnuty do celkového architektonického návrhu. Některé komponenty BI jsou součástí našeho počátečního úsilí, zatímco některé nebudou implementovány až za několik měsíců.

Všechny známé požadavky se však promítají do návrhu, takže když potřebujeme implementovat konkrétní technologii, jsme na to připraveni. Něco na projektu bude odrážet tradiční myšlení.

Tato sada dát se používá k podpoře pozdějšího použití dát dimenzionální řízená obchodními problémy, které jsme identifikovali. Jako další dokumenty jsou generovány, jako je vývoj designu dát, začneme formalizovat, jak i dát se šíří v prostředí. Zjistili jsme potřebu zastupovat i dát dimenzionálním způsobem jejich rozdělením (podle konkrétních specifických potřeb) do datových tržišť.

Další otázka, na kterou je třeba odpovědět, zní: jak budou tyto datové tržiště vybudovány?
Stavíte hvězdy na podporu kostek, nebo jen kostky, nebo jen hvězdy? (nebo pravé kostky, nebo pravé hvězdy). Generujte architekturu pro závislé datové tržiště, které vyžadují atomovou vrstvu pro všechny dát získané? Umožněte nezávislým datovým trhům získávat dát přímo z operačních systémů?

Jakou technologii krychle se pokusíte standardizovat?

Máte obrovské množství bohů dát potřebné pro rozměrovou analýzu nebo potřebujete kostky od vašeho národního prodejního týmu na týdenní bázi nebo obojí? Stavíte něco tak výkonného, ​​jako je DB2 OLAP Server pro finance nebo kostky Cognos PowerPlay pro vaši prodejní organizaci, nebo obojí? Toto jsou velká architektonická rozhodnutí, která ovlivní vaše prostředí BI odsud. Ano, stanovili jste potřebu OLAP. Jak nyní provedete tento typ techniky a technologie?

Jak některé z nejpokročilejších technologií ovlivňují vaše návrhy? Předpokládejme, že jste identifikovali potřebu místa ve vaší organizaci. Nyní si musíte vyvolat edice architektonických výkresů, i když neplánujete vytvářet prostorové komponenty po dobu několika měsíců. Architekt dnes musí navrhovat na základě toho, co je potřeba. Předvídejte potřebu prostorové analýzy, která generuje, ukládá, provádí a poskytuje přístup dát prostorový. To by zase mělo sloužit jako omezení ohledně typu softwarové technologie a specifikací platformy, které můžete v současné době uvažovat. Například systém administrace databáze relační vrstva (RDBMS), kterou provádíte pro svou atomovou vrstvu, musí mít k dispozici robustní prostorový rozsah. To by zajistilo maximální výkon při používání geometrie a prostorových objektů ve vašich analytických aplikacích. Pokud váš RDBMS nezvládne dát (prostorově-centrický) interně, takže budete muset vytvořit a databáze (prostorově-centrické) vnější. To komplikuje správu problémů a ohrožuje váš celkový výkon, nemluvě o dalších problémech vytvořených pro vaše DBA, protože pravděpodobně mají minimální pochopení základů dát také prostorové. Na druhou stranu, pokud váš modul RDMBS zpracovává všechny prostorové komponenty a jeho optimalizátor si je vědom speciálních potřeb (například indexování) prostorových objektů, pak vaši správci databází mohou snadno zvládnout správu problémů a můžete maximalizovat výkon.

Navíc musíte upravit pracovní oblast a vrstvu atomického prostředí tak, aby zahrnovaly vyčištění adres (a

klíčový prvek prostorové analýzy), stejně jako následná úspora vesmírných objektů. Sled kresebných edic pokračuje nyní, když jsme zavedli pojem jasného směru. Jednak bude tato aplikace diktovat typ softwaru potřebného pro vaše ETL úsilí.

Potřebujete produkty, jako je Trillium, aby mu poskytly čistou adresu, nebo prodejce ETL dle vašeho výběru, který tuto funkcionalitu zajistí?
Pro tuto chvíli je důležité, abyste ocenili úroveň designu, který je třeba dokončit, než začnete s realizací svého skladu. Výše uvedené příklady by měly demonstrovat množství rozhodnutí o návrhu, která musí následovat po identifikaci jakéhokoli konkrétního obchodního požadavku. Pokud jsou tato rozhodnutí o návrhu provedena správně, podporují vzájemnou závislost mezi fyzickými strukturami vašeho prostředí, výběrem použité technologie a tokem šíření informačního obsahu. Bez této konvenční architektury BI bude vaše organizace vystavena chaotické směsi existujících technologií, v nejlepším případě volně sešitých, aby poskytovaly zjevnou stabilitu.

Udržujte informační obsah

Přinést hodnotu informací vaší organizaci je velmi obtížný úkol. Bez dostatečného porozumění a zkušeností nebo správného plánování a návrhu selžou i ty nejlepší týmy. Na druhou stranu, pokud máte skvělou intuici a podrobné plánování, ale žádnou disciplínu při provádění, jen jste plýtvali penězi a časem, protože vaše úsilí je odsouzeno k nezdaru. Zpráva by měla být jasná: Pokud vám chybí jedna nebo více z těchto dovedností, porozumění/zkušenosti nebo disciplína plánování/návrhu nebo implementace, ochromí to nebo zničí budování organizace BI.

Je váš tým dostatečně připraven? Je ve vašem týmu BI někdo, kdo rozumí rozsáhlému analytickému prostředí dostupnému v prostředí BI a technikám a technologiím potřebným k údržbě tohoto prostředí? Je ve vašem týmu někdo, kdo dokáže rozpoznat rozdíl mezi pokročilými aplikacemi

statické hlášení a OLAP, nebo rozdíly mezi ROLAP a OLAP? Uvědomuje si jeden z členů vašeho týmu jasně, jak extrahovat a jak to může ovlivnit sklad nebo jak může sklad podporovat výkon těžby? Člen týmu chápe hodnotu dát vesmírná nebo agentní technologie? Máte někoho, kdo oceňuje jedinečnou aplikaci nástrojů ETL oproti technologii zprostředkovatele zpráv? Pokud ho nemáte, pořiďte si ho. BI je mnohem větší než normalizovaná atomová vrstva, OLAP, hvězdná schémata a ODS.

Mít porozumění a zkušenosti s rozpoznáním požadavků BI a jejich řešení je zásadní pro vaši schopnost správně formalizovat potřeby uživatelů a navrhovat a implementovat jejich řešení. Pokud má vaše komunita uživatelů potíže s popisem požadavků, je úkolem skladového týmu poskytnout toto pochopení. Ale pokud skladový tým

nezná konkrétní aplikaci BI - například dolování dat - pak není nejlepší, že se prostředí BI často omezují na pasivní úložiště. Ignorování těchto technologií však nesnižuje jejich důležitost a vliv, který mají na vznik schopností vaší organizace business intelligence, stejně jako na informační prostředí, které plánujete podporovat.

Plánování musí zahrnovat pojem kreslení a obojí vyžaduje kompetentní osobu. Kromě toho návrh vyžaduje filozofii týmového skladu a dodržování standardů. Pokud například vaše společnost zavedla standardní platformu nebo identifikovala konkrétní RDBMS, kterou chcete standardizovat napříč platformou, je na každém v týmu, aby tyto standardy dodržoval. Obecně tým vystavuje potřebu standardizace (uživatelským komunitám), ale tým sám není ochoten dodržovat standardy zavedené i v jiných oblastech společnosti nebo snad dokonce v podobných společnostech. Nejen, že je to pokrytecké, ale zároveň to ukazuje, že společnost není schopna využívat stávající zdroje a investice. Neznamená to, že neexistují situace, které by zaručovaly nestandardizovanou platformu nebo technologii; však skladové úsilí

měli by žárlivě střežit podnikové standardy, dokud obchodní požadavky neurčují jinak.

Třetí klíčovou složkou potřebnou k vybudování BI organizace je disciplína.
Závisí to celkem, stejně na jednotlivcích a prostředí. Plánovači projektů, sponzoři, architekti a uživatelé musí ocenit disciplínu nezbytnou k vybudování informačního prostředí společnosti. Designéři musí své designérské úsilí nasměrovat tak, aby doplňovali ostatní nezbytné snahy ve společnosti.

Řekněme například, že vaše společnost vytvoří aplikaci ERP, která má komponentu skladu.
Proto je odpovědností návrhářů ERP spolupracovat s týmem skladového prostředí, aby si nekonkurovali nebo neduplikovali již započatou práci.

Disciplína je také téma, kterému se musí věnovat celá organizace a bývá ustaveno a svěřeno výkonné úrovni.
Jsou manažeři ochotni dodržovat navržený přístup? Přístup, který slibuje vytvoření informačního obsahu, který v konečném důsledku přinese hodnotu všem oblastem podniku, ale možná kompromituje jednotlivé agendy nebo agendy oddělení? Pamatujte na rčení: „Přemýšlet o všem je důležitější než myslet jen na jednu věc“. Toto rčení platí pro BI organizace.

Bohužel mnoho skladů zaměřuje své úsilí na to, aby se snažilo zacílit a přinést hodnotu konkrétnímu oddělení nebo konkrétním uživatelům, s malým ohledem na organizaci jako celek. Předpokládejme, že výkonný pracovník požádá o pomoc tým ubytovny. Tým reaguje 90denním úsilím, které zahrnuje nejen dodání notifikačních požadavků definovaných manažerem, ale také zajištění toho, aby všechny dát báze jsou smíchány na atomové úrovni před zavedením do navrhované technologie krychle.
Tento inženýrský doplněk zajišťuje, že z toho bude mít prospěch i mycí společnost dát nezbytné pro manažera.
Jednatel však hovořil s externími poradenskými firmami, které navrhly podobnou aplikaci s doručením za méně než 4 týdny.

Za předpokladu, že tým interního skladu je kompetentní, má jednatel na výběr. Kdo může podporovat další inženýrskou disciplínu potřebnou ke kultivaci podniku s informačními aktivy, nebo se může rozhodnout rychle vybudovat vlastní řešení. Zdá se, že poslední možnost je volena příliš často a slouží pouze k vytváření kontejnerů informací, které jsou přínosem pouze pro málo lidí nebo jednotlivce.

Krátkodobé a dlouhodobé cíle

Architekti a projektanti musí formalizovat dlouhodobou vizi celkové architektury a plány růstu v organizaci BI. Tato kombinace krátkodobého zisku a dlouhodobého plánování představuje dvě strany úsilí BI. Krátkodobý zisk je aspektem BI, který je spojen s iteracemi vašeho skladu.

Zde se plánovači, architekti a sponzoři zaměřují na splnění specifických komerčních požadavků. Na této úrovni se budují fyzické struktury, nakupuje se technologie a implementují se techniky. V žádném případě nejsou vytvořeny tak, aby odpovídaly konkrétním požadavkům definovaným konkrétními komunitami uživatelů. Vše se děje za účelem řešení konkrétních požadavků definovaných konkrétní komunitou.
Dlouhodobé plánování je však druhou stránkou BI. To je místo, kde plány a návrhy zajistily, že jakákoli fyzická struktura byla postavena, technologie byly vybrány a techniky implementovány s ohledem na podnik. Je to dlouhodobé plánování, které poskytuje soudržnost potřebnou k zajištění toho, že obchodní výhody plynou z jakýchkoli nalezených krátkodobých zisků.

Zdůvodněte své úsilí v oblasti BI

Un datový sklad sama o sobě nemá žádnou vlastní hodnotu. Jinými slovy, mezi skladovými technologiemi a implementačními technikami neexistuje žádná vlastní hodnota.

Hodnota jakéhokoli úsilí ve skladu se nachází v akcích prováděných v důsledku prostředí skladu a v průběhu času kultivovaného informačního obsahu. Toto je kritický bod, kterému je třeba porozumět dříve, než se vůbec pokusíte odhadnout hodnotu jakékoli iniciativy v místě bydliště.

Architekti a designéři se příliš často pokoušejí aplikovat hodnotu na fyzické a technické komponenty skladu, i když ve skutečnosti je hodnota založena na obchodních procesech, které jsou skladem pozitivně ovlivněny, a na dobře získaných informacích.

Zde spočívá výzva zakládání BI: Jak zdůvodníte investici? Pokud samotný sklad nemá žádnou vnitřní hodnotu, musí projektanti prozkoumat, definovat a formalizovat přínosy dosažené těmi jednotlivci, kteří budou sklad používat ke zlepšení konkrétních obchodních procesů nebo hodnoty chráněných informací nebo obojího.

Aby to bylo zkomplikováno, jakýkoli obchodní proces ovlivněný úsilím o skladování by mohl poskytnout „značné“ nebo „nepatrné“ výhody. Značné výhody poskytují hmatatelnou metriku pro měření návratnosti investic (ROI) – například otočení zásob o další dobu během určitého období nebo pro nižší přepravní náklady na zásilku. Je těžší definovat jemné výhody, jako je lepší přístup k informacím, pokud jde o hmatatelnou hodnotu.

Připojte svůj projekt, abyste věděli Obchodní požadavky

Plánovači projektů se příliš často pokoušejí propojit hodnotu skladu s amorfními podnikovými cíli. Prohlášením, že „hodnota skladu je založena na naší schopnosti uspokojit strategické požadavky“ otevíráme diskuzi příjemným způsobem. Ale to samo o sobě nestačí k určení, zda má investice do zásob smysl. Nejlepší je propojit iterace skladu se specifickými, známými obchodními požadavky.

Měření návratnosti investic

Výpočet ROI ve skladu může být obzvláště obtížný. To je zvláště obtížné, pokud výhodu

princip určitého opakování je něco, co není hmatatelné nebo snadno měřitelné. Jedna studie zjistila, že uživatelé vnímají dvě hlavní výhody iniciativ BI:

  • ▪ Vytvořte schopnost vytvářet rozhodnutí
  • ▪ Vytvořit přístup k informacím
    Tyto výhody jsou měkké (nebo mírné) výhody. Je snadné vidět, jak můžeme vypočítat ROI na základě tvrdého (nebo významného) přínosu, jako jsou snížené náklady na dopravu, ale jak změřit schopnost činit lepší rozhodnutí?
    To je rozhodně výzva pro projektanty, když se snaží přesvědčit společnost, aby investovala do konkrétního skladového úsilí. Zvyšování prodeje nebo snižování nákladů již nejsou ústředními tématy, které řídí prostředí BI.
    Místo toho se díváte na obchodní požadavky na lepší přístup k informacím, aby se konkrétní oddělení mohlo rychleji rozhodovat. Jedná se o strategické hybné síly, které jsou pro podnik stejně důležité, ale jsou nejednoznačnější a obtížněji se charakterizují v konkrétní metrice. V tomto případě může být výpočet ROI zavádějící, ne-li irelevantní.
    Projektanti musí být schopni prokázat hmatatelnou hodnotu pro vedoucí pracovníky, aby mohli rozhodnout, zda se investice do konkrétní iterace vyplatí. Nebudeme však navrhovat novou metodu pro výpočet ROI, ani nebudeme uvádět žádné argumenty pro nebo proti.
    Existuje mnoho článků a knih, které pojednávají o základech výpočtu ROI. Existují speciální hodnotové nabídky, jako je hodnota investice (VOI), nabízené skupinami jako Gartner, které si můžete prozkoumat. Místo toho se zaměříme na základní aspekty jakékoli návratnosti investic nebo jiných hodnotových návrhů, které musíte vzít v úvahu. Uplatňování návratnosti investic Kromě argumentu o „tvrdých“ přínosech versus „měkkých“ přínosech spojených s úsilím BI existují další otázky, které je třeba zvážit při aplikaci ROI. Například:

Připisujte příliš mnoho úspor úsilí DW, které by stejně přišlo
Řekněme, že vaše společnost přešla z architektury sálových počítačů na distribuované prostředí UNIX. Jakékoli úspory, které lze (nebo nemusí) z tohoto úsilí dosáhnout, by tedy neměly být připisovány výhradně, pokud vůbec (?), skladu.

Neúčtovat všechno je nákladné. A je třeba vzít v úvahu mnoho věcí. Zvažte následující seznam:

  • ▪ Počáteční náklady, včetně proveditelnosti.
  • ▪ Náklady na vyhrazený hardware se souvisejícím úložištěm a komunikací
  • ▪ Náklady na software včetně správy dát a rozšíření klient/server, software ETL, technologie DSS, vizualizační nástroje, aplikace pro plánování a workflow a monitorovací software, .
  • ▪ Náklady na návrh konstrukce dáts vytvářením a optimalizací
  • ▪ Náklady na vývoj softwaru přímo spojené s úsilím BI
  • ▪ Náklady na podporu na místě, včetně optimalizace výkonu, včetně kontroly verzí softwaru a operací nápovědy Použijte návratnost investic „Big-Bang“. Vybudování skladu jako jediného obrovského úsilí je odsouzeno k neúspěchu, takže i vypočítejte ROI pro iniciativu velkého podniku Nabídka je překvapivá a plánovači se nadále jen chabě snaží odhadnout hodnotu celého úsilí. Proč se plánovači snaží dát obchodní iniciativě peněžní hodnotu, pokud je všeobecně známo a přijímáno, že odhadování konkrétních opakování je obtížné? Jak je to možné? Není to až na výjimky možné. Nedělej to. Nyní, když jsme stanovili, co nedělat při výpočtu ROI, zde je několik bodů, které nám pomohou vytvořit spolehlivý proces pro odhad hodnoty vašeho úsilí BI.

Získání konsenzu ROI. Bez ohledu na vaši volbu techniky pro odhad hodnoty vašeho BI úsilí musí být schválena všemi stranami, včetně projektantů, sponzorů a obchodních manažerů.

Snižte ROI na identifikovatelné části. Nezbytným krokem k rozumnému výpočtu ROI je zaměřit tento výpočet na konkrétní projekt. To pak umožňuje odhadnout hodnotu na základě konkrétních obchodních požadavků, které jsou splněny

Definujte náklady. Jak již bylo zmíněno, je třeba vzít v úvahu řadu nákladů. Kromě toho musí náklady zahrnovat nejen náklady spojené s jednou iterací, ale také náklady spojené se zajištěním souladu s podnikovými standardy.

Definujte výhody. Jasným propojením ROI s konkrétními obchodními požadavky bychom měli být schopni identifikovat výhody, které povedou ke splnění požadavků.

Snižte náklady a přínosy v bezprostředních ziscích. Je to nejlepší způsob, jak založit své ocenění na čisté současné hodnotě (NPV), na rozdíl od snahy předpovídat budoucí hodnotu budoucích příjmů.

Udržujte načasování rozdělení ROI na minimum. Je dobře zdokumentován po dlouhou dobu, kdy byl používán ve vaší návratnosti investic.

Použijte více než jeden vzorec ROI. Existuje mnoho metod pro předpovídání ROI a měli byste si naplánovat, zda použijete jednu nebo více z nich, včetně čisté současné hodnoty, vnitřní míry návratnosti (IRR) a návratnosti.

Definujte opakovatelný proces. To je zásadní pro výpočet jakékoli dlouhodobé hodnoty. Měl by být zdokumentován jeden opakovatelný proces pro všechny následné dílčí sekvence projektu.

Uvedené problémy jsou nejběžnějšími, které definovali odborníci na prostředí skladišť. Trvání managementu na dosažení návratnosti investic „velkého třesku“ je velmi dezorientující. Začnete-li všechny své výpočty ROI jejich rozdělením na identifikovatelné, hmatatelné části, máte dobrou šanci odhadnout přesné hodnocení ROI.

Dotazy ohledně výhod návratnosti investic

Ať už jsou vaše výhody jakékoli, měkké nebo tvrdé, můžete použít několik základních otázek k určení jejich hodnoty. Například pomocí jednoduchého systému škálování od 1 do 10 můžete měřit dopad jakéhokoli úsilí pomocí následujících otázek:

  • Jak byste ohodnotili porozumění dát sleduje tento projekt vaší společnosti?
  • Jak byste odhadli zlepšení procesů v důsledku tohoto projektu?
  • Jak byste změřili dopad nových poznatků a závěrů, které jsou nyní dostupné touto iterací?
  • Jaký byl dopad nových a výkonných počítačových prostředí v důsledku toho, co jsme se naučili? Pokud je odpovědí na tyto otázky málo, je možné, že se společnost nevyplatí investovat. Otázky s vysokým skóre poukazují na významné zisky hodnoty a měly by sloužit jako vodítko pro další zkoumání. Například vysoké skóre za zlepšení procesů by mělo vést konstruktéry k tomu, aby zkoumali, jak byly procesy vylepšeny. Možná zjistíte, že některé nebo všechny dosažené zisky jsou hmatatelné, a proto lze peněžní hodnotu snadno použít. Získejte maximum z první iterace sklad Největší výsledek vašeho podnikového úsilí je často v prvních několika iteracích. Tyto rané snahy tradičně vytvářejí nejužitečnější informační obsah pro veřejnost a pomáhají vytvořit technologický základ pro následné aplikace BI. Obvykle každá následující podsekvence dát Skladové projekty přinášejí podniku celkově stále menší přidanou hodnotu. To platí zejména v případě, že iterace nepřidává nová témata nebo nesplňuje potřeby nové uživatelské komunity.

Tato funkce úložiště platí také pro rostoucí hromady dát historici. Protože další úsilí vyžaduje více dát a jak víc dát se nalije do skladu v průběhu času, nejvíce dát stává se méně relevantní pro použitou analýzu. Tyto dát často se jim říká dát spící a je vždy drahé je udržovat, protože se téměř nikdy nepoužívají.

Co to znamená pro sponzory projektu? První sponzoři sdílejí v podstatě více, než kolik stojí investice. To je primární, protože jsou impulsem pro vytvoření široké vrstvy prostředí skladu s technologií a zdroji, včetně organického.

Tyto první kroky však přinášejí nejvyšší hodnotu, a proto musí projektanti často zdůvodňovat investici.
Projekty provedené po vaší iniciativě BI mohou mít nižší (ve srovnání s prvním) a přímé náklady, ale přinášejí společnosti menší hodnotu.

A majitelé organizací musí začít uvažovat o vyhození akumulace dát a méně relevantní technologie.

Těžba dat: těžba Dát

Četné architektonické komponenty vyžadují různé technologie a techniky dolování dat –
například různí "agenti" pro zkoumání bodů zájmu úřadu zákazníci, operační systémy společnosti a pro samotné dw. Těmito agenty mohou být pokročilé neuronové sítě trénované na trendy POT, jako je budoucí poptávka po produktech založená na podpoře prodeje; motory založené na pravidlech, které reagují na sadu dat okolností, například lékařská diagnóza a doporučení léčby; nebo dokonce jednoduché agenty s rolí hlásit výjimky vrcholovým manažerům. Obecně tyto extrakční procesy dát si

ověřit v reálném čase; proto musí být zcela sjednoceny s pohybem dát oni sami.

Online analytické zpracování Zpracování

Online analýza

Schopnost krájet, krájet, házet, procházet dolů a provádět analýzu
what-if, je v rozsahu, zaměření technologické sady IBM. Například pro DB2 existují funkce online analytického zpracování (OLAP), které přináší dimenzionální analýzu do softwarového jádra. databáze stejný.

Funkce přidávají do SQL rozměrovou obslužnost a zároveň využívají všech výhod přirozené součásti DB2. Dalším příkladem integrace OLAP je extrakční nástroj DB2 OLAP Server Analyzer. Tato technologie umožňuje rychlou a automatickou analýzu krychlí serveru DB2 OLAP za účelem vyhledání hodnot hodnot a sestavování těchto hodnot dát neobvyklé nebo neočekávané v celé kostce pro obchodního analytika. A konečně, funkce DW Center poskytují architektům prostředky k ovládání, mimo jiné, profilu serverové kostky DB2 OLAP jako přirozené součásti ETL procesů.

Prostorová analýza Prostorová analýza

Prostor představuje polovinu analytických kotev (svodů) potřebných pro panorama
analytický široký (čas představuje druhou polovinu). Atomová úroveň skladu, znázorněná na obrázku 1.1, zahrnuje základy času i prostoru. Časová razítka ukotvují analýzy podle času a analýzy ukotvují informace o adresách podle prostoru. Časová razítka provádějí analýzu podle času a informace o adrese provádějí analýzu podle prostoru. Diagram ukazuje geokódování – proces převodu adres na body na mapě nebo body v prostoru, aby bylo možné v analýze použít pojmy jako vzdálenost a uvnitř/vně – prováděné na atomové úrovni a prostorová analýza, která je zpřístupněna analytik. IBM poskytuje prostorová rozšíření vyvinutá ve spolupráci s institutem ESRI (Environmental System Research Institute). databáze DB2, takže vesmírné objekty mohou být uloženy jako normální součást databáze relační. DB2

Prostorová rozšíření také poskytují všechna rozšíření SQL pro využití prostorové analýzy. Například rozšíření SQL pro dotazování
vzdálenost mezi adresami nebo zda je bod uvnitř nebo vně definované polygonální oblasti, jsou analytickým standardem pro Spatial Extender. Další informace naleznete v kapitole 16.

Databáze- Nástroje rezidentních nástrojů Databáze-Rezident

DB2 má mnoho BI-rezidentních funkcí SQL, které pomáhají při akci analýzy. Tyto zahrnují:

  • Funkce rekurze k provedení analýzy, jako je „nalezení všech možných letových drah San Francisco a New York".
  • Analytické funkce pro hodnocení, kumulativní funkce, krychle a rollup pro usnadnění úkolů, které se běžně vyskytují pouze s technologií OLAP, jsou nyní přirozenou součástí enginu. databáze
  • Schopnost vytvářet tabulky obsahující výsledky
    Prodejci databáze lídři přimíchají více možností BI do databáze stejný.
    Hlavní dodavatelé databáze kombinují více možností BI do databáze stejný.
    To poskytuje lepší výkon a více možností provádění řešení BI.
    Vlastnosti a funkce DB2 V8 jsou podrobně popsány v následujících kapitolách:
    Základy technické architektury a správy dat (kapitola 5)
  • Základy DB2 BI (kapitola 6)
  • Tabulky materializovaných dotazů DB2 (kapitola 7)
  • Funkce DB2 OLAP (kapitola 13)
  • Funkce a funkce rozšířeného BI DB2 (kapitola 15) Zjednodušený systém dodání dat Doručovací systém dát zjednodušený

Architektura znázorněná na obrázku 1.1 zahrnuje četné struktury dát fyzický. Jedním z nich je sklad dát provozní. Obecně je ODS subjektově orientovaný, integrovaný a aktuální objekt. Vy byste postavili ODS na podporu například obchodní kanceláře. Prodeje ODS by doplňovaly dát z mnoha různých systémů, ale zachoval by si například pouze dnešní transakce. ODS lze aktualizovat i mnohokrát denně. Současně procesy tlačí na dát integrována do jiných aplikací. Tato struktura je speciálně navržena pro integraci dát aktuální a dynamické a byl by pravděpodobným kandidátem na podporu analýzy v reálném čase, jako je poskytování servisním agentům zákazníci aktuální informace o prodeji zákazníka extrahováním informací o trendech prodeje ze samotného skladu. Další struktura zobrazená na obrázku 1.1 je formální stav pro dw. Nejen, že je to místo pro provedení nezbytné integrace, kvality dáta transformace dát vstupního skladu, ale je také spolehlivou a dočasnou skladovací plochou pro dát repliky, které by mohly být použity v analýzách v reálném čase. Pokud se rozhodnete použít ODS nebo předváděcí oblast, jeden z nejlepších nástrojů pro osídlení těchto struktur dát použití různých provozních zdrojů je heterogenní distribuovaný dotaz DB2. Tuto schopnost poskytuje volitelná funkce DB2 nazvaná DB2 Relational Connect (pouze dotaz) a prostřednictvím DB2 DataJoiner (samostatný produkt, který poskytuje možnost dotazování, vkládání, aktualizace a odstraňování heterogenním distribuovaným systémům RDBMS).

Tato technologie umožňuje architektům dát svázat dát výroba s analytickými procesy. Nejen, že se tato technologie dokáže přizpůsobit prakticky jakémukoli replikačnímu požadavku, který může vyvstat při analýze v reálném čase, ale může se také připojit k široké škále databází. dát nejoblíbenější, včetně DB2, Oracle, Sybase, SQL Server, Informix a dalších. DB2 DataJoiner lze použít k naplnění struktury dát formální jako ODS nebo dokonce stálý stůl zastoupený ve skladu určený pro rychlé obnovení okamžitých aktualizací nebo k prodeji. Samozřejmě, tyto stejné struktury dát lze vyplnit pomocí

další hlavní technologie určená pro replikaci dát, IBM DataPropagator Relational. (DataPropagator je samostatný produkt pro centrální systémy. DB2 UNIX, Linux, Windows a OS/2 zahrnují služby replikace dat dát jako standardní funkce).
Další způsob přesunu dát působící v rámci celého podniku je integrátor podnikových aplikací, jinak známý jako zprostředkovatel zpráv. Tato jedinečná technologie umožňuje bezkonkurenční kontrolu cílení a přesunu dát kolem společnosti. IBM má nejrozšířenějšího zprostředkovatele zpráv, MQSeries, nebo variantu produktu, která zahrnuje požadavky e-commerce, IBM WebSphere MQ.
Per più discussione su come sfruttare MQ per sostenere un magazzino e un ambiente BI, visitare webové stránky del libro. Per ora, è sufficiente dire che questa tecnologia è un mezzo eccellente per catturare e trasformare (utilizzando MQSeries Integrator) dát centrovaní (cílení) operátoři rekrutovaní pro BI řešení. Technologie MQ byla integrována a zabalena do UDB V8, což znamená, že fronty zpráv lze nyní spravovat, jako by to byly tabulky DB2. Koncept svařování ve frontě zpráv a vesmíru databáze relační směřuje k výkonnému prostředí pro doručování dát.

Nulová latence Nulová latence

Konečným strategickým cílem IBM je analýza s nulovou latencí. Podle definice
Gartner, BI systém musí být schopen odvodit, asimilovat a poskytnout informace analytikům na vyžádání. Výzvou samozřejmě je, jak namíchat dát aktuální a v reálném čase s nezbytnými historickými informacemi, jako např dát související vzor/trend nebo extrahované porozumění, jako je profilování zákazníků.

Mezi tyto informace patří například identifikace zákazníci vysoké nebo nízké riziko nebo které produkty i zákazníci s největší pravděpodobností nakoupí, pokud již mají sýr v nákupních košíkech.

Dosažení nulové latence je ve skutečnosti závislé na dvou základních mechanismech:

  • Kompletní spojení dát které jsou analyzovány pomocí zavedených technik a nástrojů vytvořených BI
  • Systém doručení dát Tyto předpoklady pro nulovou latenci se neliší od dvou cílů stanovených IBM a popsaných výše. Blízké páření dát Je součástí bezproblémového integračního programu IBM. A vytvořit systém doručení dát účinnost je zcela závislá na dostupné technologii, která zjednodušuje proces dodání dát. V důsledku toho jsou dva ze tří cílů IBM rozhodující pro realizaci třetího. IBM vědomě vyvíjí svou technologii, aby zajistila, že nulová latence je realitou pro skladové práce. Shrnutí / syntéza Organizace BI poskytuje plán pro budování vašeho prostředí
    iterativně. Musí být upraven tak, aby odrážel potřeby vašeho podnikání, současné i budoucí. Bez široké architektonické vize jsou iterace skladů jen o málo více než nahodilé implementace centrálního skladu, které málo přispívají k vytvoření širokého a informativního podniku. První překážkou pro projektové manažery je, jak zdůvodnit investice potřebné k rozvoji BI organizace. Zatímco výpočet návratnosti investic zůstal základním pilířem implementací skladů, je stále obtížnější přesně předvídat. To vedlo k dalším metodám, jak zjistit, zda dostáváte své peníze. Jako řešení se propaguje například hodnota investice2 (VOI). Je to povinností architektů dát a plánovači projektů záměrně generují a poskytují informace uživatelským sdružením a ne pouze jim poskytují službu dát. Mezi těmito dvěma je obrovský rozdíl. Informace je něco, co má vliv na rozhodování a efektivitu; relativně, tj dát jsou stavebními kameny pro odvozování těchto informací.

Ačkoli kritický vůči zdroji dát Pro řešení obchodních požadavků by prostředí BI mělo hrát větší roli při vytváření informačního obsahu. Musíme podniknout další kroky k vyčištění, integraci, transformaci nebo jinému vytvoření informačního obsahu, na základě kterého mohou uživatelé jednat, a pak musíme zajistit, aby se tyto akce a rozhodnutí tam, kde je to rozumné, odrazily v prostředí BI. Pokud sklad odsuneme, aby sloužil pouze dál dát, je zajištěno, že uživatelská sdružení vytvoří informační obsah potřebný k akci. To zajišťuje, že jejich komunita bude schopna činit lepší rozhodnutí, ale podnik trpí nedostatkem znalostí, které využili. Dato Když architekti a projektanti iniciují konkrétní projekty v prostředí BI, zůstávají odpovědní podniku jako celku. Jednoduchý příklad této oboustranné charakteristiky iterací BI lze nalézt ve zdroji dát. Všechny dát přijaté pro konkrétní obchodní požadavky musí být naplněny v první atomové vrstvě. To zajišťuje vývoj podnikových informačních aktiv a také správu a řešení specifických požadavků uživatelů definovaných v iteraci.

Co je DataWarehouse?

Datový sklad je srdcem architektury informačních systémů od roku 1990 a podporuje informační procesy nabídkou solidní integrované platformy dát historická data použitá jako základ pro následné analýzy. THE datový sklad nabízejí snadnou integraci ve světě nekompatibilních aplikačních systémů. Datový sklad se vyvinul v trend. Datový sklad organizuje a ukládá i dát nezbytné pro informační a analytické procesy založené na dlouhé historické časové perspektivě. To vše s sebou nese značné a stálé nasazení při výstavbě a údržbě datový sklad.

Co tedy je datový sklad? datový sklad je:

  • ▪ oborově zaměřená
  • ▪ integrovaný systém
  • ▪ variantní čas
  • ▪ nevolatilní (nelze vymazat)

sbírka dát slouží k podpoře manažerských rozhodnutí při zavádění procesů.
I dát vloženo datový sklad ve většině případů pocházejí z provozních prostředí. The datový sklad je tvořen úložnou jednotkou, fyzicky oddělenou od zbytku systému, který obsahuje dát dříve transformované aplikacemi, které pracují na informacích odvozených z operačního prostředí.

Doslovná definice a datový sklad si zaslouží podrobné vysvětlení, protože existují důležité motivace a základní významy, které popisují vlastnosti skladu.

PŘEDMĚT ORIENTACE ORIENTACE TEMATICKÝ

První vlastnost a datový sklad je, že je orientován na hlavní hráče ve společnosti. Průvodce zkouškami přes dát je to na rozdíl od klasičtější metody, která zahrnuje orientaci aplikací na procesy a funkce, metodu většinou sdílenou většinou méně novějších systémů řízení.

Operační svět je navržen kolem aplikací a funkcí, jako jsou půjčky, spoření, bankovní karty a důvěra pro finanční instituce. Svět dw je organizován kolem hlavních předmětů, jako je zákazník, prodejce, produkt a činnost. Zarovnání kolem témat ovlivňuje návrh a implementaci dát nalezený v dw. Ještě důležitější je, že hlavní téma ovlivňuje nejdůležitější část klíčové struktury.

Svět aplikace je ovlivněn jak návrhem databáze, tak návrhem procesu. Svět dw je zaměřen výhradně na modeling dát a na designu databáze. Návrh procesů (ve své klasické podobě) není součástí prostředí dw.

Rozdíly mezi volbou procesní/funkční aplikace a volbou předmětu se projevují také jako rozdíly v obsahu dát na podrobné úrovni. THE dát del dw nezahrnují i dát které nebudou použity pro proces DSS při aplikacích

provozně orientovaný na dát obsahovat i dát k okamžitému uspokojení funkčních/procesních požadavků, které mohou nebo nemusí mít pro analytika DSS žádné využití.
Dalším důležitým způsobem, jak provozně orientované aplikace dát se liší od dát z dw je ve zprávách o dát. Já dát operace udržují nepřetržitý vztah mezi dvěma nebo více tabulkami na základě obchodního pravidla, které je aktivní. THE dát dw překračuje spektrum času a vztahů nalezených v dw je mnoho. Mnoho obchodních pravidel (a odpovídajícím způsobem mnoho vztahů mezi dát ) jsou zastoupeny ve skladu dát mezi dvěma nebo více stoly.

(Podrobné vysvětlení toho, jak jsou vztahy mezi dát jsou zpracovány v DW, odkazujeme na Technické téma k tomuto problému.)
Z žádné jiné perspektivy, než z pohledu zásadního rozdílu mezi volbou funkční/procesní aplikace a volbou předmětu, existuje větší rozdíl mezi operačními systémy a dát a DW.

INTEGRACE INTEGRACE

Nejdůležitějším aspektem prostředí dw je to, že i dát nalezené v dw jsou snadno integrovatelné. VŽDY. BEZ VÝJIMEK. Samotná podstata prostředí dw spočívá v tom, že i dát obsažené v mezích skladu jsou integrovány.

Integrace se projevuje mnoha různými způsoby – v konzistentních identifikovaných konvencích, v konzistentním měření proměnných, v konzistentních kódovaných strukturách, ve fyzických atributech dát konzistentní atd.

V průběhu let učinili návrháři různých aplikací mnoho rozhodnutí o tom, jak by měla být aplikace vyvíjena. Styl a individualizovaná designová rozhodnutí návrhářských aplikací se odhalují na sto způsobů: v rozdílech v kódování, klíčové struktuře, fyzických vlastnostech, určování konvencí a tak dále. Kolektivní schopnost mnoha návrhářů aplikací vytvářet nekonzistentní aplikace je legendární. Obrázek 3 ukazuje některé z nejdůležitějších rozdílů ve způsobech navrhování aplikací.

Kódování: Kódování:

Návrháři aplikací zvolili kódování pole – sex – různými způsoby. Návrhář představuje sex jako „m“ a „f“. Jiný návrhář představuje pohlaví jako „1“ a „0“. Jiný návrhář představuje sex jako „x“ a „y“. Jiný návrhář představuje sex jako „mužský“ a „ženský“. Nezáleží na tom, jak se sex dostane do DW. „M“ a „F“ jsou pravděpodobně stejně dobré jako celá hra.

Důležité je, že z jakéhokoli původu se sexuální pole odvozuje, toto pole přichází do DW v konzistentním integrovaném stavu. V důsledku toho, když je pole načteno do DW z aplikace, kde bylo reprezentováno ve formátu „M“ a „F“, dát musí být převedeny do formátu DW.

Měření atributů: Měření Atributy:

Návrháři aplikací se v průběhu let rozhodli měřit potrubí různými způsoby. Návrhář ukládá dát potrubí v centimetrech. Jiný návrhář aplikací ukládá soubor dát potrubí v palcích. Jiný návrhář aplikací ukládá soubor dát potrubí v milionech kubických stop za sekundu. A další návrhář ukládá informace o potrubí ve smyslu yardů. Bez ohledu na zdroj, když informace z potrubí dorazí do DW, musí být měřeny stejným způsobem.

Podle údajů na obrázku 3 ovlivňují integrační problémy téměř každý aspekt projektu – fyzické vlastnosti dát, dilema mít více než jeden zdroj dát, problematika nekonzistentních identifikovaných vzorků, formátů dát nekonzistentní atd.

Ať už je téma designu jakékoli, výsledek je stejný – tj dát musí být uloženy v DW jedinečným a globálně přijatelným způsobem, i když je základní operační systémy ukládají odlišně dát.

Když se analytik DSS podívá na DW, cílem analytika by mělo být využití dát kteří jsou ve skladu,

spíše než přemýšlet o důvěryhodnosti nebo konzistenci dát.

ČASOVÁ RŮZNOST

Vše i dát v DW jsou přesné do určitého okamžiku. Tato základní charakteristika dát v DW se velmi liší od dát v operačním prostředí. THE dát provozního prostředí jsou stejně přesné jako v okamžiku přístupu. Jinými slovy, v operačním prostředí při přístupu k jednotce dát, očekává se, že bude odrážet přesné hodnoty v době přístupu. Protože já dát v DW jsou přesné v určitém okamžiku (tj. ne „právě teď“), říká se, že dát nalezené v DW jsou „časové odchylky“.
Časová odchylka dát Na DW se odkazuje mnoha způsoby.
Nejjednodušší je, že i dát DW představují dát v dlouhém časovém horizontu – pět až deset let. Časový horizont reprezentovaný pro provozní prostředí je mnohem kratší než dnešní aktuální hodnoty až do šedesáti devadesáti
Aplikace, které musí dobře fungovat a musí být dostupné pro zpracování transakcí, musí mít minimální množství dát pokud umožňují nějakou míru flexibility. Provozní aplikace mají tedy krátký časový horizont, jako téma návrhu zvukové aplikace.
Druhý způsob, jak se „časová odchylka“ objevuje v DW, je ve struktuře klíče. Každá klíčová struktura v DW obsahuje, implicitně nebo explicitně, časový prvek, jako je den, týden, měsíc atd. Časový prvek je téměř vždy ve spodní části zřetězeného klíče nalezeného v DW. V těchto případech bude časový prvek existovat implicitně, jako je tomu v případě, kdy je celý soubor duplikován na konci měsíce nebo čtvrtletí.
Třetí způsob zobrazení časové odchylky je ten, že i dát DW, jakmile je správně zaregistrován, nelze aktualizovat. THE dát DW jsou pro všechny praktické účely dlouhou řadou snímků. Pokud byly snímky pořízeny nesprávně, lze je samozřejmě upravit. Ale za předpokladu, že jsou snímky pořízeny správně, nebudou upraveny, jakmile jsou pořízeny. V některých

V některých případech může být úpravy snímků v DW neetické nebo dokonce neplatné. THE dát funkční, přesné v okamžiku přístupu, mohou být aktualizovány podle potřeby.

NENÍ PRUTKOVÉ

Čtvrtým důležitým rysem DW je, že je energeticky nezávislý.
Aktualizace, vkládání, mazání a úpravy se pravidelně provádějí v provozních prostředích na základě záznamu po záznamu. Ale základní manipulace s dát které jsou potřebné v DW, je mnohem jednodušší. V DW se vyskytují pouze dva druhy operací – počáteční načítání dát a přístup k dát. Neexistuje žádná aktualizace dát (v obecném smyslu aktualizace) v DW jako normální operace zpracování. Tento základní rozdíl mezi operačním zpracováním a zpracováním DW má velmi silné důsledky. Na úrovni návrhu není potřeba být opatrný ohledně anomálních aktualizací v DW faktorem, protože aktualizace dát se neprovádí. To znamená, že na úrovni fyzického návrhu lze využít svobody pro optimalizaci přístupu dát, zejména při řešení témat fyzikální normalizace a denormalizace. Další důsledek jednoduchosti operací DW je v základní technologii používané ke spuštění prostředí DW. Nutnost podporovat aktualizace inline záznam po záznamu (jak je tomu často u provozního zpracování) vyžaduje, aby technologie měla velmi komplexní základ při zjevné jednoduchosti.
Technologie, která podporuje zálohování a obnovu, transakce a integritu dát a detekce a náprava stavu uváznutí je poměrně složitá a není nezbytná pro zpracování DW. Charakteristika DW, orientace návrhu, integrace dát v rámci DW, časový rozptyl a jednoduchost řízení dát, to vše vede k prostředí, které je velmi, velmi odlišné od klasického provozního prostředí. Zdroj téměř všech dát DW jsou operačním prostředím. Je lákavé si myslet, že existuje masivní redundance dát mezi těmito dvěma prostředími.
Ve skutečnosti je prvním dojmem mnoha lidí pocit velké redundance dát mezi operačním prostředím a

DW. Taková interpretace je povrchní a ukazuje nepochopení toho, co se děje v DW.
Ve skutečnosti existuje minimální nadbytečnost dát mezi operačním prostředím a i dát z DW. Zvažte následující: I dát jsou filtrovány dat přechod z operačního prostředí do prostředí DW. Mnoho dát nikdy neprocházejí mimo provozní prostředí. Kromě toho, že i dát které jsou nezbytné pro zpracování DSS najít svůj směr v prostředí

▪ časový horizont dát je velmi odlišné od jednoho prostředí k druhému. THE dát v operačním prostředí jsou velmi čerstvé. THE dát v DW jsou mnohem starší. Pouze z hlediska časového horizontu se operační prostředí a DW velmi málo překrývají.

▪ DW obsahuje dát shrnutí, které se v prostředí nikdy nenachází

▪ I dát procházejí zásadní proměnou, protože přechod na obrázek 3 ukazuje, že většina dát jsou výrazně upraveny za předpokladu, že jsou vybrány a přesunuty do DW. Jinak řečeno, většina dát při přesunu do DW se fyzicky a radikálně mění. Z hlediska integrace nejsou stejné dát které se nacházejí v operačním prostředí. Ve světle těchto faktorů je nadbytečnost dát mezi těmito dvěma prostředími je vzácná událost, která vede k méně než 1% redundanci mezi těmito dvěma prostředími. STRUKTURA SKLADU DW mají odlišnou strukturu. Existují různé úrovně souhrnu a podrobností, které vymezují DW.
Různé komponenty DW jsou:

  • Metadata
  • Dát aktuální podrobnosti
  • Dát starých detailů
  • Dát mírně shrnuto
  • Dát velmi shrnuto

Zdaleka hlavní starost je o i dát aktuální detaily. Je to hlavní problém, protože:

  • I dát aktuální detaily odrážejí nejnovější události, o které je vždy velký zájem a
  • i dát aktuálních detailů je objemný, protože je uložen na nejnižší úrovni granularity a
  • i dát Aktuální podrobnosti jsou téměř vždy uloženy na diskové paměti, ke které je rychlý přístup, ale použití je drahé a složité dát starší podrobnosti jsou dát které jsou uloženy v nějaké paměti Massa. Je přístupný sporadicky a je uložen na úrovni podrobností kompatibilní s dát aktuální detaily. I když není povinné ukládat na alternativní paměťové médium z důvodu velkého objemu dát v kombinaci se sporadickým přístupem dát, paměťové médium pro dát starší detailní data se obvykle neukládají na disk. THE dát shrnuto lehce dát které jsou destilovány od nízké úrovně nalezených detailů až po současnou úroveň detailů. Tato úroveň DW je téměř vždy uložena na disku. Problémy s designem, kterým architekt čelí dát při konstrukci této úrovně DW jsou:
  • Jakou časovou jednotkou je výše uvedené shrnutí
  • Který obsah, atributy mírně shrnují obsah dát Další úroveň dát v DW je to z dát vysoce shrnuto. THE dát vysoce shrnuto jsou kompaktní a snadno dostupné. THE dát vysoce shrnuté se někdy nacházejí v prostředí DW a v jiných případech i dát vysoce shrnuté se nacházejí mimo bezprostřední stěny technologie, ve které je umístěn DW. (v každém případě, tj dát vysoce shrnuté jsou součástí DW bez ohledu na to, kde i dát jsou fyzicky ubytováni). Poslední složkou DW jsou metadata. V mnoha ohledech jsou metadata v jiné dimenzi než ostatní dát DW, protože metadata žádná neobsahují dat převzaty přímo z operačního prostředí. Metadata mají v DW zvláštní a velmi důležitou roli. Metadata se používají jako:
  • adresář, který pomůže analytikovi DSS najít obsah DW,
  • průvodce mapováním dát jak já dát byly transformovány z provozního prostředí do prostředí DW,
  • průvodce algoritmy používanými pro sumarizaci mezi dát aktuálních detailů ei dát mírně shrnuto, tj dát velmi shrnuto, metadata hrají mnohem větší roli v prostředí DW, než kdy měla v provozním prostředí STARÉ DETAILNÍ SKLADOVÁNÍ STŘEDNÍ K uložení tohoto typu lze použít magnetickou pásku dát. Ve skutečnosti existuje široká škála paměťových médií, která by měla být považována za stará úložiště dát detailů. V závislosti na objemu dát, četnost přístupu, náklady na nástroje a typ přístupu, je zcela pravděpodobné, že ostatní nástroje budou potřebovat starou úroveň podrobností v DW. PRŮTOK ÚDAJŮ Existuje normální a předvídatelný tok bohů dát uvnitř DW.
    I dát vstupují do DW z operačního prostředí. (POZNÁMKA: Existuje několik velmi zajímavých výjimek z tohoto pravidla. Nicméně téměř všechny dát zadejte DW z operačního prostředí). Dato že i dát vstoupí do DW z operačního prostředí, transformuje se tak, jak bylo popsáno dříve. Za podmínky vstupu do DW, tzn dát zadejte aktuální úroveň podrobností, jak je znázorněno. Je tam umístěn a používá se, dokud nenastane jedna ze tří událostí:
  • je očištěn,
  • je shrnut, a/nebo ▪è Zastaralý proces v rámci přesunů DW i dát aktuální podrobnosti a dát starých detailů, podle věku dát. Proces

shrnutí používá detail dát vypočítat i dát mírně shrnuté a vysoce shrnuté úrovně dát. V zobrazeném toku existují některé výjimky (bude diskutováno později). Obvykle však pro drtivou většinu dát nalezený v DW, tok dát je na obrázku.

POUŽÍVÁNÍ DATOVÉHO DOMU

Není divu, že různé úrovně dát v rámci DW nedostávají různé úrovně využití. Zpravidla platí, že čím vyšší úroveň sumarizace, tím více i dát jsou použity.
Mnoho použití se vyskytuje v dát velmi shrnuto, zatímco staré dát detailů se téměř nepoužívají. Existuje dobrý důvod, proč přesunout organizaci do paradigmatu využití zdrojů. Více shrnuto I dát, tím rychlejší a efektivnější je dostat se do dát. Pokud negozio zjistí, že provádí mnoho procesů na úrovni detailů DW, pak je spotřebováno odpovídající velké množství strojových zdrojů. Je v nejlepším zájmu každého zpracovat co nejvyšší úroveň shrnutí co nejdříve.

Pro mnoho obchodů použil analytik DSS v předprostředním prostředí DW dát na úrovni detailů. V mnoha ohledech je příjezd a dát podrobné shrnutí připomíná bezpečnostní přikrývku, i když jsou k dispozici další úrovně souhrnu. Jedna z architektových činností dát je odnaučit uživatele DSS od neustálého používání dát na nejnižší úrovni detailů. Architekt má k dispozici dvě motivace dát:

  • instalací systému zpětného zúčtování, kdy koncový uživatel platí za spotřebované zdroje a
  • což naznačuje, že velmi dobré doby odezvy lze dosáhnout, když chování s i dát je na vysoké úrovni sumarizace, zatímco špatná doba odezvy pochází z chování dát na nízké úrovni DALŠÍ ÚVAHY Existuje několik dalších úvah o konstrukci a správě DW.
    První úvaha se týká indexů. THE dát na vyšších úrovních sumarizace je lze libovolně indexovat, zatímco i dát

na nižších úrovních detailů jsou tak objemné, že je lze indexovat šetrně. Ze stejného tokenu, tj dát při vysoké úrovni detailů lze relativně snadno restrukturalizovat, zatímco objem dát na nižších úrovních je tak velká, že i dát nelze je snadno renovovat. V důsledku toho model dát a formální práce provedená designem položila základ pro DW aplikovaný téměř výhradně na aktuální úroveň detailů. Jinými slovy, modelovací aktivity dát téměř ve všech případech se nevztahují na úrovně shrnutí. Dalším strukturálním hlediskem je pododdělení dát autor: DW.

Rozdělení disku lze provést na dvou úrovních - na úrovni dbms a na aplikační úrovni. V divizi na úrovni dbms, dbms je informován o divizích a podle toho je řídí. V případě rozdělení na aplikační úrovni je o rozděleních informován pouze programátor a odpovědnost za jejich správu je ponechána na něm.

Pod úrovní dbms, spousta práce se dělá automaticky. S automatickou správou divizí je spojena velká nepružnost. V případě divizí na aplikační úrovni dát del datový sklad, hodně práce zatěžuje programátora, ale konečným výsledkem je flexibilita při správě dát v datový sklad

OSTATNÍ ANOMÁLIE

Zatímco komponenty datový sklad Fungují tak, jak je popsáno téměř u všech dát, existuje několik užitečných výjimek, které je třeba prodiskutovat. Výjimkou je to z dát veřejné souhrnné údaje. Tyto jsou dát souhrny, které byly vypočteny z datový sklad ale společnost je používá. THE dát veřejné souhrny jsou uloženy a spravovány v datový sklad, i když, jak již bylo zmíněno, jsou vypočteny. Účetní pracují na výrobě takových čtvrtletních dát jako jsou příjmy, čtvrtletní výdaje, čtvrtletní zisk a tak dále. Práce účetních je externí datový sklad. Nicméně, i dát se používají „interně“ v rámci společnosti – od marketing, prodej atd. Další anomálie, o které nebude řeč, je anomálie dát externí.

Další skvělý druh dát které lze nalézt v a datový sklad je to trvalých podrobných dat. Ty způsobují potřebu trvalého uložení dát na podrobné úrovni z etických nebo právních důvodů. Pokud společnost vystavuje své pracovníky nebezpečným látkám, je to nutné dát podrobné a trvalé. Pokud společnost vyrábí produkt, který zahrnuje veřejnou bezpečnost, jako jsou součásti letadel, je potřeba dát trvalé detaily, stejně jako pokud společnost uzavírá nebezpečné smlouvy.

Společnost si nemůže dovolit přehlížet detaily, protože během několika příštích let, v případě soudního sporu, odvolání, sporné konstrukční vady atd. expozice společnosti může být velká. Výsledkem je jedinečný typ dát známé jako trvalé podrobné údaje.

SOUHRN

Un datový sklad je objektově orientovaná, integrovaná, časová varianta, kolekce dát nevolatilní na podporu rozhodovacích potřeb správy. Každá z hlavních funkcí a datový sklad má své důsledky. Navíc existují čtyři úrovně dát del datový sklad:

  • Starý detail
  • Aktuální detail
  • Dát mírně shrnuto
  • Dát Vysoce shrnutá metadata jsou také důležitou součástí datový sklad. ABSTRAKTNÍ Koncept skladování dát V poslední době získal velkou pozornost a stal se trendem 90. let. datový sklad překonat omezení systémů podpory řízení, jako jsou systémy pro podporu rozhodování (DSS) a výkonné informační systémy (EIS). I když koncept datový sklad vypadá slibně, implementujte i datový sklad může být problematické kvůli rozsáhlým skladovacím procesům. Navzdory složitosti projektů skladů dát, mnoho dodavatelů a poradců, kteří skladují dát tvrdí, že skladování dát proud nezpůsobuje žádné problémy. Na počátku tohoto výzkumného projektu však neproběhl téměř žádný nezávislý, rigorózní a systematický výzkum. V důsledku toho je těžké říci, co se ve skutečnosti děje v průmyslu, když jsou postaveny datový sklad. Tato studie zkoumala praxi skladování dát contemporaries, jehož cílem je rozvinout bohatší porozumění australské praxi. Přehled literatury poskytl kontext a základ pro empirickou studii. Z tohoto výzkumu vyplývá řada zjištění. Za prvé, tato studie odhalila aktivity, které vznikly během vývoje datový sklad. V mnoha oblastech, tj dát shromážděné potvrdily praxi uváděnou v literatuře. Za druhé, problémy a problémy, které mohou ovlivnit vývoj datový sklad byly identifikovány touto studií. A konečně, výhody získané australskými organizacemi spojené s používáním datový sklad byly odhaleny.

Kapitola 1

Kontext výzkumu

Koncept datových skladů byl široce rozšířen a v 90. letech se stal novým trendem (McFadden 1996, TDWI 1996, Shah a Milstein 1997, Shanks a kol. 1997, Eckerson 1998, Adelman a Oates 2000). To je patrné z rostoucího počtu článků o datových skladech v odborných publikacích (Little a Gibson 1999). Mnoho článků (viz např. Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett a King 1996, Graham et al. 1996, Sakaguchi a Frolick 1996, Alvarez 1997, Brousell 1997, Don1997llarthy1997 Edwards 1997, TDWI 1998) uvedli významné výhody získané organizacemi, které zavádějí i datový sklad. Svou teorii podpořili neoficiálními důkazy o úspěšných implementacích, vysokou návratností investic (ROI) a také poskytnutím pokynů nebo metodologií pro vývoj datový sklad

(Shanks a kol. 1997, Seddon a Benjamin 1998, Little a Gibson 1999). V extrémním případě Graham a spol. (1996) uvedli průměrnou návratnost tříleté investice 401 %.

Velká část současné literatury však přehlíží složitosti spojené s prováděním takových projektů. Projekty datový sklad jsou obvykle složité a rozsáhlé, a proto mají vysokou pravděpodobnost selhání, pokud nejsou pečlivě kontrolovány (Shah a Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs a Clymer 1998, Rao 1998). Vyžadují obrovské množství lidských i finančních zdrojů a čas a úsilí na jejich vybudování (Hill 1998, Crofts 1998). Typický požadovaný čas a finanční prostředky jsou přibližně dva roky, respektive dva až tři miliony dolarů (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Tento čas a finanční prostředky jsou zapotřebí k řízení a konsolidaci mnoha různých aspektů datového skladu (Cafasso 1995, Hill 1998). Kromě hardwarových a softwarových aspektů jsou k dispozici další funkce, které se liší od extrakce dát na procesy načítání dát, kapacita paměti pro správu aktualizací a meta dát pro školení uživatelů, je třeba je vzít v úvahu.

V době, kdy tento výzkumný projekt začal, bylo v oblasti datových skladů prováděno velmi málo akademického výzkumu, zejména v Austrálii. To bylo zřejmé z nedostatku publikovaných článků o datovém skladu z časopisů nebo jiných akademických spisů té doby. Mnohé z dostupných akademických spisů popisovaly zkušenosti z USA. Nedostatek akademického výzkumu v oblasti datových skladů vyvolal volání po rigorózním výzkumu a empirických studiích (McFadden 1996, Shanks et al. 1997, Little a Gibson 1999). Zejména výzkumné studie o procesu implementace datový sklad je třeba provést pro rozšíření obecných znalostí o implementaci datový sklad a poslouží jako základ pro budoucí výzkumnou studii (Shanks et al. 1997, Little a Gibson 1999).

Účelem této studie je proto studovat, co se skutečně děje, když organizace provádějí a používají i datový sklad v Austrálii. Konkrétně tato studie bude zahrnovat analýzu celého procesu vývoje a datový sklad, počínaje iniciací a plánováním přes návrh a implementaci a následné použití v australských organizacích. Kromě toho studie také přispěje k současné praxi tím, že identifikuje oblasti, kde lze praxi dále zlepšit a minimalizovat neefektivitu a rizika nebo se jim vyhnout. Dále poslouží jako podklad pro další studie o datový sklad v Austrálii a zaplní mezeru, která v současnosti existuje v literatuře.

Výzkumné otázky

Cílem tohoto výzkumu je prostudovat aktivity spojené s implementací datový sklad a jejich využití australskými organizacemi. Studují se zejména prvky týkající se plánování projektu, vývoje, provozu, použití a souvisejících rizik. Otázka tohoto výzkumu tedy zní:

"Jaká je současná praxe datový sklad v Austrálii?"

K účinnému zodpovězení této otázky je zapotřebí řada vedlejších výzkumných otázek. Z literatury, která je uvedena v kapitole 2, byly identifikovány zejména tři dílčí otázky, kterými se má tento výzkumný projekt řídit: Jak jsou datový sklad z australských organizací? S jakými problémy jste se setkali?

Jaké jsou výhody?
Při zodpovězení těchto otázek byl použit explorativní výzkumný design využívající průzkum. Jako explorativní studie nejsou odpovědi na výše uvedené otázky úplné (Shanks et al. 1993, Denscombe 1998). V tomto případě je pro zlepšení odpovědí na tyto otázky nutná triangulace. Vyšetřování však poskytne pevný základ pro budoucí práci zkoumající tyto otázky. Podrobná diskuse o zdůvodnění a návrhu výzkumné metody je uvedena v kapitole 3.

Struktura výzkumného projektu

Tento výzkumný projekt je rozdělen na dvě části: kontextovou studii konceptu datového skladu a empirický výzkum (viz obrázek 1.1), z nichž každá je diskutována níže.

Část I: Kontextová studie

První část výzkumu spočívala v revizi současné literatury o různých typech datových skladů včetně systémů pro podporu rozhodování (DSS), výkonných informačních systémů (EIS), případových studií datový sklad a koncepty datový sklad. Dále výsledky fór datový sklad a skupiny odborníků a praktiků vedené výzkumným týmem Monash DSS přispěly k této fázi studie, jejímž cílem bylo získat vhled do praxe datový sklad a identifikovat rizika spojená s jejich přijetím. Během tohoto kontextuálního studijního období bylo zjištěno porozumění problémové oblasti, aby bylo možné poskytnout základní znalosti pro následná empirická šetření. Během provádění výzkumné studie se však jednalo o pokračující proces.

Část II: Empirický výzkum

Relativně nový koncept datových skladů, zejména v Austrálii, vyvolal potřebu průzkumu, který by získal široký obrázek o uživatelské zkušenosti. Tato část byla provedena poté, co byla na základě rozsáhlého přehledu literatury stanovena problémová doména. Koncept datového skladu vytvořený během fáze kontextové studie byl použit jako vstup pro úvodní dotazník této studie. Poté byl dotazník zkoumán. Jste odborníky v datový sklad se zúčastnil testu. Účelem testování vstupního dotazníku bylo zkontrolovat úplnost a správnost otázek. Na základě výsledků testu byl dotazník upraven a upravená verze byla zaslána účastníkům průzkumu. Vrácené dotazníky byly poté analyzovány pro i dát v tabulkách, diagramech a jiných formátech. THE

výsledky analýzy dát tvoří snímek praxe datového skladu v Austrálii.

PŘEHLED DATA SKLADOVÁNÍ

Koncepce datových skladů se vyvíjela s pokroky v počítačové technologii.
Je zaměřen na překonání problémů, kterým čelí skupiny aplikační podpory, jako je Systém podpory rozhodování (DSS) a Výkonný informační systém (EIS).

V minulosti byla největší překážkou těchto aplikací neschopnost těchto aplikací poskytovat a databáze nezbytné pro analýzu.
Je to způsobeno především povahou práce managementu. Zájmy managementu společnosti se neustále mění v závislosti na pokrytí oblasti. Proto i dát základní pro tyto aplikace musí být schopny rychle se měnit v závislosti na dílu, který má být zpracován.
To znamená, že i dát musí být k dispozici ve vhodné formě pro požadované analýzy. Ve skutečnosti bylo pro skupiny podpory aplikací v minulosti velmi obtížné shromažďovat a integrovat dát ze složitých a rozmanitých zdrojů.

Zbytek této části představuje přehled konceptu datových skladů a pojednává o tom, jak datový sklad může překonat problémy skupin aplikační podpory.
Termín „Datový sklad“ zpopularizoval William Inmon v roce 1990. Jeho často citovaná definice vidí Datový sklad jako sbírka dát předmětově orientované, integrované, nevolatilní a proměnlivé v průběhu času na podporu manažerských rozhodnutí.

Pomocí této definice Inmon zdůrazňuje, že i dát s bydlištěm v a datový sklad musí mít tyto 4 vlastnosti:

  • ▪ Předmětově orientovaný
  • ▪ Integrovaný
  • ▪ Nevolatilní
  • ▪ Proměnná v čase Předmětově orientovaný Inmon znamená, že i dát v datový sklad v největších organizačních oblastech, které byly

definované v modelu dát. Například všechny dát Týkající se zákazníci jsou obsaženy v oblasti předmětu ZÁKAZNÍCI. Stejně tak všichni dát týkající se produktů jsou obsaženy v předmětové oblasti PRODUKTY.

Integati Inmon znamená, že i dát pocházející z různých platforem, systémů a míst jsou kombinovány a uloženy na jednom místě. Následně dát podobné je nutné převést do konzistentních formátů, aby je bylo možné snadno přidávat a porovnávat.
Například mužský a ženský rod jsou v jednom systému reprezentovány písmeny M a F a v jiném 1 a 0. Aby bylo možné je správně integrovat, musí být jeden nebo oba formáty transformovány tak, aby oba formáty byly stejné. V tomto případě bychom mohli změnit M na 1 a F na 0 nebo naopak. Předmětově orientované a integrované naznačují, že datový sklad je navržen tak, aby poskytoval funkční a příčné vidění dát společností.

Non-volatile znamená, že i dát v datový sklad zůstat konzistentní a aktualizovat dát není to nutné. Místo toho každá změna dát originály se přidají do souboru databáze del datový sklad. To znamená, že historické dei dát je obsažen v datový sklad.

U proměnných v průběhu času Inmon naznačuje, že i dát v datový sklad vždy obsahují časové značky a i dát obvykle překračují určitý časový horizont. Například a
datový sklad může obsahovat 5 let historických hodnot zákazníci od roku 1993 do roku 1997. Dostupnost historie a časové řady dát umožňuje analyzovat trendy.

Un datový sklad může sbírat vlastní dát ze systémů OLTP, ze zdrojů dát mimo organizaci a/nebo jinými projekty speciálních systémů odchytu dát.
I dát extrakty mohou projít procesem čištění, v tomto případě tj dát jsou transformovány a integrovány před uložením do databáze del datový sklad. Pak já dát

bydlící uvnitř databáze del datový sklad jsou k dispozici pro přihlášení koncových uživatelů a nástroje pro obnovu. Pomocí těchto nástrojů má koncový uživatel přístup k integrovanému pohledu na organizaci dát.

I dát bydlící uvnitř databáze del datový sklad jsou uloženy jak v podrobném, tak v souhrnném formátu.
Úroveň shrnutí může záviset na povaze dát. Já dát podrobně se může skládat z dát aktuální a dát historici
I dát skutečné nejsou zahrnuty v datový sklad dokud já dát v datový sklad jsou osvěženy.
Kromě ukládání i dát sami, a datový sklad může také uložit jiný typ dat nazvaná METADATA popisující dát bydlící v jeho databáze.
Existují dva typy metadat: vývojová metadata a analytická metadata.
Vývojová metadata se používají ke správě a automatizaci procesů extrakce, čištění, mapování a načítání dát v datový sklad.
Informace obsažené v metadatech vývoje mohou obsahovat podrobnosti o operačních systémech, podrobnosti o prvcích, které mají být extrahovány, o modelu dát del datový sklad a obchodní pravidla pro konverzi dát.

Druhý typ metadat, známý jako analytická metadata, umožňuje koncovému uživateli prozkoumat obsah souboru datový sklad najít dát dostupné a jejich význam v jasných, netechnických termínech.

Proto analytická metadata fungují jako most mezi datový sklad a aplikace pro koncové uživatele. Tato metadata mohou obsahovat obchodní model, popis dát odpovídající obchodnímu modelu, předdefinované dotazy a sestavy, informace pro uživatelský přístup a index.

Aby mohla správně fungovat metadata analýzy a vývoje, musí být kombinována do jediného integrovaného metadat.

Bohužel mnoho existujících nástrojů má svá vlastní metadata a v současnosti pro ně neexistují žádné existující standardy

umožňují nástrojům pro datové sklady integrovat tato metadata. K nápravě této situace mnoho obchodníků s hlavními nástroji pro ukládání dat vytvořilo Meta Data Council, která se později stala Meta Data Coalition.

Cílem této koalice je vytvořit standardní sadu metadat, která umožní různým nástrojům pro datové sklady převádět metadata.
Jejich úsilí vyústilo ve zrození specifikace Meta Data Interchange Specification (MDIS), která umožní výměnu informací mezi archivy Microsoftu a souvisejícími soubory MDIS.

Existence dát jak souhrnné/indexované, tak podrobné dávají uživateli možnost provést VRTÁNÍ VRTANÍ (vrtání) z dát indexovány na podrobné a naopak. Existence dát podrobné historie umožňují vytvářet analýzy trendů v čase. Navíc lze analytická metadata použít jako adresář databáze del datový sklad pomoci koncovým uživatelům najít dát nutné.

Ve srovnání se systémy OLTP s jejich schopností podporovat analýzu dát a podávání zpráv, datový sklad je považován za vhodnější systém pro informační procesy, jako je vytváření a odpovídání na dotazy a vytváření zpráv. Následující část podrobně vyzdvihne rozdíly mezi těmito dvěma systémy.

DATOVÝ SKLAD PROTI OLTP SYSTÉMŮM

Mnoho informačních systémů v organizacích je určeno k podpoře každodenního provozu. Tyto systémy známé jako OLTP SYSTEMS zachycují průběžně aktualizované každodenní transakce.

I dát v rámci těchto systémů jsou často upravovány, přidávány nebo odstraňovány. Například adresa zákazníka se mění, když se pohybuje z jednoho místa na druhé. V tomto případě bude nová adresa zaregistrována úpravou pole adresy databáze. Hlavním cílem těchto systémů je snížit transakční náklady a zároveň zkrátit dobu zpracování. Příklady systémů OLTP zahrnují kritické akce, jako je zadávání objednávek, mzdy, faktura, výroba, zákaznický servis zákazníci.

Na rozdíl od systémů OLTP, které byly vytvořeny pro procesy založené na transakcích a událostech, tzn datový sklad byly vytvořeny, aby poskytovaly podporu pro procesy založené na analýze dát a rozhodovací procesy.

Toho je obvykle dosaženo integrací i dát z různých OLTP a externích systémů v jediném „kontejneru“. dát, jak je uvedeno v předchozí části.

Procesní model datového skladu Monash

Procesní model pro datový sklad Monash byl vyvinut výzkumníky z Monash DSS Research Group a je založen na literatuře datový sklad, o zkušenostech s podporou rozvoje oborů systémů, o diskuzích s prodejci aplikací pro použití na datový sklad, o skupině odborníků na používání datový sklad.

Fáze jsou: iniciace, plánování, vývoj, operace a vysvětlení. Diagram vysvětluje iterativní nebo evoluční povahu vývoje a datový sklad proces pomocí obousměrných šipek umístěných mezi různými fázemi. V tomto kontextu „iterativní“ a „evoluční“ znamenají, že v každém kroku procesu se implementační aktivity mohou vždy posunout zpět k předchozí fázi. To je způsobeno povahou projektu datový sklad ve kterém kdykoli vzniknou dodatečné požadavky od koncového uživatele. Například během vývojové fáze procesu datový sklad, je koncovým uživatelem požadována nová dimenze nebo předmětová oblast, která nebyla součástí původního plánu, musí být přidána do systému. To způsobí změnu v projektu. Výsledkem je, že konstrukční tým musí během fáze návrhu změnit požadavky na dosud vytvořené dokumenty. V mnoha případech se aktuální stav projektu musí vrátit do fáze návrhu, kde je třeba přidat a zdokumentovat nový požadavek. Koncový uživatel musí mít možnost vidět revidovanou konkrétní dokumentaci a změny, které byly provedeny ve fázi vývoje. Na konci tohoto vývojového cyklu musí projekt získat vynikající zpětnou vazbu od vývojového i uživatelského týmu. Zpětná vazba je poté znovu použita ke zlepšení budoucího projektu.

Plánovaní kapacity
Dw bývají velmi velké a rostou velmi rychle (Best 1995, Rudin 1997a) v důsledku množství dát historie, které si uchovávají od svého trvání. Růst může být také způsoben dát dodatky požadované uživateli ke zvýšení hodnoty dát že už mají. V souladu s tím požadavky na skladování pro dát může být výrazně zvýšena (Eckerson 1997). Je tedy nezbytné zajistit prováděním kapacitního plánování, že budovaný systém může růst s růstem potřeb (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Při plánování škálovatelnosti databáze je třeba znát očekávaný růst velikosti skladu, typy dotazů, které budou pravděpodobně prováděny, a počet podporovaných koncových uživatelů (Best 1995, Rudin 1997b, Foley 1997a). Vytváření škálovatelných aplikací vyžaduje kombinaci škálovatelných serverových technologií a škálovatelných technik návrhu aplikací (Best 1995, Rudin 1997b. Obojí je nezbytné při budování vysoce škálovatelné aplikace. Technologie škálovatelných serverů může usnadnit a zvýhodnit přidání úložiště, paměti a CPU bez degradace představení (Lang 1997, Telefonie 1997).

Existují dvě hlavní škálovatelné serverové technologie: symetrické vícenásobné zpracování (SMP) a masivní paralelní zpracování (MPP) (IDC 1997, Humphries et al. 1999). SMP server má typicky více procesorů sdílejících paměť, systémovou sběrnici a další zdroje (IDC 1997, Humphries et al. 1999). Pro jeho zvýšení lze přidat další procesory Potenza výpočetní. Další způsob zvýšení Potenza SMP serveru, je kombinovat četné SMP stroje. Tato technika je známá jako shlukování (Humphries et al. 1999). Na druhé straně MPP server má více procesorů, z nichž každý má svou vlastní paměť, sběrnicový systém a další zdroje (IDC 1997, Humphries et al. 1999). Každý procesor se nazývá uzel. Zvýšení v Potenza výpočetní lze dosáhnout

přidání dalších uzlů k MPP serverům (Humphries et al. 1999).

Slabinou SMP serverů je, že příliš mnoho vstupně-výstupních (I/O) operací může zahltit systémovou sběrnici (IDC 1997). Tento problém se nevyskytuje na serverech MPP, protože každý procesor má svůj vlastní sběrnicový systém. Propojení mezi každým uzlem je však obecně mnohem pomalejší než u sběrnicového systému SMP. Servery MPP mohou navíc přidat vývojářům aplikací další úroveň složitosti (IDC 1997). Volbu mezi SMP a MPP servery tedy může ovlivnit mnoho faktorů, včetně složitosti aplikací, poměru cena/výkon, požadované kapacity zpracování, bráněných aplikací dw a nárůstu velikosti databáze dw a v počtu koncových uživatelů.

Při plánování kapacity lze použít mnoho škálovatelných technik návrhu aplikací. Jeden používá různé oznamovací lhůty, jako jsou dny, týdny, měsíce a roky. S různými oznamovacími lhůtami, databáze lze jej rozdělit do ovladatelně seskupených částí (Inmon et al. 1997). Další technikou je použití souhrnných tabulek, které jsou vytvořeny sumarizací dát da dát detailní. Tedy dát shrnuté jsou kompaktnější než podrobné, což vyžaduje méně místa v paměti. Takže dát detailů lze uložit do levnější úložné jednotky, která ušetří ještě více úložného prostoru. Přestože použití souhrnných tabulek může ušetřit místo v paměti, vyžaduje hodně úsilí, aby byly aktuální a v souladu s obchodními potřebami. Tato technika je však široce používána a často používána ve spojení s předchozí technikou (Best 1995, Inmon 1996a, Chauduri a Dayal
1997).

Definování Datový sklad Technické architektury Definice technik dw architektury

První uživatelé datových skladů si primárně představovali centralizovanou implementaci dw, ve které jsou všechny dát, včetně i dát externí, byly integrovány do jednoho,
fyzické úložiště (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Hlavní výhodou tohoto přístupu je, že koncoví uživatelé mají přístup k celopodnikovému pohledu dát organizační (Ovum 1998). Další výhodou je, že nabízí standardizaci dát prostřednictvím organizace, což znamená, že pro každou terminologii používanou v dw úložišti (metadata) existuje pouze jedna verze nebo definice (Flanagan a Safdie 1997, Ovum 1998). Nevýhodou tohoto přístupu na druhou stranu je, že je drahý a složitý na konstrukci (Flanagan a Safdie 1997, Ovum 1998, Inmon et al. 1998). Nedlouho po architektuře úložiště dát centralizovaný se stal populárním, koncept extrahování menších podmnožin se vyvinul dát podporovat potřeby specifických aplikací (Varney 1996, IDC 1997, Berson a Smith 1997, páv 1998). Tyto malé systémy jsou deriváty většího datový sklad centralizované. Jmenují se datový sklad závislé oddělení nebo závislé datové tržiště. Závislá architektura datového trhu je známá jako třívrstvá architektura, kde první vrstva se skládá z datový sklad centralizovaná, druhá se skládá z vkladů dát resortní a třetí se skládá z přístupu k dát a analytickými nástroji (Demarest 1994, Inmon et al. 1997).

Datové trhy se obvykle staví po datový sklad centralizovaný byl postaven tak, aby vyhovoval potřebám konkrétních jednotek (White 1995, Varney 1996).
Úložiště datových trhů i dát velmi relevantní ve vztahu ke konkrétním jednotkám (Inmon a kol. 1997, Inmon a kol. 1998, IA 1998).

Výhodou této metody je, že žádná nebude dat není integrován a že i dát bude méně redundantní v rámci datových trhů jako všechny ostatní dát pocházejí z vkladu dát integrovaný. Další výhodou je, že mezi každým datovým trhem a jeho zdroji bude jen málo spojení dát protože každý datový trh má pouze jeden zdroj dát. Navíc s touto architekturou mají koncoví uživatelé stále přístup k přehledu dát

firemní organizace. Tato metoda je známá jako metoda shora dolů, kde jsou datové tržiště sestaveny po datový sklad (páv 1998, Goff 1998).
S rostoucí potřebou ukazovat výsledky brzy začaly některé organizace budovat nezávislé datové tržiště (Flanagan a Safdie 1997, White 2000). V tomto případě dostanou data marts své dát přímo ze základů dát OLTP a ne z centralizovaného a integrovaného skladu, čímž odpadá nutnost mít centrální sklad na místě.

Každý datový trh vyžaduje alespoň jeden odkaz na jeho zdroje dát. Nevýhodou více připojení pro každý datový trh je to, že ve srovnání s předchozími dvěma architekturami je nadbytek dát výrazně zvyšuje.

Každý datový trh musí ukládat všechny dát vyžaduje lokálně, aby neměly žádný vliv na systémy OLTP. To způsobuje, že i dát jsou uloženy v různých datových tržištích (Inmon et al. 1997). Další nevýhodou této architektury je, že vede k vytváření složitých propojení mezi datovými tržišti a jejich datovými zdroji. dát které je obtížné provádět a kontrolovat (Inmon et al. 1997).

Další nevýhodou je, že koncoví uživatelé nemají přístup k přehledu firemních informací, protože např dát různých datových trhů nejsou integrovány (Ovum 1998).
Další nevýhodou je, že pro každou terminologii používanou v datových tržištích může existovat více než jedna definice, což vytváří nekonzistence dát v organizaci (Ovum 1998).
Navzdory výše uvedeným nevýhodám nezávislé datové tržiště stále přitahují zájem mnoha organizací (IDC 1997). Jedním z faktorů, který je činí atraktivními, je to, že se rychleji vyvíjejí a vyžadují méně času a zdrojů (Bresnahan 1996, Berson a Smith 1997, Ovum 1998). Slouží tedy především jako testovací projekty, které lze použít k rychlé identifikaci přínosů a/nebo nedokonalostí projektu (Parsaye 1995, Braly 1995, Newing 1996). V tomto případě musí být část implementovaná v pilotním projektu malá, ale pro organizaci důležitá (Newing 1996, Mansell-Lewis 1996).

Prozkoumáním prototypu se mohou koncoví uživatelé a administrativa rozhodnout, zda v projektu pokračovat nebo jej zastavit (Flanagan a Safdie 1997).
Pokud má rozhodnutí pokračovat, měly by být datové tržiště pro další průmyslová odvětví budovány jeden po druhém. Pro koncové uživatele existují dvě možnosti na základě jejich potřeb při vytváření nezávislých datových matic: integrované/federované a neintegrované (Ovum 1998)

V první metodě by měl být každý nový datový trh postaven na základě aktuálních datových trhů a modelu dát používá společnost (Varney 1996, Berson a Smith 1997, Peacock 1998). Nutnost použít model dát o společnosti znamená, že musí být zajištěno, že pro každou terminologii používanou napříč datovými tržišti bude existovat pouze jedna definice, což má také zajistit, aby bylo možné kombinovat různé datové tržiště a poskytnout tak přehled informací o společnosti (Bresnahan 1996). Této metodě se říká zdola nahoru a je nejlepší, když jsou omezené finanční prostředky a čas (Flanagan a Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). Ve druhé metodě mohou zkonstruované datové tržiště uspokojit pouze potřeby konkrétní jednotky. Varianta federovaného datového trhu je datový sklad distribuovaný, ve kterém databáze Middleware Hub Server se používá ke sloučení mnoha datových trhů do jednoho úložiště dát distribuován (White 1995). V tomto případě, tj dát společnosti jsou distribuovány v několika data marketech. Požadavky koncových uživatelů jsou předávány na databáze middleware serverového rozbočovače, který extrahuje všechny dát požaduje data marts a vrací výsledky aplikacím koncových uživatelů. Tato metoda poskytuje koncovým uživatelům obchodní informace. Problémy nezávislých datových trhů však stále nejsou odstraněny. Existuje další architektura, kterou lze použít a která se nazývá datový sklad virtuální (White 1995). Tato architektura, která je popsána na obrázku 2.9, však není architekturou pro ukládání dat. dát reálné, protože nepřesouvá načítání ze systémů OLTP do datový sklad (Demarest 1994).

Ve skutečnosti žádosti o dát od koncových uživatelů jsou předávány systémům OLTP, které vracejí výsledky po zpracování uživatelských požadavků. Ačkoli tato architektura umožňuje koncovým uživatelům generovat zprávy a zadávat požadavky, nemůže poskytnout

dát historie a přehled informací o společnosti od i dát z různých systémů OLTP nejsou integrovány. Proto tato architektura nemůže uspokojit analýzu dát složité, jako jsou předpovědi.

Výběr aplikací pro přístup a obnovu dát

Účel stavby a datový sklad je předat informace koncovým uživatelům (Inmon a kol. 1997, Poe 1996, McFadden 1996, Shanks a kol. 1997, Hammergren 1998); jednu nebo více aplikací pro přístup a obnovu dát musí být poskytnuto. K dnešnímu dni existuje široká škála těchto aplikací, ze kterých si uživatel může vybrat (Hammergren 1998, Humphries et al. 1999). Aplikace, které vyberete, určují úspěšnost vašeho úsilí o skladování dát v organizaci, protože aplikace jsou nejviditelnější součástí datový sklad koncovému uživateli (Inmon et al. 1997, Poe 1996). Být úspěšný a datový sklad, musí být schopen podporovat analytické činnosti dát koncového uživatele (Poe 1996, Seddon a Benjamin 1998, Eckerson 1999). Musí být tedy identifikována „úroveň“ toho, co koncový uživatel chce (Poe 1996, Mattison 1996, Inmon a kol. 1997, Humphries a kol. 1999).

Obecně lze koncové uživatele seskupit do tří kategorií: výkonní uživatelé, obchodní analytici a pokročilí uživatelé (Poe 1996, Humphries et al. 1999). Výkonní uživatelé potřebují snadný přístup k předdefinovaným sadám zpráv (Humphries et al. 1999). K těmto poměrům lze snadno přistupovat pomocí navigace v nabídce (Poe 1996). Kromě toho by zprávy měly prezentovat informace pomocí grafického znázornění, jako jsou tabulky a šablony pro rychlé předání informací (Humphries et al. 1999). Obchodní analytici, kteří nemusí mít technické schopnosti k tomu, aby samostatně vyvíjeli zprávy od nuly, musí být schopni upravit aktuální zprávy tak, aby vyhovovaly jejich specifickým potřebám (Poe 1996, Humphries et al. 1999). Na druhé straně pokročilí uživatelé jsou typem koncových uživatelů, kteří mají schopnost generovat a psát požadavky a zprávy od nuly (Poe 1996, Humphries et al. 1999). Jsou to oni, kdo

vyvíjejí zprávy pro jiné typy uživatelů (Poe 1996, Humphries et al. 1999).

Jakmile budou stanoveny požadavky koncového uživatele, je třeba provést výběr aplikací pro přístup a obnovu dát mezi všemi dostupnými (Poe 1996, Inmon et al. 1997).
Přístup k dát a vyhledávací nástroje lze rozdělit do 4 typů: nástroje OLAP, nástroje EIS/DSS, nástroje pro dotazy a sestavování a nástroje pro dolování dat.

Nástroje OLAP umožňují uživatelům vytvářet dotazy ad hoc i dotazy vytvořené na databáze del datový sklad. Tyto produkty navíc umožňují uživatelům procházet z nich dát obecné až po podrobné.

Nástroje EIS/DSS poskytují výkonné reporty, jako je analýza „co kdyby“ a přístup k reportům řízeným menu. Přehledy by měly být předdefinovány a sloučeny s nabídkami pro snazší navigaci.
Dotazovací a reportovací nástroje umožňují uživatelům vytvářet předdefinované a specifické reporty.

Nástroje pro dolování dat se používají k identifikaci vztahů, které by mohly vrhnout nové světlo na zapomenuté operace v dát datového skladu.

Kromě optimalizace požadavků každého typu uživatele musí být vybrané nástroje intuitivní, efektivní a snadno použitelné. Musí být také kompatibilní s ostatními částmi architektury a schopné pracovat se stávajícími systémy. Doporučuje se také zvolit nástroje pro přístup k datům a jejich vyhledávání s rozumnými cenami a výkonem. Mezi další kritéria, která je třeba zvážit, patří závazek dodavatele nástroje podporovat jejich produkt a jak se bude vyvíjet v budoucích verzích. Aby bylo zajištěno zapojení uživatelů do používání datového skladu, zapojuje vývojový tým uživatele do procesu výběru nástroje. V tomto případě by mělo být provedeno praktické hodnocení uživatele.

Pro zvýšení hodnoty datového skladu může vývojový tým také poskytnout webový přístup ke svému datovému skladu. Webový datový sklad umožňuje uživatelům přístup dát ze vzdálených míst nebo na cestách. Také informace mohou

být poskytovány s nižšími náklady díky snížení nákladů na školení.

2.4.3 Datový sklad Fáze provozu

Tato fáze se skládá ze tří činností: definice strategií obnovy dat, kontrola činností datového skladu a správa zabezpečení datového skladu.

Definice strategií obnovy dat

Po počátečním nahrávání, tj dát v databáze datového skladu se musí pravidelně obnovovat, aby se reprodukovaly změny, které v nich byly provedeny dát originály. Musíte se proto rozhodnout, kdy se má obnovovat, jak často má být obnovování naplánováno a jak obnovovat data dát. Doporučuje se obnovit dát kdy lze systém přepnout do režimu offline. Frekvenci obnovování určuje vývojový tým na základě požadavků uživatelů. Existují dva přístupy k obnově datového skladu: kompletní obnova a průběžné načítání změn.

První přístup, úplné obnovení, vyžaduje opětovné načtení všech dát od nuly. To znamená, že vše dát požadované musí být extrahovány, vyčištěny, transformovány a integrovány do každého obnovení. Tomuto přístupu je třeba se pokud možno vyhnout, protože vyžaduje mnoho času a zdrojů.

Alternativním přístupem je průběžně nahrávat změny. To přidává i dát které byly změněny od posledního cyklu obnovy datového skladu. Identifikace nových nebo upravených záznamů výrazně snižuje množství dát které musí být šířeny do datového skladu při každé aktualizaci, protože pouze tyto dát bude přidán do databáze datového skladu.

Existuje alespoň 5 přístupů, které lze použít pro stažení i dát nové nebo upravené. Chcete-li získat efektivní strategii obnovy dat dát užitečná může být směs těchto přístupů, která zachycuje všechny změny v systému.

První přístup, který používá časová razítka, předpokládá, že jsou přiřazeny všechny dát upravili a aktualizovali časové razítko, abyste je mohli snadno identifikovat dát upravené a nové. Tento přístup však nebyl ve většině dnešních operačních systémů široce používán.
Druhým přístupem je použití delta souboru generovaného aplikací, který obsahuje pouze provedené změny dát. Použití tohoto souboru také zesiluje cyklus aktualizace. Ani tato metoda však nebyla v mnoha aplikacích použita.
Třetím přístupem je skenování souboru protokolu, který v zásadě obsahuje informace podobné souboru delta. Jediný rozdíl je v tom, že pro proces obnovy je vytvořen soubor protokolu a může být obtížné mu porozumět.
Čtvrtým přístupem je úprava kódu aplikace. Většina aplikačního kódu je však stará a křehká; proto je třeba se této technice vyhnout.
Posledním přístupem je srovnání dát zdroje s hlavním souborem dei dát.

Řízení činností datového skladu

Jakmile je datový sklad uvolněn uživatelům, musí být v průběhu času monitorován. V tomto případě může správce datového skladu využít jeden nebo více nástrojů pro správu a kontrolu ke sledování využití datového skladu. Zejména lze shromažďovat informace o lidech a době, ve které přistupují do datového skladu. Pojď dát shromážděné, lze vytvořit profil provedené práce, který lze použít jako vstup do implementace zpětného zúčtování uživatele. Chargeback umožňuje uživatelům být informováni o nákladech na zpracování datového skladu.

Kromě toho lze audit datového skladu také použít k identifikaci typů dotazů, jejich velikosti, počtu dotazů za den, reakční doby dotazu, dosažených sektorů a množství dotazů. dát zpracováno. Dalším účelem provádění auditu datového skladu je identifikace dát které se nepoužívají. Tyto dát mohou být odstraněny z datového skladu, aby se zlepšil čas

reakce na provedení dotazu a řízení růstu dát kteří bydlí v databáze datového skladu.

Správa zabezpečení datového skladu

Datový sklad obsahuje dát integrované, kritické, citlivé, snadno dosažitelné. Z tohoto důvodu by měl být chráněn před neoprávněnými uživateli. Jedním ze způsobů implementace zabezpečení je použití funkce del DBMS přidělovat různá oprávnění různým typům uživatelů. Tímto způsobem musí být pro každý typ uživatele udržován přístupový profil. Dalším způsobem, jak zabezpečit datový sklad, je zašifrovat jej tak, jak je napsáno v databáze datového skladu. Přístup k dát a vyhledávací nástroje musí dešifrovat dát před prezentováním výsledků uživatelům.

2.4.4 Datový sklad Fáze nasazení

Je to poslední fáze v cyklu implementace datového skladu. Činnosti, které je třeba v této fázi provést, zahrnují školení uživatelů k používání datového skladu a provádění kontrol datového skladu.

Školení uživatelů

Uživatelské školení by mělo být provedeno před přístupem k dát datového skladu a používání nástrojů pro vyhledávání. Obecně by sezení měla začínat úvodem do konceptu úložiště dát, obsah datového skladu, meta dát a základní vlastnosti nástrojů. Pokročilejší uživatelé by pak také mohli studovat fyzické tabulky a uživatelské funkce nástrojů pro přístup k datům a jejich získávání.

Existuje mnoho přístupů k provádění školení uživatelů. Jedním z nich je výběr mnoha uživatelů nebo analytiků vybraných ze skupiny uživatelů na základě jejich vůdčích a komunikačních schopností. Jsou osobně vyškoleni na vše, co potřebují vědět, aby se se systémem seznámili. Jakmile školení skončí, vrátí se ke své práci a začnou učit ostatní uživatele, jak systém používat. Na

Na základě toho, co se naučili, mohou ostatní uživatelé začít prozkoumávat datový sklad.
Dalším přístupem je vyškolit mnoho uživatelů současně, jako byste absolvovali kurz ve třídě. Tato metoda je vhodná, když je současně mnoho uživatelů, kteří potřebují školení. Další metodou je trénovat každého uživatele individuálně, jednoho po druhém. Tato metoda je vhodná, když je málo uživatelů.

Účelem školení uživatelů je seznámit vás s přístupem k dát a nástroje pro vyhledávání a také obsah datového skladu. Někteří uživatelé však mohou být zahlceni množstvím informací poskytnutých během školení. Proto je nutné provést určitý počet opakovacích sezení za účelem průběžné pomoci a zodpovězení konkrétních otázek. V některých případech je vytvořena uživatelská skupina, která poskytuje tento typ podpory.

Shromažďování zpětné vazby

Po zavedení datového skladu mohou uživatelé používat i dát které jsou umístěny v datovém skladu pro různé účely. Většinou analytici nebo uživatelé používají i dát v datovém skladu pro:

  1. 1 Identifikujte trendy společnosti
  2. 2 Analyzujte nákupní profily zákazníci
  3. 3 Rozdělit i zákazníci a
  4. 4 Poskytujte ty nejlepší služby zákazníci - přizpůsobit služby
  5. 5 Formulujte strategie marketing
  6. 6 Poskytujte konkurenceschopné cenové nabídky pro analýzy nákladů a pomoc s kontrolou
  7. 7 Podpora strategického rozhodování
  8. 8 Identifikujte příležitosti, jak vyniknout
  9. 9 Zlepšit kvalitu současných obchodních procesů
  10. 10 Zkontrolujte zisk

V návaznosti na směr vývoje datového skladu by mohla být provedena řada kontrol systému za účelem získání zpětné vazby

jak od vývojového týmu, tak od komunity koncových uživatelů.
Získané výsledky lze vzít v úvahu pro další vývojový cyklus.

Vzhledem k tomu, že datový sklad má inkrementální přístup, je zásadní poučit se z úspěchů a chyb předchozího vývoje.

2.5 Shrnutí

V této kapitole byly diskutovány přístupy uvedené v literatuře. V části 1 byl diskutován koncept datového skladu a jeho role v rozhodovací vědě. Část 2 popisuje hlavní rozdíly mezi datovými sklady a systémy OLTP. V části 3 jsme diskutovali o modelu datového skladu Monash, který byl v části 4 použit k popisu činností spojených s procesem vývoje datového skladu, tyto teze nebyly založeny na rigorózním výzkumu. To, co se děje ve skutečnosti, se může velmi lišit od toho, co uvádí literatura, nicméně tyto výsledky lze použít k vytvoření základního pozadí, které podtrhuje koncept datového skladu pro tento výzkum.

Kapitola 3

Výzkumné a konstrukční metody

Tato kapitola se zabývá metodami výzkumu a návrhu této studie. První část ukazuje obecný pohled na dostupné výzkumné metody pro vyhledávání informací, dále jsou diskutována kritéria pro výběr nejlepší metody pro konkrétní studii. V části 2 jsou poté diskutovány dvě metody vybrané s právě uvedenými kritérii; z nich bude vybráno a přijato jedno s důvody uvedenými v části 3, kde jsou uvedeny i důvody pro vyloučení druhého kritéria. Část 4 představuje návrh výzkumu a část 5 závěry.

3.1 Výzkum informačních systémů

Výzkum v oblasti informačních systémů není omezen pouze na technologickou oblast, ale musí být rozšířen tak, aby zahrnoval behaviorální a organizační účely.
Vděčíme za to tezím různých oborů od společenských až po přírodní; to vede k potřebě určitého spektra výzkumných metod zahrnujících kvantitativní a kvalitativní metody pro informační systémy.
Všechny dostupné výzkumné metody jsou důležité, ve skutečnosti několik výzkumníků jako Jenkins (1985), Nunamaker et al. (1991) a Galliers (1992) tvrdí, že neexistuje žádná konkrétní univerzální metoda pro provádění výzkumu v různých oblastech informačních systémů; ve skutečnosti může být metoda vhodná pro určitý výzkum, ale ne pro ostatní. To nám přináší potřebu vybrat metodu, která je vhodná pro náš konkrétní výzkumný projekt: pro tuto volbu Benbasat et al. (1987) uvádí, že je třeba zvážit povahu a účel výzkumu.

3.1.1 Povaha výzkumu

Různé metody založené na povaze výzkumu lze rozdělit do tří tradic široce známých v informační vědě: pozitivistický, interpretační a kritický výzkum.

3.1.1.1 Pozitivní výzkum

Pozitivistický výzkum je také známý jako vědecká nebo empirická studie. Snaží se: „vysvětlit a předpovědět, co se stane v sociálním světě tím, že se podíváme na zákonitosti a vztahy příčiny a následku mezi prvky, které jej tvoří“ (Shanks et al 1993).

Pozitivistický výzkum se také vyznačuje opakovatelností, zjednodušováním a vyvracením. Pozitivistický výzkum navíc připouští existenci apriorních vztahů mezi zkoumanými jevy.
Podle Gallierse (1992) je taxonomie výzkumnou metodou zahrnutou do pozitivistického paradigmatu, které se však neomezuje pouze na toto, ve skutečnosti jde o laboratorní experimenty, terénní experimenty, případové studie, demonstrace teorémů, predikce a simulace. Použitím těchto metod výzkumníci připouštějí, že zkoumané jevy lze pozorovat objektivně a důsledně.

3.1.1.2 Interpretační výzkum

Interpretační výzkum, který je často nazýván fenomenologií nebo antipozitivismem, popisuje Neuman (1994) jako „systematickou analýzu sociálního významu jednání prostřednictvím přímého a podrobného pozorování lidí v přirozených situacích s cílem dospět k porozumění a k výkladu toho, jak lidé vytvářejí a udržují svůj sociální svět“. Interpretační studie odmítají předpoklad, že pozorované jevy lze pozorovat objektivně. Ve skutečnosti jsou založeny na subjektivních interpretacích. Kromě toho interpretační badatelé nevnucují a priori významy jevům, které studují.

Tato metoda zahrnuje subjektivní/argumentativní studie, akční výzkum, deskriptivní/interpretační studie, budoucí výzkum a hraní rolí. Kromě těchto průzkumů lze do tohoto přístupu zahrnout případové studie, protože se týkají studií jednotlivců nebo organizací ve složitých situacích reálného světa.

3.1.1.3 Kritický výzkum

Kritické bádání je nejméně známým přístupem ve společenských vědách, ale nedávno se mu dostalo pozornosti výzkumníků informačních systémů. Filosofický předpoklad, že sociální realita je historicky produkována a reprodukována lidmi, stejně jako sociální systémy s jejich akcemi a interakcemi. Jejich schopnost je však zprostředkována řadou sociálních, kulturních a politických úvah.

Stejně jako interpretační výzkum i kritický výzkum tvrdí, že pozitivistický výzkum nemá nic společného se sociálním kontextem a ignoruje jeho vliv na lidské jednání.
Kritický výzkum na druhé straně kritizuje interpretační výzkum za to, že je příliš subjektivní a že si neklade za cíl pomoci lidem zlepšit jejich životy. Největší rozdíl mezi kritickým výzkumem a ostatními dvěma přístupy je v jeho evaluační dimenzi. Zatímco objektivitou pozitivistické a interpretační tradice je předvídat nebo vysvětlovat status quo nebo sociální realitu, kritický výzkum si klade za cíl kriticky zhodnotit a transformovat zkoumanou sociální realitu.

Kritici se obvykle staví proti status quo, aby odstranili sociální rozdíly a zlepšili sociální podmínky. Kritický výzkum se zavazuje k procesuálnímu pohledu na jevy, které nás zajímají, a proto je obvykle longitudinální. Příkladem výzkumných metod jsou dlouhodobé historické studie a etnografické studie. Kritický výzkum však nebyl široce používán ve výzkumu informačních systémů

3.1.2 Účel výzkumu

Spolu s povahou výzkumu může být jeho účel použit jako vodítko pro výzkumníka při výběru konkrétní výzkumné metody. Účel výzkumného projektu úzce souvisí s pozicí výzkumu ve vztahu k výzkumnému cyklu, který se skládá ze tří fází: budování teorie, testování teorie a upřesňování teorie. Na základě načasování výzkumného cyklu tak může mít výzkumný projekt explanační, popisný, průzkumný nebo prediktivní účel.

3.1.2.1 Průzkumný výzkum

Explorativní výzkum si klade za cíl prozkoumat zcela nové téma a formulovat otázky a hypotézy pro budoucí výzkum. Tento typ výzkumu se používá při budování teorie k získání počátečních referencí v nové oblasti. Typicky se používají metody kvalitativního výzkumu, jako jsou případové studie nebo fenomenologické studie.

Je však také možné použít kvantitativní techniky, jako jsou průzkumné průzkumy nebo experimenty.

3.1.3.3 Popisný výzkum

Deskriptivní výzkum má za cíl analyzovat a velmi podrobně popsat konkrétní organizační situaci nebo praxi. To je vhodné pro budování teorií a může být také použito k potvrzení nebo zpochybnění hypotéz. Deskriptivní výzkum obvykle zahrnuje použití opatření a vzorků. Mezi nejvhodnější výzkumné metody patří průzkumy a analýzy předchůdců.

3.1.2.3 Vysvětlující výzkum

Vysvětlující výzkum se snaží vysvětlit, proč se věci dějí. Je postaven na již prozkoumaných skutečnostech a snaží se najít důvody těchto skutečností.
Explanační výzkum je tedy obvykle postaven na průzkumném nebo deskriptivním výzkumu a je doplňkem k testování a zpřesňování teorií. Vysvětlující výzkum obvykle využívá případové studie nebo výzkumné metody založené na průzkumu.

3.1.2.4 Preventivní výzkum

Preventivní výzkum má za cíl předpovídat sledované události a chování, které jsou studovány (Marshall a Rossman 1995). Předpověď je standardní vědecký test pravdy. Tento typ výzkumu obecně využívá průzkumy nebo analýzy dát historici. (Jin 1989)

Výše uvedená diskuse ukazuje, že existuje řada možných výzkumných metod, které lze v konkrétní studii použít. Musí však existovat jedna konkrétní metoda, která je pro konkrétní typ výzkumného projektu vhodnější než ostatní. (Galliers 1987, Yin 1989, De Vaus 1991). Každý výzkumník proto musí pečlivě zhodnotit silné a slabé stránky různých metod, aby mohl přijmout nejvhodnější a kompatibilní výzkumnou metodu s výzkumným projektem. (Jenkins 1985, Pervan a Klass 1992, Bonomia 1985, Yin 1989, Himilton a Ives 1992).

3.2. Možné výzkumné metody

Cílem tohoto projektu bylo studovat zkušenosti australských organizací s i dát uloženy s vývojem datový sklad. Dato že v současné době v Austrálii chybí výzkum v oblasti datových skladů, je tento výzkumný projekt stále v teoretické fázi výzkumného cyklu a má průzkumný účel. Zkoumání zkušeností v australských organizacích přijímajících datové sklady vyžaduje interpretaci skutečné společnosti. V důsledku toho se filozofický předpoklad, který je základem výzkumného projektu, řídí tradičním výkladem.

Po rigorózním zkoumání dostupných metod byly identifikovány dvě možné výzkumné metody: průzkumy a případové studie, které lze použít pro explorativní výzkum (Shanks et al. 1993). Galliers (1992) ve své revidované taxonomii argumentuje pro vhodnost těchto dvou metod pro tuto konkrétní studii tím, že jsou vhodné pro vytváření teorie. Následující dvě podkapitoly podrobně pojednávají o každé metodě.

3.2.1 Metoda vyšetřovacího výzkumu

Metoda průzkumu pochází z antické metody sčítání lidu. Sčítání lidu spočívá ve shromažďování informací od celé populace. Tato metoda je drahá a nepraktická, zvláště pokud je populace velká. Ve srovnání se sčítáním se tedy průzkum obvykle zaměřuje na sběr informací pro malý počet nebo vzorek zástupců populace (Fowler 1988, Neuman 1994). Vzorek odráží populaci, ze které je čerpán, s různou úrovní přesnosti v závislosti na struktuře vzorku, velikosti a použité metodě výběru (Fowler 1988, Babbie 1982, Neuman 1994).

Metoda průzkumu je definována jako „snímky postupů, situací nebo názorů v určitém časovém okamžiku, provedené pomocí dotazníků nebo rozhovorů, ze kterých lze vyvodit závěry.
made“ (Galliers 1992:153) [snímek praktik, situací nebo pohledů v určitém časovém okamžiku, provedené pomocí dotazníků nebo rozhovorů, ze kterých lze vyvozovat závěry]. Průzkumy se zabývají shromažďováním informací o některých aspektech studie od určitého počtu účastníků kladením otázek (Fowler 1988). Tyto dotazníky a rozhovory, které zahrnují osobní telefonické rozhovory a strukturované rozhovory, jsou také technikami sběru dát nejčastěji používané při vyšetřování (Blalock 1970, Nachmias a Nachmias 1976, Fowler 1988), lze použít pozorování a analýzy (Gable 1994). Ze všech těchto metod sběru dát, použití dotazníku je nejoblíbenější technikou, protože zajišťuje, že i dát

shromážděné informace jsou strukturovány a formátovány, a proto usnadňuje klasifikaci informací (Hwang 1987, de Vaus 1991).

Při analýze dát, strategie vyšetřování často využívá kvantitativní techniky, jako je statistická analýza, ale lze použít i kvalitativní techniky (Galliers 1992, Pervan

a Klass 1992, Gable 1994). Normálně, i dát shromážděné se používají k analýze distribucí a vzorců asociací (Fowler 1988).

Ačkoli jsou průzkumy obecně vhodné pro výzkum zabývající se otázkou 'co?' (co) nebo z toho odvozené, např. „kolik“ a „kolik“, je lze položit prostřednictvím otázky „proč“ (Sonquist a Dunkelberg 1977, Yin 1989). Podle Sonquista a Dunkelberga (1977) se zjišťovací výzkum zaměřuje na zpochybňování hypotéz, hodnocení programů, popis populace a vývoj modelů lidského chování. Dále lze průzkumy použít ke studiu určitého názoru populace, podmínek, názorů, charakteristik, očekávání a dokonce i minulého nebo současného chování (Neuman 1994).

Průzkumy umožňují výzkumníkovi objevit vztahy mezi populací a výsledky jsou obvykle obecnější než jiné metody (Sonquist a Dunkelberg 1977, Gable 1994). Průzkumy umožňují výzkumníkům pokrýt větší geografickou oblast a oslovit mnoho respondentů (Blalock 1970, Sonquist a Dunkelberg 1977, Hwang a Lin 1987, Gable 1994, Neuman 1994). A konečně, průzkumy mohou poskytnout informace, které nejsou dostupné jinde nebo ve formě požadované pro analýzy (Fowler 1988).

Při provádění průzkumu však existují určitá omezení. Nevýhodou je, že výzkumník nemůže získat mnoho informací o studovaném objektu. Důvodem je skutečnost, že průzkumy se provádějí pouze v určitém čase, a proto existuje omezený počet proměnných a lidí, které výzkumník může

studie (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Další nevýhodou je, že provádění průzkumu může být velmi nákladné z hlediska času a zdrojů, zejména pokud zahrnuje osobní rozhovory (Fowler 1988).

3.2.2. Metoda vyšetřovacího výzkumu

Výzkumná metoda dotazování zahrnuje hloubkové studium konkrétní situace v kontextu jejího reálného světa po definované časové období, bez jakéhokoli zásahu ze strany výzkumníka (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Tato metoda se používá především k popisu vztahů mezi proměnnými, které jsou studovány v konkrétní situaci (Galliers 1992). Vyšetřování může zahrnovat jeden nebo více případů v závislosti na analyzovaném jevu (Franz a Robey 1987, Eisenhardt 1989, Yin 1989).

Výzkumná metoda dotazování je definována jako „empirické zkoumání, které studuje současný jev v jeho aktuálním kontextu s využitím více zdrojů shromážděných od jedné nebo více entit, jako jsou lidé, skupiny nebo organizace“ (Yin 1989). Neexistuje žádné jasné oddělení mezi jevem a jeho kontextem a neexistuje žádná experimentální kontrola nebo manipulace s proměnnými (Yin 1989, Benbasat et al. 1987).

Existuje řada technik pro sběr dát které lze použít v metodě dotazování, která zahrnuje přímé pozorování, revize archiválií, dotazníky, kontrolu dokumentace a strukturované rozhovory. Disponujeme širokou škálou technik sklizně dátvýzkumy umožňují výzkumníkům zabývat se oběma dát kvalitativní i kvantitativní zároveň (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Stejně jako je tomu u metody průzkumu, výzkumný pracovník slouží jako pozorovatel nebo výzkumník, nikoli jako aktivní účastník ve zkoumané organizaci.

Benbasat a kol.

teorie během procesu sběru dát. Být vhodný i na jeviště

z budování teorie Franz a Robey (1987) navrhují, že metodu dotazování lze použít i pro fázi komplexní teorie. V tomto případě je na základě shromážděných důkazů daná teorie nebo hypotéza ověřena nebo vyvrácena. Průzkum je navíc vhodný i pro výzkum zabývající se otázkami „jak“ nebo „proč“ (Yin 1989).

Ve srovnání s jinými metodami umožňují průzkumy výzkumníkovi podrobněji zachytit podstatné informace (Galliers 1992, Shanks et al. 1993). Průzkumy navíc umožňují výzkumníkovi porozumět povaze a složitosti studovaných procesů (Benbasat et al. 1987).

S metodou průzkumu jsou spojeny čtyři hlavní nevýhody. Prvním je nedostatek řízených odpočtů. Subjektivita výzkumníka může změnit výsledky a závěry studie (Yin 1989). Druhou nevýhodou je chybějící kontrolované pozorování. Na rozdíl od experimentálních metod nemůže badatel kontrolovat studované jevy, protože jsou zkoumány v jejich přirozeném kontextu (Gable 1994). Třetí nevýhodou je nedostatečná replikovatelnost. Je to proto, že výzkumník pravděpodobně nebude pozorovat stejné události a nemůže ověřit výsledky konkrétní studie (Lee 1989). Konečně, v důsledku nereplikovatelnosti je obtížné zobecnit výsledky získané jedním nebo více výzkumy (Galliers 1992, Shanks et al 1993). Všechny tyto problémy však nejsou nepřekonatelné a výzkumník je může ve skutečnosti minimalizovat aplikací vhodných opatření (Lee 1989).

3.3. Zdůvodněte metodologii výzkumu přijato

Ze dvou možných výzkumných metod pro tuto studii je metoda průzkumu považována za nejvhodnější. Šetření bylo po pečlivém zvážení relevantních vyřazeno

přednosti a slabosti. Vhodnost nebo nevhodnost každé metody pro tuto studii je diskutována níže.

3.3.1. Nevhodná metoda výzkumu dotazu

Metoda dotazování vyžaduje hloubkovou studii o konkrétní situaci v rámci jedné nebo více organizací po určité časové období (Eisenhardt 1989). V tomto případě může lhůta přesáhnout časový rámec stanovený pro tuto studii. Dalším důvodem pro nepřijetí metody průzkumu je, že výsledky mohou trpět nedostatečnou přesností (Yin 1989). Subjektivita výzkumníka může ovlivnit výsledky a závěry. Dalším důvodem je, že tato metoda je vhodnější pro výzkum otázek typu „jak“ nebo „proč“ (Yin 1989), zatímco výzkumná otázka pro tuto studii je typu „co“. V neposlední řadě je obtížné zobecnit poznatky z jednoho nebo několika výzkumů (Galliers 1992, Shanks et al. 1993). Na základě tohoto zdůvodnění nebyla zvolena metoda průzkumu, protože byla pro tuto studii nevhodná.

3.3.2. Pohodlí výzkumné metody vyšetřování

Když byl tento výzkum prováděn, praxe datových skladů nebyla široce přijata australskými organizacemi. O jejich implementaci v australských organizacích tedy nebylo mnoho informací. Dostupné informace pocházejí od organizací, které zavedly nebo použily a datový sklad. V tomto případě je nejvhodnější metoda průzkumu, protože umožňuje získat informace, které nejsou dostupné jinde nebo ve formě požadované pro analýzu (Fowler 1988). Výzkumná metoda průzkumu navíc umožňuje výzkumníkovi získat dobrý náhled na praktiky, situace nebo názory v konkrétní době (Galliers 1992, Denscombe 1998). Pro zvýšení znalostí o zkušenostech s australským datovým skladem byl vyžadován přehled.

Dále Sonquist a Dunkelberg (1977) uvádějí, že výsledky průzkumového výzkumu jsou obecnější než jiné metody.

3.4. Návrh průzkumného výzkumu

Průzkum o praktikách datového skladu byl proveden v roce 1999. Cílovou populaci tvořily australské organizace, které se zajímaly o studie datových skladů, protože pravděpodobně již byly informovány o dát které uchovávají, a proto by mohly poskytnout užitečné informace pro tuto studii. Cílová populace byla identifikována prostřednictvím počátečního průzkumu mezi všemi australskými členy The Data Warehousing Institute (Tdwi-aap). Tato část pojednává o návrhu fáze empirického výzkumu této studie.

3.4.1. Technika sběru dát

Ze tří technik běžně používaných v průzkumném výzkumu (tj. poštovní dotazník, telefonický rozhovor a osobní rozhovor) (Nachmias 1976, Fowler 1988, de Vaus 1991) byl pro tuto studii převzat poštovní dotazník. Prvním důvodem pro přijetí posledně jmenovaného je, že může oslovit geograficky rozptýlenou populaci (Blalock 1970, Nachmias a Nachmias 1976, Hwang a Lin 1987, de Vaus 1991, Gable 1994). Za druhé, poštovní dotazník je vhodný pro vysoce vzdělané účastníky (Fowler 1988). E-mailový dotazník pro tuto studii byl adresován sponzorům projektu datového skladu, ředitelům a/nebo projektovým manažerům. Za třetí, poštovní dotazníky jsou vhodné, pokud je k dispozici zabezpečený seznam adresátů (Salant a Dilman 1994). TDWI, v tomto případě sdružení důvěryhodných datových skladů, poskytlo seznam adresátů svých australských členů. Další výhodou poštovního dotazníku oproti telefonnímu dotazníku nebo osobním rozhovorům je to, že umožňuje respondentům odpovídat přesněji, zvláště když si respondenti musí prohlížet poznámky nebo diskutovat o otázkách s jinými lidmi (Fowler 1988).

Potenciální nevýhodou může být čas potřebný k vyřízení dotazníků poštou. Obvykle se poštovní průzkum provádí v tomto pořadí: poštovní dopisy, čekání na odpovědi a odeslání potvrzení (Fowler 1988, Bainbridge 1989). Celková doba tedy může být delší než doba potřebná pro osobní pohovory nebo telefonické pohovory. Celkový čas však lze znát předem (Fowler 1988, Denscombe 1998). Čas strávený prováděním osobních rozhovorů nelze předem znát, protože se liší od jednoho rozhovoru k druhému (Fowler 1988). Telefonické rozhovory mohou být rychlejší než poštovní dotazníky a osobní rozhovory, ale mohou mít vysokou míru neodpovědí kvůli nedostupnosti některých lidí (Fowler 1988). Telefonické rozhovory jsou navíc obecně omezeny na relativně krátké seznamy otázek (Bainbridge 1989).

Další slabinou poštovního dotazníku je vysoká míra neodpovědí (Fowler 1988, Bainbridge 1989, Neuman 1994). Byla však přijata protiopatření spojením této studie s důvěryhodnou institucí pro ukládání dat (tj. TDWI) (Bainbridge 1989, Neuman 1994), která zasílá dva upomínkové dopisy nereagujícím (Fowler 1988, Neuman 1994) a obsahuje také další dopis vysvětlující účel studie (Neuman 1994).

3.4.2. Jednotka analýzy

Účelem této studie je získat informace o implementaci datového skladu a jeho využití v rámci australských organizací. Cílovou populaci tvoří všechny australské organizace, které zavedly nebo zavádějí, tzn datový sklad. Jednotlivé organizace jsou pak registrovány na jméno. Dotazník byl zaslán poštou organizacím, které měly zájem o přijetí datový sklad. Tato metoda zajišťuje, že shromážděné informace pocházejí z nejvhodnějších zdrojů každé zúčastněné organizace.

3.4.3. Ukázka průzkumu

„Seznam adresátů“ účastníků průzkumu byl získán od TDWI. Z tohoto seznamu bylo vybráno 3000 australských organizací jako základ pro výběr vzorků. Vzorku byl zaslán doplňující dopis vysvětlující projekt a účel průzkumu spolu s odpovědním archem a předplacenou obálkou pro vrácení vyplněného dotazníku. Z 3000 organizací souhlasilo s účastí ve studii 198. Tak malý počet odpovědí se očekával dat velký počet australských organizací, které tehdy přijaly nebo přijaly strategii datového skladu ve svých organizacích. Cílovou populaci pro tuto studii tedy tvoří pouze 198 organizací.

3.4.4. Obsah dotazníku

Struktura dotazníku byla založena na modelu datového skladu Monash (diskutováno dříve v části 2.3). Obsah dotazníku vycházel z analýzy literatury uvedené v kapitole 2. Kopii dotazníku zaslaného účastníkům průzkumu naleznete v příloze B. Dotazník se skládá ze šesti částí, které sledují jednotlivé fáze modelu. Následujících šest odstavců stručně shrnuje obsah každé části.

Sekce A: Základní informace o organizaci
Tato část obsahuje otázky týkající se profilu zúčastněných organizací. Některé z otázek se navíc týkají stavu projektu datového skladu účastníka. Důvěrné informace, jako je název organizace, nebyly v analýze průzkumu odhaleny.

Sekce B: Start
Otázky v této části souvisejí s úkolem spustit datové sklady. Byly položeny otázky týkající se iniciátorů projektu, garantů, požadovaných dovedností a znalostí, cílů rozvoje datových skladů a očekávání koncových uživatelů.

Sekce C: Design
Tato část obsahuje otázky týkající se plánování činností datový sklad. Otázky se týkaly zejména rozsahu realizace, doby trvání projektu, nákladů na projekt a analýzy nákladů a přínosů.

Sekce D: Vývoj
V sekci rozvoje jsou otázky týkající se rozvojových aktivit společnosti datový sklad: sbírka požadavků koncových uživatelů, zdroje dát, logický model dát, prototypy, kapacitní plánování, technické architektury a výběr nástrojů pro vývoj datových skladů.

Sekce E: Provoz
Provozní otázky související s provozem a rozšiřitelností datový sklad, jak se vyvíjí v další fázi vývoje. Tam kvalita dat, obnovovací strategie dát, zrnitost dát, škálovatelnost datový sklad a bezpečnostní otázky datový sklad patřily mezi typy kladených otázek.

Sekce F: Vývoj
Tato část obsahuje otázky související s používáním datový sklad koncovými uživateli. Výzkumníka zajímal účel a užitečnost datový skladpřijaté strategie přezkoumání a školení a strategie kontroly datový sklad adoptoval.

3.4.5. Míra odpovědi

Ačkoli jsou poštovní průzkumy kritizovány za nízkou míru odezvy, byla přijata opatření ke zvýšení míry návratnosti (jak bylo uvedeno dříve v části 3.4.1). Termín „míra odpovědí“ označuje procento lidí v konkrétním vzorku průzkumu, kteří odpovídají na dotazník (Denscombe 1998). Pro výpočet míry odezvy pro tuto studii byl použit následující vzorec:

Počet lidí, kteří odpověděli
Míra odpovědí = ———————————————————————————– X 100 Celkový počet odeslaných dotazníků

3.4.6. Pilotní test

Než byl dotazník zaslán vzorku, byly otázky prozkoumány provedením pilotních testů, jak navrhli Luck a Rubin (1987), Jackson (1988) a de Vaus (1991). Účelem pilotních testů je odhalit jakékoli nepříjemné, nejednoznačné výrazy a otázky, které je obtížné interpretovat, objasnit jakékoli použité definice a termíny a určit přibližnou dobu potřebnou k vyplnění dotazníku (Warwick a Lininger 1975, Jackson 1988, Salant a Dilman 1994). Pilotní testy byly provedeny výběrem subjektů s charakteristikami podobnými vlastnostem finálních subjektů, jak navrhl Davis e Cosenza (1993). V této studii bylo jako pilotní subjekty vybráno šest odborníků na datové sklady. Po každém pilotním testu byly provedeny nezbytné opravy. Z provedených pilotních testů přispěli účastníci k přepracování a resetování finální verze dotazníku.

3.4.7. Metody analýzy Di Dát

I dát průzkumů shromážděných z uzavřených dotazníků bylo analyzováno pomocí statistického programu SPSS. Mnoho odpovědí bylo analyzováno pomocí deskriptivních statistik. Řada dotazníků se vrátila neúplná. Bylo s nimi zacházeno s větší opatrností, aby bylo zajištěno, že i dát chybějící nebyly důsledkem chyb při zadávání údajů, ale protože otázky nebyly pro žadatele o registraci vhodné, nebo se žadatel o registraci rozhodl neodpovědět na jednu nebo více konkrétních otázek. Tyto chybějící odpovědi byly během analýzy ignorovány dát a byly kódovány jako „- 9“, aby bylo zajištěno jejich vyloučení z procesu analýzy.

Při přípravě dotazníku byly uzavřené otázky předkódovány přiřazením čísla každé možnosti. Číslo bylo poté použito k přípravě dát během analýzy (Denscombe 1998, Sapsford a Jupp 1996). Například v otázce 1 oddílu B bylo uvedeno šest možností: představenstvo, vedoucí pracovník, oddělení IT, obchodní jednotka, konzultanti a další. V souboru dát SPSS byla vygenerována proměnná označující „iniciátora projektu“ se šesti štítky hodnot: „1“ pro „představenstvo“, „2“ pro „vyšší vedoucí“ atd. Street. Použití Likertinovy ​​škály v některých uzavřených otázkách také umožnilo snadnou identifikaci vzhledem k použití odpovídajících číselných hodnot zadaných do SPSS. U otázek s nevyčerpávajícími odpověďmi, které se vzájemně nevylučovaly, byla každá možnost považována za jednu proměnnou se dvěma štítky hodnot: „1“ pro „označeno“ a „2“ pro „neoznačeno“.

S otevřenými otázkami se zacházelo jinak než s otázkami uzavřenými. Odpovědi na tyto otázky nebyly zadány do SPSS. Místo toho byly analyzovány ručně. Použití tohoto typu otázek nám umožňuje získat informace o volně vyjádřených představách a osobních zkušenostech respondentů (Bainbridge 1989, Denscombe 1998). Kde to bylo možné, byla provedena kategorizace odpovědí.

Pro analýzu dátse používají jednoduché metody statistické analýzy, jako je frekvence odpovědí, průměr, směrodatná odchylka a medián (Argyrous 1996, Denscombe 1998).
Gamma test si vedl dobře pro získání kvantitativních měření asociací mezi nimi dát řadové (Norusis 1983, Argyrous 1996). Tyto testy byly vhodné, protože použité ordinální stupnice neměly mnoho kategorií a mohly být zobrazeny v tabulce (Norusis 1983).

3.5 Shrnutí

V této kapitole byla diskutována metodologie a design výzkumu přijatý pro tuto studii.

Zohledňuje se výběr nejvhodnější výzkumné metody pro konkrétní studii
zvážení řady pravidel, včetně povahy a typu výzkumu, jakož i předností a slabin každé možné metody (Jenkins 1985, Benbasat et al. 1097, Galliers a Land 1987, yin 1989, Hamilton a Ives 1992, Galliers 1992, Neuman 1994). Vzhledem k nedostatku existujících znalostí a teorie o přijetí datových skladů v Austrálii vyžaduje tato výzkumná studie interpretační výzkumnou metodu s průzkumnou schopností prozkoumat zkušenosti australských organizací. Zvolená výzkumná metoda byla vybrána za účelem získání informací o přijetí konceptu datového skladu australskými organizacemi. Jako technika sběru byl zvolen poštovní dotazník dát. Zdůvodnění výzkumné metody a techniky sběru dát vybrané budou uvedeny v této kapitole. Dále byla prezentována diskuse o jednotce analýzy, použitém vzorku, procentech odpovědí, obsahu dotazníku, předběžném testu dotazníku a způsobu analýzy dotazníku. dát.

Navrhování a Datový sklad:

Kombinace vztahů mezi entitami a dimenzionální modelování

Abstrakt
Store i dát je hlavním aktuálním problémem mnoha organizací. Klíčová otázka ve vývoji počítačových úložišť dát je to jeho design.
Návrh musí podporovat detekci konceptů v datový sklad na starší systém a další zdroje dát a také snadné pochopení a účinnost při provádění datový sklad.
Hodně z literatury o skladování dát doporučuje použití modelování vztahů entit nebo rozměrového modelování k reprezentaci návrhu datový sklad.
V tomto článku ukážeme, jak lze obě reprezentace kombinovat v jednom přístupu ke kreslení datový sklad. Použitý přístup je systematický

zkoumána v případové studii a je identifikována v řadě důležitých důsledků s odborníky z praxe.

SKLADOVÁNÍ DAT

Un datový sklad obvykle se definuje jako „subjektově orientovaný, integrovaný, časově proměnný a nestálý sběr dat na podporu rozhodnutí managementu“ (Inmon a Hackathorn, 1994). Předmětově orientovaný a integrovaný naznačuje, že datový sklad je navržen tak, aby překročil funkční hranice systémů Legaci a nabídl integrovanou perspektivu dát.
Časová varianta ovlivňuje historickou povahu nebo povahu časových řad dát v ne datový sklad, který umožňuje analyzovat trendy. Nevolatilní znamená, že datový sklad není průběžně aktualizován jako a databáze společnosti OLTP. Spíše je pravidelně aktualizován, s dát z interních a externích zdrojů. The datový sklad je speciálně navržen pro vyhledávání spíše než pro aktualizaci integrity a provozního výkonu.
Myšlenka ukládání i dát není nový, byl to jeden z manažerských účelů dát od 1982. let (Il Martin, XNUMX).
I datový sklad nabízejí infrastrukturu dát pro systémy podpory řízení. Systémy podpory řízení zahrnují systémy pro podporu rozhodování (DSS) a výkonné informační systémy (EIS). DSS je počítačový informační systém, který je navržen tak, aby zlepšoval lidské rozhodování. EIS je typicky doručovací systém dát což umožňuje vedoucím podnikům snadný přístup k zobrazení dát.
Obecná architektura a datový sklad zdůrazňuje roli datový sklad v podpoře managementu. Stejně tak nabízí infrastrukturu dát pro EIS a DSS, al datový sklad lze k němu přistupovat přímo prostřednictvím dotazů. THE dát zahrnuto v a datový sklad jsou založeny na analýze požadavků na manažerské informace a jsou získávány ze tří zdrojů: interních starších systémů, speciálních systémů sběru dat a externích zdrojů dat. THE dát v interních starších systémech jsou často redundantní, nekonzistentní, mají nízkou kvalitu a jsou uloženy v různých formátech, takže je třeba je sladit a vyčistit, než je lze načíst do

datový sklad (Inmon, 1992; McFadden, 1996). THE dát pocházející z úložných systémů dát ad hoc a ze zdrojů dát externí se používají k rozšíření (aktualizaci, nahrazení) i dát ze starších systémů.

Existuje mnoho přesvědčivých důvodů pro vývoj a datový sklad, které zahrnují lepší rozhodování díky efektivnímu využívání více informací (Ives 1995), podporu zaměření na celé obchody (Graham 1996) a snížení dát pro EIS a DSS (Graham 1996, McFadden 1996).

Nedávná empirická studie zjistila v průměru návratnost investic datový sklad o 401 % po třech letech (Graham, 1996). Nicméně, další empirické studie datový sklad zjistila významné problémy včetně potíží s měřením a přidělováním výhod, nedostatek jasného účelu, podcenění účelu a složitosti procesu ukládání dávek dát, zejména pokud jde o zdroje a čistotu dát. Ukládání i dát lze považovat za řešení problému řízení dát mezi organizacemi. Manipulace s dát jako sociální zdroj zůstává po mnoho let jedním z klíčových problémů při řízení informačních systémů po celém světě (Brancheau a kol. 1996, Galliers a kol. 1994, Niederman a kol. 1990, Pervan 1993).

Populární přístup k řízení dát v osmdesátých letech to byl vývoj modelu dát sociální. Modelka dát social byl navržen tak, aby nabízel stabilní základnu pro vývoj nových aplikačních systémů a databáze a rekonstrukci a integraci starších systémů (Brancheau et al.

1989, Goodhue a kol. 1988:1992, Kim a Everest 1994). S tímto přístupem však existuje mnoho problémů, zejména složitost a cena každého úkolu a dlouhá doba potřebná k dosažení hmatatelných výsledků (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il datový sklad je to samostatná databáze, která existuje společně se staršími databázemi, spíše než aby je nahrazovala. Umožňuje vám tedy přímou správu dát a vyhnout se nákladné rekonstrukci starších systémů.

STÁVAJÍCÍ PŘÍSTUPY K DATU ČERPÁNÍ

SKLAD

Proces budování a zdokonalování datový sklad měl by být chápán spíše jako evoluční proces než jako vývojový životní cyklus tradičních systémů (Desio, 1995, Shanks, O'Donnell a Arnott 1997a). Projekt zahrnuje mnoho procesů datový sklad jako je inicializace, plánování; informace získané z požadavků kladených na manažery společností; zdroje, přeměny, čištění dát a synchronizace ze starších systémů a dalších zdrojů dát; doručovací systémy ve vývoji; sledování datový sklad; a nesmyslnost evolučního procesu a konstrukce a datový sklad (Stinchi, O'Donnell a Arnott 1997b). V tomto časopise se zaměříme na to, jak kreslit dát uloženy v kontextu těchto dalších procesů. Existuje řada navrhovaných přístupů k architektuře datový sklad v literatuře (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Každá z těchto metodik má stručný přehled s analýzou jejich silných a slabých stránek.

Inmonův (1994) přístup pro Datový sklad Design

Inmon (1994) navrhl čtyři iterativní kroky k návrhu a datový sklad (viz obrázek 2). Prvním krokem je návrh šablony dát sociální pochopit, jak i dát mohou být integrovány napříč funkčními oblastmi v rámci organizace rozdělením dát skladujte v oblastech. Modelka dát je vyroben pro skladování dát související s rozhodováním, včetně dát historické a zahrnuty dát odvodit a agregovat. Druhým krokem je identifikace tematických oblastí pro implementaci. Ty jsou založeny na prioritách stanovených konkrétní organizací. Třetí krok zahrnuje kreslení a databáze pro danou oblast věnujte zvláštní pozornost zahrnutí vhodných úrovní podrobnosti. Společnost Inmon doporučuje používat model entit a vztahů. Čtvrtým krokem je identifikace zdrojových systémů dát vyžaduje a vyvíjí transformační procesy pro zachycení, čištění a formátování i dát.

Silnými stránkami Inmonova přístupu je tento model dát sociální poskytuje základ pro integraci dát v rámci organizace a plánování podpor pro iterativní rozvoj datový sklad. Jeho nedostatky jsou obtížnost a cena při navrhování modelu dát sociální, potíže s pochopením modelů entit a vztahů používaných v obou modelech, že dát sociální a to dát uloženy podle oblasti předmětu a vhodnosti dát výkresu datový sklad pro realizaci databáze relační, ale ne pro databáze vícerozměrný.

Ives '(1995) Přístup k Datový sklad Design

Ives (1995) navrhuje čtyřstupňový přístup k návrhu informačního systému, o kterém se domnívá, že je použitelný při návrhu datový sklad (viz obrázek 3). Tento přístup je do značné míry založen na informačním inženýrství pro vývoj informačních systémů (Martin 1990). Prvním krokem je stanovení cílů, kritických faktorů a faktorů úspěchu a klíčových ukazatelů výkonnosti. Klíčové obchodní procesy a potřebné informace jsou modelovány tak, aby nás vedly k modelu dát sociální. Druhý krok zahrnuje vývoj definující architektury dát uloženy podle oblastí, databáze di datový sklad, technologické komponenty, které jsou požadovány, soubor organizační podpory potřebné k implementaci a provozu datový sklad. Třetí krok zahrnuje výběr požadovaných softwarových balíků a nástrojů. Čtvrtým krokem je detailní návrh a konstrukce datový sklad. Ives to bere na vědomí dát je to omezený iterativní proces.

Silnými stránkami přístupu Ives je použití specifických technik pro stanovení požadavků na informace, použití strukturovaného procesu na podporu integrace datový sklad, výběr vhodného hardwaru a softwaru a použití více technik reprezentace pro datový sklad. Jeho nedostatky jsou vlastní složitosti. Mezi další patří potíže s rozvojem mnoha úrovní databáze all'interno del datový sklad v rozumných časech a nákladech.

Kimball's (1994) Approach to Datový sklad Design

Kimball (1994) navrhl pět iterativních kroků k návrhu a datový sklad (viz obrázky 4). Jeho přístup je věnován zejména designu sóla datový sklad a na používání dimenzionálních modelů přednostně před modely entit a vztahů. Kimball analyzuje tyto rozměrové modely, protože je pro vedoucí pracovníky snazší porozumět podnikání, je efektivnější při řešení složitých konzultací a návrhů databáze fyzické je efektivnější (Kimball 1994). Kimball uznává, že vývoj a datový sklad je iterativní, a to datový sklad samostatné stoly lze integrovat rozdělením na stoly běžných rozměrů.

Prvním krokem je určit konkrétní předmět, který má být zdokonalen. Druhý a třetí krok se týkají rozměrového modelování. Ve druhém kroku opatření identifikují věci, které jsou zajímavé v dané oblasti, a seskupí je do tabulky faktů. Například v předmětné oblasti prodeje mohou míry zájmu zahrnovat množství prodaných položek a dolar jako prodejní měnu. Třetí krok zahrnuje identifikaci dimenzí, což jsou způsoby, jakými lze seskupovat fakta. V oblasti předmětu prodeje mohou relevantní dimenze zahrnovat položku, umístění a časové období. Tabulka faktů má vícedílný klíč k propojení s každou z tabulek dimenzí a obvykle obsahuje velmi velký počet faktů. Naproti tomu tabulky dimenzí obsahují popisné informace o dimenzích a další atributy, které lze použít k seskupení faktů. Přidružená navrhovaná tabulka faktů a rozměrů tvoří to, co se kvůli svému tvaru nazývá hvězdicové schéma. Čtvrtý krok zahrnuje vybudování a databáze multidimenzionální k dokonalosti hvězdicového vzoru. Posledním krokem je identifikace zdrojových systémů dát vyžaduje a vyvíjí transformační procesy pro zachycení, čištění a formátování i dát.

Mezi silné stránky Kimballova přístupu patří použití rozměrových modelů k reprezentaci dát uloženy, což usnadňuje pochopení a vede k efektivnímu fyzickému návrhu. Rozměrový model, který také snadno využívá oba systémy databáze relační systémy mohou být zdokonaleny nebo systémy databáze multidimenzionální. Mezi jeho nedostatky patří nedostatek některých technik, které by usnadnily plánování nebo integraci mnoha hvězdných vzorů v a datový sklad a obtížnost návrhu z extrémní denormalizované struktury do rozměrového modelu dát ve starém systému.

McFaddenův (1996) Přístup k datům Skladový design

McFadden (1996) navrhuje pětistupňový přístup k navrhování a datový sklad (viz obrázek 5).
Jeho přístup je založen na syntéze myšlenek z literatury a je zaměřen na design singlu datový sklad. První krok zahrnuje analýzu požadavků. Ačkoli technické specifikace nejsou předepsány, McFaddenovy poznámky identifikují entity dát specifikace a jejich atributy a pro zachycení požadavků odkazuje na čtenáře Watsona a Frolicka (1993).
Ve druhém kroku je nakreslen model relační entity datový sklad a poté ověřeny vedoucími podniků. Třetí krok zahrnuje určení mapování ze starších systémů a externích zdrojů datový sklad. Čtvrtý krok zahrnuje procesy ve vývoji, nasazení a synchronizaci dát v datový sklad. V posledním kroku je vyvinuta dodávka systému se zvláštním důrazem na uživatelské rozhraní. McFadden poznamenává, že proces kreslení je obecně iterativní.

Silné stránky McFaddenova přístupu poukazují na účast vedoucích firem při určování požadavků a také na důležitost zdrojů dát, jejich čištění a sběr. Mezi jeho nedostatky patří chybějící proces pro rozbití velkého projektu datový sklad v mnoha integrovaných fázích a

potíže s porozuměním entitních a vztahových modelů použitých při navrhování datový sklad.

Vybírají si nás nejen ti, kteří jsou nám blízcí.

    0/5 (0 recenzí)
    0/5 (0 recenzí)
    0/5 (0 recenzí)

    Zjistěte více od Online Web Agency

    Přihlaste se k odběru nejnovějších článků e-mailem.

    avatar autora
    administrátor Generální ředitel
    👍Online webová agentura | Expert na webovou agenturu v oblasti digitálního marketingu a SEO. Web Agency Online je webová agentura. Úspěch Agenzia Web Online v digitální transformaci je založen na základech Iron SEO verze 3. Speciality: Systémová integrace, integrace podnikových aplikací, architektura orientovaná na služby, cloud computing, datový sklad, business intelligence, velká data, portály, intranety, webové aplikace Návrh a správa relačních a vícerozměrných databází Návrh rozhraní pro digitální média: použitelnost a grafika. Online Web Agency nabízí společnostem následující služby: -SEO na Google, Amazon, Bing, Yandex; -Webová analytika: Google Analytics, Správce značek Google, Yandex Metrica; -Uživatelské konverze: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM na Google, Bing, Amazon Ads; - Marketing na sociálních sítích (Facebook, Linkedin, Youtube, Instagram).
    Moje agilní soukromí
    Tato stránka používá technické a profilovací soubory cookie. Kliknutím na Souhlasím autorizujete všechny profilovací cookies. Kliknutím na odmítnout nebo na X budou všechny profilovací soubory cookie odmítnuty. Kliknutím na přizpůsobení je možné vybrat, které profilovací soubory cookie aktivovat.
    Tato stránka je v souladu se zákonem o ochraně osobních údajů (LPD), švýcarským federálním zákonem z 25. září 2020 a GDPR, nařízením EU 2016/679, týkajícím se ochrany osobních údajů a volného pohybu těchto údajů.