https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

Datový sklad a ERP | CENTRÁLNÍ ARCHIV ÚDAJŮ: HISTORIE A VÝVOJ

ARCHIV DATA CENTRÁLNÍ: HISTORIE A VÝVOJ

Dvě dominantní témata podnikové technologie v 90. letech jsou
uvádí i datový sklad a ERP. Po dlouhou dobu tito dva mocní
proudy byly součástí podnikového IT, aniž by kdy byly
křižovatky. Bylo to téměř jako by to byla hmota a anti-hmota. Ale
růst obou jevů nevyhnutelně vedl k jednomu
jejich křižovatka. Dnes se společnosti potýkají s problémem
co dělat s ERP e datový sklad. Tento článek bude ilustrovat
jaké jsou problémy a jak je řeší společnosti.
NA ZAČÁTKU…
Na začátku byla datový sklad. Datový sklad se narodil pro
čelit systému aplikací pro zpracování transakcí.
V raných dobách memorování dát to mělo být
jen kontrapunkt k aplikacím zpracování
transakce. Ale v dnešní době existují mnohem propracovanější vize
než co datový sklad. V dnešním světě
datový sklad je vložen do struktury, která může být
s názvem Podniková informační továrna.
FIREMNÍ INFORMAČNÍ TOVÁRNA
(CIF)
Podniková informační továrna má architektonické komponenty
standard: úroveň transformace a integrace kódu
který integruje i dát zatímco já dát pohybují se z prostředí
environmentální aplikace datový sklad společnosti; A
datový sklad společnosti, kde i dát
podrobné a integrované historie. The datový sklad společnosti slouží jako
základ, na kterém lze stavět všechny ostatní části
prostředí datový sklad; úložiště provozních dat (ODS).
ODS je hybridní struktura, která obsahuje některé aspekty dat
sklad a další aspekty prostředí OLTP; datové trhy, ve kterých i
různá oddělení mohou mít vlastní verzi dat
sklad; A datový sklad průzkumu, ve kterém i
„Myslitelé“ společnosti mohou předložit své dotazy
72 hodin bez škodlivých účinků na datový sklad; a vzpomínka
blízko řádku, ve kterém dát starý a dát hromadné detaily mohou být
levné.
KDE ERP KOMBINUJE S
FIRMA PRO FIREMNÍ INFORMACE
ERP se spojuje s Corporate Information Factory na dvou místech.
Nejprve jako základní aplikace (základní), která poskytuje
dát aplikace do datový sklad. V tomto případě i dát,
generované jako vedlejší produkt transakčního procesu,
jsou integrovány a načteny do datový sklad společnosti. The
druhý bod spojení mezi ERP a CIF a ODS. Opravdu, mnoho
prostředí se ERP používá jako klasický ODS.
V případě, že se jako základní aplikace používá ERP
stejný ERP lze také použít v CIF jako ODS. v
pokud však má být ERP používán v obou rolích, existuje
mezi těmito dvěma entitami musí být jasný rozdíl. Jinými slovy,
když ERP hraje roli základní aplikace a ODS,
dvě architektonické entity musí být odlišné. Pokud svobodný
implementace ERP se snaží hrát obě role
současně nevyhnutelně nastanou problémy v EU
návrh a implementace této struktury.
ODDĚLENÉ ODS A ZÁKLADNÍ APLIKACE
Existuje mnoho důvodů, které vedou k rozdělení součástí
architektonický. Snad nejnaléhavější otázka k oddělení
různými komponentami architektury je to, že každá komponenta
architektury má svůj vlastní názor. Je potřeba základní aplikace
z jiného důvodu než ODS. Zkuste se překrývat
základní pohled aplikace na svět ODS nebo naopak
není to správný způsob práce.
V důsledku toho je prvním problémem ERP v CIF problém
zkontrolujte, zda existuje rozdíl mezi základními aplikacemi a
SDGs.
DATOVÉ MODELY VE FIRMĚ
INFORMAČNÍ TOVÁRNA
K dosažení soudržnosti mezi různými složkami
architektury CIF, musí existovat model dát. Já
modely dát sloužit jako spojovací článek mezi různými komponentami
architektura, jako jsou základní aplikace a ODS. THE
modely dát stát se "intelektuální cestovní mapou", aby
správný význam různými architektonickými komponentami CIF.
Jde ruku v ruce s touto představou, myšlenka je, že by měla být
být skvělým a jedinečným modelem dát. Je zřejmé, že musí
být vzorem dát pro každou ze složek a dále tam
musí to být rozumná cesta spojující různé modely.
Každá součást architektury - ODS, základní aplikace,
datový sklad společnost atd. - potřebuje vlastní
model dát. Musí tedy existovat přesná definice
jako tyto modely dát vzájemně se propojují.
POHYB I DATA DATUM ERP
SKLAD
Pokud je původ dát je základní aplikace a / nebo ODS, když
ERP vložky i dát v datový sklad, takové vložení musí být
na nejnižší úrovni „zrnitosti“. Rekapitulace nebo
jednoduše agregovat i dát jak vycházejí
ze základní aplikace ERP nebo z ERP ODS není
správná věc. THE dát v datu jsou potřebné podrobnosti
sklad tvoří základ procesu DSS. Takový dát
v mnoha ohledech budou přetvořeny datovými trhy a průzkumy
del datový sklad.
Posunutí dát z prostředí základní aplikace
ERP do prostředí EU datový sklad společnosti se provádí v a
přiměřeně uvolněný. K tomuto posunu dojde poté
přibližně 24 hodin od aktualizace nebo vytvoření v ERP. Skutečnost
mít „líné“ hnutí bohů dát v datový sklad
společnosti umožňuje dát přicházející z ERP na „vyrovnání“.
Jednou jsem dát jsou uloženy v základní aplikaci,
pak se můžete bezpečně pohybovat i dát ERP
ve společnosti. Další cíl dosažitelný díky pohybu
„Líní“ bohové dát je jasné vymezení mezi provozními procesy a
DSS. "Rychlým" pohybem dát dělicí čára
mezi DSS a provozem zůstává nejasný.
Pohyb dát z ODS ERP do datový sklad
společnosti se provádí pravidelně, obvykle
týdně nebo měsíčně. V tomto případě je pohyb
dát vychází z potřeby „vyčistit“ staré dát historici.
ODS samozřejmě obsahuje i dát které jsou mnohem novější
respekt k dát historici našli v datový sklad.
Posunutí dát v datový sklad to se skoro nikdy neděje
„Velkoobchod“ (jako velkoobchod). Zkopírujte tabulku
z prostředí ERP do datový sklad nedává to smysl. Jeden přístup
mnohem realističtější je posun vybraných jednotek jednotky dát.
Pouze dát které se od poslední aktualizace data změnily
sklad jsou ty, které by se měly v datech přesouvat
sklad. Jeden způsob, jak zjistit, které z nich dát byly upraveny
od poslední aktualizace je podívat se na časová razítka dát
v prostředí ERP. Návrhář vybere všechny změny
k nimž došlo od poslední aktualizace. Jiný přístup
je použít techniky získávání změn dát. S
tyto techniky jsou analyzovány log a deníkové pásky za účelem
určit, které z nich dát musí být přesunut z prostředí ERP do
To z datový sklad. Tyto techniky jsou nejlepší
kolik záznamů a deníkových pásek lze načíst ze souborů ERP
bez dalších účinků na ostatní zdroje ERP.
DALŠÍ KOMPLIKACE
Jedním z problémů s ERP v CIF je to, co se stane ostatním
zdroje aplikací nebo ai dát ODS, ke kterému musí přispět
datový sklad ale nejsou součástí prostředí ERP. Vzhledem k
uzavřená povaha ERP, zejména SAP, pokus o integraci
klíče z externích zdrojů dát s i dát které pocházejí z ERP do
čas na pohyb i dát v datový sklad, je to velká výzva.
A kolik přesně je pravděpodobností, že i dát aplikací nebo
ODS mimo prostředí ERP budou integrovány do dat
sklad? Šance jsou ve skutečnosti velmi vysoké.
NALÉZT DATA HISTORICKÉ INFORMACE Z ERP
Další problém s dát ERP je výsledný
z nutnosti mít dát historické v rámci datový sklad.
Obvykle datový sklad potřeby dát historici. JE
Technologie ERP je obvykle neukládá dát
historické, přinejmenším ne do bodu, kdy je k datu potřeba
sklad. Když velké množství dát historici začínají
být přidáno do prostředí ERP, takové prostředí musí být
uklizený. Předpokládejme například, že datový sklad musí
být nabitý pěti lety dát zatímco ERP drží
maximálně šest měsíců z nich dát. Pokud je společnost spokojená
sbírat různé dát jak čas plyne,
pak nejsou problémy s používáním ERP jako zdroje pro
datový sklad. Ale když datový sklad musím jít
zpět v čase a vzít bohy dát historici, kteří nebyli
dříve shromážděné a uložené ERP, pak prostředí ERP
se stává neúčinným.
ERP A METADATA
Další úvaha o ERP a datový sklad je to
o existujících metadatech v prostředí ERP. Stejně jako metadata
přecházejí z prostředí ERP do datový sklad,
metadata musí být přesunuta stejným způsobem. Dále, i
metadata musí být transformována ve formátu a struktuře
požadované infrastrukturou EU datový sklad. Je tu velká
rozdíl mezi provozními metadaty a DSS metadaty. Metadata
funkční jsou hlavně pro vývojáře a pro
programátor. DSS metadata jsou primárně pro uživatele
finále. Existující metadata v aplikacích ERP nebo ODS
je třeba je převést a tento převod není vždy snadný
a přímé.
ZDROJOVÁNÍ DAT ERP
Pokud je ERP používán jako poskytovatel dát pro datový sklad ci
musí to být pevné rozhraní, které pohybuje i dát z prostředí
ERP do životního prostředí datový sklad. Rozhraní musí:
▪ být snadno použitelný
▪ povolit přístup k dát ERP
▪ vzít význam dát které mají být přesunuty
v datový sklad
▪ znát omezení ERP, která by mohla vzniknout v
čas, kdy se přihlásíte dát ERP:
▪ referenční integrita
▪ hierarchické vztahy
▪ implicitní logické vztahy
▪ konvence aplikace
▪ všechny struktury dát podporováno ERP atd. ...
▪ být efektivní v přístupu dát, poskytnutím:
▪ přímý pohyb dát
▪ nabytí změny dát
▪ podpora včasného přístupu k dát
▪ pochopit formát souboru dát, a tak dále…
ROZHRANÍ SE SAPEM
Rozhraní může být dvou typů, domácí nebo komerční.
Mezi hlavní komerční rozhraní patří:
▪ SAS
▪ Řešení Prims
▪ D2k atd. ...
VÍCE TECHNOLOGIÍ ERP
Zacházení s prostředím ERP, jako by to byla jedna technologie, je
velký omyl. Existuje mnoho technologií ERP, z nichž každá má své vlastní
silné stránky. Nejznámějšími prodejci na trhu jsou:
▪ SAP
▪ Oracle Financials
▪ PeopleSoft
JD Edwards
▪ Baans
SAP
SAP je největší a nejkompletnější ERP software. Aplikace
SAP zahrnuje mnoho typů aplikací v mnoha oblastech. SAP má
pověst bytí:
▪ velmi velký
▪ velmi obtížné a nákladně proveditelné
▪ potřebuje mnoho lidí a konzultantů
implementováno
▪ k realizaci potřebuje specializované pracovníky
▪ implementace trvá dlouho
Kromě toho má SAP pověst, že si pamatuje své vlastní dát molto
opatrně, takže je pro ně obtížné se k nim dostat
osoba mimo oblast SAP. Síla SAP má být
schopné zachytit a uložit velké množství dát.
Společnost SAP nedávno oznámila svůj záměr rozšířit
jeho aplikace ai datový sklad. Existuje mnoho kladů a záporů
při používání SAP jako dodavatele datový sklad.
Jednou výhodou je, že SAP je již nainstalován a že většina z
konzultanti již SAP znají.
Nevýhody mít SAP jako dodavatele datový sklad jsou
mnoho: SAP nemá ve světě Windows žádné zkušenosti datový sklad
Pokud je SAP dodavatelem datový sklad, je nutné „vyjmout“
i dát od společnosti SAP al datový sklad. Dato záznam SAP o
uzavřený systém, je nepravděpodobné, že by bylo snadné dostat se do systému SAP
to (???). Existuje mnoho starších prostředí, která pohánějí SAP,
například IMS, VSAM, ADABAS, ORACLE, DB2 atd.
Společnost SAP trvá na přístupu „není zde vynalezeno“. SAP nechce
spolupracovat s dalšími prodejci na použití nebo vytvoření datový sklad.
Společnost SAP trvá na generování veškerého svého softwaru sama.
Ačkoli SAP je velká a silná společnost, skutečnost
pokus o přepsání technologie ELT, OLAP, správa
systém a dokonce i základní kód dbms je to prostě šílené.
Místo zaujetí přístupu spolupráce s dodavateli
di datový sklad dlouhodobě společnost SAP postupuje podle tohoto přístupu
„vědí více“. Tento přístup brzdí úspěch
SAP může mít v oblasti datový sklad.
Odmítnutí společnosti SAP umožnit přístup externím dodavatelům
rychle a elegantně jim dát. Samotná podstata používání
un datový sklad je snadný přístup k dát. Celý příběh SAP je
na základě ztížení přístupu dát.
Nedostatek zkušeností SAP při řešení velkých objemů dát;
v oblasti datový sklad existují objemy dát od té doby nikdy neviděl
SAP a zvládnout tyto velké částky dát musíte mít
vhodná technologie. SAP o tom zjevně neví
technologická bariéra, která existuje pro vstup do datového pole
sklad.
Firemní kultura SAP: SAP vytvořil podnikání
při získávání i dát ze systému. Ale k tomu musíte mít
jinou mentalitu. Tradičně to byly softwarové společnosti
dobré v získávání dat do prostředí nebyly dobré
získávání dat jít opačným směrem. Pokud SAP dokáže tento druh
switch bude první společností, která tak učiní.
Stručně řečeno, je sporné, zda by si společnost měla vybrat
SAP jako dodavatel společnosti datový sklad. Existují velmi vážná rizika
na jedné straně a velmi málo odměn na straně druhé. Ale je tu ještě jedna
důvod, který odrazuje od výběru společnosti SAP jako dodavatele data
sklad. Protože každá společnost by měla mít stejné datum
sklad všech ostatních společností? The datový sklad je to srdce
konkurenční výhoda. Pokud by každá společnost přijala to samé
datový sklad bylo by to obtížné, i když ne nemožné,
dosáhnout konkurenční výhody. Zdá se, že SAP si myslí, že a
datový sklad může to být viděno jako cookie a to je
další známka jejich „získat data
v".
Žádný jiný prodejce ERP není tak dominantní jako SAP.
Nepochybně budou existovat společnosti, které budou následovat cestu SAP
pro jejich datový sklad ale pravděpodobně tyto datum
Sklady SAP budou velké, drahé a velmi náročné
čas na jejich vytvoření.
Tato prostředí zahrnují takové činnosti jako „zpracování bankovních pokladen“,
procesy pro rezervace leteckých společností, procesy pro stížnosti
pojištění atd. Výkonnější byl transakční systém,
jasnější byla potřeba oddělení mezi provozním procesem a
DSS (systém podpory rozhodování). Se zdrojovými systémy
lidské a osobní, nikdy se nestretnete s velkými objemy
transakce. A samozřejmě, když je člověk najat
nebo opustit společnost, jedná se o záznam transakce.
Ale ve srovnání s jinými systémy, systémy lidských zdrojů a
osobní prostě nemají mnoho transakcí. Proto v
systémy lidských a osobních zdrojů není zcela zřejmé, že existuje
potřebujete DataWarehouse. V mnoha ohledech tyto systémy
představují sloučení systémů DSS.
Je-li však třeba, je třeba vzít v úvahu další faktor
dělat s datawarehouse a PeopleSoft. V mnoha prostředích, tj dát
lidské a osobní zdroje jsou pro podnikání druhořadé
primární společnost. Většina společností vystupuje
výroba, prodej, poskytování služeb atd. THE
systémy lidských a osobních zdrojů jsou obvykle sekundární (nebo
podpora) do hlavní obchodní linie společnosti. Proto je
nejednoznačné a nepohodlné a datový sklad oddělené pro
podpora lidských a osobních zdrojů.
PeopleSoft se v tomto ohledu velmi liší od společnosti SAP. U SAP to tak je
povinné, že existuje datový sklad. S PeopleSoftem to tak není
pak tak jasné. U společnosti PeopleSoft je datový sklad volitelný.
Nejlepší věc, kterou lze říci pro dát PeopleSoft je datum
sklad lze použít k uložení i dát ohledně
staré lidské a osobní zdroje. Druhým důvodem pro
které by společnost chtěla použít a datový sklad a
na úkor prostředí PeopleSoft je umožnit přístup a
bezplatný přístup k analytickým nástrojům, ai dát od PeopleSoft. Ale
kromě těchto důvodů mohou nastat případy, kdy je to lepší ne
mít datový sklad pro dát PeopleSoft.
celkem
Existuje mnoho poznatků o konstrukci data
sklad uvnitř ERP softwaru.
Některé z nich jsou:
▪ Má smysl mít a datový sklad to vypadá jako kdokoli
jinde v oboru?
▪ Jak flexibilní je ERP datový sklad software?
▪ ERP datový sklad software zvládne svazek
dát který se nachází v „datový sklad aréna"?
▪ Jaký je dosavadní výsledek, který dělá dodavatel ERP
snadné a levné z hlediska času, ai dát? (co
je záznam dodavatelů ERP o dodávce levného,
čas, snadný přístup k datům?)
▪ Jaké je chápání architektury DSS a
„Podniková informační společnost“ od dodavatele ERP?
▪ Dodavatelé ERP chápou, jak se dostat dát uvnitř
prostředí, ale také rozumíte, jak je exportovat?
▪ Jak otevřený je dodavatel ERP nástrojů k dnešnímu dni
skladování?
Při určování je třeba vzít v úvahu všechny tyto úvahy
kam umístit datový sklad který bude hostit i dát ERP a další
dát. Obecně platí, pokud pro to neexistuje závažný důvod
dělat jinak, je doporučeno stavět datový sklad ven
z prostředí dodavatele ERP.
KAPITOLA 1
Přehled organizace BI
Klíčové body:
Úložiště informací fungují opačně
do architektury business intelligence (BI):
Firemní kultura a IT mohou omezit úspěch v
budování BI organizací.
Technologie již není omezujícím faktorem pro organizace BI. The
problém pro architekty a projektanty není, pokud
technologie existuje, ale pokud mohou účinně implementovat
dostupná technologie.
Pro mnoho společností a datový sklad je to něco víc než záloha
pasivní distribuce i dát uživatelům, kteří to potřebují. THE dát
jsou extrahovány ze zdrojových systémů a jsou naplněny v cílových strukturách
di datový sklad. Já dát lze je také vyčistit pomocí celku
štěstí. Nepřidává se však ani žádná další hodnota
shromáždil dát během tohoto procesu.
Pasivní DW v zásadě přinášejí
jen já dát čisté a funkční pro asociace uživatelů. Tam
tvorba informací a analytické porozumění závisí
zcela podle uživatelů. Posuďte, zda DW (Datový sklad) být
úspěch je subjektivní. Pokud usoudíme úspěch na
schopnost efektivně shromažďovat, integrovat a čistit i dát
společnost na předvídatelném základě, pak ano, DW je úspěch.
Na druhou stranu, pokud se podíváme na kolekci, konsolidaci a na ni
tedy vykořisťování informací organizace jako celek
DW je porucha. DW poskytuje malou nebo žádnou hodnotu
informace. V důsledku toho jsou uživatelé nuceni si vystačit,
čímž se vytvářejí informační sila. Tato kapitola představuje
kompletní pohled na shrnutí architektury BI (Business
Intelligence) společností. Začněme popisem BI a
pak přejdeme k diskusím o designu a
vývoj informací, na rozdíl od jednoduchého poskytování i dát
uživatelům. Diskuse jsou poté zaměřeny na výpočet
hodnotu vašeho úsilí v oblasti BI. Na závěr jsme definovali, jak IBM
řeší architektonické BI požadavky vaší organizace.
Popis architektury
organizace BI
Nyní jsou k dispozici výkonné informační systémy zaměřené na transakce
na pořadu dne v každém velkém podniku, jak se vyrovnávají
efektivně hřiště pro společnosti z celého světa.
Udržet si konkurenceschopnost však nyní vyžaduje systémy analyticky
orientovaný na který může převratem ve schopnosti společnosti znovu objevit a
pomocí informací, které již mají. Tyto systémy
analytika vychází z porozumění z bohatství dát
k dispozici. BI může zlepšit výkon ve všech informacích
společnosti. Společnosti mohou zlepšit vztahy se zákazníky a
dodavatelé, zlepšit zisk z produktů a služeb, generovat
nové a nejlepší nabídky, řízení rizik a mnoho dalších
výdělky drasticky snižují výdaje. S vaší BI
společnost konečně začíná používat informace o zákaznících
jako konkurenční aktivum díky aplikacím, které mají cíle
trh.
Mít správné podnikání znamená mít definitivní odpovědi na
klíčové otázky jako:
▪ Který z našich zákazníci nutí nás vydělávat více, nebo tam
posílají se ztrátou?
▪ Kde žijí naši nejlepší zákazníci ve vztahu k negozio/
sklad, který často navštěvují?
▪ Které z našich produktů a služeb lze prodat nejvíce
efektivně a komu?
▪ Které produkty lze nejúčinněji prodat a komu?
▪ Která prodejní kampaň byla nejúspěšnější a proč?
▪ Které prodejní kanály jsou pro které produkty nejúčinnější?
▪ Jak můžeme zlepšit vztahy s našimi nejlepšími zákazníci?
Většina společností má dát hrubý odpovědět
tyto otázky.
Operační systémy generují velké množství produktu, z
zákazník a dát trh z prodejních míst, rezervace,
ze zákaznických služeb a systémů technické podpory. Výzva je
extrahovat a využívat tyto informace.
Mnoho společností využívá pouze své malé zlomky dát
pro strategické analýzy.
I dát zbývající, často spojené s i dát vyplývající z externích zdrojů, jako je i
„Vládní zprávy“ a další zakoupené informace jsou jedno
zlatý důl jen čeká na prozkoumání, ei dát musí
upřesněte pouze v informativním kontextu
organizace.
Tyto znalosti lze aplikovat několika způsoby, variantami
od návrhu obecné podnikové strategie po
osobní komunikace s dodavateli prostřednictvím call center,
fakturace, Internet a další body. Dnešní podnikatelské prostředí diktuje
že DW a související BI řešení se dále vyvíjejí
provádění tradičních struktur dát který i dát normalizováno na
atomová úroveň a „farmy hvězd / kostek“.
K udržení konkurenceschopnosti je zapotřebí sloučení
tradiční a vyspělé technologie ve snaze podpořit a
obrovská analytická krajina.
Nakonec musí obecné prostředí zlepšit znalosti
společnosti jako celku a ujistit se, že přijatá opatření
v důsledku provedených analýz jsou užitečné, aby to udělal každý
výhoda.
Řekněme například, že hodnotíte své zákazníci v kategoriích
vysoké nebo nízké riziko.
Pokud jsou tyto informace generovány těžebním modelem nebo
jinými prostředky musí být vložen do DW a zpřístupněn
kdokoli, jakýmkoli způsobem přístupu, jako je i
statické zprávy, tabulky, tabulky nebo analytické zpracování v systému Windows
linka (OLAP).
V současné době je však mnoho tohoto typu informací
zůstat v silech dát jednotlivců nebo oddělení, které generují
analýza. Organizace jako celek má malou nebo žádnou viditelnost
pro porozumění. Pouhým smícháním tohoto typu obsahu
informace ve vaší společnosti DW můžete eliminovat sila
informace a povýšit vaše prostředí Dw.
Existují dvě hlavní překážky rozvoje organizace
BI.
Nejprve máme problém samotné organizace
souvisejících předpisů.
Ačkoli nemůžeme pomoci se změnami zásad
organizace, můžeme vám pomoci pochopit komponenty
organizace BI, její architektura a jak
Technologie IBM usnadňuje její vývoj.
Druhou překážkou, kterou je třeba překonat, je nedostatek technologií
integrovaná a znalost metody, která připomíná celý prostor
BI na rozdíl od pouze malé součásti.
IBM reaguje na změny v technologii
integrace. Je vaší odpovědností poskytnout návrh
sebevědomý. Tato architektura musí být vyvinuta s
technologie zvolená pro integraci bez omezení, nebo alespoň s
technologie, která dodržuje otevřené standardy. Také vaše
vedení společnosti musí zajistit, aby podnik Bi byl
prováděny podle harmonogramu a nedovolit to
vývoj informačních sil odvozených od samoúčelnosti
agendy nebo cíle.
To neznamená, že prostředí BI není citlivé na
reagovat na různé potřeby a požadavky různých uživatelů; místo toho to znamená
že implementace těchto individuálních potřeb a požadavků je
provedeno ve prospěch celé organizace BI.
Popis architektury BI organizace může
najdete na straně 9 na obrázku 1.1 Architektura ukazuje
bohatá směsice technologií a technik.
Z tradičního pohledu architektura zahrnuje následující komponenty
skladu
Atomová vrstva.
Toto je základ, srdce celého DW a tedy i
strategické zprávy.
I dát zde uložené si udrží historickou integritu, zprávy o
dát a zahrnout odvozenou metriku a být čistý,
integrovány a uloženy pomocí extrakčních šablon.
Veškeré jejich následné použití dát a související informace jsou
odvozené z této struktury. To je vynikající zdroj pro
těžba dát a pro sestavy se strukturovanými dotazy SQL
Provozní vklad ve výši dát nebo nahlásit základnu
dát(Úložiště provozních dat (ODS) nebo hlášení
databáze.)
Toto je struktura dát speciálně navržen pro
technické hlášení.
I dát uloženy a přeneseny přes tyto struktury mohou konečně
propagovat ve skladu přes zónu organizace (pracovní
oblast), kde by mohla být použita pro strategické reportování.
Pracovní plocha.
První zastávka pro většinu dát určené pro životní prostředí
sklad je zóna organizace.
Tady dát jsou integrovány, vyčištěny a transformovány do dát užitečné, že
naplní skladovou strukturu
Datum trhů.
Tato část architektury představuje strukturu dát usata
speciálně pro OLAP. Přítomnost datamartů, pokud i dát jsou
uložené ve hvězdném schématu, které se překrývají dát
vícerozměrné v relačním prostředí nebo v kartotékách
di dát proprietární používaný konkrétní technologií OLAP, jako je
Server DB2 OLAP, není relevantní.
Jediným omezením je, že architektura usnadňuje použití dát
vícerozměrný.
Architektura také zahrnuje kritické technologie a techniky Bi
které se rozlišují jako:
Prostorová analýza
Vesmír je neočekávané množství informací pro analytika a
pro dokončení řešení je zásadní. Vesmír může
představují informace lidí žijících v určitém
umístění a také informace o tom, kde se dané místo nachází
fyzicky ve srovnání se zbytkem světa.
Chcete-li provést tuto analýzu, musíte začít svázáním té své
informace na souřadnicích zeměpisné šířky a délky. To je ono
označované jako „geokódování“ a musí být součástí těžby,
transformace a proces načítání (ETL) na úrovni
vašeho skladu.
Dolování dat.
Těžba dát umožňuje našim společnostem růst
počet zákazníci, předvídat prodejní trendy a povolit
řízení vztahů s i zákazníci (CRM), mimo jiné iniciativy
BI.
Těžba dát musí být proto integrován do struktur
dát DWHouse a podporováno skladovými procesy pro
- zjistit účinné a efektivní využívání technologií a -
související techniky.
Jak je uvedeno v architektuře BI, atomová úroveň
Dwhouse, stejně jako datamarts, je vynikajícím zdrojem dát
pro extrakci. Stejné struktury také musí být
příjemci výsledků těžby k ověření dostupnosti pro
nejširší publikum.
Agenti.
Existují různí agenti, kteří klienta prozkoumají pro každý bod, jako např
operační systémy společnosti a stejný dw. Tito agenti mohou
být pokročilými neuronovými sítěmi trénovanými, aby se o nich dozvěděli
trendy každého bodu, například budoucí produkt založený na poptávce
na podporu prodeje, motory založené na pravidlech, na které se má reagovat
un dat soubor okolností, nebo dokonce jednoduché agenty, které
hlásí výjimky „vrcholovým manažerům“. Tyto procesy ano
obvykle přítomné v reálném čase, a proto musí
být úzce spjaty s pohybem téhož dát.
Všechny tyto struktury dát, technologie a techniky zaručují
že nebudete trávit noc vytvářením organizace
vaše BI.
Tato aktivita bude vyvíjena v dílčích krocích, pro malé
bodů.
Každý krok je samostatným projektovým úsilím a je ohlášen
jako iterace ve vaší dw nebo BI iniciativě. Iterace
může zahrnovat zavádění nových technologií pro
začněte s novými technikami přidáním nových struktur dát ,
načítání i dát nebo s rozšířením analýzy
vaše prostředí. Tento odstavec je diskutován více
do hloubky v kapitole 3.
Kromě tradičních struktur Dw a nástrojů Bi existují i další
funkce vaší BI organizace, které dlužíte
design, například:
Dotyková místa zákazníka (Dotyk zákazníka
body).
Jako u každé moderní organizace existuje řada
zákaznické kontaktní body, které naznačují, jak získat zkušenost
pozitivní pro vaše zákazníci. Existují tradiční kanály, jako je i
obchodníci, operátoři ústředen, přímá pošta, multimédia a tisk
reklama, stejně jako nejaktuálnější kanály, jako je e-mail a web, tj dát
produkty s určitým kontaktním místem musí být získány,
přepravovány, čištěny, transformovány a poté osídleny strukturami dát z
BI.
Základy dát provozní a uživatelská sdružení (provozní
databáze a uživatelské komunity).
Na konci kontaktních míst zákazníci najdete základy dát
aplikace společnosti a uživatelských komunit. THE dát existující
jsou dát tradiční, které musí být smířeny a sloučeny s dát že
tok z kontaktních míst k uspokojení nezbytných
informace.
Analytici. (Analytici)
Primárním příjemcem prostředí BI je analytik. Je to on
těží ze současné těžby dát funkční, integrovaný s
různé zdroje dát , doplněné o funkce, jako je analýza
geografické (geokódování) a prezentovány v BI technologiích, které
vám umožní extrahovat, OLAP, pokročilé reportování a analýzy SQL
zeměpisný. Primární rozhraní pro analytika s prostředím
reporting je portál BI.
Analytik však není jediný, kdo těží z architektury
BI.
Vedoucí pracovníci, velká sdružení uživatelů a dokonce i partneři, dodavatelé a i
zákazníci měli by najít výhody v podnikové BI.
Zpětná smyčka.
BI architektura je výukové prostředí. Princip
charakteristikou vývoje je umožnit trvalé struktury dát
aktualizovat pomocí použité technologie BI a prostřednictvím akcí
uživatel intrapese. Příkladem je hodnocení
zákazník (bodování zákazníka).
Pokud obchodní oddělení dělá model těžby
skóre zákazníka, pokud jde o použití nové služby, pak
obchodní oddělení by nemělo být jedinou skupinou příjemců
služby.
Místo toho by měl být model těžby vyroben jako součást
přirozený tok dat ve společnosti a skóre zákazníka
měl by se stát nedílnou součástí informačního prostředí EU
sklad, viditelný pro všechny uživatele. Sada IBM Bi-bi-centric
včetně produktu DB2 UDB, zahrnuje server DB2 OLAP většinu
část důležitých komponent technologie definovaných na obrázku
1.1.
Používáme architekturu, jak je uvedena v této knize
dát nám úroveň kontinuity a ukázat, jak každý produkt
IBM zapadá do obecného schématu BI.
Poskytování informačního obsahu (Poskytování
Informační obsah)
Návrh, vývoj a implementace vašeho prostředí BI je
náročná operace. Design musí tolik zahrnovat
současné a budoucí obchodní požadavky. Návrh architektury
musí být úplné, aby zahrnovalo všechny nalezené závěry
během fáze návrhu. Poprava musí zůstat
zavázáno k jedinému účelu: rozvíjet architekturu BI
jak je formálně uvedeno na výkresu a na základě požadavků
byznys.
Je obzvláště obtížné tvrdit, že disciplína zajistí
relativní úspěch.
To je jednoduché, protože nevyvíjíte celé prostředí BI
najednou, ale probíhá to malými kroky v průběhu času.
Identifikace BI komponent vaší architektury však je
důležité ze dvou důvodů: Budete řídit veškerá následná rozhodnutí
architektonické techniky.
Budete schopni vědomě navrhnout konkrétní využití technologie
i když nemusí dostat zástupce, který potřebuje
technologie na několik měsíců.
Pochopení vašich obchodních požadavků dostatečně ovlivní typ
produktů, které získáte pro svou architekturu.
Návrh a vývoj vaší architektury zajistí
že váš sklad je
ne náhodná událost, ale spíše „promyšlená“,
pečlivě vytvořená reklama opera umění jako mozaika
smíšená technologie.
Navrhněte informační obsah
Veškeré počáteční plánování se musí zaměřit a identifikovat
hlavní součásti BI, které bude prostředí potřebovat
obecně v současnosti i v budoucnosti.
Znát obchodní požadavky je důležité.
Ještě předtím, než začne veškeré konvenční plánování,
projektant dokáže často identifikovat jeden nebo dva
komponenta hned.
Rovnováha složek, které mohou být potřebné pro
vaši architekturu však nelze snadno najít.
Během fáze návrhu hlavní část architektury
naváže relaci vývoje aplikace (JAD) na vyhledávání
identifikovat obchodní požadavky.
Někdy je možné tyto požadavky zadat externě
dotazy a hlášení.
Například uživatelé deklarují, že pokud chtějí automatizovat
v současné době musí být zpráva ručně generována integrací
dva aktuální poměry a přidání výpočtů odvozených z
kombinace dát.
I když je tento požadavek jednoduchý, definuje určitý
funkce funkce, kterou musíte zahrnout, když
kupte si pro svou organizaci reportovací nástroje.
Návrhář musí také sledovat další požadavky na
získat úplný obrázek. Uživatelé se chtějí přihlásit k odběru
tato zpráva?
Podskupiny přehledu jsou generovány a posílány e-mailem různým
uživatelé? Chcete zobrazit tuto zprávu na portálu společnosti?
Všechny tyto požadavky jsou součástí jednoduché potřeby
nahraďte ruční hlášení podle požadavků uživatelů. Výhoda
těchto typů požadavků je každý, uživatelé i designéři
porozumění konceptu zpráv.
Existují však i jiné typy podniků, které musíme naplánovat.
Pokud jsou obchodní požadavky uvedeny ve formě
Obchodní strategické otázky, to je pro zkušeného designéra snadné
rozeznat míru / fakt a rozměrové požadavky.
Obrázek 1.2 ilustruje měřicí a rozměrové složky a
Obchodní problém.
Pokud uživatelé JAD neví, jak deklarovat své požadavky
v podobě obchodního problému návrhář často poskytne
příklady přeskočení - zahájení relace kolekce
Požadavky.
Expertní designér může pomoci uživatelům porozumět více než jen
strategický obchod, ale také jak ho trénovat.
Přístup shromažďování požadavků je popsán v kapitole 3; pro
nyní bychom chtěli jen naznačit potřebu designu pro každého
typy požadavků na BI
Strategický obchodní problém není jen požadavek
Obchodní, ale také designová stopa. Pokud máte odpovědět
na vícerozměrnou otázku, pak si musíte zapamatovat,
předložit i dát rozměry a pokud potřebujete uložit i
dát vícerozměrný, musíte se rozhodnout, jaký druh technologie nebo
techniku, kterou budete používat.
Implementujete rezervované kostkové hvězdné schéma nebo obojí?
Jak vidíte, i jednoduchý obchodní problém
může mít značný vliv na design. nicméně
tyto typy obchodních požadavků jsou běžné a přinejmenším samozřejmě
zkušenými designéry a projektanty.
Proběhla dostatečná debata o technologiích a podpoře
OLAP a k dispozici je široká škála řešení. Doteď
zmínili jsme potřebu kombinovat jednoduché hlášení s i
rozměrové požadavky podnikání a jak tyto požadavky
ovlivňovat technická architektonická rozhodnutí.
Jaké jsou však požadavky, které nejsou snadno pochopitelné
uživateli nebo týmem DW? Analýzu nikdy nebudete potřebovat
prostorová (prostorová analýza)?
Těžařské modely dát budou vaší nezbytnou součástí
budoucnost? Kdo ví?
Je důležité si uvědomit, že těchto typů technologií není mnoho
známé obecným uživatelským komunitám a členům týmu
Dw, částečně by se to mohlo stát, protože obvykle
zpracovávají je někteří interní nebo externí techničtí odborníci. To je
extrémní případ problémů, které tyto typy technologií generují. Já
uživatelé nemohou popsat obchodní požadavky ani je rámcovat
aby mohli návrhářům poskytnout pokyny
zůstaňte bez povšimnutí nebo, horší, jednoduše ignorujte.
Problematičtější se stává, když návrhář a vývojář selžou
mohou rozpoznat použití jednoho z těchto pokročilých, ale
kritické technologie.
Jak jsme často slyšeli, jak návrháři říkají: „No, proč
Neodložíme to stranou, dokud nedostaneme tuto další věc?
"Opravdu se zajímají o priority, nebo se jen vyhýbají i."
požadavky, kterým nerozumí? Je to s největší pravděpodobností poslední hypotéza.
Řekněme, že váš prodejní tým sdělil požadavek
jak je uvedeno na obrázku 1.3, jak vidíte,
požadavek je formulován ve formě obchodního problému. Tam
rozdíl mezi tímto problémem a typickým dimenzionálním problémem je
vzdálenost. V tomto případě chce prodejní skupina vědět,
na měsíční bázi celkový prodej výrobků, skladů a
zákazníci kteří žijí do 5 mil od skladiště, kde jsou
oni kupují.
Je smutné, že návrháři nebo architekti prostě mohou
ignorujte vesmírnou komponentu slovy: „máme klienta,
produkt a já dát vkladu. Udržujeme vzdálenost až do
další iterace.
"Špatná odpověď. Tento typ obchodního problému se týká
úplně BI. Představuje hlubší pochopení
naše podnikání a robustní analytický prostor pro naše analytiky.
BI je nad rámec jednoduchého dotazu nebo standardního výkaznictví nebo
dokonce OLAP. To však neznamená, že tyto technologie ne
jsou pro vaše BI důležité, ale samy o sobě nepředstavují
prostředí BI.
Design pro informační kontext
(Navrhování informačního obsahu)
Nyní, když jsme identifikovali obchodní požadavky, které je odlišují
do výkresu musí být zahrnuty různé základní komponenty
obecný architektonický. Některé ze součástí BI jsou součástí
našeho počátečního úsilí, zatímco u některých nebude implementováno
několik měsíců.
Všechny známé požadavky se však odrážejí v konstrukci tak
když musíme implementovat určitou technologii, jsme
připravte se na to. Něco na projektu bude odrážet myšlení
tradiční.
Například obrázek 1.1 na začátku kapitoly ukazuje datum
Mart, který udržuje dát dimenzionální.
Tato sada dát se používá k podpoře pozdějšího použití
dát dimenzionálně poháněn obchodními problémy, které
identifikovali jsme. Jako další dokumenty
generovány, jako je vývoj designu dát, my
začneme formalizovat, jak i dát šíří se v prostředí.
Zjistili jsme potřebu zastupovat dát ano
dimenzionální, jejich rozdělení (podle konkrétních potřeb
určeno) na bradavicích.
Další otázkou, na kterou je třeba odpovědět, je: jak budou postaveny
tyto datové trhy?
Stavíte hvězdy na podporu kostek, nebo jen kostek, nebo jen hvězd?
(nebo pravé kostky nebo pravé hvězdy). Vygenerujte architekturu dat
závislé trhy, které pro všechny vyžadují atomovou vrstvu dát
získané? Umožněte nezávislým datovým trhům získávat dát
přímo z operačních systémů?
Jakou technologii krychle se pokusíte standardizovat?
Máte obrovské množství bohů dát potřebné pro dimenzionální analýzu
nebo potřebujete své národní kostky prodejní síly na jedné
týdně nebo obojí? Postavte silný předmět
například server DB2 OLAP pro finance nebo kostky Cognos
PowerPlay pro vaši prodejní organizaci nebo obojí?
Toto jsou ta velká architektonická rozhodnutí
od této chvíle ovlivní vaše prostředí BI. Jo,
zjistili jste potřebu OLAP. Jak to tedy provedete
druh techniky a technologie?
Jak některé z pokročilejších technologií ovlivňují vaše
výkresy? Předpokládáme, že jste identifikovali potřebu
prostor ve vaší organizaci. Nyní musíte vyvolat
edice architektonických výkresů, i když neplánované
provádět vesmírné komponenty několik měsíců. Architekt musí
design dnes vychází z toho, co je potřeba. Předvídat potřebu
prostorová analýza, která generuje, ukládá, provádí a poskytuje
přístup k dát prostor. To by zase mělo sloužit jako a
omezení týkající se typu technologie a specifikací
softwarová platforma, kterou můžete v současné době zvážit Pro
například administrativní systém databáze relační
(RDBMS), které provádíte pro svoji atomovou vrstvu, musí mít
k dispozici robustní prostorové rozšíření. Tím by bylo zajištěno
maximální výkon při použití geometrie a objektů
prostor ve vašich analytických aplikacích. Pokud váš RDBMS není
zvládne i dát (prostorově-centrické) interně, takže budete muset
založit a databáze (prostorově-centrické) externí. To komplikuje
správa vydání a ohrožení celkového výkonu,
nemluvě o dalších problémech vytvořených pro váš
DBA, protože pravděpodobně mají minimální porozumění
základů dát také prostor. Na druhou stranu, pokud váš
RDMBS zpracovává všechny prostorové a související komponenty
optimalizátor si je vědom zvláštních potřeb (například
indexování) prostorových objektů, pak mohou vaše DBA zpracovat
okamžitě spravujte edice a můžete zvýšit
výkon.
Musíte také upravit pracovní plochu (oblast scény) a vrstvu
atomové prostředí zahrnující vyčištění adresy (a
klíčový prvek pro prostorovou analýzu), jakož i následující
úspora prostorových objektů. Posloupnost vydání
design pokračuje nyní, když jsme zavedli pojem čištění
adresa. Za prvé, tato aplikace bude diktovat typ
software potřebný pro vaše úsilí ETL.
Potřebujete produkty, jako je Trillium, které vám poskytnou adresu
čistý, nebo poskytovatel ETL, kterého jste se rozhodli poskytnout
funkčnost?
Prozatím je důležité, abyste ocenili úroveň provedeného designu
musí být dokončeno, než začnete vyrábět své
prostředí (sklad). Výše uvedené příklady by měly
předvést množství návrhových rozhodnutí, která musí následovat
identifikace konkrétního obchodního požadavku. Pokud je hotovo
správně, tato designová rozhodnutí podporují
vzájemná závislost mezi fyzickými strukturami vašeho prostředí,
výběr použité technologie a tok šíření
informační obsah. Bez této konvenční architektury
BI, bude vaše organizace smíšena
chaotický vůči stávajícím technologiím, v lepším případě tak jednotný
není přesné, aby poskytlo zdánlivou stabilitu.
Udržujte informační obsah
Přináší hodnotu informací vaší organizaci
velmi obtížná operace. Bez dostatečného porozumění
a zkušenosti, nebo správné plánování a kreslení, dokonce i
lepší týmy by selhaly. Na druhou stranu, pokud máte velkou
intuice a detailní design, ale žádná disciplína
poprava, jen jste promarnili peníze a čas
protože vaše úsilí je odsouzeno k neúspěchu. Zpráva by měla
být jasný: Pokud vám chybí jeden nebo více z nich
dovednosti, porozumění / zkušenost nebo plánování / kreslení o
implementační disciplína, to povede k ochromení nebo
zničit stavbu BI organizace.
Je váš tým dostatečně připraven? Někdo je na vašem
Tým BI, který rozumí široké dostupné analytické scéně
v prostředí BI, v nezbytných technikách a technologiích
uskutečnit tu krajinu? Ve vašem týmu je někdo
který dokáže rozpoznat rozdíl v aplikaci mezi pokročilými
statické hlášení a OLAP, nebo rozdíly mezi ROLAP a OLAP? Jeden z
Členové vašeho týmu jasně rozpoznávají cestu
výpis a jak to může ovlivnit sklad nebo jak
může sklad podporovat výkon těžby? Člen
týmu rozumí hodnotě dát vesmír nebo technologie
agent-based? Máte někoho, kdo ocení jedinečnou aplikaci
ETL nástrojů versus makléřská technologie
zpráva? Pokud ho nemáte, pořiďte si ho. BI je mnohem víc
velká normalizovaná atomová vrstva, OLAP, schémat a
hvězda a ODS.
Mít porozumění a zkušenosti, abyste rozpoznali požadavky
BI a jejich řešení je pro vaše schopnosti zásadní
správně formalizovat potřeby a design uživatele
a provádět jejich řešení. Pokud vaše komunita uživatelů ano
potíže s popisem požadavků, je to práce týmu
toto porozumění poskytuje sklad. Ale pokud tým
sklad
nerozpozná konkrétní aplikaci BI - například uvedenou
těžba - pak to není to nejlepší, co BI prostředí dělají
často omezena na pasivní vklady. Ignorujte je však
technologie nesnižuje jejich důležitost a účinek, který mají
o vzniku vašich možností business intelligence
organizace a také informační struktura, kterou navrhujete
povýšit.
Design musí zahrnovat pojem design, ed
oba vyžadují kompetentní osobu. Kromě toho design
vyžaduje to týmovou filozofii a pozorování
norem. Například pokud je vaše společnost založila
standardní platformu nebo identifikoval konkrétní RDBMS, který jste
chtějí standardizovat napříč platformou, rýsuje se to
všichni v týmu tyto standardy dodržují. Obecně jeden
tým vystavuje potřebu normalizace (uživateli
komunit), ale samotný tým není ochoten se k nim připojit
standardy stanovené v jiných oblastech společnosti nebo snad i v EU
podobné společnosti. Nejen, že je to hyporcritické, ale zajišťuje to i firma
je schopen využívat stávající zdroje a investice. Neznamená to
že neexistují žádné situace, které by zaručovaly určitou platformu
nestandardní technologie; úsilí skladiště
měli by žárlivě chránit standardy podniku až do výše
že obchodní požadavky nevyžadují jinak.
Třetí klíčová součást potřebná k vytvoření BI
organizace je disciplína.
Závisí to celkem, stejně na jednotlivcích i na životním prostředí.
Projektanti, sponzoři, architekti a uživatelé musí ocenit
disciplína nezbytná k vybudování informační struktury společnosti.
Návrháři musí směřovat své úsilí v oblasti designu tak, aby
dokončit další nezbytné úsilí ve společnosti.
Předpokládejme například, že vaše společnost staví a
ERP aplikace, která má skladovou komponentu.
Je tedy odpovědností návrhářů ERP spolupracovat s
tým skladového prostředí, aby také nekonkuroval
duplicitní práce již byly zahájeny.
Disciplína je také předmět, který je třeba obsadit
celou organizací a je obvykle zřízena a svěřena a
výkonná úroveň.
Jsou vedoucí pracovníci ochotni dodržovat navržený přístup? A
přístup, který slibuje vytvoření informačního obsahu, který
konec přinese hodnotu všem oblastem podniku, ale možná
kompromituje jednotlivce nebo agendy oddělení? Pamatujte si na to rčení
"Přemýšlet o všem je důležitější než přemýšlet o jedné věci".
Toto rčení platí pro organizace BI.
Mnoho skladů bohužel soustředí své úsilí
snaží oslovit a přinést hodnotu konkrétnímu oddělení nebo
konkrétní uživatelé, s malým ohledem na organizaci v
Všeobecné. Předpokládejme, že manažer požádá o pomoc
werehouse. Tým na to reaguje 90denní prací
nezahrnuje pouze dodání požadavků na oznámení definovaných
výkonný, ale zajišťuje to všechno dát základny jsou smíchány v úrovni
atomové před zavedením do technologie krychle
návrh.
Tento technický doplněk zajišťuje, že firma je
thehousehouse bude mít prospěch z dát nezbytné pro manažera.
Výkonný ředitel však hovořil s externími poradenskými firmami
navrhli podobnou aplikaci s dodáním za méně než 4
týdny.
Za předpokladu, že interní tým ubytovny je kompetentní,
manažer má na výběr. Kdo může podporovat disciplínu
k pěstování dobra bylo zapotřebí dalšího inženýrství
informativní podnik nebo se mohou rozhodnout provést vlastní
řešení rychle. Ta druhá se zdá být skutečně vybrána
příliš často a slouží pouze k vytváření informačních kontejnerů
které prospívají jen několika nebo jedinému.
Krátkodobé a dlouhodobé cíle
Architekti a projektanti musí jeden formalizovat
dlouhodobý pohled na obecnou architekturu a plány
vyrůst v organizaci BI. Tato kombinace
krátkodobý zisk a dlouhodobé plánování
představují dvě tváře úsilí BI. Krátkodobý zisk
expirace je aspekt BI, který je spojen s iteracemi souboru
váš sklad.
Na to se zaměřují plánovači, architekti a sponzoři
splňují konkrétní obchodní požadavky. Právě na této úrovni
jsou stavěny fyzické struktury, nakupována technologie a
techniky jsou implementovány. V žádném případě nejsou vyřizovány
specifické požadavky definované konkrétními uživatelskými komunitami.
Vše se děje za účelem splnění konkrétních definovaných požadavků
z konkrétní komunity.
Plánování na velké vzdálenosti je však druhou stránkou
BI. Zde to plány a projekty zajistily
vybudoval jakoukoli fyzickou strukturu, vybrané technologie a
techniky vyrobené s ohledem na společnost. A
dlouhodobé plánování zajišťující soudržnost
je nutné zajistit, aby obchodní výhody pocházely ze všech
nalezené krátkodobé zisky.
Zdůvodněte své úsilí v oblasti BI
Un datový sklad sám o sobě nemá žádnou vlastní hodnotu. V jiných
slovy, mezi technologiemi z
skladové a implementační techniky.
Hodnotu veškerého úsilí ve skladu najdete v akcích
provedeno v důsledku prostředí a obsahu skladu
informativní v průběhu času. Toto je kritický bod k pochopení
než se pokusíte odhadnout hodnotu jakékoli iniciativy
kde.
Architekti a projektanti se příliš často snaží ocenit
fyzické a technické součásti skladu, i když ve skutečnosti je jeho hodnota
založen na obchodních procesech, které jsou pozitivně ovlivněny
sklad a dobře získané informace.
Zde stojí výzva k založení BI: Jak odůvodníte investici?
Pokud thehouse sám o sobě nemá žádnou vnitřní hodnotu, návrháři
projekt musí zkoumat, definovat a formalizovat přínosy
dosáhli ti jednotlivci, kteří budou sklad používat
zlepšit konkrétní obchodní procesy nebo hodnotu
chráněné informace nebo obojí.
Aby to bylo komplikované, jakýkoli komerční proces
ovlivněné úsilím skladu by mohlo poskytnout výhody
„Značné“ nebo „mírné“. Značnou výhodu poskytuje jeden
hmatatelná metrika pro měření návratnosti investic (ROI) - reklama
například otočit inventář další dobu během určitého období
konkrétní nebo za nižší náklady na dopravu na zásilku. Je to víc
obtížné definovat nepatrné výhody, jako je lepší přístup k
hmatatelné hodnoty.
Připojte svůj projekt, abyste věděli
Obchodní požadavky
Návrháři projektů se příliš často pokoušejí spojit hodnotu
skladu s amorfními cíli firmy. Uvedením toho
"Hodnota skladu je založena na naší schopnosti."
uspokojit strategické požadavky “otevíráme
mluvený projev. Samotné však nestačí k určení, zda
investice do inventáře má smysl. Je lepší spojit opakování
sklad se specifickými a známými komerčními požadavky.
Měření návratnosti investic
Výpočet ROI v nastavení skladu může být
obzvláště obtížné. Je obzvláště obtížné, pokud je výhodou
Princip konkrétního opakování je něco nehmotného nebo
snadno měřitelné. Jedna studie zjistila, že uživatelé vnímají
dvě hlavní výhody iniciativ BI:
▪ Vytvořit schopnost rozhodovat
▪ Vytvořit přístup k informacím
Tyto výhody jsou měkké (nebo mírné) výhody. Je to dobře vidět
jak můžeme vypočítat ROI na základě tvrdého vedení (nebo
větší) jako snížení nákladů na dopravu, ale jak
měříme schopnost dělat lepší rozhodnutí?
To je určitě výzva pro projektanty, když
snaží se přimět společnost, aby investovala do konkrétního podniku
skladové úsilí. Zvýšení prodeje nebo snížení nákladů
již nejsou ústředními tématy, která řídí prostředí BI.
Místo toho hledáte přístup v obchodních požadavcích
lepší informace, aby konkrétní oddělení mohlo
činit rychlejší rozhodnutí. To jsou strategické hnací síly
což je pro podnikání stejně důležité, ale jsou
nejednoznačnější a obtížněji charakterizovatelné v konkrétní metrice.
V takovém případě může být výpočet ROI klamný, ne-li irelevantní.
Návrháři projektů musí být schopni prokázat hodnotu
hmatatelné, aby se vedení rozhodlo, zda do něj investovat
určité opakování platí. Nebudeme však navrhovat nový
metoda pro výpočet ROI, nebudeme dělat žádné pro nebo argumenty
proti tomu.
K dispozici je mnoho článků a knih, které pojednávají o základech
vypočítat ROI. Existují speciální hodnoty, jako je hodnota
o investici (VY), kterou nabízejí skupiny jako Gartner, které můžete
zkoumat. Místo toho se zaměříme na klíčové aspekty všech
ROI nebo jiné hodnotové nabídky, které musíte vzít v úvahu.
Uplatňování návratnosti investic
Kromě argumentu o „tvrdých“ výhodách oproti „lehkým“ výhodám
spojené s úsilím BI je třeba zvážit další problémy
když použijeme ROI. Například:
Přisuzujte příliš mnoho úspor úsilí DW, které by mělo přijít
nicméně
Řekněme, že vaše společnost přešla z architektury
mainframe do distribuovaného prostředí UNIX. Takže jakékoli
úspory, které mohou (ale nemusí) být tímto úsilím realizovány
by neměly být připisovány výlučně, pokud všem (?),
sklad.
Neúčtování všech nákladů. A je z toho spousta věcí
vzít v úvahu. Zvažte následující seznam:
▪ Náklady na spuštění, včetně proveditelnosti.
▪ Náklady na vyhrazený hardware se souvisejícím úložištěm e
komunikace
▪ Náklady na software, včetně správy dát a rozšíření
klient / server, software ETL, technologie DSS,
vizualizace, programování a aplikace toku
pracovní a sledovací software.
▪ Náklady na návrh konstrukce dát, s realizací, a
optimalizace
▪ Náklady na vývoj softwaru přímo spojené s tímto úsilím
BI
▪ Náklady na domácí podporu, včetně optimalizace
výkon, včetně kontroly verze softwaru e
operace pomoci
Použijte návratnost investic „Big-Bang“.
Stavba skladu jako jediné a obrovské úsilí
je odsouzena k neúspěchu, takže také vypočítá návratnost investic pro iniciativu
velký podnik Nabídka je překvapivá a to designéři
pokračujte v chabých pokusech odhadnout hodnotu celku
snaha.
Protože designéři se snaží dát peněžní hodnotu
o podnikatelské iniciativě, pokud je všeobecně známo a přijato
Je těžké odhadnout konkrétní opakování? Jak je to možné? Není
možné až na několik výjimek. Nedělej to.
Nyní, když jsme zjistili, co dělat, když nebudeme počítat
ROI, zde je několik bodů, které nám pomohou při definici
spolehlivý proces pro odhad hodnoty vašeho úsilí BI.
Získání souhlasu s návratností investic. Bez ohledu na to vaše
volba techniky k odhadu hodnoty vašeho úsilí BI, musíte
musí být odsouhlaseny všemi stranami, včetně projektantů,
sponzoři a vedoucí pracovníci společnosti.
Snižte ROI na identifikovatelné části. Nezbytný krok směrem dovnitř
rozumný výpočet návratnosti investic je zaměřit tento výpočet na jeden
konkrétní projekt. To pak umožňuje odhadnout hodnotu
na základě splnění konkrétních obchodních požadavků
Definujte náklady. Jak již bylo zmíněno, mnoho nákladů musí být
považováno. Kromě toho musí náklady zahrnovat nejen související náklady
k jedné iteraci, ale také k souvisejícím nákladům
zajištění souladu s normami společnosti.
Definujte výhody. Jasným propojením návratnosti investic s požadavky
komerční, měli bychom být schopni identifikovat
výhody, které povedou ke splnění požadavků.
Snižte náklady a přínosy při nadcházejících výdělcích. To je cesta
nejlepší způsob, jak založit své ocenění na čisté současné hodnotě
(NPV) na rozdíl od pokusu o předpovědi budoucí hodnoty v
budoucí výdělky.
Udržujte mezičas ROI na minimu. JE'
dlouhodobě dobře zdokumentováno, ve vašem se používá
ROI
Použijte více než jeden vzorec návratnosti investic. Existuje mnoho metod pro
Předpověď ROI a měli byste si naplánovat, zda použít jednu nebo
plus, včetně čisté současné hodnoty, vnitřní rychlost návratu
(IRR) a zotavení.
Definujte opakovatelný proces. To je zásadní pro výpočet
jakákoli dlouhodobá hodnota. A
jediný opakovatelný proces pro všechny sekvence projektu a
následovat.
Uvedené problémy jsou nejčastější problémy definované odborníky
prostředí penzionu. Naléhání na vedení společnosti
dodání ROI „Velkého třesku“ je velmi matoucí. Pokud začnete vše
výpočty návratnosti investic jejich snížením na identifikovatelné a hmatatelné části
dobrá šance odhadnout přesné hodnocení ROI.
Dotazy ohledně výhod návratnosti investic
Ať už máte jakékoli výhody, měkké i tvrdé, můžete je použít
několik základních otázek k určení jejich hodnoty. Na
příklad pomocí jednoduchého systému měřítka, od 1 do 10, vy
dopad jakéhokoli úsilí můžete zjistit pomocí následujícího postupu
otázky:
▪ Jak byste ohodnotili pochopení dát po tomto
projekt vaší společnosti?
▪ Jak byste odhadli vylepšení procesu jako výsledek
tento projekt?
▪ Jak byste nyní změřili dopad nových poznatků a závěrů
zpřístupněny touto iterací
▪ Jaký byl dopad nových počítačových prostředí e
účinkování v důsledku toho, co jsme se naučili?
Pokud je odpovědí na tyto otázky málo, je možné, že
společnost nestojí za investici. Otázky s vysokou
bodování k významným ziskům hodnoty a mělo by
slouží jako vodítka pro další vyšetřování.
Například vysoké skóre za vylepšení procesu
mělo by vést designéry k tomu, aby prozkoumali, jaké jsou procesy
byly vylepšeny. Možná zjistíte, že některé nebo všechny získané zisky
jsou hmatatelné, a proto lze snadno získat peněžní hodnotu
aplikovaný.
Získejte maximum z první iterace
sklad
Největší výsledek vašeho obchodního úsilí je často v
prvních několik iterací. Tyto první snahy tradičně
vytvořit nejužitečnější informační obsah pro veřejnost e
zavádí podporu pro technologický základ pro další
BI aplikace.
Obvykle každá následující posloupnost dát projektu
sklady přinášejí podniku v roce XNUMX stále menší přidanou hodnotu
Všeobecné. To platí zejména v případě, že iterace není
přidává nová témata nebo nesplňuje potřeby nového
komunita uživatelů.
Tato funkce skladování platí také pro baterie
zvýšení o dát historici. Protože další úsilí vyžaduje více
dát a jak víc dát se nalije do skladu v průběhu času, nejvíce
dát stává se méně relevantní pro použitou analýzu. Tyto dát jsou
často volané dát usnout a vždy je drahé si je nechat, protože
téměř nikdy se nepoužívají.
Co to znamená pro sponzory projektů? V zásadě, i
první sponzoři sdílejí více než investiční náklady.
To je primární, protože jsou impulsem k založení vrstvy
velké technologické prostředí a skladové zdroje,
včetně organických.
Ale tyto první kroky přinášejí nejvyšší hodnotu, a tedy i designéry
často musí investici zdůvodnit.
Projekty vytvořené po vaší iniciativě BI mohou mít náklady
nižší (ve srovnání s prvním) a přímé, ale mají menší hodnotu
společnosti.
A vlastníci organizací musí začít uvažovat
hodit akumulaci dát a méně relevantní technologie.
Těžba dat: těžba Dát
Četné architektonické komponenty vyžadují varianty
technologie a techniky dolování dat -
například různí "agenti" pro zkoumání bodů zájmu úřadu
zákazníci, operační systémy společnosti a pro stejný dw. Tyto
agenti mohou být pokročilé neuronové sítě trénované na
Trendové trendy, jako je například budoucí poptávka po produktu
podpora prodeje; založené na pravidlech pro
reagovat na celek dat okolnosti, například diagnóza
lékařská a léčebná doporučení; nebo dokonce jednoduchých agentů
s rolí hlášení výjimek vrcholovým manažerům (top
vedoucí pracovníci). Obecně tyto extrakční procesy dát si
ověřit v reálném čase; proto musí být jednotní
zcela s pohybem dát oni sami.
Online analytické zpracování Zpracování
Online analýza
Možnost krájení, sekání, válcování, vrtání
a provést analýzu
co-li, je v rozsahu, cíle sady
Technologie IBM. Například funkce analytického zpracování
online (OLAP) existuje pro produkt DB2, který přináší do systému dimenzionální analýzu
motor databáze stejný.
Funkce přidávají do SQL rozměrný nástroj
využijte všech výhod přirozené součásti produktu DB2. Další
příkladem integrace OLAP je extrakční nástroj DB2
Analyzátor serveru OLAP. Tato technologie umožňuje kostky
Server DB2 OLAP bude rychle a automaticky
analyzovány za účelem identifikace a hlášení hodnot dát neobvyklé nebo neočekávané
skrz krychli obchodnímu analytikovi. A konečně, funkce
DW Center poskytuje mezi architekty prostředky ke kontrole
mimo jiné profil krychle serveru DB2 OLAP jako součásti
povaha procesů ETL.
Prostorová analýza Prostorová analýza
Prostor představuje polovinu analytických kotev (vedení)
nezbytné pro panorama
široký analytický (čas představuje druhou polovinu). Atomová úroveň
(atomová úroveň) skladu, znázorněného na obrázku 1.1,
zahrnuje základy času i prostoru. Nahrávky
analýzy časové kotvy pro informace o čase a adrese
analýza kotevního prostoru. Časová razítka (časová razítka)
provádějí analýzu včas a vedou informace o adrese
analýza vesmírem. Diagram ukazuje geokódování - proces
převod adres na body na mapě nebo body v prostoru
takže pojmy jako vzdálenost a interní / externí mohou být
používá se v analýze - provádí se na atomové úrovni a prostorové analýze
který je k dispozici analytikovi. IBM poskytuje rozšíření
vesmír, vyvinutý s Institutem pro výzkum environmentálního systému (ESRI),
al databáze DB2 tak, aby prostorové objekty mohly být
uloženy jako běžná součást databáze relační. DB2
Spatial Extenders, také poskytují všechna rozšíření SQL pro
využít prostorové analýzy. Například rozšíření SQL z
otázka o
vzdálenost mezi adresami nebo to, zda je bod uvnitř nebo vně oblasti
polygonální definované, jsou analytickým standardem s prostorovým
Extender. Další informace najdete v kapitole 16.
Databáze- Nástroje rezidentních nástrojů Databáze-
Resident
DB2 má mnoho funkcí SQL rezidentů BI, které pomáhají
v analytické akci. Tyto zahrnují:
▪ Rekurzivní funkce k provedení analýzy, například „najít
všechny možné dráhy letu z San Francisco a New York".
▪ Analytické funkce pro hodnocení, kumulativní funkce, krychle
a souhrny pro usnadnění běžných úkolů
pouze s technologií OLAP jsou nyní přirozenou součástí
motor databáze
▪ Možnost vytvářet tabulky, které obsahují výsledky
Prodejci databáze vůdci kombinují více schopností BI
v databáze stejný.
Hlavní dodavatelé databáze míchají více
Funkce BI v databáze stejný.
To poskytuje nejlepší výkon a více možností spuštění pro
BI řešení.
Jsou diskutovány vlastnosti a funkce produktu DB2 V8
podrobně v následujících kapitolách:
Základy technické architektury a správy dat
(Kapitola 5)
▪ Základy produktu DB2 BI (kapitola 6)
▪ Tabulky materializovaného dotazu DB2
Tabulky) (kapitola 7)
▪ Funkce DB2 OLAP (Kapitola 13)
▪ DB2 Enhanced BI
Funkce a funkce) (Kapitola 15)
Zjednodušený systém dodání dat
Doručovací systém dát zjednodušený
Architektura znázorněná na obrázku 1.1 obsahuje několik
struktur dát fyzický. Jedním z nich je sklad dát provozní.
Obecně je ODS zaměřena na předmět,
integrovaný a aktuální. Vytvořili byste ODS na podporu, ad
například prodejní kancelář. Prodej ODS by se integroval dát
pochází z mnoha různých systémů, ale ponechá si pouze, ad
například dnešní transakce. ODS lze aktualizovat
i mnohokrát denně. Zároveň procesy
tlačit i dát integrován do jiných aplikací. Tato struktura je
speciálně navržen pro integraci dát aktuální a dynamické e
bude pravděpodobným kandidátem, který podstoupí analýzu v reálném čase,
jak poskytnout servisní agenty zákazníci prodejní informace
proudy zákazníka získáním informací o prodejních trendech
ze samotného skladu. Další struktura znázorněná na obrázku 1.1 je
formální status pro dw. Není to jen místo pro
provádění nezbytné integrace, kvality dátA
transformace dát zásob na cestě, ale je to také
spolehlivý a dočasný skladovací prostor pro dát odpověděl
lze použít v analýze v reálném čase. Pokud se rozhodnete
použijte ODS nebo pracovní plochu, jednu
nejlepších nástrojů k naplnění těchto struktur dát použitím
různých operačních zdrojů je heterogenní distribuovaný dotaz produktu DB2.
Tuto schopnost zajišťuje volitelná funkce DB2
s názvem DB2 Relational Connect (pouze dotaz) a prostřednictvím DB2
DataJoiner (samostatný produkt dodávající aplikaci,
vkládání, aktualizace a možnost zrušení a
Heterogenní distribuované RDBMS).
Tato technologie umožňuje architektům dát svázat dát di
výroba s analytickými procesy. Nejen technologie
prakticky přizpůsobit jakémukoli požadavku na replikaci
mohou se ukázat s analýzou v reálném čase, ale to
mohou se také připojit k široké škále základen dát více
populární, včetně DB2, Oracle, Sybase, SQL Server,
Informix a další. K naplnění lze použít produkt DB2 DataJoiner
struktura dát formální jako ODS nebo dokonce stůl
stálé zastoupení ve skladu určeném k restaurování
rychlé okamžité aktualizace nebo prodej. Samozřejmě,
tyto stejné struktury dát lze vyplnit pomocí
další hlavní technologie určená pro replikaci dát, IBM
DataPropagator relační. (DataPropagator je samostatný produkt
pro centrální systémy. Zahrnuje DB2 UNIX, Linux, Windows a OS / 2
replikační služby dát jako standardní funkce).
Další způsob přesunu dát operující kolem
jinak je podnik integrátorem podnikových aplikací
známý jako zprostředkovatel zpráv
jedinečná technologie umožňuje bezkonkurenční ovládání do středu
(cílení) a pohyb dát kolem společnosti. IBM má makléře
nejpoužívanější zprávy, MQSeries nebo variace
výrobku, který zahrnuje požadavky e-commerce, IBM
WebSphere MQ.
Další diskuse o tom, jak využít MQ k podpoře a
sklad a prostředí BI, viz webové stránky knihy. Zatím ano
stačí říci, že tato technologie je vynikající médium pro
zachycení a transformace (pomocí MQSeries Integrator) dát
cílení operátoři získaní pro řešení BI. Tam
Technologie MQ byla integrována a zabalena do UDB V8, který
to znamená, že nyní lze spravovat fronty zpráv
jako by to byly tabulky DB2. Koncept svařování
zprávy ve frontě a vesmír databáze relační hlavy
směrem k výkonnému doručovacímu prostředí dát.
Nulová latence Nulová latence
Konečným strategickým cílem pro IBM je analýza nulové latence (nulové latence).
Jak je definováno
Gartner, systém BI, musí být schopen odvodit, asimilovat
a na požádání poskytnout analytikům informace. Výzva,
samozřejmě to spočívá v tom, jak se mísit dát aktuální a v reálném čase
s nezbytnými historickými informacemi, jako je i dát související model /
trend nebo extrahované porozumění jako vymezení
zákazníka
Mezi tyto informace patří například identifikace zákazníci ad
vysoké nebo nízké riziko nebo které produkty i zákazníci hodně koupí
pravděpodobně pokud už mají ve svých vozících nějaký sýr
nakupování.
Získání nulové latence je ve skutečnosti závislé na dvou
základní mechanismy:
▪ Úplné sjednocení dát které jsou analyzovány pomocí
zavedenými technikami as nástroji vyvinutými BI
▪ Dodací systém dát efektivní k zajištění toho
analýza v reálném čase je opravdu k dispozici
Tyto předpoklady nulové latence se od těchto dvou neliší
cíle stanovené společností IBM a popsané výše.
Úzké spojení dát je součástí
bezproblémová integrace zajištěná společností IBM. A vytvořit systém
dodání dát efektivní je zcela závislá na
dostupná technologie, která zjednodušuje proces doručování
dát. V důsledku toho jsou dva ze tří cílů IBM kritické
realizovat třetí. IBM vědomě vyvíjí vlastní
technologie zajišťující, že nulová latence je realitou
skladové úsilí.
Shrnutí / syntéza
Organizace BI poskytuje cestovní mapu pro
vytvořte si své prostředí
iterativně. Musí být upravena tak, aby odrážela potřeby
vaše podnikání, současné i budoucí. Bez architektonické vize
velké, opakování zásob je o něco více než
náhodné implementace centrálního skladu, pro které je málo
vytvořit velký informativní podnik.
První překážkou pro projektové manažery je, jak ospravedlnit
investice nezbytné pro rozvoj organizace BI.
Ačkoli výpočet návratnosti investic zůstal primární podporou pro
skladové úspěchy, je stále obtížnější
přesně předpovědět. To vedlo k dalším metodám pro
určení, zda získáváte peníze. The
kupuje se například hodnota investice2 (VY)
jako řešení.
Vynořuje se nad architekty dát a na projektantech
záměrně generovat a poskytovat informace sdružením
uživatelům a ne pouze poskytovat službu na dát. Tady je
obrovský rozdíl mezi těmito dvěma. Informace jsou něco, co člověka dělá
rozdíl v rozhodování a účinnosti; relativně, tj
dát jsou stavebními kameny pro odvozování těchto informací.
Ačkoli kritický vůči zdroji dát řešit požadavky
komerční, prostředí BI by mělo hrát větší roli
při vytváření informačního obsahu. Musíme vzít
další opatření k čištění, integraci, transformaci nebo
jinak vytvořit informační obsah, podle kterého
uživatelé mohou jednat, a proto je musíme zajistit
akce a tato rozhodnutí, jsou-li důvodná, jsou zohledněna
v prostředí BI. Pokud odsuneme sklad, aby sloužil pouze na dát,
je zajištěno, že obsah vytvoří asociace uživatelů
informace potřebné k přijetí opatření. Tím je zajištěno, že jejich
komunita bude moci dělat lepší rozhodnutí, ale firma
trpí nedostatkem znalostí, které využili.
Dato že architekti a projektanti iniciují projekty
specifické pro prostředí BI, zůstávají odpovědné podniku
obecně. Jednoduchý příklad této obousměrné funkce
tváře iterací BI se nacházejí ve zdroji dát. Všechny
dát obdržené pro konkrétní obchodní požadavky musí být
osídleno v první atomové vrstvě. To zaručuje rozvoj
podnikové informační aktivum, stejně jako spravovat, řešit
specifické požadavky uživatele definované v iteraci.

W hatisa D ata W arehouse?
Datový sklad je srdcem architektury informačních systémů
od roku 1990 a podporuje informační procesy tím, že nabízí solidní
integrovaná platforma dát historici brát jako základ pro později
analýza. THE datový sklad nabízejí snadnou integraci do
svět nekompatibilních aplikačních systémů. datum
sklad se vyvinul a stal se trendem. Datový sklad
organizuje a ukládá i dát nezbytné pro informační procesy e
analytické na základě dlouhé historické časové perspektivy. Všechno
to vyžaduje značný a stálý závazek ve výstavbě e
při údržbě datový sklad.
Co tedy je datový sklad? datový sklad je:
▪ orientovaný na předměty
▪ integrovaný systém
▪ variantní čas
▪ energeticky nezávislé (nezruší se)
sbírka dát slouží k podpoře manažerských rozhodnutí v
implementace procesu.
I dát vloženo datový sklad ve většině vznikají
případy z provozního prostředí. The datový sklad je vyroben a
paměťová jednotka, fyzicky oddělená od zbytku
systém, který obsahuje dát dříve transformováno uživatelem
aplikace, které fungují na informacích odvozených z prostředí
provozní.
Doslovná definice a datový sklad si zaslouží důkladný pohled
vysvětlení, protože existují důležité motivace a významy
fond, který popisuje vlastnosti skladu.
PŘEDMĚT ORIENTACE ORIENTACE
TEMATICKÝ
První vlastnost a datový sklad je, že je ai-orientovaný
hlavní hráči ve společnosti. Posuzování zkoušek prostřednictvím i
dát je to na rozdíl od klasičtější metody, která poskytuje
orientace aplikací na procesy a funkce,
metoda z větší části sdílená většinou
starší směrové systémy.
Svět provozu je navržen kolem aplikací a funkcí
jako jsou půjčky, úspory, bankovní karty a důvěra pro instituci
finanční. Svět dw je organizován kolem subjektů
například zákazník, prodejce, produkt a firma.
Zarovnání kolem témat ovlivňuje design a
o realizaci dát nalezeno v dw. Relevantnější,
hlavní argument ovlivňuje nejdůležitější část EU
klíčová struktura.
Svět aplikace je ovlivněn jak designem data
základny az návrhu procesu. Svět
dw se zaměřuje výhradně na modelování dát Je to zapnuté
kresba databáze. Návrh procesu (ve své formě
classic) není součástí prostředí dw.
Rozdíly mezi výběrem procesu / funkce a aplikací
volba podle předmětu se také projevuje jako rozdíly v obsahu
z dát na podrobné úrovni. THE dát del dw nezahrnují i dát že
nebudou použity pro proces DSS během aplikací
provozně orientovaný na dát obsahovat i dát uspokojit
okamžitě funkční / zpracovatelské požadavky, které mohou nebo
minus jakékoli využití pro analytika DSS.
Další důležitý způsob, jak provozně orientované aplikace
ai dát se liší od dát z dw je ve zprávách o dát. Já dát
provozní udržovat nepřetržitý vztah mezi dvěma nebo více tabulkami
na základě obchodního pravidla, které je aktivní. THE dát od dw
protínají spektrum času a poměry nalezené v dw jsou
hodně. Mnoho obchodních pravidel (a odpovídajícím způsobem mnoho
zprávy o dát ) jsou zastoupeny ve skladu dát mezi dvěma o
více tabulek.
(Podrobné vysvětlení toho, jak jsou vztahy mezi dát jsou
spravované v DW, odkazujeme na to technické téma
otázka.)
Z jiného úhlu pohledu než z rozdílu
zásadní mezi výběrem funkčnosti / procesu a aplikací
výběr předmětu, existuje větší rozdíl mezi systémy
provozní a dát a DW.
INTEGRACE INTEGRACE
Nejdůležitějším aspektem prostředí dw je to, že i dát nalezeno
v rámci dw jsou snadno integrovány. VŽDY. BEZ
VÝJIMKY. Samotná podstata prostředí dw spočívá v tom, že i dát
obsažené v mezích skladu jsou integrovány.
Integrace se projevuje mnoha různými způsoby - v konvencích
identifikován jako konzistentní v rozsahu konzistentních proměnných v roce XNUMX
kodifikované struktury skládající se z fyzických atributů dát
konzistentní atd.
V průběhu let to dokázali designéři různých aplikací
mnoho rozhodnutí o tom, jak by aplikace měla být
být vyvinut. Individuální styl a designová rozhodnutí
aplikace návrhářů se odhalují stovkami způsobů: v
rozdíly v kódování, struktura klíče, fyzikální vlastnosti,
konvence identifikace atd. Kolektivní kapacita mnoha
návrháři aplikací k vytváření nekonzistentních aplikací
je to legendární. Obrázek 3 odhaluje některé z více rozdílů
důležité ve způsobech navrhování aplikací.
Kódování: Kódování:
Návrháři aplikací zvolili kódování v terénu -
sex - několika způsoby. Návrhář představuje sex jako
„m“ a „f“. Jiný designér představuje sex jako „1“
a „0“. Další návrhář představuje sex jako „x“ e
„Y“. Další návrhář představuje sex jako „mužský“, např
"ženský". Nezáleží na tom, jak sex přichází v DW. Písmeno „M“
a „F“ jsou pravděpodobně stejně dobré jako celek
reprezentace.
Důležité je, že z jakéhokoli původu pochází sexuální pole,
toto pole dorazí do DW v konzistentním integrovaném stavu. Z
důsledek, když je pole načteno do DW z
aplikace, kde byla zastoupena ve formátu
„M“ a „F“, tj dát musí být převedeny do formátu DW.
Měření atributů: Měření
Atributy:
Návrháři aplikací se rozhodli měřit potrubí
různými způsoby v kurzu
Některé roky. Značkové obchody i dát potrubí v
centimetrů. Další návrhář aplikací ukládá i dát
potrubí v palcích. Další designér z
obchody s aplikacemi i dát potrubí v milionech kubických stop
za sekundu. A další návrhář ukládá informace o
potrubí z hlediska yardů. Ať už je zdroj jakýkoli, když
informace o potrubí přicházejí do DW, musí být
měřeno stejným způsobem.
Podle údajů na obrázku 3 problémy s integrací
ovlivňují téměř všechny aspekty projektu - funkce
fyzické dát, dilema mít více než jeden zdroj dát, la
záležitost nekonzistentních identifikovaných vzorků, formáty dát
nekonzistentní atd.
Ať už je designový argument jakýkoli, výsledek je stejný -
i dát musí být uloženy v DW v jednotném čísle e
globálně přijatelným způsobem, i když operační systémy
spodní obchod jinak i dát.
Když se analytik DSS podívá na DW, cíl analytika
by mělo být vykořisťování dát kteří jsou ve skladu,
spíše než přemýšlet o důvěryhodnosti nebo konzistenci
dát.
ČASOVÁ RŮZNOST
Vše i dát v DW jsou v určitém okamžiku přesné.
Tato základní vlastnost dát v DW se velmi liší od dát
v operačním prostředí. THE dát provozního prostředí jsou
přesné jako v okamžiku přístupu. Jinými slovy,
v operačním prostředí při přístupu k jednotce dát, Ale také
počkejte, až bude odrážet přesné hodnoty jako v okamžiku přístupu.
Proč já dát v DW jsou stejně přesné jako v určitém okamžiku v
čas (tj. ne „právě teď“), tj dát nalezené v DW
jsou to „časové odchylky“.
Časová odchylka dát Na DW se odkazuje mnoha způsoby.
Nejjednodušší je, že i dát DW představují dát to je
dlouhodobý horizont - pět až deset let. Horizont
čas představovaný pro operační prostředí je mnohem kratší
▪ z dnešních současných hodnot až šedesát devadesát
Aplikace, které musí fungovat dobře a musí být
dostupné pro zpracování transakcí musí nést
minimální částka dát pokud přiznají jakýkoli stupeň
flexibilita. Takže operační aplikace mají horizont
krátce, jako téma designu
zvukové aplikace.
Druhým způsobem, jak se „časová odchylka“ objeví v DW, je v
klíčová struktura. Každá klíčová struktura v DW obsahuje,
implicitně nebo explicitně časový prvek, jako je
den, týden, měsíc atd. Časový prvek je téměř vždy
ve spodní části zřetězeného klíče nalezeného v DW. V těchto
příležitostně bude prvek času existovat implicitně, podle okolností
kde je na konci měsíce nebo čtvrtletí duplikován celý soubor.
Třetí způsob zobrazení časové odchylky je ten, že i dát del
DW, právě správně zaregistrovaný, nemůže být
aktualizováno. THE dát DW jsou z praktických důvodů dlouhé
série snímků (snímek). Samozřejmě, pokud jsou snímky
byly pořízeny nesprávně, pak mohou být snímky
upraveno. Ale za předpokladu, že jsou snímky hotové
správně, nezmění se, jakmile jsou hotové. V některých
případy mohou být neetické nebo dokonce neplatné, že snímky v
DW jsou upraveny. THE dát funkční, přesný jako v
po přístupu je lze aktualizovat tak, jak se prezentuje
potřeba.
NENÍ PRUTKOVÉ
Čtvrtým důležitým rysem DW je, že je energeticky nezávislý.
Provádějí se aktualizace, vkládání, rušení a změny
pravidelně pro operační prostředí záznam po záznamu. Ale
základní manipulace s dát potřebné v DW je mnohem víc
jednoduchý. V systému existují pouze dva druhy operací
DW - počáteční načtení dát a přístup k dát. Není
jakákoli aktualizace dát (v obecném smyslu
aktualizace) v DW jako normální operace zpracování.
Tento rozdíl má některé velmi silné důsledky
základ mezi provozním zpracováním a zpracováním DW. Na úrovni
design, je třeba být při aktualizaci opatrný
anomální není faktorem v DW, protože aktualizace dát Není
odneseno. To znamená, že na fyzické úrovni designu
lze optimalizovat přístup k svobodám dát,
zejména při řešení témat normalizace a
fyzická denormalizace. Další důsledek jednoduchosti
operací DW je v základní technologii použité pro
spustit prostředí DW. Musí podporovat aktualizace
záznam po záznamu online (jak se často stává u
provozní zpracování), kterou technologie musí mít
velmi složité základy pod zjevnou jednoduchostí.
Technologie, která podporuje zálohování a obnovu, transakce
a integrita dát objevení a náprava stavu zablokování
poměrně složité a není nutné pro zpracování DW.
Vlastnosti DW, orientace designu,
integrace dát v rámci DW, časová variabilita a jednoduchost
vedení dát, to vše vede k prostředí, které je velmi, velmi
odlišné od klasického operačního prostředí. Zdroj téměř všech
dát DW jsou provozní prostředí. Je lákavé přemýšlet
že existuje masivní nadbytečnost dát mezi těmito dvěma prostředími.
První dojem, který mnoho lidí získá, je ve skutečnosti
velká redundance dát mezi operačním prostředím a
DW. Taková interpretace je povrchní a dokazuje ji
nepochopení toho, co se děje v DW.
Ve skutečnosti existuje minimální nadbytečnost dát mezi operačním prostředím
a dát DW. Zvažme následující:
▪ já dát jsou filtrovány dat které předáte z operačního prostředí
do prostředí DW. Hodně dát nikdy nezmizí
z provozního prostředí. Až na to, že i dát které jsou potřebné pro
Zpracování DSS najde svůj směr v prostředí
▪ časový horizont dát je to velmi odlišné od prostředí
na druhou. THE dát v operačním prostředí jsou velmi čerstvé. THE dát
v DW jsou mnohem starší. Pouze z pohledu
časového horizontu je velmi málo překrytí
mezi operačním prostředím a DW.
▪ DW obsahuje dát souhrn, který se nikdy nenajde
v prostředí
▪ já dát od té doby podstoupí zásadní transformaci
při přechodu na obrázek 3 to ilustruje nejvíce
část dát jsou významně upraveny za předpokladu
být vybrán a přesunut do DW. Jinak řečeno,
většina dát je fyzicky upraven e
radikálně, jak je přesunuta do DW. Z pohledu
integrace nejsou stejné dát kteří bydlí
v operačním prostředí.
Ve světle těchto faktorů je nadbytečnost dát mezi těmito dvěma prostředími je
vzácná událost, která vede k redundanci méně než 1% mezi těmito dvěma
prostředí.
STRUKTURA SKLADU
DW mají odlišnou strukturu. Existují různé souhrnné a různé úrovně
detail, který vymezuje DW.
Různé komponenty DW jsou:
▪ Metadata
▪ Dát aktuální podrobnosti
▪ Dát starých detailů
▪ Dát mírně shrnuto
▪ Dát velmi shrnuto
Zdaleka hlavní starost je o i dát detailů
proudy. Jedná se o hlavní problém, protože:
▪ já dát aktuální podrobnosti odrážejí nejnovější události,
o které je vždy velký zájem a
▪ i dát současných detailů jsou objemné, protože jsou
uloženy na nejnižší úrovni zrnitosti e
▪ i dát aktuální podrobnosti jsou téměř vždy uloženy
paměť disku, ke které je rychlý přístup, ale drahá e
komplex od
I dát starší podrobnosti jsou dát které jsou uloženy na
nějakou vzpomínku Massa. Má přístup sporadicky a je
uloženy na úrovni detailů kompatibilní s dát detailní
proudy. I když to není povinné ukládat na a
alternativní paměť, kvůli velkému objemu dát sjednocen s
sporadický přístup dát, paměťové médium pro dát di
starší detail se obvykle na disk neukládá.
I dát shrnuto lehce dát které se destilují zespodu
úroveň podrobností nalezená na aktuální úrovni podrobností. Tento
Úroveň DW je téměř vždy uložena v paměti disku. THE
problémy návrhu, které jsou předkládány architektovi dát
při konstrukci této úrovně DW jsou:
▪ Která jednotka času je shrnutím provedeným výše
▪ Jaký obsah, atributy mírně shrnou
obsah dát
Další úroveň dát v DW je to z dát vysoce
shrnuto. THE dát vysoce shrnuté jsou kompaktní a snadno použitelné
přístupné. THE dát někdy velmi nalezené
v prostředí DW a v ostatních případech i dát vysoce shrnuté jsou
našel mimo bezprostřední zdi technologie hostující DW.
(v každém případě, tj dát vysoce shrnuté jsou součástí DW
bez ohledu na to, kde i dát jsou fyzicky ubytováni).
Konečnou součástí DW jsou metadata. V mnoha ohledech
metadata jsou v jiné dimenzi než ostatní dát
DW, protože metadata žádná neobsahují dat přímo
převzato z provozního prostředí. Metadata mají zvláštní roli, např
velmi důležité v DW. Metadata se používají jako:
▪ adresář, který pomůže analytikovi DSS najít
obsah DW,
▪ průvodce mapováním dát jak já dát Oni byli
transformována z operačního prostředí do prostředí DW,
▪ průvodce po algoritmech použitých pro sumarizaci mezi dát di
aktuální detail ei dát mírně shrnuto, tj dát vysoce
shrnutí,
Metadata hrají v prostředí DW mnohem důležitější roli
než kdy v operačním prostředí
STARÉ DETAILNÍ SKLADOVÁNÍ STŘEDNÍ
K uložení tohoto typu lze použít magnetickou pásku
dát. Ve skutečnosti existuje celá řada nástrojů pro zapamatování
měly by být brány v úvahu pro zachování starých dát di
detail.
V závislosti na objemu dát, frekvence přístupu, náklady
nástrojů a typu přístupu je zcela pravděpodobné
že ostatní nástroje budou potřebovat starou úroveň podrobností
v DW.
PRŮTOK ÚDAJŮ
Existuje normální a předvídatelný tok bohů dát uvnitř DW.
I dát zadejte DW z operačního prostředí. (POZNÁMKA: existují
několik velmi zajímavých výjimek z tohoto pravidla. Nicméně téměř
všechny dát zadejte DW z operačního prostředí). Dato že i dát
zadejte DW z operačního prostředí, transformuje se tak, jak to bylo
popsáno výše. Pokud zadáte DW, tj dát vstoupit do
aktuální úroveň podrobností, jak je znázorněno. Bydlí tam a používá se
dokud nedojde k jedné ze tří událostí:
▪ je čištěn,
▪ je shrnuto a / nebo
▪ je
Zastaralý proces uvnitř pohybu DW i dát aktuální podrobnosti
a dát starých detailů, podle věku dát. Proces
shrnutí používá detail dát vypočítat i dát
mírně shrnuté a vysoce shrnuté úrovně dát. Existují
některé výjimky ze zobrazeného toku (bude probráno později).
Obvykle však pro drtivou většinu dát nalezeno
v DW, tok dát je na obrázku.
POUŽÍVÁNÍ DATOVÉHO DOMU
Není divu, že různé úrovně dát v rámci DW ne
dostávají různé úrovně použití. Zpravidla platí, že čím vyšší je úroveň
shrnutí, plus i dát jsou použity.
Mnoho použití se vyskytuje v dát velmi shrnuto, zatímco staré
dát podrobnosti se téměř nikdy nepoužívají. Existuje dobrý důvod v
přesunout organizaci do paradigmatu využívání zdrojů. Více má
shrnutí i dát, tím rychlejší a efektivnější je dostat se do dát. To
un negozio zjistíte, že provádí mnoho procesů na úrovni podrobností DW,
pak odpovídající velké množství prostředků stroje
je spotřebováno. Stíhání je v nejlepším zájmu každého
co nejdříve na vysoké úrovni shrnutí.
Pro mnoho obchodů použil analytik DSS v předprostředním prostředí DW
dát na úrovni detailů. V mnoha ohledech je příjezd a dát detailní
vypadá to jako bezpečnostní deka, i když jsou k dispozici
další úrovně shrnutí. Jednou z činností architekta dát è
zvyknout uživatele DSS na neustálé používání dát na úrovni plus
nízké detaily. K dispozici jsou dva důvody
architektem dát:
▪ instalace systému zpětného zúčtování, kde koncový uživatel platí
spotřebované zdroje e
▪ což naznačuje, že velmi dobrá doba odezvy může být
získáno, když chování s i dát je na vysoké úrovni
sumarizace, zatímco špatná doba odezvy vyplývá z
chování dát na nízké úrovni
DALŠÍ ÚVAHY
Existuje několik dalších úvah o konstrukci a správě
D.W.
První úvaha se týká indexů. THE dát na vyšších úrovních
shrnutí lze libovolně indexovat, zatímco i dát
na nižších úrovních detailů jsou tak objemné, že mohou být
šetrně indexováno. Ze stejného tokenu, tj dát na vysokých úrovních
detail lze relativně snadno obnovit,
zatímco objem dát na nižších úrovních je tak velká, že i dát ne
mohou být snadno renovovány. V důsledku toho model
z dát a formální práce provedená návrhovou sadou
základ pro DW platil téměř výlučně na úrovni
aktuální proud. Jinými slovy, modelovací činnosti společnosti
dát nevztahují se na úrovně shrnutí téměř ve všech případech.
Další strukturální úvahou je úvaha o rozdělení na
dát autor: DW.
Rozdělení disku lze provést na dvou úrovních - na úrovni dbms a al
úroveň aplikace. V divizi na úrovni dbms, dbms è
informován o divizích a odpovídajícím způsobem je zkontroluje. V případě
dělení na aplikační úrovni, pouze programátor
informováni o divizích a odpovědnosti za ně
správa je ponechána na něm
Pod úrovní dbms, spousta práce se provádí automaticky. Tady je
mnoho nepružnosti spojené s automatickou správou
divize. V případě rozdělení na aplikační úrovni dát del
datový sklad, hodně práce je na programátorovi, ale
konečným výsledkem je flexibilita při správě dát v den
sklad
OSTATNÍ ANOMÁLIE
Zatímco komponenty datový sklad pracovat, jak je popsáno
téměř pro všechny dát, musí existovat několik užitečných výjimek
být projednán. Výjimkou je dát veřejné souhrny
(veřejné souhrnné údaje). Tyto jsou dát souhrny, které byly
vypočteno mimo EU datový sklad ale společnost je používá. THE dát
veřejné souhrny jsou uloženy a spravovány v datový sklad,
i když, jak již bylo zmíněno výše, došlo na ně. THE
účetní vyrábějí takové čtvrtletníky dát jako
příjem, čtvrtletní výdaje, čtvrtletní zisk atd. Práce
prováděné účetními je mimo rámec datový sklad. Nicméně, i dát jsou
používá se „interně“ v rámci společnosti – od marketing, prodej atd.
Další anomálie, o níž nebudeme hovořit, je dát externí.
Další skvělý druh dát které lze najít na rande
sklad je trvalý podrobný údaj. Ty způsobují
je třeba trvale ukládat i dát na jedné úrovni
z etických nebo právních důvodů. Pokud společnost vystavuje i
souvisejících pracovníků s nebezpečnými látkami je potřeba dát
podrobné a trvalé. Pokud společnost vyrábí produkt, který
zahrnuje veřejnou bezpečnost, jaké části letounu jsou
potřeba dát trvalé údaje, stejně jako v případě společnosti
uzavírá nebezpečné smlouvy.
Společnost si nemůže dovolit přehlédnout podrobnosti proč
během několika příštích let, v případě soudního procesu, odvolání, a
sporná stavební vada atd. expozice společnosti
mohlo by to být skvělé. V důsledku toho existuje jedinečný typ dát
známé jako trvalé podrobné údaje.
SOUHRN
Un datový sklad je orientovaný, integrovaný, variantní objekt
čas, sbírka dát energeticky nezávislé na podporu potřeb
rozhodnutí správy. Každá z hlavních funkcí
un datový sklad má své důsledky. Navíc jsou čtyři
úrovně dát del datový sklad:
▪ Starý detail
▪ Aktuální detail
▪ Dát mírně shrnuto
▪ Dát velmi shrnuto
Metadata jsou také důležitou součástí datový sklad.
ABSTRAKTNÍ
Koncept skladování dát nedávno přijato
hodně pozornosti a stal se trendem 90. let. To je ono
díky schopnosti a datový sklad překonat
omezení systémů podpory správy, jako je i
systémy pomoci při rozhodování (DSS) a informační systémy
jednatel (EIS).
Ačkoli koncept datový sklad vypadá slibně,
implementovat i datový sklad to může být problematické, protože
rozsáhlé procesy ukládání. Navzdory
složitost projektů skladování dát, mnoho dodavatelů
a konzultanti, kteří ukládají dát oni to tvrdí
skladování dát proud nezahrnuje problémy.
Na začátku tohoto výzkumného projektu však téměř žádný
byl proveden nezávislý, přísný a systematický výzkum. Z
Proto je těžké říci, co se skutečně stane
v průmyslu při stavbě datový sklad.
Tato studie prozkoumala praxi skladování dát
současníci, jejichž cílem je rozvíjet bohatší porozumění
australské praxe. Analýza literatury poskytla
kontext a základ pro empirické studium.
Z tohoto vyhledávání existuje řada výsledků. První
místo, tato studie odhalila činnosti, ke kterým došlo
během vývoje datový sklad. V mnoha oblastech, tj dát shromáždili
potvrdil praxi uvedenou v literatuře. Za sekundu
stránky, problémy a problémy, které mohou mít dopad
vývoj datový sklad z této studie.
A konečně výhody plynoucí z australských organizací spojených s
použití datový sklad byly odhaleny.
Kapitola 1
Kontext výzkumu
Koncept datových skladů získal širokou popularitu
expozice a proměnil se v objevující se trend v roce XNUMX
90 (McFadden 1996, TDWI 1996, Shah and Milstein 1997,
Shanks a další. 1997, Eckerson 1998, Adelman and Oates 2000). Tento
je vidět na rostoucím počtu článků k datu
skladování v komerčních publikacích (Little a Gibson 1999).
Mnoho článků (viz například Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett a King 1996, Graham et al. 1996,
Sakaguchi a Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997, McCarthy 1997, O 'Donnell 1997, Edwards 1998, TDWI
1999) uvádí významné výhody pro organizace
které implementují i datový sklad. Podporovali svou teorii
s neoficiálními důkazy o úspěšných implementacích, vysoká návratnost
údaje o investicích (ROI) a také poskytování pokynů
reference nebo metodiky pro vývoj datový sklad
(Shanks a kol. 1997, Seddon a Benjamin 1998, Little a Gibson
1999). V extrémním případě Graham et al. (1996) mají
vykázala průměrnou návratnost tříleté investice 401%.
Hodně ze současné literatury však přehlédlo
složitost těchto projektů. Projekty
datový sklad jsou obvykle složité a rozsáhlé, např
proto znamenají vysokou pravděpodobnost selhání, pokud nejsou
pečlivě kontrolováno (Shah a Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs a Clymer 1998, Rao
1998). Vyžadují obrovské množství lidí i zdrojů
finanční a čas a úsilí na jejich vybudování (Hill 1998, Crofts 1998). The
typický čas a potřebné finanční prostředky
asi dva roky a dva nebo tři miliony dolarů (Braly 1995, Foley
1997b, Bort 1998, Humphries et al. 1999). Tyto časy a prostředky
finanční prostředky jsou vyžadovány ke kontrole a konsolidaci mnoha aspektů
různé typy datových skladů (Cafasso 1995, Hill 1998). Na stranu
úvahy o hardwaru a softwaru, další funkce, které se liší
z těžby dát na procesy načítání dát, od
kapacita paměti pro správu aktualizací a meta dát
pro školení uživatelů, je třeba je vzít v úvahu.
V době zahájení tohoto výzkumného projektu jich bylo velmi málo
akademický výzkum prováděný v oblasti datových skladů,
zejména v Austrálii. To bylo patrné z nedostatku článků
zveřejněno v datových skladech v novinách nebo jiných spisech
akademici té doby. Mnoho z akademických spisů
dostupné popsal americké zkušenosti. Nedostatek
Akademický výzkum v oblasti datových skladů sl způsobil
poptávka po pečlivém výzkumu a empirických studiích (McFadden 1996,
Shanks a další. 1997, Little a Gibson 1999). Zejména studie
výzkum prováděcího procesu datový sklad
je třeba je udělat pro rozšíření znalostí
obecně o provádění datový sklad e
bude sloužit jako základ pro budoucí výzkumnou studii (Shanks ed
ostatní. 1997, Little a Gibson 1999).
Účelem této studie je tedy studovat, co je ve skutečnosti
stává se to, když organizace udržují a používají data
sklad v Austrálii. Tato studie bude konkrétně zahrnovat
analýza celého procesu vývoje a datový sklad,
od zahájení a plánování přes návrh a
implementace a následné použití v organizacích
Australan. Studie navíc přispěje ke stávající praxi
identifikace oblastí, kde může být praxe dále
zlepšenou a neefektivnost a rizika lze minimalizovat nebo
vyhnout se. Kromě toho poslouží jako základ pro další studie o datový sklad in
Austrálie a vyplní mezeru, která v současné době existuje v literatuře.
Výzkumné otázky
Cílem tohoto výzkumu je studovat příslušné činnosti
při provádění datový sklad a jejich použití
Australské organizace. Zejména jsou studovány prvky
s ohledem na plánování, rozvoj, al
provoz, použití a příslušná rizika. Proto otázka
tohoto výzkumu je:
"Jaká je současná praxe datový sklad v Austrálii?"
K efektivnímu řešení tohoto problému, a
určitý počet doplňkových výzkumných otázek. Zejména tři
dílčí otázky byly identifikovány z literatury, to znamená
uvedený v kapitole 2, který má vést tento výzkumný projekt:
Jak se mám datový sklad organizacemi
Australan? Jaké jsou problémy?
Jaké jsou výhody?
Při zodpovězení těchto otázek byl použit výkres
průzkumný výzkum využívající dotaz. Jako studie
průzkumné, odpovědi na výše uvedené otázky nejsou úplné
(Shanks a kol. 1993, Denscombe 1998). V tomto případě ano
ke zlepšení reakce na ně je nutná triangulace
otázky. Šetření však poskytne pevný základ pro
budoucí práce zkoumání těchto otázek. Podrobný
diskuse o oprávněnosti výzkumné metody a designu
je uveden v kapitole 3.
Struktura výzkumného projektu
Tento výzkumný projekt je rozdělen do dvou částí: kontextuální studie
konceptu datového skladu a empirického výzkumu (viz
obrázek 1.1), z nichž každá je popsána níže.
Část I: Kontextová studie
První část výzkumu spočívala v opětovném prozkoumání
aktuální literatura o různých typech datových skladů včetně i
systémy pomoci při rozhodování (DSS), informační systémy
executive (EIS), případové studie datový sklad a datové koncepty
sklad. Dále výsledky fau sui datový sklad a bohové
skupiny pro setkání odborníků a odborníků pod vedením skupiny
K této fázi studie přispěl výzkum Monash DSS
jehož cílem bylo získat informace o praxi údajů
sklad a identifikovat rizika spojená s jejich přijetím.
Během tohoto období kontextového studia, porozumění
problémová oblast byla vytvořena, aby poskytovala znalosti o
základ pro následná empirická šetření. Toto však
byl probíhající proces při provádění studie
výzkum.
Část II: Empirický výzkum
Zejména relativně nový koncept datových skladů
v Austrálii to vyvolalo potřebu provést vyšetřování pro
získejte ucelený obraz zkušeností s používáním. Tento
část byla hotová, jakmile byla problémová doména
byla stanovena rozsáhlým přehledem literatury. Koncept
datových skladů vytvořených během fáze kontextového studia je
byl použit jako vstup pro počáteční dotazník této studie.
Poté byl dotazník přezkoumán. Šest odborníků na rande
skladu se zúčastnil zkoušky. Účelem
Prvotním dotazníkem byla kontrola úplnosti a přesnosti
nějaké otázky. Na základě výsledků testu je dotazník
byl upraven a upravená verze byla odeslána uživateli
účastníci průzkumu. Vrácené dotazníky pak byly
analyzováno na i dát v tabulkách, diagramech a jiných formátech. THE
výsledky analýzy dát tvoří snímek
praxe skladování dat v Austrálii.
PŘEHLED DATA SKLADOVÁNÍ
S vylepšením se vyvinul koncept datového skladu
výpočetní techniky.
Je zaměřen na překonání problémů, se kterými se setkávají skupiny
podpora aplikací, jako je systém pro podporu rozhodování (DSS) e
Výkonný informační systém (EIS).
V minulosti byla největší překážkou těchto aplikací
neschopnost těchto aplikací poskytnout a databáze
nezbytné pro analýzu.
To je způsobeno hlavně povahou práce úřadu
vedení lidí. Zájmy vedení společnosti se liší
neustále v závislosti na ošetřované oblasti. Proto i dát
základní pro tyto aplikace musí být schopen
rychle se mění v závislosti na ošetřované části.
To znamená, že i dát musí být k dispozici ve formuláři
adekvátní pro požadované analýzy. Ve skutečnosti podpůrné skupiny
aplikace našly v minulosti mnoho problémů se shromažďováním a
integrace dát ze složitých a rozmanitých zdrojů.
Zbytek této části představuje přehled pojmu
skladování dat a zabývá se tím, jak datový sklad může překročit i
Problémy se skupinami podpory aplikací.
Termín „Datový sklad„Vydal William Inmon v roce 1990.
Jeho často citovaná definice vidí Datový sklad Přijít
sbírka dát předmětově orientovaný, integrovaný, energeticky nezávislý a proměnlivý
v průběhu času na podporu rozhodnutí managementu.
Pomocí této definice Inmon zdůrazňuje, že i dát obyvatel
v ne datový sklad musí mít následující 4
funkce:
▪ Předmětově orientovaný
▪ Integrovaný
▪ Nestálý
▪ Proměnná v průběhu času
Subjektově orientovaný Inmon znamená, že i dát v den
sklad v největších organizačních oblastech, které kdy byly
definované v modelu dát. Například všechny dát Týkající se zákazníci
jsou obsaženy v oblasti předmětu ZÁKAZNÍCI. Stejně tak všichni
dát související s produkty jsou obsaženy v oblasti předmětu
PRODUKTY.
Integati Inmon znamená, že i dát pocházející z různých
platformy, systémy a umístění jsou kombinovány a uloženy v
jediné místo. tudíž dát podobné musí být transformovány
v konzistentních formátech, které se přidávají a porovnávají
snadno.
Zastoupeny jsou například mužské a ženské pohlaví
písmeny M a F v jednom systému a s 1 a 0 v jiném systému. Pro
integrovat je správným způsobem, musí jeden nebo oba formáty
být transformovány tak, aby byly oba formáty stejné. V tomhle
v případě, že bychom mohli změnit M na 1 a F na 0 nebo naopak. Orientováno na
předmět a integruje naznačují, že datový sklad je určen pro
poskytují funkční a příčné vidění dát stranou
společnosti.
Non-volatile znamená, že i dát v datový sklad zůstat
důsledné a aktualizované dát není to nutné. Místo toho každý
změna v dát originály se přidají do souboru databáze dne
sklad. To znamená, že historik dát je obsažen v
datový sklad.
U proměnných v průběhu času Inmon naznačuje, že i dát v datový sklad
vždy obsahují časové značky a i dát normalmente
překračují určitý časový horizont. Například a
datový sklad může obsahovat 5 let historických hodnot zákazníci Dal
1993 až 1997. Dostupnost historika a časové řady
z dát umožňuje analyzovat trendy.
Un datový sklad může sbírat vlastní dát ze systémů
OLTP; od počátku dát mimo organizaci a / nebo jinými odborníky
zachytit projekty systému dát.
I dát extrakty mohou projít procesem čištění v
tento případ i dát před transformací jsou transformovány a integrovány
uložené v databáze del datový sklad. Pak já dát
bydlící uvnitř databáze del datový sklad jsou k dispozici
nástroje pro přístup a obnovu koncových uživatelů. Použitím
pomocí těchto nástrojů má koncový uživatel přístup k integrovanému pohledu
organizace dát.
I dát bydlící uvnitř databáze del datový sklad jsou
uloženy v podrobnostech i v souhrnných formátech.
Úroveň shrnutí může záviset na povaze dát. Já dát
podrobně se může skládat z dát aktuální a dát historici
I dát skutečné nejsou zahrnuty v datový sklad dokud já dát
v datový sklad jsou osvěženy.
Kromě ukládání i dát sami, a datový sklad může také
uložit jiný typ dat s názvem METADATA který
popsat i dát bydlící v jeho databáze.
Existují dva typy metadat: vývojová metadata a
analýza.
Ke správě a automatizaci se používají vývojová metadata
procesy těžby, čištění, mapování a načítání dát v
datový sklad.
Informace obsažené v metadatech vývoje mohou obsahovat
podrobnosti operačních systémů, podrobnosti o prvcích, které mají být extrahovány,
modello dát del datový sklad a podniková pravidla pro
konverze dát.
Druhý typ metadat, známý jako analytická metadata
umožňuje koncovému uživateli prozkoumat obsah dat
sklad najít dát dostupné a jejich význam z hlediska
jasné a netechnické.
Analytická metadata proto fungují jako most mezi daty
aplikace pro sklady a koncové uživatele. Tato metadata mohou
obsahovat obchodní model, popisy dát korespondenti
na obchodní model, předdefinované dotazy a zprávy,
informace o přihlášení uživatele a rejstříku.
Metadata pro analýzu a vývoj musí být spojena do jednoho
integrovaná metadata omezení, aby fungovala správně.
Mnoho stávajících nástrojů má bohužel své vlastní
metadata a v současné době neexistují žádné stávající standardy
umožnit nástrojům pro datové sklady jejich integraci
metadata. K nápravě této situace mnoho obchodníků z
hlavní nástroje pro datové sklady vytvořily Meta Data
Rada, která se později stala Meta Data Coalition.
Účelem této koalice je vytvořit soubor metadat
standard, který umožňuje různé nástroje pro datové sklady
převést metadata
Jejich úsilí vyústilo v zrození mety
Specifikace datové výměny (MDIS), která umožní výměnu
informací mezi archivy Microsoftu a souvisejícími soubory MDIS.
Existence dát souhrnné / indexované a podrobné údaje
uživateli možnost provést DRILL DROWN
(vrtání) no tak dát indexovány na podrobné a naopak.
Existence dát podrobná historie umožňuje vytváření
analýza trendů v čase. Kromě toho mohou metadata analýzy
být použit jako adresář databáze del datový sklad za
pomoci koncovým uživatelům najít i dát nutné.
Ve srovnání se systémy OLTP s jejich schopností podporovat
analýza dát a podávání zpráv, datový sklad je to vnímáno jako systém
vhodnější pro informační procesy, jako je provádění e
odpovídat na dotazy a vytvářet zprávy. Další část
podrobně zvýrazní rozdíly mezi těmito dvěma systémy.
DATOVÝ SKLAD PROTI OLTP SYSTÉMŮM
Mnoho z informačních systémů v organizacích
jsou určeny k podpoře každodenních operací. Tyto
systémy známé jako OLTP SYSTEMS, zachycují transakce
průběžně aktualizováno každý den.
I dát v rámci těchto systémů jsou často upravovány, přidávány nebo
smazáno. Například se jen změní adresa zákazníka
pohybuje se z jednoho místa na druhé. V tomto případě nová adresa
bude zaregistrován změnou adresního pole databáze.
Hlavním cílem těchto systémů je snížit náklady na
transakcí a zároveň zkrátit dobu zpracování.
Mezi příklady systémů OLTP patří kritické akce, jako jsou zápisy
účtování objednávek, mezd, faktur, výroby, ai služeb zákazníci.
Na rozdíl od systémů OLTP, které byly postaveny pro procesy
na základě transakcí a událostí, tj datový sklad byly vytvořeny
poskytovat podporu procesům založeným na analýze dát je U
rozhodovací procesy.
Toho je obvykle dosaženo integrací i dát z různých systémů
OLTP a externí v jednom "kontejneru" o dát, jak bylo diskutováno
v předchozí části.
Procesní model datového skladu Monash
Procesní model pro datový sklad Monash byl vyvinut společností
výzkumníci z Monash DSS Research Group, je založen na
literatury datový sklad, o zkušenostech s podporou
vývoj systémových systémů, diskuse s prodejci z
aplikace pro použití na datový sklad, na skupině odborníků
při používání datový sklad.
Fáze jsou: zahájení, plánování, vývoj, provoz a
Vysvětlení. Diagram vysvětluje iterativní povahu o
evoluční vývoj a datový sklad proces pomocí
obousměrné šipky umístěné mezi různými fázemi. V tomhle
„iterativní“ a „evoluční“ kontext znamená, že v každém případě
kroku procesu jsou možné implementační činnosti
vždy se šíří zpět do předchozí fáze. Tohle je
vzhledem k povaze projektu a datový sklad ve kterém
kdykoli převzít další požadavky ze strany
koncový uživatel. Například během vývojové fáze a
proces datový sklad, jeden je vyžadován koncovým uživatelem
nový rozměr nebo předmět, který se netýkal
původní plán, musí být do systému přidán. Tento
způsobí změnu v projektu. Výsledkem je, že
design musí změnit požadavky dosud vytvořených dokumentů
během fáze návrhu. V mnoha případech je aktuální stav
projekt se musí vrátit do fáze návrhu, kde
nový požadavek musí být přidán a zdokumentován. Uživatel
final musí mít možnost vidět revidovanou konkrétní dokumentaci a
změny, které byly provedeny ve fázi vývoje. Na konci
v tomto vývojovém cyklu musí projekt získat vynikající zpětnou vazbu
oba týmy, vývojový tým a tým uživatelů. THE
zpětná vazba se poté znovu použije ke zlepšení budoucího projektu.
Plánovaní kapacity
DW mají tendenci být velmi velké a rostou
velmi rychle (Best 1995, Rudin 1997a) po
množství dát historikům, které si uchovali ze svého života. Tam
růst může být způsoben také dát další požadováno
uživatelé zvýšit hodnotu dát že už mají. Z
v souladu s tím požadavky na úložiště pro dát umět
být výrazně vylepšena (Eckerson 1997). Takže to je
je nezbytné zajistit, provádění plánování
kapacita, s níž může systém, který má být vybudován, růst
rostoucí potřeby (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
Při plánování škálovatelnosti dw musíte znát
Očekávaný růst velikosti skladu, typy otázek
pravděpodobně uskutečněné a počet podporovaných koncových uživatelů (Best
1995, Rudin 1997b, Foley 1997a). Vytvářejte škálovatelné aplikace
vyžaduje kombinaci škálovatelných a technických serverových technologií
škálovatelný design aplikace (Best 1995, Rudin 1997b.
Při vytváření aplikace jsou vyžadovány oba
extrémně škálovatelné. Škálovatelné serverové technologie mohou
usnadnit a ziskově přidat úložiště, paměť a
CPU bez snížení výkonu (Lang 1997, Telephony 1997).
Existují dvě hlavní škálovatelné technologie serveru: výpočetní
symetrický násobek (SMP) a masivní zpracování
paralelně (MPP)) (IDC 1997, Humphries et al. 1999). Jeden server
SMP má obvykle více procesorů sdílejících paměť,
sběrnicový systém a další zdroje (IDC 1997, Humphries et al. 1999).
Pro zvýšení lze přidat další procesory
její Potenza výpočetní. Další způsob zvýšení
Potenza výpočet SMP serveru, kombinujete mnoho
SMP stroje. Tato technika je známá jako shlukování (Humphries
et al. 1999). Server MPP má naproti tomu každý více procesorů
s vlastní pamětí, systémem sběrnice a dalšími prostředky (IDC 1997,
Humphries a kol. 1999). Každý procesor se nazývá uzel. A
zvýšení v Potenza výpočetní lze dosáhnout
přidání dalších uzlů na MPP servery (Humphries et al.
1999).
Slabinou serverů SMP je příliš mnoho operací vstupu a výstupu
(I / O) může přetížit systém sběrnice (IDC 1997). Tento
problém se u serverů MPP od každého nevyskytuje
procesor má vlastní systém sběrnice. Avšak propojení
mezi každým uzlem jsou obecně mnohem pomalejší než sběrnicový systém
SMP. Servery MPP mohou navíc přidat vrstvu
další složitost pro vývojáře aplikací (IDC
1997). Lze tedy ovlivnit výběr mezi servery SMP a MPP
mnoha faktory, včetně složitosti otázek, vztahu
cena / výkon, požadovaná kapacita zpracování,
zabráněno dw aplikacím a zvětšení velikosti databáze
dw a v počtu koncových uživatelů.
Četné škálovatelné techniky návrhu aplikací
mohou být použity při plánování kapacity. Jeden
používá různá oznamovací období, jako jsou dny, týdny, měsíce a roky.
S různými oznamovacími obdobími databáze lze rozdělit na
zvládnutelně seskupené kousky (Inmon et al. 1997). Další
technika je použít souhrnné tabulky, které jsou vytvořeny
shrnutí dát da dát detailní. Tedy dát shrnutí je více
kompaktní než detailní, což vyžaduje méně místa v paměti.
Takže dát podrobnosti lze uložit v jednotce
levnější úložiště, což šetří ještě více úložiště.
Ačkoli použití souhrnných tabulek může ušetřit místo
paměti, vyžadují hodně úsilí, aby byly aktualizovány a v
v souladu s obchodními potřebami. Tato technika však je
široce používaný a často používaný ve spojení s technikou
předchozí (Best 1995, Inmon 1996a, Chauduri a Dayal
1997).
Definování Datový sklad Technický
Architektury Definice technik
architektury od dw
Počáteční osvojitelé datových skladů jsou primárně koncipováni
centralizovaná implementace dw, kde vše dát, počítaje v to
i dát externí, byly integrovány do jednoho,
fyzické úložiště (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Hlavní výhodou tohoto přístupu je, že koncoví uživatelé
Mám přístup k pohledu v podnikatelském měřítku
(celopodnikový pohled) na dát organizační (Ovum 1998). Další
výhodou je, že nabízí standardizaci dát skrz
organizace, což znamená, že existuje pouze jedna verze nebo
definice pro každou terminologii použitou v úložišti dw
(reposity) metadata (Flanagan and Safdie 1997, Ovum 1998). The
nevýhodou tohoto přístupu je na druhé straně to, že je nákladný a obtížný
být postaven (Flanagan a Safdie 1997, Ovum 1998, Inmon et al.
1998). Nedlouho po architektuře úložiště dát
centralizovaná se stala populární, koncept těžby se vyvinul
menších podskupin dát podporovat potřeby
specifické aplikace (Varney 1996, IDC 1997, Berson a Smith
1997, páv 1998). Tyto malé systémy jsou odvozeny od více
velký datový sklad centralizované. Říká se jim datum
závislé sklady oddělení nebo závislé datové trhy.
Závislá architektura datového trhu je známá jako
třístupňová architektura, ve které se první řádek skládá z data
centralizovaný sklad, druhý se skládá ze skladů dát
resortní a třetí se skládá z přístupu k dát a nástroje
analýza (Demarest 1994, Inmon et al. 1997).
Datové trhy se obvykle staví po datový sklad
centralizovaná byla postavena tak, aby vyhovovala potřebám
specifikace jednotky (White 1995, Varney 1996).
Úložiště datových trhů i dát velmi relevantní týkající se detailů
jednotky (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
Výhodou této metody je, že žádná nebude dat ne
integrovaný a že i dát v datech budou méně nadbyteční
bradavice od všeho dát pocházejí z vkladu dát integrovaný.
Další výhodou je, že mezi nimi bude jen málo odkazů
datový trh a související zdroje dát protože každý datový trh má pouze
zdroj dát. Navíc s touto architekturou na místě, uživatelé
konce mají stále přístup k přehledu dát
obchodní organizace. Tato metoda je známá jako
metoda shora dolů, ve které jsou datové trhy vytvořeny po datu
sklad (páv 1998, Goff 1998).
Někteří zvyšují potřebu včasného předvádění výsledků
organizace začaly budovat nezávislé datové trhy
(Flanagan a Safdie 1997, White 2000). V tomto případě se data trhají
berou si své dát přímo ze základů dát OLTP a od té doby ne
centralizované a integrované úložiště, čímž se eliminuje potřeba
mít centrální sklad na místě.
Každý datový trh vyžaduje alespoň jeden odkaz na své zdroje
di dát. Nevýhodou je mít více odkazů pro každé datum
mart je, že ve srovnání se dvěma předchozími architekturami
nadbytek dát výrazně zvyšuje.
Každý datový trh musí ukládat všechny dát místně požadováno pro
nemají žádný vliv na systémy OLTP. To způsobí dát
jsou ukládány do různých datových trhů (Inmon et al. 1997).
Další nevýhodou této architektury je, že vede k
vytváření komplexních propojení mezi datovými trhy a jejich
zdroje dát které se obtížně provádějí a kontrolují (Inmon ed
ostatní. 1997).
Další nevýhodou je, že koncoví uživatelé nemohou napájet
přístup k přehledu informací o společnosti, protože i dát
různých datových trhů nejsou integrovány (Ovum 1998).
Ještě další nevýhodou je, že jich může být více
definice jakékoli terminologie použité v datových trhech, které generuje
nekonzistence dát v organizaci (Ovum 1998).
Navzdory výše zmíněným nevýhodám se nezávislá data trhají
stále přitahují zájem mnoha organizací (IDC 1997).
Jedním z faktorů, které je činí atraktivními, je jejich rychlejší vývoj
a vyžadují méně času a zdrojů (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). V důsledku toho slouží hlavně
jako důkazní projekty, které lze použít k identifikaci
rychle výhody a / nebo nedokonalosti projektu (Parsaye
1995, Braly 1995, Newing 1996). V tomto případě z části
implementace v pilotním projektu musí být malá, ale důležitá
za organizaci (Newing 1996, Mansell-Lewis 1996).
Prozkoumáním prototypu mohou koncoví uživatelé a administrace
rozhodnout, zda v projektu pokračovat nebo zastavit (Flanagan a Safdie
1997).
Pokud je rozhodnuto pokračovat, data se mění pro další sektory
měly by být postaveny jeden po druhém. Existují dvě možnosti
koncoví uživatelé na základě jejich potřeb při vytváření dat
nezávislé matice: integrované / federované a neintegrované (Ovum
1998)
V první metodě by měl být vytvořen každý nový datový trh
na základě aktuálních datových trhů a modelu dát použitý
od firmy (Varney 1996, Berson a Smith 1997, Peacock 1998).
Nutnost použít model dát společnosti vyžaduje
ujistěte se, že pro každou terminologii existuje pouze jedna definice
používá se prostřednictvím datových trhů, také k zajištění toho data
lze připojit různé tržiště, abyste získali přehled o
podnikové informace (Bresnahan 1996). Tato metoda je
označované jako zdola nahoru a je nejlepší, když existuje omezení
finanční prostředky a čas (Flanagan a Safdie 1997, Ovum 1998,
Peacock 1998, Goff 1998). Ve druhé metodě se data trhají
postavený může splňovat pouze potřeby konkrétní jednotky.
Varianta federovaného datového trhu je datový sklad distribuováno
ve kterém databáze Middleware server hub se používá k připojení mnoha
datové trhy v jednom vkladu dát distribuováno (White 1995). v
tento případ, tj dát společnosti jsou distribuovány v několika datových tržištích.
Požadavky koncových uživatelů jsou přeposílány databáze
middleware serverového rozbočovače, který extrahuje všechny dát požadované údaji
trhá a vrátí výsledky aplikacím koncového uživatele. Tento
metoda poskytuje obchodní informace koncovým uživatelům. Nicméně,
problémy datových trhů ještě nejsou odstraněny
nezávislý. Lze použít další architekturu, která je
volal datový sklad virtuální (White 1995). Avšak tento
architektura, která je popsána na obrázku 2.9, není architekturou
skladování dát skutečné, protože nepohybuje zátěží
ze systémů OLTP do datový sklad (Demarest 1994).
Ve skutečnosti žádosti o dát koncoví uživatelé přešli přes
Systémy OLTP, které vracejí výsledky po zpracování souboru
uživatelské požadavky. Ačkoli tato architektura umožňuje uživatelům
generovat zprávy a formulovat požadavky, nemůže poskytnout i
dát historie a přehled informací o společnosti od i dát
z různých systémů OLTP nejsou integrovány. Takže tohle
architektura nemůže uspokojit analýzu dát komplex, který inzerát
příklad předpovědi.
Výběr přístupových aplikací a
zotavení dát
Účel stavby a datový sklad je vyjádřit
informace pro koncové uživatele (Inmon et al 1997, Poe 1996,
McFadden 1996, Shanks a kol. 1997, Hammergren 1998); jeden nebo
více aplikací pro přístup a obnovení dát musí být poskytnuto. Na
dnes existuje široká škála těchto aplikací, mezi nimiž uživatel může
zvolit (Hammergren 1998, Humphries et al 1999). The
o úspěšnosti úsilí rozhodují vybrané aplikace
skladování dát v organizaci, protože
aplikace jsou nejviditelnější částí datový sklad uživateli
konečné (Inmon et al 1997, Poe 1996). Pro úspěšné rande
sklad, musí být schopen podporovat analytické činnosti dát
koncový uživatel (Poe 1996, Seddon a Benjamin 1998, Eckerson
1999). Takže „úroveň“ toho, co chce koncový uživatel, musí být
identifikovány (Poe 1996, Mattison 1996, Inmon et al 1997,
Humphries et al 1999).
Obecně lze koncové uživatele rozdělit do tří skupin
kategorie: výkonní uživatelé, obchodní analytici a pokročilí uživatelé (Poe
1996, Humphries et al., 1999). Výkonní uživatelé potřebují
snadný přístup k předdefinovaným sadám zpráv (Humphries ed
další 1999). Těchto vztahů lze snadno dosáhnout pomocí
navigace v nabídkách (Poe 1996). Navíc by zprávy měly
prezentovat informace pomocí grafického znázornění
jako tabulky a šablony pro rychlé dodání
informace (Humphries et al 1999). Obchodní analytici, kteří ne
mohou mít technické schopnosti, ze kterých mohou budovat vztahy
nula sama o sobě, musí být schopen změnit aktuální poměry pro
uspokojit jejich specifické potřeby (Poe 1996, Humphries et al
1999). Naproti tomu pokročilí uživatelé jsou druh koncových uživatelů
mají schopnost generovat a zapisovat požadavky a zprávy z
nula (Poe 1996, Humphries et al 1999). Jsou to ti, kdo
vyvíjet zprávy pro jiné typy uživatelů (Poe 1996, Humphries
et al 1999).
Jakmile budou stanoveny požadavky koncového uživatele, musí být provedeno
výběr aplikací pro přístup a vyhledávání dát mezi všemi
dostupné (Poe 1996, Inmon et al 1997).
Přístup k dát a vyhledávací nástroje mohou být
klasifikovány do 4 typů: nástroj OLAP, nástroj EIS / DSS, dotazovací nástroj a
nástroj pro hlášení a dolování dat.
Nástroje OLAP umožňují uživatelům vytvářet dotazy ad hoc stejně jako
ty vyrobené na databáze del datový sklad. Plus tyto produkty
umožnit uživatelům přejít z dát obecně pro ty
detailní.
Nástroje EIS / DSS poskytují výkonné zprávy jako analýzu „co kdyby“
a přístup k přehledům uspořádaným v nabídkách. Zprávy musí být
předdefinované a sloučené s nabídkami pro snazší navigaci.
Nástroje pro dotazy a vytváření sestav umožňují uživatelům vytvářet sestavy
předdefinované a konkrétní.
Nástroje pro dolování dat se používají k identifikaci vztahů, které
mohl vrhnout nové světlo na zapomenuté operace v dát del
datový sklad.
Spolu s optimalizací požadavků každého typu uživatele, tj
vybrané nástroje musí být intuitivní, efektivní a snadno použitelné.
Musí také být kompatibilní s jinými částmi architektury, např
schopen pracovat se stávajícími systémy. Navrhuje se také
zvolit nástroje pro přístup a vyhledávání dat s cenami a výkonem
rozumné. Mezi další kritéria, která je třeba vzít v úvahu, patří závazek EU
prodejce nástroje při podpoře svého produktu a vývoje, který z něj dělá
Totéž bude mít v budoucích verzích. Zajistit zapojení uživatelů
při používání datového skladu zahrnuje vývojový tým
uživatelé v procesu výběru nástrojů. V tomto případě
mělo by být provedeno praktické hodnocení uživatele.
Vývojový tým může zlepšit hodnotu datového skladu
také poskytují webový přístup do svých datových skladů. A
webový datový sklad umožňuje uživatelům přístup dát
ze vzdálených míst nebo na cestách. Také informace mohou
být poskytovány s nižšími náklady snížením nákladů
di trénink.
2.4.3 Datový sklad Fáze provozu
Tato fáze se skládá ze tří aktivit: definice datových strategií
obnova, kontrola činností datového skladu a správa
zabezpečení datového skladu.
Definice strategií obnovy dat
Po počátečním nahrávání, tj dát v databáze datového skladu
k reprodukci je třeba je pravidelně obnovovat
provedené změny dát originály. Je proto nutné se rozhodnout
kdy se má osvěžit, jak často by měl
obnovit a jak obnovit dát. Navrhuje se udělat
obnovit dát kdy lze systém vypnout offline. Tam
obnovovací frekvence určuje spoléhající se vývojový tým
na požadavky uživatelů. Existují dva přístupy k aktualizaci
datawarehouse: kompletní aktualizace a průběžné načítání
Změny.
První přístup, úplné obnovení, vyžaduje opětovné načtení
všechny dát od nuly. To znamená, že vše dát požadovaný mošt
extrahovat, vyčistit, transformovat a integrovat do každé aktualizace. Tento
přístupu by se mělo co nejvíce vyhnout, protože
to vyžaduje spoustu času a zdrojů.
Alternativním přístupem je nepřetržité načítání
Změny. To přidává i dát které byly změněny
z posledního obnovovacího cyklu datového skladu. Identifikace
nové nebo upravené záznamy významně snižují částku
dát které musí být šířeny do datového skladu v každém
aktualizovat, protože pouze tyto dát bude přidán do databáze
datového skladu.
K výběru lze použít alespoň 5 přístupů
i dát nové nebo upravené. Získat efektivní strategii
obnovit dát směs těchto přístupů může být užitečná
vyzvednout všechny změny v systému.
První přístup, který používá časová razítka, předpokládá, že to přijde
přiřazeno všem dát upravil a aktualizoval časové razítko tak
abychom mohli všechny snadno identifikovat dát upravené a nové.
Tento přístup však nebyl ve většině případů široce používán
součást dnešních operačních systémů.
Druhým přístupem je použití delta souboru generovaného
aplikace, která obsahuje pouze změny provedené v dát.
Použití tohoto souboru také zesiluje cyklus aktualizace.
Ani tato metoda však nebyla v mnoha případech použita
aplikace.
Třetím přístupem je skenování souboru protokolu, který
v zásadě obsahuje informace podobné delta souboru. Jediný
rozdíl je v tom, že je vytvořen soubor protokolu pro proces obnovy a
to může být obtížné pochopit.
Čtvrtým přístupem je úprava kódu aplikace.
Většina kódu aplikace je však stará a
křehký; proto je třeba se této technice vyhnout.
Posledním přístupem je srovnání dát zdroje se souborem
hlavní dát.
Řízení činností datového skladu
Jakmile je datový sklad vydán uživatelům, je
je nutné to časem sledovat. V tomto případě správce
datového skladu lze použít jeden nebo více nástrojů pro správu, např
ovládání ke sledování využití datového skladu. Zejména
lze shromažďovat informace o lidech a čase
ke kterému přistupují do datového skladu. No tak dát plodiny mohou být vytvořeny
profil provedené práce, který lze použít jako vstup
při implementaci kompenzace uživatele. Zpětné zúčtování
umožňuje uživatelům být informováni o nákladech na zpracování
datový sklad.
Kromě toho lze také použít ovládání datového skladu
identifikovat typy dotazů, jejich velikost, počet dotazů na
den, doby reakce na dotaz, dosažené sektory a množství
di dát zpracováno. Dalším účelem je kontrola
datawarehouse je identifikovat dát které se nepoužívají. Tyto dát
mohou být odstraněny z datového skladu, aby se zlepšil čas
reakce na provedení dotazu a řízení růstu
dát kteří bydlí v databáze datového skladu.
Správa zabezpečení datového skladu
Datový sklad obsahuje dát integrovaný, kritický, citlivý
lze snadno dosáhnout. Z tohoto důvodu by mělo
být chráněn před neoprávněnými uživateli. Jedním ze způsobů, jak
implementovat zabezpečení je použít funkci del DBMS
přiřadit různá oprávnění různým typům uživatelů. V tomhle
způsobem musí být udržován profil pro každý typ uživatele
přístup. Dalším způsobem, jak zabezpečit datový sklad, je jeho šifrování
jak je psáno v databáze datového skladu. Přístup k
dát a vyhledávací nástroje musí dešifrovat dát před předložením i
výsledky uživatelům.
2.4.4 Datový sklad Fáze nasazení
Je to poslední fáze v cyklu implementace datového skladu. The
Mezi činnosti, které mají být v této fázi prováděny, patří školení
uživatelé mohou používat datový sklad a provádět kontroly
datového skladu.
Školení uživatelů
Nejprve je třeba provést školení uživatelů
přístup k dát datového skladu a používání
vyhledávání. Obecně by relace měly začínat
úvod do pojetí skladování dát, K
obsah datového skladu, do meta dát a základní funkce
nástrojů. Poté mohli pokročilejší uživatelé také studovat
fyzické tabulky a funkce uživatelů přístupu k datům a nástrojů
vyhledávání.
Existuje mnoho přístupů ke školení uživatelů. Jeden z
poskytují výběr mnoha uživatelů nebo analytiků vybraných společností a
skupina uživatelů, spoléhající se na jejich vedení a dovednosti
sdělení. Tito jsou osobně proškoleni
vše, co potřebují vědět, aby se seznámili s
Systém. Jakmile školení skončí, vrátí se ke své práci e
začnou učit ostatní uživatele, jak používat systém. Na
na základě toho, co se naučili, mohou ostatní uživatelé začít
prozkoumejte datový sklad.
Dalším přístupem je vyškolit mnoho uživatelů současně
čas, jako byste chodili na kurz ve třídě. Tato metoda
je vhodné, když existuje mnoho uživatelů, kteří potřebují být vyškoleni
ve stejnou dobu. Ještě další metodou je trénovat
každý uživatel zvlášť, jeden po druhém. Tato metoda je
vhodné, když je málo uživatelů.
Účelem školení uživatelů je seznámit se
s přístupem k dát a vyhledávací nástroje a také obsah
datový sklad. Někteří uživatelé však mohou být ohromeni
množství informací poskytnutých během relace
výcvik. Musí se tedy udělat řada
aktualizovat relace probíhající pomoc a reagovat
na konkrétní otázky. V některých případech skupina
uživatelům poskytnout tento typ podpory.
Shromažďování zpětné vazby
Jakmile je datový sklad zaveden, uživatelé mohou
použijte i dát sídlící v datovém skladu pro různé účely.
Analytici nebo uživatelé používají hlavně dát v
datový sklad pro:
1 Identifikujte firemní trendy
2 Analyzujte nákupní profily společnosti zákazníci
3 Rozdělte i zákazníci a
4 Poskytujte nejlepší služby zákazníci - přizpůsobit služby
5 Formulujte strategie marketing
6 Proveďte konkurenční odhady pro analýzu nákladů a pomoc
řízení
7 Podpora strategického rozhodování
8 Určete příležitosti, které se objeví
9 Zlepšit kvalitu současných obchodních procesů
10 Zkontrolujte zisk
Podle směru vývoje datového skladu mohli
provést řadu revizí systému za účelem získání zpětné vazby
od vývojového týmu i komunity
koneční uživatelé.
Získané výsledky lze zohlednit pro
další vývojový cyklus.
Vzhledem k tomu, že datový sklad má přírůstkový přístup,
je nezbytné poučit se z úspěchů a chyb předchozích
vývoj.
2.5 Shrnutí
V této kapitole jsou přístupy nalezené v
literatura. Oddíl 1 pojednával o pojmu
datový sklad a jeho role v rozhodovací vědě. v
část 2 popsala hlavní rozdíly mezi
datový sklad a systémy OLTP. Oddíl 3 pojednával o
Použitý model datového skladu Monash
v části 4 k popisu činností zapojených do procesu
vývoj datového skladu, tyto práce nebyly založeny na
přísný výzkum. To, co se děje ve skutečnosti, může být
velmi odlišné od toho, co uvádí literatura, nicméně tyto
výsledky lze použít k vytvoření základního zavazadla, které
zdůraznit koncept datového skladu pro tento výzkum.
Kapitola 3
Výzkumné a konstrukční metody
Tato kapitola se zabývá výzkumnými a konstrukčními metodami pro
tato studie. První část ukazuje obecný pohled na metody
k dispozici také pro vyhledávání informací
Jsou diskutována kritéria pro výběr nejlepší metody pro jednu
konkrétní studie. V části 2 jsou poté popsány dvě metody
vybráno výše uvedenými kritérii; z nich bude vybráno a
přijal jeden s důvody uvedenými v oddíle 3, kde jsou
byly rovněž uvedeny důvody pro vyloučení dalšího kritéria. Tam
část 4 představuje výzkumný projekt a část 5 le
závěry.
3.1 Výzkum informačních systémů
Výzkum v informačních systémech se neomezuje pouze na jednoduchý
do technologické oblasti, ale musí být také rozšířena o
účely týkající se chování a organizace.
Vděčíme za to tezím různých oborů od
společenské až přírodní vědy; to vede k potřebě a
určité spektrum výzkumných metod zahrnujících kvantitativní metody
a kvalitativní pro informační systémy.
Všechny dostupné výzkumné metody jsou důležité, ve skutečnosti rozmanité
vědci jako Jenkins (1985), Nunamaker et al. (1991) a Galliers
(1992) tvrdí, že neexistuje žádná univerzální specifická metoda
provádět výzkum v různých oblastech informačních systémů; Vskutku
metoda může být vhodná pro konkrétní vyhledávání, ale ne
pro ostatní. To nás vede k potřebě zvolit metodu, která
je vhodný pro náš konkrétní výzkumný projekt: k tomu
volba Benbasat a kol. (1987) uvádějí, že je třeba je vzít v úvahu
povaha a účel výzkumu.
3.1.1 Povaha výzkumu
Mohou být různé metody založené na povaze výzkumu
klasifikovány do tří široce známých vědeckých tradic
informace: pozitivistický, interpretační a kritický výzkum.
3.1.1.1 Pozitivní výzkum
Pozitivní výzkum je také známý jako vědecká studie nebo
empirický. Snaží se: „vysvětlit a předpovědět, co se stane v
sociální svět se dívá na zákonitosti a vztahy příčin a následků
mezi jejími základními prvky “(Shanks et al 1993).
Pozitivní výzkum je také charakterizován opakovatelností,
zjednodušení a vyvrácení. Pozitivní výzkum navíc připouští
existence apriorních vztahů mezi studovanými jevy.
Podle Galliersa (1992) je taxonomie výzkumnou metodou
zahrnuto do pozitivistického paradigmatu, které se však neomezuje pouze na toto,
ve skutečnosti existují laboratorní experimenty, polní experimenty,
případové studie, důkazy vět, předpovědi a simulace.
Pomocí těchto metod vědci připouštějí, že jevy
studované lze objektivně a důsledně sledovat.
3.1.1.2 Interpretační výzkum
Interpretační výzkum, který se často nazývá fenomenologie nebo
antipozitivismus popisuje Neuman (1994) jako „analýzu
systematika sociálního významu akce prostřednictvím přímého e
podrobné pozorování lidí v přírodních situacích v pořádku
dospět k pochopení a interpretaci toho, jak
lidé vytvářejí a udržují svůj sociální svět “. Studie
interpretační odmítnout předpoklad, že pozorované jevy
lze objektivně pozorovat. Opravdu jsou založeny
o subjektivních interpretacích. Výkladní vědci to navíc neudělají
vnucují apriorní význam jevům, které studují.
Tato metoda zahrnuje subjektivní / argumentační studie, jednání
výzkum, popisné / interpretační studie, budoucí výzkum a hry o
role. Kromě těchto průzkumů a případových studií může být
zahrnuty do tohoto přístupu, protože se týkají studií
jednotlivci nebo organizace ve složitých situacích
skutečného světa.
3.1.1.3 Kritický výzkum
Kritický výzkum je nejméně známý přístup ve vědách
sociální, ale nedávno si získala pozornost výzkumných pracovníků
v oblasti informačních systémů. Filozofický předpoklad, že
sociální realita je historicky vytvářena a reprodukována lidmi,
stejně jako sociální systémy s jejich akcemi a interakcemi. Jejich
dovednost je však zprostředkována řadou ohledů
sociální, kulturní a politické.
Stejně jako interpretační výzkum, kritický výzkum tvrdí, že
pozitivistický výzkum nemá nic společného se sociálním kontextem a ignoruje
jeho vliv na lidské činy.
Kritický výzkum naproti tomu kritizuje interpretační výzkum
být příliš subjektivní a protože to nemá za cíl pomoci
lidem zlepšit jejich život. Největší rozdíl mezi
kritickým výzkumem a dalšími dvěma přístupy je jeho hodnotící rozměr.
Zatímco objektivita pozitivistických a interpretačních tradic je pro
předpovědět nebo vysvětlit status quo nebo sociální realitu, kritický výzkum
si klade za cíl kriticky vyhodnotit a transformovat sociální realitu níže
studio.
Kritičtí badatelé se obvykle staví proti současnému stavu
odstranit sociální rozdíly a zlepšit sociální podmínky. Tam
kritický výzkum má závazek k procedurálnímu pohledu na EU
zajímavé jevy, a proto je obvykle podélný.
Příkladem výzkumných metod jsou dlouhodobé historické studie a
etnografické studie. Kritický výzkum však nebyl
široce používaný ve výzkumu informačních systémů
3.1.2 Účel výzkumu
Spolu s povahou výzkumu lze použít jeho účel
vést výzkumného pracovníka při výběru konkrétní metody
Výzkum. Účel výzkumného projektu úzce souvisí
pozice vyhledávání vzhledem k vyhledávacímu cyklu, který tvoří
tři fáze: konstrukce teorie, zkouška teorie a zdokonalení
teorie. Spoléhání se tedy na okamžik ve vztahu k výzkumnému cyklu, a
výzkumný projekt může mít vysvětlující, popisný a účel
průzkumné nebo prediktivní.
3.1.2.1 Průzkumný výzkum
Průzkumný výzkum je zaměřen na zkoumání tématu
zcela nové a formulovat otázky a hypotézy pro výzkum
budoucnost. Tento typ výzkumu se používá při konstrukci
teorie získat počáteční reference v nové oblasti.
Obvykle se používají kvalitativní metody výzkumu, například případy
studia nebo fenoménových studií.
Je však také možné použít kvantitativní techniky, jako je
průzkumné vyšetřování nebo experimenty.
3.1.3.3 Popisný výzkum
Popisný výzkum je zaměřen na analýzu a popis ve velkém
podrobně popsat konkrétní organizační situaci nebo praxi. Tento
je vhodný pro vytváření teorií a lze jej také použít pro
potvrdit nebo vyvrátit hypotézy. Popisný výzkum obvykle
zahrnuje použití měření a vzorků. Nejvhodnější metody výzkumu
zahrnují vyšetřování a analýzu pozadí.
3.1.2.3 Vysvětlující výzkum
Vysvětlující výzkum se snaží vysvětlit, proč se věci stávají.
Je postaven na faktech, která již byla studována a snaží se je najít
důvody těchto skutečností.
Vysvětlující výzkum je tedy obvykle postaven na výzkumu
průzkumný nebo popisný a je pomocný za účelem testování a upřesnění
teorie. Vysvětlující výzkum obvykle využívá případové studie
o výzkumné metody založené na průzkumu.
3.1.2.4 Preventivní výzkum
Preventivní výzkum si klade za cíl předvídat události a chování
pod dohledem, že jsou studováni (Marshall a Rossman
1995). Predikce je standardní vědecký test pravdy.
Tento typ výzkumu obecně využívá vyšetřování nebo analýzu
dát historici. (Jin 1989)
Výše uvedená diskuse ukazuje, že existuje celá řada
možné výzkumné metody, které lze použít ve studii
konkrétní. Musí však existovat konkrétní metoda, která je vhodnější
jiné pro konkrétní typ výzkumného projektu. (Galliers
1987, Yin 1989, De Vaus 1991). Každý výzkumník tedy má
je třeba pečlivě vyhodnotit silné a slabé stránky
různé metody za účelem přijetí nejvhodnější metody výzkumu, např
kompatibilní s výzkumným projektem. (Jenkins 1985, Pervan a Klass
1992, Bonomia 1985, Yin 1989, Himilton a Ives 1992).
3.2. Možné výzkumné metody
Cílem tohoto projektu bylo studovat zkušenosti v
Australské organizace s i dát uložen s jedním
vývoj datový sklad. Dato který v současné době existuje
nedostatek výzkumu v oblasti datových skladů v Austrálii,
tento výzkumný projekt je stále v teoretické fázi cyklu
výzkum a má průzkumný účel. Zkoumání zkušeností v
Australské organizace využívající datové sklady
vyžaduje výklad skutečné společnosti. V důsledku toho
následuje filozofický předpoklad, který je základem výzkumného projektu
tradiční výklad.
Po pečlivém přezkoumání dostupných metod byly identifikovány
dvě možné výzkumné metody: průzkumy a případové studie
(případové studie), které lze použít pro výzkum
průzkumné (Shanks et al. 1993). Galliers (1992) to tvrdí
vhodnost těchto dvou metod pro tuto konkrétní studii v EU
jeho taxonomie se vrátila s tím, že jsou vhodné pro stavbu
teoretický. Následující dvě podsekce pojednávají o každé metodě v
detail.
3.2.1 Metoda vyšetřovacího výzkumu
Metoda vyšetřovacího výzkumu pochází ze starověké metody
sčítání lidu. Sčítání lidu spočívá ve sběru informací z
celá populace. Tato metoda je nákladná a nepraktická
zvláště pokud je početná populace velká. Takže ve srovnání s
sčítání lidu, průzkum je obvykle zaměřen na
sbírat informace o malém počtu nebo vzorku z
zástupci populace (Fowler 1988, Neuman 1994). A
vzorek odráží populaci, ze které je čerpán, s různými
úrovně přesnosti podle struktury vzorku,
použitá velikost a metoda výběru (Fowler 1988, Babbie
1982, Neuman 1994).
Metoda průzkumu je definována jako „snímky postupů,
situace nebo pohledy v určitém okamžiku provedené pomocí
dotazníky nebo rozhovory, z nichž mohou vycházet závěry
made "(Galliers 1992: 153) [snímek souborů,
situace nebo pohledy v konkrétním časovém bodě provedené pomocí
dotazníky nebo rozhovory, ze kterých lze vyvodit závěry]. The
průzkumy se zabývají shromažďováním informací o určitých aspektech
studie, provedeno několika účastníky
otázky (Fowler 1988). I tyto dotazníky a rozhovory, které
zahrnují osobní telefonické rozhovory a strukturované rozhovory,
jsou techniky sběru dát nejběžnější používané v
vyšetřování (Blalock 1970, Nachmias a Nachmias 1976, Fowler
1988), lze použít pozorování a analýzy (Gable
1994). Ze všech těchto metod sběru dát, použití
dotazník je nejoblíbenější technikou, protože zajišťuje, že i dát
shromážděné jsou strukturovány a formátovány, což usnadňuje
klasifikace informací (Hwang 1987, de Vaus 1991).
Při analýze dát, často využívá strategie vyšetřování
kvantitativní techniky, jako je statistická analýza, ale mohou být
také se používají kvalitativní techniky (Galliers 1992, Pervan
a Klass 1992, Gable 1994). Normálně, i dát shromážděny jsou
slouží k analýze distribucí a asociačních modelů
(Fowler 1988).
Ačkoli průzkumy jsou obecně vhodné pro výzkum
řešení otázky „co?“ (co) nebo z toho
odvození, například „kvantová“ (kolik) a „kvantová“ (kolik), ese
lze položit prostřednictvím otázky „proč“ (Sonquist a
Dunkelberg 1977, Yin 1989). Podle Sonquista a Dunkelberga
(1977), výzkumné šetření poukazuje na obtížné hypotézy, program
hodnocení, popis populace a vývoj modelů EU
lidské chování. Lze také použít průzkumy
studovat určitý názor na populaci, podmínky,
minulé názory, charakteristiky, očekávání a dokonce i chování
nebo přítomný (Neuman 1994).
Vyšetřování umožňuje výzkumníkovi objevit vztahy mezi
populace a výsledky jsou obvykle obecnější než
jiné metody (Sonquist a Dunkelberg 1977, Gable 1994). The
průzkumy umožňují výzkumným pracovníkům vztahovat se k zeměpisné oblasti
širší a oslovit mnoho žadatelů o registraci (Blalock 1970,
Sonquist a Dunkelberg 1977, Hwang a Lin 1987, Gable 1994,
Neuman 1994). Nakonec informace mohou poskytnout průzkumy
které nejsou k dispozici jinde nebo ve formě požadované pro analýzu
(Fowler 1988).
Při provádění vyšetřování však existují určitá omezení. Jeden
nevýhodou je, že výzkumník nemůže získat mnoho informací
o studovaném objektu. To je způsobeno skutečností, že
vyšetřování se provádí pouze v určitou dobu, a proto
existuje omezený počet proměnných a osob, které výzkumník může
studovat (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Další nevýhodou je, co může být provedení průzkumu
velmi nákladné z hlediska času a zdrojů, zvláště pokud
zahrnuje osobní rozhovory (Fowler 1988).
3.2.2. Metoda vyšetřovacího výzkumu
Metoda vyšetřovacího výzkumu zahrnuje hloubkovou studii o
konkrétní situace v jejím reálném kontextu v a
definované období, bez jakéhokoli zásahu ze strany
výzkumný pracovník (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Tato metoda se používá hlavně k popisu vztahů mezi
proměnné, které jsou studovány v konkrétní situaci
(Galliers 1992). Vyšetřování může zahrnovat jednotlivé případy nebo
násobek v závislosti na analyzovaném jevu (Franz a Robey 1987,
Eisenhardt 1989, Jin 1989).
Metoda dotazovacího výzkumu se nazývá „dotaz
empirický, který studuje současný fenomén v rámci EU
jeho skutečný kontext s využitím více zdrojů shromážděných z jednoho nebo
více entit, jako jsou lidé, skupiny nebo organizace “(Yin 1989).
Mezi fenoménem a jeho kontextem není jasné oddělení, např
neexistuje žádná experimentální kontrola nebo manipulace s proměnnými (Yin
1989, Benbasat a kol. 1987).
Existuje řada technik pro sběr dát že mohou
být zaměstnáni ve vyšetřovací metodě, která zahrnuje
přímá pozorování, recenze archivních záznamů, dotazníky,
kontrola dokumentace a strukturované rozhovory. Mít
pestrou škálu technik sběru dát, dotazy
umožnit výzkumným pracovníkům jednat s oběma dát kvalitativní
kvantitativní současně (Bonoma 1985, Eisenhardt 1989, Yin
1989, Gable 1994). Stejně jako v případě metody průzkumu, a
investigativní výzkumník jedná jako pozorovatel nebo výzkumník a ne
jako aktivní účastník ve studované organizaci.
Benbasat et al. (1987) tvrdí, že metoda vyšetřování je
zvláště vhodný pro konstrukci teorie výzkumu, která
začíná výzkumnou otázkou a pokračuje tréninkem
teorie během procesu sběru dát. Bytost
vhodné i na jeviště
konstrukční teorie to navrhují Franz a Robey (1987)
pro komplex lze použít také vyšetřovací metodu
teoretická fáze. V tomto případě na základě shromážděných důkazů jeden
daná teorie nebo hypotéza je ověřena nebo vyvrácena. Navíc vyšetřování je
vhodné také pro výzkum zabývající se otázkami „jako“ nebo
„proč“ (Jin 1989).
Ve srovnání s jinými metodami umožňuje výzkumník výzkumníkovi
zachytit základní informace podrobněji (Galliers
1992, Shanks a kol. 1993). Vyšetřování navíc umožňují:
výzkumník pochopit podstatu a složitost studovaných procesů
(Benbasat et al 1987).
S metodou jsou spojeny čtyři hlavní nevýhody
vyšetřování. Prvním je nedostatek kontrolovaných odpočtů. Tam
Subjektivita výzkumného pracovníka může zkreslit výsledky a závěry
studie (Yin 1989). Druhou nevýhodou je nedostatek
řízené pozorování. Na rozdíl od experimentálních metod
investigativní výzkumník nemůže ovládat studované jevy
protože jsou zkoumány v jejich přirozeném kontextu (Gable 1994). The
třetí nevýhodou je nedostatečná replikovatelnost. To je způsobeno skutečností
že je nepravděpodobné, že by badatel pozoroval stejné události, např
nemůže ověřit výsledky konkrétní studie (Lee 1989).
A konečně, v důsledku nereplikovatelnosti je to obtížné
zobecnit výsledky získané z jednoho nebo více šetření (Galliers
1992, Shanks a kol. 1993). Všechny tyto problémy však selhávají
jsou nepřekonatelné a lze je ve skutečnosti minimalizovat
výzkumník provádějící vhodné akce (Lee 1989).
3.3. Zdůvodněte metodologii výzkumu
přijato
Ze dvou možných výzkumných metod pro tuto studii,
průzkum je považován za nejvhodnější. Dotaz je
byl vyřazen po pečlivém zvážení příbuzného
zásluhy a slabosti. Pohodlí nebo nevhodnost každého z nich
níže je popsána metoda pro tuto studii.
3.3.1. Nevhodná metoda výzkumu
dotazu
Metoda vyšetřování vyžaduje důkladnou studii o jednom
konkrétní situace v jedné nebo více organizacích pro a
časové období (Eisenhardt 1989). V tomto případě období může
překročit časový rámec stanovený pro tuto studii. Další
důvodem pro nepřijetí vyšetřovací metody jsou výsledky
mohou trpět nedostatkem přísnosti (Yin 1989). Subjektivita
výzkumníka může ovlivnit výsledky a závěry. Další
důvodem je, že tato metoda je vhodnější pro výzkum otázek
typu „jak“ nebo „proč“ (Yin 1989), zatímco výzkumná otázka
pro tuto studii jde o typ „co“. V neposlední řadě
Důležité je, že je obtížné zobecnit výsledky pouze z jednoho o
několik výzkumů (Galliers 1992, Shanks et al. 1993). Na základě
z tohoto důvodu vyšetřovací výzkumná metoda není
byl pro tuto studii vybrán jako nevhodný.
3.3.2. Pohodlí výzkumné metody
vyšetřování
Když byl proveden tento výzkum, praxe datového skladu
nebyl široce přijat
Australské organizace. Takže nebylo mnoho informací
o jejich provádění v rámci EU
Australské organizace. Dostupné informace přišly
organizacemi, které implementovaly nebo používaly data
sklad. V tomto případě je metoda průzkumu nejvíce
vhodné, protože umožňuje získat informace, které nejsou
dostupné jinde nebo ve formě požadované pro analýzu (Fowler 1988).
Metoda průzkumu navíc umožňuje výzkumníkovi
získat dobrý přehled o postupech, situacích nebo
vidět v daném čase (Galliers 1992, Denscombe 1998).
Byl požadován přehled, aby se rozšířil
znalosti o australských zkušenostech s datovými sklady.
Sonquist a Dunkelberg (1977) opět uvádějí, že výsledky
průzkumový průzkum je obecnější než jiné metody.
3.4. Návrh průzkumného výzkumu
Vyšetřování praktik skladování dat bylo provedeno v roce 1999.

Cílovou populaci tvořily organizace
Australané, kteří se zajímali o studie datových skladů
pravděpodobně již informován o i dát které ukládají a
proto by mohl poskytnout užitečné informace pro tuto studii. Tam
cílová populace byla identifikována počátečním průzkumem
všichni australští členové „The Data Warehousing Institute“ (Tdwiaap).
Tato část pojednává o návrhu fáze výzkumu
empirická analýza této studie.
3.4.1. Technika sběru dát
Ze tří technik běžně používaných při průzkumu
(tj. dotazník poštou, telefonickým pohovorem a pohovorem
osobní) (Nachmias 1976, Fowler 1988, de Vaus 1991), per
této studii byl přijat dotazník poštou. První
důvodem pro přijetí druhého je to, že může dosáhnout a
geograficky rozptýlená populace (Blalock 1970, Nachmias e
Nachmias 1976, Hwang a Lin 1987, de Vaus 1991, Gable 1994).
Zadruhé, poštovní dotazník je vhodný pro účastníky
vysoce vzdělaný (Fowler 1988). K tomu dotazník poštou
studie byla adresována sponzorům projektu datových skladů,
ředitelé a / nebo vedoucí projektů. Za třetí, dotazníky na
pošta je vhodná, pokud máte bezpečný seznam
adresy (Salant a Dilman 1994). TDWI, v tomto případě, a
důvěryhodná asociace datových skladů poskytla seznam adresátů
jejích australských členů. Další výhoda dotazníku
poštou s ohledem na telefonický dotazník nebo pohovory
osobní je to, že umožňuje žadatelům o registraci reagovat s většími
přesnost, zvláště když se žadatelé o registraci musí poradit
zaznamenává nebo diskutuje o otázkách s jinými lidmi (Fowler
1988).
Potenciální nevýhodou může být čas, který je zapotřebí
provádět dotazníky poštou. Normálně je dotazník zapnutý
pošta probíhá v tomto pořadí: odesílejte dopisy, počkejte na ně
odpovědi a odeslání potvrzení (Fowler 1988, Bainbridge 1989).
Celkový čas proto může být delší než čas potřebný pro
osobní rozhovory nebo telefonické rozhovory. Nicméně
celkový čas může být znám předem (Fowler 1988,
Denscombe 1998). Čas strávený prováděním rozhovorů
osobní nelze předem zjistit, protože se liší od
rozhovor s druhým (Fowler 1988). Telefonické rozhovory
může být rychlejší než poštovní dotazníky a
ale osobní rozhovory mohou mít vysokou poruchovost
reakce kvůli nedostupnosti některých lidí (Fowler 1988).
Kromě toho jsou telefonické rozhovory obecně omezeny na seznamy
relativně krátké otázky (Bainbridge 1989).
Další slabinou poštovního dotazníku je vysoká míra
nedostatečná odezva (Fowler 1988, Bainbridge 1989, Neuman
1994). Protiopatření však byla přijata sdružením
tato studie s důvěryhodnou institucí v oblasti dat
skladování (tj. TDWI) (Bainbridge 1989, Neuman 1994),
který zasílá dva upomínkové dopisy těm, kteří neodpověděli
(Fowler 1988, Neuman 1994) a zahrnuje také dopis
což vysvětluje účel studie (Neuman 1994).
3.4.2. Jednotka analýzy
Účelem této studie je získat informace o
implementace datových skladů a jejich využití
v australských organizacích. Cílová populace
je složena ze všech australských organizací, které ji mají
implementovány, nebo implementují, tj datový sklad, v
jednotlivé organizace jsou poté zaregistrovány. Dotazník
bylo zasláno organizacím, které mají zájem o adopci
di datový sklad. Tato metoda zaručuje, že informace
sbírky pocházejí z nejvhodnějších zdrojů každé organizace
účastník.
3.4.3. Ukázka průzkumu
Seznam adresátů respondentů průzkumu byl získán od
TDWI. Z tohoto seznamu 3000 XNUMX australských organizací
byly vybrány jako základ pro odběr vzorků. A
další dopis s vysvětlením projektu a účelu šetření,
spolu s odpovědí a předplacenou obálkou pro
vrácení vyplněného dotazníku byly odeslány do vzorku.
Z 3000 198 organizací XNUMX souhlasilo s účastí v
studie. Očekával se takový malý počet odpovědí dat il
tehdy měli velké množství australských organizací
objímali nebo objímali strategii rande
skladování v jejich organizacích. Takže
cílová populace pro tuto studii sestávala pouze z 198
organizace.
3.4.4. Obsah dotazníku
Struktura dotazníku vycházela z datového modelu
Skladování Monash (popsáno výše v části 2.3). The
obsah dotazníku byl založen na analýze
literatura uvedená v kapitole 2. Kopie dotazníku
zaslané účastníkům průzkumu najdete
v příloze B. Dotazník se skládá ze šesti částí, které
sledovat fáze ošetřeného modelu. Následující šest odstavců
stručně shrnout obsah každé sekce.
Sekce A: Základní informace o organizaci
Tato část obsahuje otázky týkající se profilu uživatele
zúčastněné organizace. Navíc některé z otázek jsou
týkající se stavu projektu datových skladů z
účastník. Důvěrné informace, například jméno
organizace nebyly v analýze průzkumu zveřejněny.
Sekce B: Start
Otázky v této části souvisejí se zahájením činnosti
skladování dat. Byly položeny otázky, jak dlouho
jde o iniciátory projektu, sponzory, dovednosti a znalosti
požadavky, cíle rozvoje datových skladů a
očekávání koncového uživatele.
Sekce C: Design
Tato část obsahuje otázky týkající se činnosti organizace
plánování datový sklad. Konkrétně jde o otázky
uveďte o rozsahu realizace, době trvání projektu, nákladech
projektu a analýzy nákladů a přínosů.
Sekce D: Vývoj
V části pro vývoj jsou otázky týkající se činnosti společnosti
vývoj datový sklad: sběr uživatelských požadavků
finále, zdroje dát, logický model dátprototypy,
kapacitní plánování, technické architektury a výběr
nástroje pro vývoj datových skladů.
Sekce E: Provoz
Provozní otázky týkající se provozu vyd
rozšiřitelnost datový sklad, jak se vyvíjí do
další fáze vývoje. Tam kvalita dat, strategie
obnovit dát, zrnitost dát, škálovatelnost dat
sklad a bezpečnostní problémy datový sklad byli mezi
typy kladených otázek.
Sekce F: Vývoj
Tato část obsahuje otázky týkající se použití data
sklad koncovými uživateli. Výzkumníka to zajímalo
pro účel a užitečnost datový sklad, přezkoumání a strategie
přijaté vzdělávací programy a strategie kontroly údajů
sklad byl přijat.
3.4.5. Míra odpovědi
Ačkoli poštovní průzkumy jsou kritizovány za to, že
nízká odezva, byla přijata opatření ke zvýšení
míra návratnosti (jak je uvedeno výše v části A)
3.4.1). Termín „míra odezvy“ se vztahuje k procentu
lidé v konkrétním vzorku průzkumu, který odpovídá na dotazník
dotazník (Denscombe 1998). Bylo použito následující
vzorec pro výpočet míry odezvy pro tuto studii:
Počet lidí, kteří odpověděli
Míra odpovědi =
——————————————————————————— X 100
Celkový počet odeslaných dotazníků
3.4.6. Pilotní test
Před odesláním dotazníku vzorku jsou otázky
byly testovány provedením pilotních testů, jak navrhl Luck
a Rubin (1987), Jackson (1988) a de Vaus (1991). Účelem
pilotní testování má odhalit všechny nepříjemné, nejednoznačné a výrazy
obtížně interpretovatelné otázky, vyjasnit jakékoli
použité definice a pojmy a určit přibližný čas
vyplnění dotazníku (Warwick a Lininger 1975,
Jackson 1988, Salant a Dilman 1994). Pilotní testy byly
provádí výběrem předmětů s charakteristikami podobnými těm
závěrečných předmětů, jak navrhuje Davis e Cosenza (1993). In
této studie bylo šest profesionálů v oblasti datových skladů
vybrány jako pilotní předměty. Po každém pilotním testu jsou
byly provedeny nezbytné opravy. Z provedených pilotních zkoušek, tj
účastníci pomohli předělat a resetovat
finální verze dotazníku.
3.4.7. Metody analýzy Di Dát
I dát průzkumu shromážděného z uzavřených dotazníků je
byly analyzovány pomocí balíčku statistických programů
s názvem SPSS. Mnoho odpovědí bylo analyzováno
pomocí popisných statistik. Řada dotazníků
vrátili se neúplní. Ty byly ošetřeny majorem
pozornost, aby se ujistil, že i dát pohřešovaní nebyli ani jeden
důsledek chyb při zadávání dat, ale proč ne
byly vhodné pro deklaranta nebo se deklarant rozhodl, že ne
odpovězte na jednu nebo více konkrétních otázek. Tyto odpovědi
chybějící byla během analýzy ignorována dát a byli
kódováno jako „- 9“, aby se zjistilo jejich vyloučení z procesu
analýza.
Při přípravě dotazníku byly uzavřené otázky
předkódováno přidělením čísla každé možnosti. Číslo
pak to bylo použito k přípravě dát během analýzy
(Denscombe 1998, Sapsford a Jupp 1996). Například tam byly
šest možností uvedených v otázce 1 části B: rada
administrativa, vrchní ředitel, IT oddělení, jednotka
podnikání, konzultanti a další. V souboru dát SPSS, je
byla vygenerována proměnná označující „iniciátora projektu“,
se šesti hodnotovými štítky: „1“ pro „představenstvo“, „2“
pro „výkonného ředitele na vysoké úrovni“ atd. Použití Likertinovy stupnice
v některých uzavřených otázkách také povoleno
identifikace, která při použití hodnot nevyžaduje úsilí
odpovídající čísla zadaná v SPSS. Pro dotazy s
nevyčerpávající odpovědi, které se vzájemně nevylučovaly,
každá možnost byla považována za jednu proměnnou se dvěma
štítky hodnot: „1“ pro „označené“ a „2“ pro „neoznačené“.
S otevřenými otázkami bylo zacházeno odlišně od otázek
Zavřeno. Odpovědi na tyto otázky nebyly zveřejněny
SPSS. Naopak, byly analyzovány ručně. Použití tohoto
typ otázek vám umožňuje získat informace o nápadech
svobodně vyjádřené a osobní zkušenosti žadatelů o registraci
(Bainbridge 1989, Denscombe 1998). Pokud to bylo možné, bylo to provedeno
kategorizace odpovědí.
Pro analýzu dát, používají se metody jednoduché statistické analýzy,
jako je frekvence odpovědí, průměr, čtvercová odchylka
průměr a medián (Argyrous 1996, Denscombe 1998).
K získání kvantitativních měření byl prováděn gama test
sdružení mezi dát ordinálové (Norusis 1983, Argyrous 1996).
Tyto testy byly vhodné, protože použité řadové stupnice nebyly
měli mnoho kategorií a mohli být zobrazeni v tabulce
(Norusis 1983).
3.5 Shrnutí
V této kapitole je metodologie výzkumu a
návrhy přijaté pro tuto studii.
Výběr nejvhodnější metody vyhledávání pro a
konkrétní studie
zvážit řadu pravidel, včetně povahy a typu
výzkumu, jakož i zásluh a slabin každého možného
metoda (Jenkins 1985, Benbasat et al. 1097, Galliers a Land 1987,
yin 1989, Hamilton and ives 1992, Galliers 1992, neuman 1994). Pohled
nedostatek stávajících znalostí a teorie o tom
přijetí datových skladů v Austrálii, tato studie
výzkum vyžaduje interpretační metodu výzkumu s dovedností
průzkumné k prozkoumání zkušeností organizací
Australan. Byla zvolena metoda hledání, kterou jste vybrali
shromažďovat informace týkající se přijetí konceptu data
skladování australskými organizacemi. A
Jako technika sběru byl vybrán poštovní dotazník dát,
odůvodnění metody výzkumu a techniky sběru dát
vybrané budou uvedeny v této kapitole. Také to bylo
představil diskusi o jednotce analýzy, o vzorku
použité, procenta odpovědí, obsah dotazníku,
pre-test dotazníku a analytické metody dát.

Navrhování a Datový sklad:
Kombinace vztahů mezi entitami a dimenzionální modelování
Abstrakt
Store i dát pro mnohé je to hlavní aktuální problém
organizace. Klíčový vývojový problém
skladování dát je to jeho design.
Návrh musí podporovat detekci konceptů v datech
uskladnit starší systém a další zdroje dát a také jeden
snadné pochopení a účinnost při implementaci dat
sklad.
Hodně z literatury o skladování dát doporučeno
použití modelování vztahů mezi entitami nebo dimenzionálního modelování pro
představují nákres datový sklad.
V tomto deníku si ukážeme, jak obojí
reprezentace lze kombinovat v přístupu k
kresba datový sklad. Použitý přístup je systematický
zkoumána v případové studii a je identifikována v řadě
důležité důsledky pro profesionály.
SKLADOVÁNÍ DAT
Un datový sklad obvykle je definován jako „předmětově orientovaný,
integrovaný, časově variabilní a energeticky nezávislý sběr dat na podporu
rozhodnutí managementu “(Inmon a Hackathorn, 1994).
Subjektově orientovaný a integrovaný znamená, že datový sklad è
navržen tak, aby překročil funkční hranice staršího systému podle
nabídnout integrovaný pohled na dát.
Časová varianta ovlivňuje historickou povahu nebo povahu časových řad dát in
un datový sklad, což umožňuje analyzovat trendy.
Non-volatile naznačuje, že datový sklad není to nepřetržitě
aktualizováno jako databáze OLTP. Spíše je to aktuální
pravidelně, s dát z interních a externích zdrojů. The
datový sklad je speciálně navržen pro výzkum
spíše než pro integritu aktualizací a výkon
operace.
Myšlenka ukládání i dát není to nové, byl to jeden z účelů
vedení dát od 1982. let (Il Martin, XNUMX).
I datový sklad nabízejí infrastrukturu dát pro správu
podpůrné systémy. Systémy podpory správy zahrnují rozhodnutí
podpůrné systémy (DSS) a výkonné informační systémy (EIS).
DSS je počítačový informační systém, který je
navržen tak, aby zlepšil proces a následně přilnavost
lidské rozhodnutí. EIS je obvykle doručovací systém
dát což umožňuje obchodním manažerům snadný přístup k pohledu
z dát.
Obecná architektura a datový sklad zdůrazňuje roli
datový sklad v podpoře řízení. Kromě nabídky
infrastruktura dát pro EIS a DSS, al datový sklad je možné
přistupovat k němu přímo prostřednictvím dotazů. THE dát zahrnuto v rande
sklad jsou založeny na analýze informačních požadavků
řízení a jsou získávány ze tří zdrojů: interní starší systémy,
speciální systémy pro sběr dat a externí zdroje dat. THE
dát ve vnitřních starších systémech jsou často nadbytečné,
nekonzistentní, nízké kvality a uložené v různých formátech
musí být tedy sladěny a vyčištěny před tím, než mohou být vloženy do
datový sklad (Inmon, 1992; McFadden, 1996). THE dát z
ze skladovacích systémů dát ad hoc a ze zdrojů dát
externí se používají k rozšíření (aktualizaci, nahrazení) i
dát ze starších systémů.
Existuje mnoho přesvědčivých důvodů pro vývoj a datový sklad,
které zahrnují lepší rozhodování prostřednictvím používání
aktuální více informací (Ives 1995), podpora fokusu
o úplném podnikání (Graham 1996) a snížení nákladů o
poskytování dát pro EIS a DSS (Graham 1996, McFadden
1996).
Nedávná empirická studie zjistila v průměru návratnost
investice pro i datový sklad 401% po třech letech (Graham,
1996). Nicméně, další empirické studie datový sklad mít
našel významné problémy včetně obtíží při měření a
přidělování výhod, postrádající jasný účel, podceňování
účel a složitost procesu ukládání i dát, v
zejména s ohledem na zdroje a čistotu dát.
Store i dát lze považovat za řešení
k problému řízení dát mezi organizacemi. Tam
manipulace s dát jako sociální zdroj zůstal jedním z
klíčové problémy při správě informačních systémů v celé EU
svět po mnoho let (Brancheau et al. 1996, Galliers et al. 1994,
Niederman a kol. 1990, Pervan 1993).
Populární přístup k řízení dát v osmdesátých letech to bylo
vývoj modelu dát sociální. Modelka dát sociální to bylo
navržen tak, aby nabízel stabilní základnu pro vývoj nových systémů
aplikace a databáze a rekonstrukce a integrace dědictví
systémy (Brancheau et al.
1989, Goodhue et al. 1988: 1992, Kim a Everest 1994).
Existuje však mnoho problémů s tímto přístupem, v
zejména složitost a cena každého úkolu a dlouhá doba
hmatatelné výsledky (Beynon-Davies 1994, Earl
1993, Goodhue a kol. 1992, Periasamy 1994, Shanks 1997).
Il datový sklad je to samostatná databáze, která koexistuje se starým
databáze namísto jejich nahrazování. Proto vám to umožňuje
řídit vedení dát a vyhnout se nákladnému přestavování
starších systémů.
STÁVAJÍCÍ PŘÍSTUPY K DATU ČERPÁNÍ
SKLAD
Proces budování a zdokonalování datový sklad
mělo by to být chápáno spíše jako evoluční proces než a
životní cyklus vývoje tradičních systémů (Desio1995, Shanks,
O'Donnell a Arnott 1997a). Existuje mnoho procesů zapojených do a
projekt datový sklad jako je inicializace, plánování;
informace získané z náležitostí požadovaných od manažerů společnosti;
zdroje, transformace, čištění dát a synchronizace ze staršího
systémy a další zdroje dát; vyvíjené doručovací systémy;
monitorování datový sklad; a nesmysl procesu
evoluce a konstrukce a datový sklad (Shins, O'Donnell
a Arnott 1997b). V tomto deníku se zaměřujeme na to, jak
kreslit i dát uloženy v kontextu těchto dalších procesů.
Existuje několik přístupů navržených pro datovou architekturu
sklad literatury (Inmon 1994, Ives 1995, Kimball 1994
McFadden 1996). Každá z těchto metodik obsahuje stručný přehled
přezkoumání s analýzou jejich silných stránek a ne.
Inmonův (1994) přístup pro Datový sklad
Design
Inmon (1994) navrhl čtyři iterativní kroky k navržení data
sklad (viz obrázek 2). Prvním krokem je návrh modelu
dát sociální pochopit, jak i dát lze integrovat
napříč funkčními oblastmi v rámci organizace
dělením dát skladujte v oblastech. Modelka dát je stvořen pro
uložit dát související s rozhodováním, včetně dát
historické a zahrnuty dát odvodit a agregovat. Druhým krokem je
určit předmětné oblasti implementace. Ty jsou založeny
o prioritách stanovených konkrétní organizací. Třetí
krok zahrnuje kreslení a databáze pro danou oblast představuje
zvláštní pozornost je věnována zahrnutí odpovídající úrovně podrobnosti.
Inmon doporučuje používat model entity a vztahu. Čtvrtý
krokem je identifikace systémů zdrojů dát požadované a rozvíjet
transformační procesy k získání, čištění a formátování i dát.
Silnými stránkami Inmonova přístupu je tento model dát sociální
poskytuje základ pro integraci dát v rámci organizace
a plánování podpory pro iterativní vývoj data
sklad. Jeho nevýhodou je obtížnost a cena kreslení
Modelka dát sociální, potíže s porozuměním vzorců entit e
vztahy použité v obou modelech, to dát sociální a to dát
uloženy podle oblasti předmětu a vhodnosti dát del
kresba datový sklad pro realizaci databáze
relační, ale ne pro databáze vícerozměrný.
Ives '(1995) Přístup k Datový sklad
Design
Ives (1995) navrhuje čtyřkrokový přístup k kreslení a
informační systém, který považuje za použitelný pro návrh data
sklad (viz obrázek 3). Tento přístup je do značné míry založen na
Informační inženýrství pro vývoj informačních systémů
(Martin 1990). Prvním krokem je stanovení cílů, faktorů
kritické a úspěšné a klíčové ukazatele výkonu. THE
klíčové obchodní procesy a nezbytné informace jsou
tvarovaný, aby nás vedl k modelu dát sociální. Druhý krok
zahrnuje vývoj definující architektury dát
uloženy podle oblastí, databáze di datový sklad, komponenty
požadované technologie, soubor organizační podpory
potřebné k implementaci a provozu s datový sklad. Třetí
krok zahrnuje výběr požadovaných softwarových balíčků a nástrojů.
Čtvrtým krokem je podrobný návrh a konstrukce
datový sklad. Ives to bere na vědomí dát je vázán
iterativní proces.
Silnou stránkou Ivesova přístupu je použití technických specifikací pro
určit požadavky na informace, využití strukturovaného
proces na podporu integrace datový sklad,
vhodný výběr hardwaru a softwaru a použití více
techniky reprezentace pro datový sklad. Jeho chyby
jsou inherentní složitosti. Mezi další patří potíže s
vyvinout mnoho úrovní databáze all'interno del datový sklad in
přiměřený čas a náklady.
Kimball's (1994) Approach to Datový sklad
Design
Kimball (1994) navrhl pět iteračních kroků pro nakreslení data
sklad (viz obrázky 4). Jeho přístup je obzvláště
věnovaný kresbě sóla datový sklad a používání šablon
dimenzionální přednostně před modely entit a vztahů. Kimball
analyzovat ty dimenzionální modely, protože je pro mě snazší to pochopit
obchodní manažeři jsou při obchodování efektivnější
komplexní konzultace a návrh databáze fyzické je více
efektivní (Kimball 1994). Kimball uznává, že rozvoj a
datový sklad je iterativní, a to datový sklad oddělená plechovka
být integrovány rozdělením do tabulek rozměrů
běžný.
Prvním krokem je určit konkrétní předmětnou oblast
zdokonaleno. Druhý a třetí krok se týká modelování
dimenzionální. Ve druhém kroku měření identifikují věci
zájem o předmětnou oblast a seskupeny do tabulky faktů.
Například v předmětné oblasti prodeje míry zájmu
mohly by zahrnovat množství prodaných položek a dolar
jako měna prodeje. Třetí krok zahrnuje identifikaci
dimenze, což jsou způsoby, kterými je lze seskupit, tj
fakta. V oblasti předmětu prodeje příslušné rozměry
mohly by zahrnovat položku, umístění a časové období. Tam
tabulka faktů má vícedílný klíč, který lze propojit
dimenzionálních tabulek a obvykle obsahuje velmi velké číslo
ve skutečnosti skvělé. Naproti tomu velikostní desky obsahují
popisné informace o dimenzích a dalších atributech, které
mohou být použity ke seskupení faktů. Tabulka faktů e
dimenze spojené s návrhem formuláře, který se nazývá jeden
hvězdný vzor díky svému tvaru. Čtvrtý krok zahrnuje
budova a databáze vícerozměrný k jeho zdokonalení
hvězdné schéma. Posledním krokem je identifikace zdrojových systémů dát
a rozvíjet transformační procesy k získání, čištění
a formát i dát.
Mezi silné stránky Kimballova přístupu patří používání modelů
dimenzionální reprezentovat i dát uloženy, které to dělají
snadno pochopitelné a vede k efektivnímu fyzickému designu. A
dimenzionální model, který snadno používá obojí
systémy databáze relační systémy mohou být zdokonaleny nebo systémy
databáze vícerozměrný. Mezi jeho nedostatky patří nedostatek
některé techniky usnadňující plánování nebo integraci
mnoho hvězdných vzorů v jednom datový sklad a
obtížnost navrhování z extrémně denormalizované struktury v a
rozměrový model a dát ve starém systému.
McFaddenův (1996) Přístup k datům
Skladový design
McFadden (1996) navrhuje pětistupňový přístup k
Nakresli datový sklad (viz obrázek 5).
Jeho přístup je založen na syntéze myšlenek z literatury
a je zaměřen na kreslení jednoho datový sklad. První
krok zahrnuje analýzu požadavků. I když specifika
techniky nejsou předepsány, McFaddenovy poznámky identifikují
subjekt dát specifikace a jejich atributy a odkazuje na čtenáře Watson
a Frolick (1993) pro získání požadavků.
Ve druhém kroku je nakreslen model relační entity
datový sklad a poté ověřeny obchodními manažery. Třetí
krok zahrnuje určení mapování ze staršího systému
a externí zdroje datový sklad. Čtvrtý krok zahrnuje
procesy ve vývoji, distribuci a synchronizaci dát v
datový sklad. V posledním kroku je dodávka systému
vyvinut se zvláštním důrazem na uživatelské rozhraní.
McFadden zdůrazňuje, že proces kreslení je obecně
iterativní.
Silné stránky McFaddenova přístupu spoléhají na účast
vedoucími pracovníky při určování požadavků a také
důležitost zdrojů dát, jejich čištění a sběr. Její
nevýhody se týkají chybějícího procesu rozdělení a
skvělý projekt datový sklad v mnoha integrovaných fázích a
potíže s porozuměním entitních a vztahových modelů použitých při navrhování
datový sklad.

0/5 (0 recenzí)

Zjistěte více od Online Web Agency

Přihlaste se k odběru nejnovějších článků e-mailem.

administrátor Generální ředitel

👍Online webová agentura | Expert na webovou agenturu v oblasti digitálního marketingu a SEO. Web Agency Online je webová agentura. Úspěch Agenzia Web Online v digitální transformaci je založen na základech Iron SEO verze 3. Speciality: Systémová integrace, integrace podnikových aplikací, architektura orientovaná na služby, cloud computing, datový sklad, business intelligence, velká data, portály, intranety, webové aplikace Návrh a správa relačních a vícerozměrných databází Návrh rozhraní pro digitální média: použitelnost a grafika. Online Web Agency nabízí společnostem následující služby: -SEO na Google, Amazon, Bing, Yandex; -Webová analytika: Google Analytics, Správce značek Google, Yandex Metrica; -Uživatelské konverze: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM na Google, Bing, Amazon Ads; - Marketing na sociálních sítích (Facebook, Linkedin, Youtube, Instagram).

Viz celé Bio

Share:

Líbí se mi:

Zjistěte více od Online Web Agency