fbpx

Datapakhuis en ERP | SENTRALE DATAARGIEF: GESKIEDENIS EN EVOLUSIES

ARGIEF DATA SENTRAAL: GESKIEDENIS EN EVOLUSIES


Die twee dominante temas van korporatiewe tegnologie in die 90's is
verklaar i data pakhuis en die ERP. Vir 'n lang tyd hierdie twee kragtige
strome was dele van korporatiewe IT sonder om ooit te hê
kruisings. Dit was amper asof hulle materie en anti-materie was. Maar
die groei van beide verskynsels het onvermydelik tot een gelei
hul kruising. Maatskappye vandag staar die probleem van
wat om te doen met ERP e data pakhuis. Hierdie artikel sal illustreer
wat die probleme is en hoe dit deur maatskappye aangespreek word.
AAN DIE BEGIN…
In die begin was daar die data pakhuis. Datastoor is gebore vir
die transaksieverwerking-toepassingstelsel teë te werk.
In die vroeë dae het die memorisering van die data wat dit was bedoel om te wees
net 'n kontrapunt vir die verwerking van aansoeke van
transaksies. Maar deesdae is daar baie meer gesofistikeerde visioene
as wat a data pakhuis. In vandag se wêreld die
data pakhuis dit word ingevoeg binne 'n struktuur wat kan wees
genaamd Corporate Information Factory.
DIE KORPORATIEWE INLIGTING FABRIEK
(CIF)
Die Korporatiewe Inligtingsfabriek het argitektoniese komponente
standaard: 'n vlak van kodetransformasie en -integrasie
wat integreer i data wat terwyl ek data wat hulle beweeg uit die omgewing van
omgewingstoepassing van die data pakhuis van die maatskappy; a
data pakhuis van die maatskappy waar i data wat
gedetailleerde en geïntegreerde geskiedenisse. Die data pakhuis van die maatskappy dien as
fondament waarop alle ander dele gebou kan word
van die omgewing van data pakhuis; 'n operasionele datastoor (ODS).
'n ODS is 'n hibriede struktuur wat sekere aspekte van die data bevat
pakhuis en ander aspekte van 'n OLTP-omgewing; data marts, waarin i
verskillende departemente kan hul eie weergawe van die data hê
pakhuis; a data pakhuis van eksplorasie waarin i
Maatskappy-"denkers" kan hul navrae aanbied
72 uur sonder skadelike effek op data pakhuis; en 'n herinnering
naby lyn, waarin data wat oud en data wat grootmaat detail kan wees
goedkoop gestoor.
WAAR ERP KOMBINEER MET DIE
KORPORATIEWE INLIGTING FABRIEK
Die ERP smelt op twee plekke met die Corporate Information Factory saam.
Eerstens as 'n basiese toepassing (basislyn) wat die
data wat van die aansoek aan data pakhuis. In hierdie geval i data wat,
gegenereer as 'n neweproduk van 'n transaksieproses,
is geïntegreer en gelaai in die data pakhuis van die maatskappy. Die
tweede punt van vereniging tussen ERP en CIF en die ODS. Inderdaad, baie
omgewings word die ERP as 'n klassieke ODS gebruik.
In die geval dat ERP as 'n kerntoepassing gebruik word, is dit
dieselfde ERP kan ook in CIF as ODS gebruik word. In
as die ERP egter in beide rolle gebruik moet word, daar
daar moet 'n duidelike onderskeid tussen die twee entiteite wees. Met ander woorde,
wanneer ERP speel die rol van kern toepassing en ODS, die
twee argitektoniese entiteite moet onderskei word. As 'n enkeling
die implementering van 'n ERP probeer om beide rolle te speel
terselfdertyd sal daar onvermydelik probleme in die
ontwerp en implementering van hierdie struktuur.
APARTE ODS EN BASIESE TOEPASSINGS
Daar is baie redes wat lei tot die verdeling van komponente
argitektoniese. Miskien die mees veelseggende vraag om die te skei
verskillende komponente van 'n argitektuur is dat elke komponent
van argitektuur het sy eie siening. Die basislyntoepassing is nodig
vir 'n ander doel as die ODS. Probeer om te oorvleuel
'n basislyntoepassingsbeskouing oor die wêreld van 'n ODS of omgekeerd
dit is nie 'n regte manier van werk nie.
Gevolglik is die eerste probleem van 'n ERP in die CIF dié van
kyk of daar 'n onderskeid is tussen basislyntoepassings en die
SDG's.
DATAMODELLE IN DIE KORPORATIEWE
INLIGTINGSFABRIEK
Om samehang tussen die verskillende komponente te verkry
van die argitektuur van die CIF, moet daar 'n model wees van data wat. Ek
modelle van data wat dien as 'n skakel tussen die verskillende komponente
argitektuur soos basislyntoepassings en ODS. DIE
modelle van data wat word die "intellektuele padkaart" om die te hê
regte betekenis deur die verskillende argitektoniese komponente van die CIF.
Gaan hand aan hand met hierdie idee, die idee is dat daar moet wees
wees 'n groot en unieke model van data wat. Natuurlik moet hy
'n model wees van data wat vir elk van die komponente en verder daar
dit moet 'n sinvolle pad wees wat die verskillende modelle verbind.
Elke komponent van die argitektuur - ODS, basislyntoepassings,
data pakhuis maatskappy, ensovoorts .. - benodig sy eie
model van data wat. En dus moet daar 'n presiese definisie wees van
soos hierdie modelle van data wat hulle skakel met mekaar.
BEWEEG I DATA VAN DIE ERP DATUM
WAREHOUSE
As die oorsprong van die data wat is 'n basislyntoepassing en/of 'n ODS, wanneer
ERP-insetsels i data wat in data pakhuis, so 'n invoeging moet
kom op die laagste vlak van "korreligheid" voor. Herhaling of
eenvoudig saamvoeg i data wat soos hulle uitkom
vanaf die basislyntoepassing van die ERP of vanaf die ODS van die ERP is nie die
regte ding om te doen. DIE data wat besonderhede word in die datum benodig
pakhuis om die basis van die DSS-proses te vorm. Sulke data wat
hulle sal op baie maniere hervorm word deur datamars en verkennings
del data pakhuis.
Die verplasing van data wat vanaf die basislyntoepassingsomgewing
van die ERP aan die omgewing van die data pakhuis van die maatskappy word gedoen in 'n
redelik ontspanne. Daardie verskuiwing gebeur daarna
ongeveer 24 uur vanaf die opdatering of skepping in die ERP. Die feit van
het 'n "lui" beweging van gode data wat in data pakhuis
van die maatskappy laat die data wat kom van die ERP om te "settle".
Sodra ek data wat word in die basislynaansoek gedeponeer,
dan kan jy veilig beweeg i data wat van die ERP
in die maatskappy. Nog 'n doelwit bereikbaar danksy beweging
"Lui" gode data wat is die duidelike afbakening tussen operasionele prosesse en
DSS. Met 'n "vinnige" beweging van die data wat die skeidslyn
tussen DSS en operasioneel bly vaag.
Die beweging van data wat van die ODS van die ERP na data pakhuis
van die maatskappy word gereeld gedoen, gewoonlik
weekliks of maandeliks. In hierdie geval die beweging van
data wat dit is gebaseer op die behoefte om die oues te “skoonmaak”. data wat historici.
Natuurlik bevat die ODS i data wat wat baie meer onlangs is
Respek aan data wat historici gevind in data pakhuis.
Die verplasing van data wat in data pakhuis dit word amper nooit gedoen nie
"Groothandel" (op 'n groothandelaar wyse). Kopieer 'n tabel
van die ERP-omgewing na data pakhuis dit maak nie sin nie. Een benadering
veel meer realisties is die verplasing van geselekteerde eenhede van die data wat.
Slegs die data wat wat verander het sedert die laaste opdatering van die datum
pakhuis is dié wat in die data geskuif moet word
pakhuis. Een manier om te weet watter data wat hulle is gewysig
sedert die laaste opdatering is om te kyk na die tydstempels van die data wat
gevind in die ERP-omgewing. Die ontwerper kies al die veranderinge
wat plaasgevind het sedert die laaste opdatering. Nog 'n benadering
is om veranderingsverkrygingstegnieke te gebruik data wat. Met
hierdie tegnieke word ontleed log- en joernaalbande ten einde
bepaal watter data wat moet van die ERP-omgewing na geskuif word
Die van die data pakhuis. Hierdie tegnieke is die beste in
hoeveel logs en joernaalbande uit die ERP-lêers gelees kan word
sonder verdere uitwerking op die ander hulpbronne van die ERP.
ANDER KOMPLIKASIES
Een van die probleme met ERP in CIF is wat met ander gebeur
toepassingsbronne of ai data wat van die ODS waartoe moet bydra
data pakhuis maar hulle is nie deel van die ERP-omgewing nie. Gegewe die
geslote aard van ERP, veral SAP, die poging om te integreer
sleutels van eksterne bronne van data wat met i data wat wat van die ERP na die
tyd om te beweeg i data wat in data pakhuis, dit is 'n groot uitdaging.
En hoeveel presies is die waarskynlikhede dat i data wat van aansoeke of
ODS buite die ERP-omgewing sal in die data geïntegreer word
pakhuis? Die kans is eintlik baie hoog.
VIND DATA HISTORIES UIT ERP
Nog 'n probleem met die data wat van die ERP is die gevolglike een
van die behoefte om te hê data wat historiese binne die data pakhuis.
Gewoonlik die data pakhuis behoeftes data wat historici. En
gewoonlik stoor ERP-tegnologie dit nie data wat
histories, ten minste nie tot die punt waar dit op die datum nodig is nie
pakhuis. Wanneer 'n groot hoeveelheid van data wat historici begin
by die ERP-omgewing gevoeg word, moet so 'n omgewing wees
opgeruim. Gestel byvoorbeeld a data pakhuis moet
gelaai word met vyf jaar van data wat historiese terwyl die ERP hou die
maksimum ses maande hiervan data wat. Solank die maatskappy tevrede is met
versamel 'n verskeidenheid van data wat histories soos die tyd verbygaan,
dan is daar geen probleme in die gebruik van die ERP as 'n bron vir die
data pakhuis. Maar wanneer die data pakhuis moet gaan
terug in tyd en neem gode data wat historici wat nie was nie
voorheen versamel en gestoor deur die ERP, dan die ERP-omgewing
ondoeltreffend word.
ERP EN METADATA
Nog 'n oorweging om te maak oor ERP en data pakhuis is dit
op bestaande metadata in die ERP-omgewing. Sowel as metadata
hulle gaan van die ERP-omgewing oor na die data pakhuisdie
metadata moet op dieselfde manier geskuif word. Verder, i
metadata moet in formaat en struktuur getransformeer word
vereis deur die infrastruktuur van die data pakhuis. Daar is 'n groot een
verskil tussen operasionele metadata en DSS-metadata. Die metadata
operasionele is hoofsaaklik vir die ontwikkelaar en vir die
programmeerder. DSS-metadata is hoofsaaklik vir die gebruiker
die finaal. Bestaande metadata in ERP-toepassings of ODS'e
hulle moet bekeer word en hierdie bekering is nie altyd maklik nie
en direk.
VERSKAF VAN DIE ERP-data
As die ERP gebruik word as 'n verskaffer van data wat vir die data pakhuis ci
dit moet 'n soliede koppelvlak wees wat i beweeg data wat uit die omgewing
ERP vir die omgewing data pakhuis. Die koppelvlak moet:
▪ maklik wees om te gebruik
▪ toegang tot data wat van die ERP
▪ neem die betekenis van data wat wat op die punt staan ​​om geskuif te word
in data pakhuis
▪ ken die beperkings van ERP wat kan ontstaan ​​in
tyd wanneer jy aanmeld by data wat van die ERP:
▪ verwysende integriteit
▪ hiërargiese verhoudings
▪ implisiete logiese verwantskappe
▪ toepassingskonvensie
▪ al die strukture van die data wat ondersteun deur die ERP, ensovoorts ...
▪ doeltreffend wees in toegang data wat, deur die verskaffing van:
▪ direkte beweging van data wat
▪ verkryging van verandering data wat
▪ ondersteun tydige toegang tot data wat
▪ die formaat van die te verstaan data wat, en so aan…
INTERFACE MET SAP
Die koppelvlak kan van twee tipes wees, tuisgemaak of kommersieel.
Sommige van die belangrikste kommersiële koppelvlakke sluit in:
▪ SAS
▪ Prime Solutions
▪ D2k, ensovoorts ...
VEELVOUDIGE ERP-TEGNOLOGIEë
Om die ERP-omgewing te hanteer asof dit 'n enkele tegnologie is, is 'n
groot fout. Daar is baie ERP-tegnologieë, elk met sy eie
sterkpunte. Die bekendste verkopers in die mark is:
▪ SAP
▪ Oracle Financials
▪ PeopleSoft
JD Edwards
▪ Baans
SAP
SAP is die grootste en mees volledige ERP-sagteware. Aansoeke
van SAP bevat baie soorte toepassings op baie gebiede. SAP het
die reputasie om te wees:
▪ baie groot
▪ baie moeilik en duur om te implementeer
▪ het baie mense en konsultante nodig om te wees
geïmplementeer
▪ benodig gespesialiseerde mense vir implementering
▪ neem lank om te implementeer
Boonop het SAP 'n reputasie om sy eie te memoriseer data wat molto
versigtig, wat dit vir 'n mens moeilik maak om toegang daartoe te verkry
persoon buite die SAP-gebied. Die sterkte van SAP is om te wees
in staat om 'n groot hoeveelheid van te vang en te stoor data wat.
SAP het onlangs sy voorneme aangekondig om te verleng
sy toepassings ai data pakhuis. Daar is baie voor- en nadele
in die gebruik van SAP as 'n verskaffer van data pakhuis.
Een voordeel is dat SAP reeds geïnstalleer is en dat die meeste van die
konsultante ken reeds vir SAP.
Die nadele van SAP as 'n verskaffer van data pakhuis is
baie: SAP het geen ondervinding in die wêreld van data pakhuis
As SAP die verskaffer is van data pakhuis, is dit nodig om "uit te haal"
i data wat van SAP al data pakhuis. Dato 'n SAP se rekord van
geslote stelsel, is dit onwaarskynlik dat dit maklik sal wees om i van SAP in te kry
Dit (???). Daar is baie erfenis-omgewings wat SAP aandryf,
soos IMS, VSAM, ADABAS, ORACLE, DB2, ensovoorts.
SAP dring aan op 'n "nie hier uitgedink"-benadering. SAP wil nie
werk saam met ander verskaffers om die te gebruik of te skep data pakhuis.
SAP dring daarop aan om al sy sagteware self te genereer.
Alhoewel SAP 'n groot en kragtige maatskappy is, is die feit van
probeer om die tegnologie van ELT, OLAP, administrasie van die te herskryf
stelsel en selfs die basiskode van die dbms dit is net gek.
In plaas daarvan om 'n samewerkende houding met verskaffers aan te neem
di data pakhuis jare lank het SAP die benadering gevolg dat
hulle "weet meer". Hierdie houding hou die sukses terug wat
SAP mag hê in die gebied van data pakhuis.
SAP se weiering om eksterne verskaffers toegang te gee
spoedig en grasieus aan hulle data wat. Die kern van die gebruik
un data pakhuis is maklike toegang tot data wat. Die hele storie van SAP is
gebaseer op die maak van dit moeilik om toegang te verkry data wat.
SAP se gebrek aan ondervinding in die hantering van groot volumes van data wat;
in die veld van data pakhuis daar is volumes van data wat sedertdien nog nooit gesien nie
SAP en om hierdie groot hoeveelhede van te hanteer data wat jy moet een hê
geskikte tegnologie. SAP is glo nie bewus hiervan nie
tegnologiese versperring wat bestaan ​​om die dataveld te betree
pakhuis.
Die korporatiewe kultuur van SAP: SAP het 'n besigheid geskep
by die verkryging van i data wat vanaf die stelsel. Maar om dit te doen moet jy hê
'n ander mentaliteit. Tradisioneel, sagteware maatskappye wat was
goed daarmee om data in 'n omgewing te kry, was nie goed daarmee nie
kry data om anderpad te gaan. As SAP hierdie soort kan doen
switch sal die eerste maatskappy wees wat dit doen.
Kortom, dit is te betwyfel of 'n maatskappy moet kies
SAP as 'n verskaffer van data pakhuis. Daar is baie ernstige risiko's
aan die een kant en baie min belonings aan die ander kant. Maar daar is 'n ander
rede wat die keuse van SAP as datumverskaffer ontmoedig
pakhuis. Want elke maatskappy moet dieselfde datum hê
pakhuis van alle ander maatskappye? Die data pakhuis dit is die hart
kompeterende voordeel. As elke maatskappy dieselfde aangeneem het
data pakhuis dit sal moeilik wees, al is dit nie onmoontlik nie,
mededingende voordeel te behaal. SAP dink blykbaar dat a
data pakhuis dit kan gesien word as 'n koekie en dit is 'n
verdere teken van hul “kry die data
in ".
Geen ander ERP-verskaffer is so dominant soos SAP nie.
Daar sal ongetwyfeld maatskappye wees wat die SAP-pad sal volg
vir hulle s'n data pakhuis maar vermoedelik hierdie datum
SAP pakhuise sal groot, duur en baie veeleisend wees
tyd vir hul skepping.
Hierdie omgewings sluit aktiwiteite in soos "banktellerverwerking",
prosesse vir lugrederybesprekings, prosesse vir klagtes
versekering, ensovoorts. Meer presterende was die transaksiestelsel,
meer voor die hand liggend was die behoefte aan skeiding tussen operasionele proses en
DSS (Decision Support System). Maar met hulpbronstelsels
menslik en persoonlik, word jy nooit met groot volumes gekonfronteer nie
transaksies. En natuurlik wanneer 'n persoon aangestel word
of verlaat die maatskappy dit is 'n rekord van 'n transaksie.
Maar relatief tot ander stelsels, menslike hulpbronstelsels en
persoonlike het eenvoudig nie baie transaksies nie. Daarom, in die
menslike en persoonlike hulpbronstelsels is dit nie heeltemal voor die hand liggend dat daar is nie
benodig 'n DataWarehouse. In baie opsigte hierdie stelsels
verteenwoordig die samevoeging van DSS-stelsels.
Maar daar is nog 'n faktor wat oorweeg moet word as 'n mens dit moet doen
doen met datawarehouse en PeopleSoft. In baie omgewings, i data wat
van menslike en persoonlike hulpbronne is sekondêr tot die besigheid
primêre maatskappy. Die meeste maatskappye presteer
vervaardiging, verkope, verskaffing van dienste ensovoorts. DIE
menslike en persoonlike hulpbronstelsels is gewoonlik sekondêr (of van
ondersteuning) aan die maatskappy se kernbesigheidslyn. Daarom is dit
dubbelsinnig en ongerieflik a data pakhuis apart vir die
ondersteuning aan menslike en persoonlike hulpbronne.
PeopleSoft verskil baie van SAP in hierdie opsig. Met SAP is dit
verpligtend dat daar 'n data pakhuis. Met PeopleSoft is dit nie
dan so duidelik. 'n Datapakhuis is opsioneel met PeopleSoft.
Die beste ding wat gesê kan word vir die data wat PeopleSoft is dit die datum
pakhuis kan gebruik word om i data wat aangaande
ou menslike en persoonlike hulpbronne. 'n Tweede rede vir die
wat 'n maatskappy graag wil gebruik a data pakhuis a
tot nadeel van die PeopleSoft-omgewing is om toegang toe te laat en
gratis toegang tot analise-instrumente, ai data wat deur PeopleSoft. Maar
bykomend tot hierdie redes, kan daar gevalle wees waar dit verkieslik is om nie
het 'n datapakhuis vir data wat PeopleSoft.
Samevattend
Daar is baie insigte oor die konstruksie van 'n datum
pakhuis binne 'n ERP-sagteware.
Sommige hiervan is:
▪ Dit maak sin om 'n data pakhuis wat soos enige lyk
anders in die bedryf?
▪ Hoe buigsaam 'n ERP is data pakhuis sagteware?
▪ 'n ERP data pakhuis sagteware kan 'n volume van hanteer
data wat wat geleë is in 'n "data pakhuis arena"?
▪ Wat is die rekord wat die ERP-verskaffer maak
in die gesig staar maklik en goedkoop, in terme van tyd, ai data wat? (wat
is die ERP-verskaffers rekord op aflewering van goedkoop, op
tyd, maklik toegang tot data?)
▪ Wat is die begrip van die DSS-argitektuur en die
"Korporatiewe inligtingsfabriek" deur die ERP-verskaffer?
▪ ERP-verskaffers verstaan ​​hoe om te kry data wat binnekant van
omgewing, maar ook verstaan ​​hoe om dit uit te voer?
▪ Hoe oop is die verkoper van die ERP tot datum instrumente
pakhuise?
Al hierdie oorwegings moet gemaak word by die bepaling
waar om die te plaas data pakhuis wat gasheer vir i data wat ERP en ander
data wat. Oor die algemeen, tensy daar 'n dwingende rede daarvoor is
om anders te doen, word dit aanbeveel om te bou data pakhuis uit
uit die omgewing van die ERP-verskaffer.
HOOFSTUK 1
Oorsig van die BI-organisasie
Belangrike punte:
Die bewaarplekke van inligting werk in die teenoorgestelde manier om te respekteer
tot besigheidsintelligensie (BI) argitektuur:
Korporatiewe kultuur en IT kan sukses beperk in
bou van BI-organisasies.
Tegnologie is nie meer die beperkende faktor vir BI-organisasies nie. Die
probleem vir argitekte en projekbeplanners is nie as die
tegnologie bestaan, maar as hulle die effektief kan implementeer
beskikbare tegnologie.
Vir baie maatskappye a data pakhuis dit is weinig meer as 'n deposito
passiewe verspreiding i data wat aan gebruikers wat dit nodig het. DIE data wat
hulle word uit die bronstelsels onttrek en word in teikenstrukture bevolk
di data pakhuis. Ek data wat hulle kan ook met die geheel skoongemaak word
fortuin. Geen ekstra waarde word egter ook bygevoeg nie
ingesamel deur data wat tydens hierdie proses.
In wese lewer passiewe DW op sy beste
net ek data wat skoon en operasioneel vir gebruikersverenigings. Daar
inligtingskepping en analitiese begrip hang af
geheel en al deur gebruikers. Beoordeel of die DW (Datastoor) is
sukses is subjektief. As ons die sukses beoordeel op die
vermoë om doeltreffend te versamel, te integreer en skoon te maak i data wat
korporatief op 'n voorspelbare basis, dan ja, die DW is 'n sukses.
Aan die ander kant, as ons kyk na die versameling, die konsolidasie en dit
inligtingsuitbuiting die organisasie as geheel, dan
die DW is 'n mislukking. 'n DW bied min of geen waarde van die
inligting. As gevolg hiervan word gebruikers gedwing om te doen,
sodoende inligtingsilo's te skep. Hierdie hoofstuk bied aan
'n volledige visie om die argitektuur van BI (Besigheid
Intelligensie) van die maatskappye. Kom ons begin met 'n beskrywing van BI en
dan gaan ons oor na besprekings van ontwerp en
inligtingsontwikkeling, in teenstelling met bloot die verskaffing van i data wat
aan gebruikers. Besprekings word dan gefokus op die berekening van
waarde van jou BI-pogings. Ons sluit af deur te definieer hoe IBM
spreek die argitektoniese BI-vereistes van jou organisasie aan.
Beskrywing van die argitektuur van
organisasie van BI
Kragtige transaksie-georiënteerde inligtingstelsels is nou
op die agenda in elke groot onderneming, soos hulle vlak
effektief die speelgrond vir maatskappye regoor die wêreld.
Om mededingend te bly, vereis egter nou analitiese stelsels
gerig op wat die vermoë van die maatskappy kan rewolusie deur herontdek en
die inligting wat hulle reeds het gebruik. Hierdie stelsels
analise spruit uit begrip uit die rykdom van data wat
beskikbaar. BI kan prestasie in alle inligting verbeter
van die maatskappy. Maatskappye kan kliënteverhoudings verbeter en
verskaffers, verbeter die wins van produkte en dienste, genereer
nuwe en beste aanbiedinge, risikobeheer en onder vele ander
verdienste het besteding drasties verminder. Met BI joune
maatskappy begin uiteindelik om kliënte inligting te gebruik
as 'n mededingende bate te danke aan toepassings wat doelwitte het van
mark.
Om die regte besigheid te hê beteken om definitiewe antwoorde op te hê
sleutelvrae soos:
▪ Watter van ons kliënte hulle laat ons meer verdien, of daar
stuur hulle teen 'n verlies?
▪ Waar ons beste woon kliënte in verband met winkel/
pakhuis wat hulle gereeld besoek?
▪ Watter van ons produkte en dienste kan die meeste verkoop word
effektief en aan wie?
▪ Watter produkte kan die doeltreffendste verkoop word en aan wie?
▪ Watter verkoopsveldtog was die suksesvolste en hoekom?
▪ Watter verkoopskanale is die effektiefste vir watter produkte?
▪ Hoe ons verhoudings met ons beste kan verbeter kliënte?
Die meeste maatskappye het data wat rof om te antwoord
hierdie vrae.
Operasionele stelsels genereer groot hoeveelhede produk, van
kliënt en data wat mark vanaf verkoopspunte, besprekings,
van kliëntediens en tegniese ondersteuningstelsels. Die uitdaging is
onttrek en ontgin hierdie inligting.
Baie maatskappye trek voordeel uit slegs klein fraksies van hul eie data wat
vir strategiese ontledings.
I data wat oorblywende, dikwels saamgevoeg met i data wat voortspruitend uit eksterne bronne soos i
"Regeringsverslae", en ander aangekoopte inligting, is een
goudmyn wat net wag om verken te word, ei data wat moet
word slegs verfyn in die insiggewende konteks van jou
organisasie.
Hierdie kennis kan op verskeie maniere toegepas word, variasies
van die ontwerp van 'n algemene korporatiewe strategie tot
persoonlike kommunikasie met verskaffers, deur inbelsentrums,
fakturering, Internet en ander punte. Vandag se sake-omgewing bepaal
dat DW en verwante BI-oplossings verder ontwikkel
die uitvoering van tradisionele strukture van data wat wat ek data wat genormaliseer na
atoom-vlak en "ster / kubus plase".
Wat nodig is om mededingend te bly, is 'n samesmelting van
tradisionele en gevorderde tegnologie in 'n poging om a
uitgestrekte analitiese landskap.
Ten slotte moet die algemene omgewing kennis verbeter
van die maatskappy as geheel, om seker te maak dat die aksies wat geneem is
as gevolg van die ontledings wat uitgevoer is, is dit nuttig sodat almal dit doen
voordeel.
Byvoorbeeld, kom ons sê jy rangskik joune kliënte in die kategorieë
hoë of lae risiko.
As hierdie inligting gegenereer word deur 'n onttrekkingsmodel of
ander middele, moet dit in DW geplaas word en toeganklik gemaak word vir
enigiemand, op enige manier van toegang, soos i
statiese verslae, sigblaaie, tabelle of analitiese verwerking in
lyn (OLAP).
Tans is daar egter baie van hierdie tipe inligting
bly in die silo's van data wat van die individue of departemente wat hulle genereer
die ontleding. Die organisasie as geheel het min of geen sigbaarheid nie
vir begrip. Net deur hierdie tipe inhoud te meng
inligting in jou maatskappy DW kan jy die silo's van die uitskakel
inligting en verhoog jou Dw omgewing.
Daar is twee groot struikelblokke vir die ontwikkeling van 'n organisasie
van BI.
Eerstens het ons die probleem van die organisasie self
van die verwante regulasies.
Alhoewel ons nie kan help met beleidsveranderinge nie
organisasie, kan ons jou help om die komponente van te verstaan
'n BI organisasie, sy argitektuur en hoe die
IBM-tegnologie vergemaklik die ontwikkeling daarvan.
Die tweede struikelblok om te oorkom is die gebrek aan tegnologie
geïntegreer en die kennis van 'n metode wat die hele ruimte herroep
van BI in teenstelling met slegs 'n klein komponent.
IBM reageer op veranderinge in tegnologie
van integrasie. Dit is jou verantwoordelikheid om 'n ontwerp te verskaf
selfbewus. Hierdie argitektuur moet ontwikkel word met
tegnologie gekies vir integrasie sonder beperkings, of ten minste met
tegnologie wat aan oop standaarde voldoen. Ook joune
maatskappybestuur moet verseker dat die onderneming van Bi is
volgens die skedule uitgevoer word en dit nie toe te laat nie
ontwikkeling van inligtingsilo's wat uit selfdiening voortspruit
agendas of doelwitte.
Dit is nie te sê dat die BI-omgewing nie sensitief is vir
reageer op die verskillende behoeftes en vereistes van verskillende gebruikers; in plaas daarvan beteken dit
dat die implementering van daardie individuele behoeftes en vereistes is
gedoen tot voordeel van die hele BI-organisasie.
'n Beskrywing van die argitektuur van die BI-organisasie kan
gevind word op bladsy 9 in Figuur 1.1 Die argitektuur demonstreer
'n ryk mengsel van tegnologie en tegnieke.
Van die tradisionele siening sluit die argitektuur die volgende komponente in
van pakhuis
Atoomlaag.
Dit is die fondament, die hart van die hele DW en dus van die
strategiese verslagdoening.
I data wat hier gestoor historiese integriteit sal behou, berigte van
data wat en sluit die afgeleide metrieke in, sowel as om skoon te wees,
geïntegreer, en gestoor met behulp van die onttrekkingsjablone.
Alle daaropvolgende gebruik van hierdie data wat en verwante inligting is
uit hierdie struktuur afgelei. Dit is 'n uitstekende bron vir
onttrekking van data wat en vir verslae met gestruktureerde SQL-navrae
Operasionele deposito van data wat of verslagbasis van
data wat(Operasionele datastoor (ODS) of verslagdoening
databasis.)
Dit is 'n struktuur van data wat spesifiek ontwerp vir
tegniese verslagdoening.
I data wat gestoor en oorgedra hierdie strukture kan uiteindelik
versprei in die pakhuis deur die organisasiesone (opstelling
area), waar dit vir strategiese verslagdoening gebruik kan word.
Stasie area.
Die eerste stop vir die meeste data wat bedoel vir die omgewing van
pakhuis is die organisasie sone.
Hier i data wat hulle word geïntegreer, skoongemaak en omskep in data wat nuttig dit
sal die pakhuisstruktuur vul
Datum Maart.
Hierdie deel van die argitektuur verteenwoordig die struktuur van data wat gebruik
spesifiek vir OLAP. Die teenwoordigheid van die datamars, as i data wat is
gestoor in die sterskema wat oorvleuel data wat
multidimensioneel in 'n relasionele omgewing, of in liasseerkaste
di data wat eie gebruik deur spesifieke OLAP-tegnologie, soos die
DB2 OLAP-bediener, dit is nie relevant nie.
Die enigste beperking is dat die argitektuur die gebruik van data wat
multidimensioneel.
Die argitektuur sluit ook kritiese tegnologieë en tegnieke van Bi in
wat onderskei word as:
Ruimtelike analise
Ruimte is 'n meevaller van inligting vir die ontleder en
dit is van kritieke belang om resolusie te voltooi. Ruimte kan
verteenwoordig die inligting van mense wat in 'n sekere woon
ligging, sowel as inligting oor waar daardie ligging is
fisies in vergelyking met die res van die wêreld.
Om hierdie analise uit te voer, moet jy begin deur joune te bind
inligting by breedte- en lengtegraad-koördinate. Dit is
na verwys as "geokodering" en moet deel wees van die onttrekking,
transformasie, en die laaiproses (ETL) op die vlak
van jou pakhuis.
Data-ontginning.
Die onttrekking van data wat laat ons maatskappye die groei
nommer van kliënte, om verkoopsneigings te voorspel en toe te laat
die bestuur van betrekkinge met i kliënte (CRM), onder andere inisiatiewe van die
BI.
Die onttrekking van data wat dit moet dus geïntegreer word met die strukture van
data wat van die DWHouse en ondersteun deur pakhuisprosesse vir
vergewis van beide die effektiewe en doeltreffende gebruik van tegnologie en
verwante tegnieke.
Soos aangedui in die BI-argitektuur, is die atoomvlak van die
Dwhouse, soos datamarts, is 'n uitstekende bron van data wat
vir onttrekking. Daardie selfde strukture moet ook wees
ontvangers van onttrekking resultate om vas te stel beskikbaarheid aan
breedste gehoor.
Agente.
Daar is verskeie agente om die kliënt vir elke punt te ondersoek, soos, i
bedryfstelsels van die maatskappy en dieselfde dw. Hierdie agente kan
gevorderde neurale netwerke wees wat opgelei is om oor te leer
tendense van elke punt, soos die toekomstige vraag na die produk gebaseer
op verkoopspromosies, reëlsgebaseerde enjins om op te reageer
un Dato stel omstandighede, of selfs eenvoudige agente wat
hulle rapporteer uitsonderings aan "topbestuurders". Hierdie prosesse doen
algemeen in reële tyd teenwoordig en moet dus
nou gekoppel wees aan die beweging van dieselfde data wat.
Al hierdie strukture van data wat, tegnologie en tegnieke waarborg
dat jy nie die nag sal spandeer om 'n organisasie van die te genereer nie
jou BI.
Hierdie aktiwiteit sal in inkrementele stappe ontwikkel word, vir kleintjies
punte.
Elke stap is 'n onafhanklike projekpoging en word gerapporteer
as 'n herhaling in jou dw- of BI-inisiatief. Die herhalings
kan die implementering van nuwe tegnologieë insluit, vir
begin met nuwe tegnieke deur nuwe strukture by te voeg data wat ,
laai i data wat bykomende, of met die uitbreiding van ontleding van die
jou omgewing. Hierdie paragraaf word meer bespreek
in diepte in hoofstuk 3.
Benewens die tradisionele strukture van Dw en gereedskap van Bi is daar ander
funksies van jou BI-organisasie wat jy skuld
ontwerp, soos:
Kliënt raakpunte (kliënt raak
wys).
Soos met enige moderne organisasie is daar 'n aantal
kliënt raakpunte wat aandui hoe om 'n ervaring te hê
positief vir joune kliënte. Daar is tradisionele kanale soos i
handelaars, skakelbordoperateurs, direkte pos, multimedia en drukwerk
advertensies, sowel as die mees onlangse kanale soos e-pos en web, i data wat
produkte met een of ander kontakpunt moet verkry word,
vervoer, skoongemaak, getransformeer en dan bevolk in strukture van data wat van
BI.
Basiese beginsels van data wat operasionele en gebruikersverenigings (Operasioneel
databasisse en gebruikersgemeenskappe).
Aan die einde van die kontakpunte van die kliënte jy sal die basiese beginsels van vind data wat
toepassing van die maatskappy en gebruikersgemeenskappe. DIE data wat bestaande
is data wat tradisionele wat herenig en saamgesmelt moet word met die data wat wat
vloei vanaf die kontakpunte om aan die nodige te voldoen
inligting.
Ontleders. (Ontleders)
Die primêre begunstigde van die BI-omgewing is die ontleder. Dit is hy wat
voordele uit die huidige onttrekking van data wat operasionele, geïntegreer met
verskillende bronne van data wat , aangevul met kenmerke soos analise
geografiese (geokodering) en aangebied in BI tegnologie wat
laat jou toe om, OLAP, gevorderde SQL-verslagdoening en -analise te onttrek
geografies. Die primêre koppelvlak vir die ontleder na die omgewing van
verslagdoening is die BI-portaal.
Die ontleder is egter nie die enigste een wat voordeel trek uit die argitektuur van die
BI.
Bestuurders, groot gebruikersverenigings, en selfs vennote, verskaffers en i
kliënte hulle behoort voordele in onderneming BI te vind.
Terugvoerlus.
BI-argitektuur is 'n leeromgewing. 'n Beginsel
kenmerk van die ontwikkeling is om volgehoue ​​strukture van toe te laat data wat
bygewerk te word deur gebruikte BI-tegnologie en deur aksies
begrip van die gebruiker. 'n Voorbeeld is die evaluering van die
kliënt (kliënttelling).
As die verkoopsafdeling 'n mynboumodel maak
van die kliënt se tellings as om 'n nuwe diens te gebruik, dan is die
verkoopsafdeling behoort nie die enigste begunstigde groep te wees nie
van die diens.
In plaas daarvan moet die mynboumodel as deel gemaak word
natuurlike datavloei binne die maatskappy en die kliënt se tellings
dit moet 'n geïntegreerde deel van die inligtingsomgewing van die
pakhuis, sigbaar vir alle gebruikers. Die Bi-bi-sentriese IBM Suite
insluitend DB2 UDB, DB2 OLAP Server sluit die meeste in
deel van die belangrike komponente van tegnologie, gedefinieer in die figuur
1.1.
Ons gebruik argitektuur soos dit in hierdie boek figuur voorkom vir
gee ons 'n vlak van kontinuïteit en wys hoe elke produk
van IBM pas by die algemene skema van BI.
Die verskaffing van die Inligting-inhoud (Verskaf
Inligting inhoud)
Ontwerp, ontwikkeling en implementering van jou BI-omgewing is
'n moeisame operasie. Die ontwerp moet soveel omhels
huidige en toekomstige besigheidsvereistes. Die ontwerp van argitektuur
dit moet volledig wees om alle gevolgtrekkings wat gevind is in te sluit
tydens die ontwerpfase. Die teregstelling moet bly
verbind tot 'n enkele doel: om die argitektuur van BI te ontwikkel
soos formeel in die tekening aangebied en gebaseer op die vereistes van
besigheid.
Dit is veral moeilik om te argumenteer dat dissipline die
relatiewe sukses.
Dit is eenvoudig omdat jy nie 'n hele BI-omgewing ontwikkel nie
ewe skielik, maar dit vind mettertyd in klein treetjies plaas.
Die identifisering van die BI-komponente van jou argitektuur is egter
belangrik om twee redes: Jy sal alle daaropvolgende besluite lei
argitektoniese tegnieke.
Jy sal bewustelik 'n bepaalde gebruik van tegnologie kan ontwerp
alhoewel jy dalk nie 'n verteenwoordiger kry wat die nodig het nie
tegnologie vir 'n paar maande.
Om u besigheidsvereistes voldoende te verstaan, sal die tipe beïnvloed
van produkte wat jy vir jou argitektuur sal bekom.
Die ontwerp en ontwikkeling van jou argitektuur verseker
dat jou pakhuis is
nie 'n toevallige gebeurtenis nie, maar eerder 'n "goeddeurdagte",
sorgvuldig saamgestelde advertensie Opera van kuns as 'n mosaïek van
gemengde tegnologie.
Ontwerp die inligtinginhoud
Alle aanvanklike beplanning moet fokus en identifiseer
hoofkomponente van BI wat deur die omgewing benodig sal word
algemeen in die hede en in die toekoms.
Dit is belangrik om die besigheidsvereistes te ken.
Selfs voor al die konvensionele beplanning begin, die
projekbeplanner kan dikwels een of twee identifiseer
komponent dadelik.
Die balans van komponente wat nodig mag wees vir die
jou argitektuur kan egter nie maklik gevind word nie.
Tydens die ontwerpfase, die hoofdeel van die argitektuur
bind die toepassingsontwikkelingsessie (JAD) op 'n soektog
besigheidsvereistes te identifiseer.
Soms kan hierdie vereistes uitgekontrakteer word
navrae en verslagdoening.
Byvoorbeeld, gebruikers verklaar dat as hulle wil outomatiseer
tans moet 'n verslag met die hand gegenereer word deur te integreer
twee stroomverhoudings en die bytelling van die berekeninge wat afgelei is van
kombinasie van data wat.
Alhoewel hierdie vereiste eenvoudig is, definieer dit 'n sekere een
funksionaliteit van die kenmerk wat jy moet insluit wanneer
koop verslagdoeningsinstrumente vir jou organisasie.
Die ontwerper moet ook bykomende vereistes vir
kry 'n volledige prentjie. Gebruikers wil inteken op
hierdie verslag?
Die substelle van die verslag word gegenereer en per e-pos aan die verskillende
gebruikers? Wil jy hierdie verslag op die maatskappyportaal sien?
Al hierdie vereistes is deel van die eenvoudige behoefte aan
vervang 'n handleiding verslag soos vereis deur gebruikers. Die voordeel
van hierdie tipe vereistes is wat almal, gebruikers en ontwerpers, het
'n begrip van die konsep van verslae.
Daar is egter ander soorte besighede wat ons moet beplan.
Wanneer die besigheidsvereistes in die vorm van
Besigheid strategiese vrae, dit is maklik vir die gesoute ontwerper
onderskei die maat/feit en dimensionele vereistes.
Figuur 1.2 illustreer meting en dimensionele komponente van a
Besigheidsprobleem.
As JAD-gebruikers nie weet hoe om hul vereistes te verklaar nie
in die vorm van 'n besigheidsprobleem, sal die ontwerper dikwels voorsien
voorbeelde om die insamelingsessie oor te slaan
vereistes.
Die kundige ontwerper kan gebruikers help om nie net die
strategiese handel, maar ook hoe om dit op te lei.
Die vereistes-insamelingsbenadering word in hoofstuk 3 bespreek; vir
nou wil ons net die behoefte aan te dui om vir almal te ontwerp
die tipes BI-vereistes
'n Strategiese besigheidsprobleem is nie net 'n vereiste nie
Besigheid, maar ook 'n ontwerp-leidraad. As jy moet antwoord
na 'n multidimensionele vraag, dan moet jy memoriseer,
dien i data wat afmetings, en as jy moet stoor i
data wat multidimensionele, jy moet besluit watter soort tegnologie of
tegniek wat jy gaan gebruik.
Implementeer jy 'n gereserveerde kubussterskema, of albei?
Soos u kan sien, selfs 'n eenvoudige besigheidsprobleem
dit kan 'n aansienlike invloed op die ontwerp hê. Egter
hierdie tipe besigheidsvereistes is gewone en natuurlik ten minste
deur ervare ontwerpers en projekbeplanners.
Daar was voldoende debat oor die tegnologieë en ondersteuning van
OLAP, en 'n wye reeks oplossings is beskikbaar. Tot nou toe
ons het die behoefte genoem om eenvoudige verslagdoening met i te kombineer
dimensionele vereistes van besigheid, en hoe hierdie vereistes
tegniese argitektoniese besluite te beïnvloed.
Maar wat is die vereistes wat nie geredelik verstaan ​​word nie
deur die gebruikers of die DW-span? Jy sal nooit die ontleding nodig hê nie
ruimtelike (ruimtelike analise)?
Die mynboumodelle van data wat hulle sal 'n noodsaaklike deel van joune wees
toekoms? Wie weet?
Dit is belangrik om daarop te let dat hierdie tipe tegnologie nie baie is nie
bekend deur die algemene gebruikersgemeenskappe en spanlede van
Dw, deels, kan dit gebeur omdat hulle tipies
hulle word deur sommige interne of derdeparty tegniese kundiges hanteer. Dit is 'n
uiterste geval van die probleme wat hierdie tipe tegnologie genereer. Self
gebruikers kan nie besigheidsvereistes beskryf of dit raam nie
om riglyne aan ontwerpers te verskaf, kan hulle
gaan ongemerk of, erger, bloot geïgnoreer.
Dit word meer problematies wanneer die ontwerper en die ontwikkelaar misluk
hulle kan die toepassing van een van hierdie gevorderde maar herken
kritiese tegnologieë.
Soos ons al dikwels gehoor het dat die ontwerpers sê, “wel, hoekom
Sit ons dit nie opsy totdat ons hierdie ander ding kry nie?
“Stel hulle regtig belang in prioriteite, of vermy net i
vereistes wat hulle nie verstaan ​​nie? Dit is heel waarskynlik die laaste hipotese.
Kom ons sê jou verkoopspan het 'n vereiste gekommunikeer
van besigheid, soos in Figuur 1.3 gestel, soos jy kan sien, die
vereiste word opgestel in die vorm van 'n besigheidsprobleem. Daar
verskil tussen hierdie probleem en die tipiese dimensionele probleem is
die afstand. In hierdie geval wil die verkoopsgroep weet,
op 'n maandelikse basis, totale verkope van produkte, pakhuise en
kliënte wat binne 5 myl van die pakhuis woon waar hulle is
hulle koop.
Ongelukkig kan ontwerpers of argitekte eenvoudig
ignoreer die spasie-komponent deur te sê, "ons het die kliënt, die
produk en i data wat van die deposito. Ons hou die afstand uit tot
nog 'n herhaling.
"Verkeerde antwoord. Hierdie tipe besigheidsprobleem gaan oor
heeltemal BI. Dit verteenwoordig 'n dieper begrip van die
ons besigheid en 'n robuuste ontledingsruimte vir ons ontleders.
BI is verder as eenvoudige navraag of standaard verslagdoening, of
selfs OLAP. Dit is nie te sê dat hierdie tegnologie nie
is belangrik vir jou BI, maar alleen verteenwoordig hulle nie
die BI-omgewing.
Ontwerp vir die inligtingskonteks
(Ontwerp vir inligtinginhoud)
Noudat ons die besigheidsvereistes geïdentifiseer het wat hulle onderskei
verskeie fundamentele komponente moet in 'n tekening ingesluit word
algemene argitektoniese. Sommige van die komponente van BI is deel van
van ons aanvanklike pogings, terwyl sommige nie vir geïmplementeer sal word nie
etlike maande.
Alle bekende vereistes word egter in die ontwerp weerspieël sodat
wanneer ons 'n spesifieke tegnologie moet implementeer, is ons
maak gereed om dit te doen. Iets omtrent die projek sal die denke weerspieël
tradisioneel.
Byvoorbeeld, Figuur 1.1, aan die begin van die hoofstuk, toon 'n datum
mart wat die hou data wat dimensioneel.
Hierdie stel van data wat word gebruik om latere gebruike van
data wat dimensionele gedryf deur die Besigheidskwessies wat
ons geïdentifiseer het. Soos bykomende dokumente is
gegenereer, soos die ontwerpontwikkeling van die data wat, ons
ons sal begin om te formaliseer hoe i data wat hulle versprei in die omgewing.
Ons het vasgestel die behoefte om die data wat so as
dimensioneel, verdeel hulle (volgens spesifieke behoeftes
bepaal) op Maart.
Die volgende vraag om te beantwoord is: hoe sal hulle gebou word
hierdie data maart?
Bou jy die sterre om die kubusse te ondersteun, of net kubusse, of net die sterre?
(of regte kubusse, of regte sterre). Genereer die argitektuur vir die data
afhanklike mars wat 'n atoomlaag vir almal vereis data wat
aanwinste? Laat onafhanklike datamars toe om te verkry data wat
direk vanaf bedryfstelsels?
Watter kubustegnologie sal jy probeer standaardiseer?
Jy het massiewe hoeveelhede gode data wat benodig vir dimensionele analise
of jy het jou nasionale verkoopsmagkubusse op een nodig
op 'n weeklikse basis of op albei? Bou 'n kragtige item
soos DB2 OLAP Server vir finansies of Cognos-kubusse
PowerPlay vir jou verkoopsorganisasie of albei?
Dit is die groot argitektoniese ontwerp besluite wat
sal jou BI-omgewing van hier af beïnvloed. Ja,
jy het 'n behoefte aan OLAP geïdentifiseer. Nou hoe sal jy dit uitvoer
tipe tegniek en tegnologie?
Hoe sommige van die mees gevorderde tegnologieë joune beïnvloed
tekeninge? Ons neem aan dat u 'n behoefte vasgestel het
ruimte in jou organisasie. Nou moet jy die oproep
argitektoniese tekening uitgawes al is dit onbeplan van
ruimtekomponente vir etlike maande uit te voer. Die argitek moet
ontwerp vandag gebaseer op wat nodig is. Voorspel die behoefte aan
ruimtelike analise wat genereer, stoor, uitvoer en verskaf
toegang tot data wat spasie. Dit moet op sy beurt dien as 'n
beperking met betrekking tot die tipe tegnologie en spesifikasies
sagteware platform wat jy tans kan oorweeg. Vir
byvoorbeeld die administrasiestelsel van databasis relasionele
(RDBMS) wat jy uitvoer vir jou atoomlaag moet hê
'n robuuste ruimtelike uitbreiding beskikbaar. Dit sou verseker dat die
maksimum werkverrigting wanneer meetkunde en voorwerpe gebruik word
ruimte in jou analitiese toepassings. As jou RDBMS dit nie doen nie
kan hanteer i data wat (ruimtelik-sentries) intern, so jy sal moet
stabiliseer una databasis (ruimtelik-sentries) ekstern. Dit bemoeilik die
uitgawes bestuur en jou algehele prestasie in gevaar stel,
om nie te praat van die bykomende probleme wat vir joune geskep is nie
DBA's, aangesien hulle waarskynlik 'n bietjie begrip het
van die basiese beginsels van data wat ruimte ook. Aan die ander kant, as jou
RDMBS hanteer alle ruimtelike en verwante komponente
optimizer is bewus van spesiale behoeftes (byvoorbeeld,
indeksering) van die ruimtelike voorwerpe, dan kan jou DBA's hanteer
bestuur die uitgawes dadelik en jy kan die verhoog
prestasie.
Jy moet ook die verhoogarea en die laag aanpas
atoomomgewing om adresopruiming in te sluit (a
sleutelelement tot ruimtelike analise), asook die volgende
spaar ruimte voorwerpe. Die opeenvolging van uitgawes van
ontwerp gaan voort noudat ons die idee van skoonmaak bekendgestel het
adres. Vir een ding, hierdie toepassing sal die tipe dikteer
sagteware wat nodig is vir jou ETL-poging.
Jy benodig produkte soos Trillium om jou van 'n adres te voorsien
skoon, of 'n ETL-verskaffer wat jy gekies het om dit te verskaf
funksionaliteit?
Vir nou is dit belangrik dat jy die vlak van die ontwerp waardeer wat jy is
dit moet voltooi word voordat jy joune begin maak
omgewing (pakhuis). Bogenoemde voorbeelde moet
demonstreer die menigte ontwerpbesluite wat moet volg
die identifikasie van enige spesifieke besigheidsvereiste. Indien gedoen
korrek, bevorder hierdie ontwerpbesluite
die interafhanklikheid tussen die fisiese strukture van jou omgewing, die
seleksie van tegnologie wat gebruik word en die vloei van voortplanting
inligting inhoud. Sonder hierdie konvensionele argitektuur
van BI, sal jou organisasie onderhewig wees aan 'n mengsel
chaoties van bestaande tegnologieë, op sy beste, op 'n manier verenig
nie akkuraat om oënskynlike stabiliteit te verskaf nie.
Handhaaf inligtinginhoud
Om die waarde van inligting na jou organisasie te bring is
'n baie moeilike operasie. Sonder voldoende begrip
en ondervinding, of behoorlike beplanning en teken, selfs die
beter spanne sou misluk. Aan die ander kant, as jy 'n groot een het
insig en 'n gedetailleerde ontwerp maar geen dissipline daarvoor nie
uitvoering, jy het net jou geld en jou tyd gemors
want jou poging is gedoem om te misluk. Die boodskap moet
wees duidelik: As jy een of meer hiervan mis
vaardighede, begrip / ervaring of beplanning / teken o
implementering dissipline, sal dit lei tot kreupel of
vernietig die konstruksie van die BI-organisasie.
Is jou span voorbereid genoeg? Daar is iemand op joune
BI-span wat die uitgebreide analitiese landskap wat beskikbaar is, verstaan
in die BI-omgewings, in die nodige tegnieke en tegnologieë
om daardie landskap te bewerkstellig? Daar is iemand in jou span
wat die toepassingsverskil tussen gevorderde kan herken
statiese verslagdoening en OLAP, of die verskille tussen ROLAP en OLAP? Een van die
jou spanlede herken die weg duidelik
uittreksel en hoe dit die pakhuis kan beïnvloed of hoe
kan die pakhuis die mynprestasie ondersteun? N lid
van die span verstaan ​​die waarde van data wat ruimte of tegnologie
agent-gebaseerde? Het jy iemand wat die unieke toepassing waardeer
van ETL gereedskap versus makelaar tegnologie
boodskap? As jy dit nie het nie, kry een. BI is baie meer
groot van 'n genormaliseerde atoomlaag, van OLAP, van die skemas a
ster en 'n ODS.
Het die begrip en ervaring om die vereistes te erken
van BI en hul oplossings is noodsaaklik vir jou vermoë om
Gebruikersbehoeftes en -ontwerp korrek te formaliseer
en hul oplossings uit te voer. As jou gebruikersgemeenskap het
moeilikheid om die vereistes te beskryf, is dit die span se taak
pakhuis daardie insig verskaf. Maar as die span van
pakhuis
herken nie die spesifieke toepassing van BI nie - byvoorbeeld gegee
mynbou - dan is dit nie die beste ding wat BI-omgewings doen nie
dikwels beperk tot passiewe deposito's. Ignoreer hierdie egter
tegnologieë verminder nie hul belangrikheid en die effek wat dit het nie
oor die ontstaan ​​van sake-intelligensie-moontlikhede van jou
organisasie, sowel as die inligtingstruktuur wat jy ontwerp
om te bevorder.
Die ontwerp moet die idee van ontwerp insluit, red
beide vereis 'n bekwame individu. Daarbenewens het die ontwerp
dit vereis 'n span werehouse filosofie en waarneming
standaarde. Byvoorbeeld, as jou maatskappy een gestig het
standaard platform of het 'n spesifieke RDBMS geïdentifiseer wat jy
oor die platform wil standaardiseer, dreig dit
almal in die span voldoen aan daardie standaarde. Oor die algemeen een
span stel die behoefte aan normalisering bloot (aan gebruiker
gemeenskappe), maar die span self is nie bereid om by die
standaarde wat ook op ander gebiede in die maatskappy of dalk selfs in die
soortgelyke maatskappye. Dit is nie net skynheilig nie, maar dit verseker dat die firma dit nie doen nie
is in staat om bestaande hulpbronne en beleggings te ontgin. Dit beteken nie
dat daar geen situasies is wat 'n platform of een waarborg nie
nie-standaard tegnologie; egter die pogings van die pakhuis
hulle moet jaloers die standaarde van die onderneming beskerm
dat besigheidsvereistes nie anders voorskryf nie.
Die derde sleutelkomponent wat nodig is om 'n BI te bou
organisasie is die dissipline.
Dit hang in totaal af, ewe veel van individue en die omgewing.
Projekbeplanners, borge, argitekte en gebruikers moet die waardeer
dissipline wat nodig is om die inligtingstruktuur van die maatskappy te bou.
Ontwerpers moet hul projekpogings op so 'n manier rig om
voltooi ander nodige pogings in die samelewing.
Gestel byvoorbeeld jou maatskappy bou 'n
ERP-toepassing wat 'n pakhuiskomponent het.
Daarom is dit die verantwoordelikheid van die ERP-ontwerpers om saam te werk met die
pakhuisomgewingspan om ook nie mee te ding nie
dupliseer die werk wat reeds begin is.
Dissipline is ook 'n vak wat beset moet word
deur die hele organisasie en word gewoonlik gestig en toevertrou aan a
uitvoerende vlak.
Is bestuurders bereid om 'n ontwerpte benadering te volg? A
benadering wat beloof om inligting inhoud te skep wat is
uiteindelik sal dit waarde bring vir alle areas van die onderneming, maar miskien
Kompromitteer dit individuele of departementele agendas? Onthou die gesegde
"Om oor alles te dink is belangriker as om net aan een ding te dink."
Hierdie gesegde is waar vir BI-organisasies.
Ongelukkig fokus baie pakhuise hul pogings
op soek na dryf en waarde bring na 'n spesifieke departement of a
spesifieke gebruikers, met min agting vir organisasie in
algemeen. Gestel die bestuurder vra bystand van die span by
washuis. Die span reageer met 'n 90-dae werk wat
sluit nie net die lewering van die kennisgewing vereistes gedefinieer deur die
bestuurder maar verseker dat al data wat basis word in die vlak gemeng
atoom voordat dit in kubustegnologie bekendgestel is
voorstel.
Hierdie ingenieursbyvoeging verseker dat die prestasie van
washuis sal baat by data wat benodig deur die bestuurder.
Die uitvoerende hoof het egter met eksterne konsultasiefirmas gepraat wat
het 'n soortgelyke aansoek met aflewering in minder as 4 voorgestel
weke.
Gestel die interne washuisspan is bekwaam, die
bestuurder het 'n keuse. Wie kan die dissipline van ondersteun
bykomende ingenieurswese nodig om die put te boer
inligtingsonderneming of kan kies om hul eie te maak
oplossing vinnig. Laasgenoemde blyk werklik gekies te wees
te dikwels en dien slegs om inligtinghouers van te skep
waaruit 'n paar of die individu voordeel trek.
Kort- en langtermyn doelwitte
Argitekte en projekbeplanners moet a. formaliseer
langtermyn visie van die algehele argitektuur en planne vir
groei in 'n BI-organisasie. Hierdie kombinasie van
korttermyn wins en langtermyn beplanning
verteenwoordig die twee gesigte van pogings BI. Korttermyn wins
verval is die faset van BI wat geassosieer word met iterasies van die
jou pakhuis.
Dit is waar beplanners, argitekte en borge fokus
aan spesifieke besigheidsvereistes voldoen. Dit is op hierdie vlak waar die
fisiese strukture word gebou, tegnologie aangekoop en die
tegnieke geïmplementeer word. Hulle is geensins gemaak om in die gesig te staar nie
spesifieke vereistes soos gedefinieer deur spesifieke gebruikersgemeenskappe.
Alles word gedoen om aan bepaalde spesifieke vereistes te voldoen
uit 'n bepaalde gemeenskap.
Langafstandbeplanning is egter die ander faset
van BI. Dit is waar die planne en ontwerpe verseker het dit was
gebou enige fisiese struktuur, die tegnologie gekies en die
gerealiseerde tegnieke gemaak met die oog op die onderneming. En die
langtermynbeplanning wat kohesie verskaf
nodig om te verseker dat besigheidsvoordele aan almal toekom
die korttermynwinste wat gevind is.
Regverdig jou BI-poging
Un data pakhuis op sigself het dit geen inherente waarde nie. In ander
woorde, daar is geen inherente waarde tussen die tegnologieë nie
pakhuis en implementeringstegnieke.
Die waarde van enige pakhuispoging word in die aksies gevind
uitgevoer as gevolg van die pakhuisomgewing en -inhoud
inligting wat oor tyd verbou is. Dit is 'n kritieke punt om te verstaan
voordat jy ooit probeer om die waarde van enige inisiatief te skat deur
tuis.
Te dikwels probeer argitekte en beplanners waarde toepas op
pakhuis fisiese en tegniese komponente terwyl dit in werklikheid die waarde is
stigte met besigheidsprosesse wat positief beïnvloed word deur die
pakhuis en goed verkry inligting.
Hierin lê die uitdaging om BI te stig: Hoe regverdig jy die belegging?
As die wherehouse self geen intrinsieke waarde het nie, is die ontwerpers van
projek moet die voordele ondersoek, definieer en formaliseer
bereik deur daardie individue vir wie die pakhuis sal gebruik
verbeter spesifieke besigheidsprosesse of die waarde van
beskermde inligting of albei.
Om onderwerpe te kompliseer, enige besigheidsproses
wat deur pakhuispogings geraak word, kan voordele inhou
"aansienlik" of "effens". Aansienlike voordele bied 'n
tasbare maatstaf om opbrengs op belegging (ROI) te meet – bv
byvoorbeeld om voorraad 'n bykomende tyd gedurende 'n tydperk om te draai
spesifiek of vir laer vervoerkoste per besending. Dit is meer
Dit is moeilik om die geringe voordele vas te stel, soos verbeterde toegang tot
inligting, in terme van tasbare waarde.
Koppel jou projek om die
besigheidsversoeke
Te dikwels probeer projekontwerpers om waarde te verbind
van die pakhuis met amorfe doelwitte van die onderneming. verklaar dat
“Die waarde van 'n pakhuis is gebaseer op ons vermoë om
bevredig strategiese versoeke” maak ons ​​aangenaam oop die
toespraak. Maar dit alleen is nie genoeg om te bepaal of
die belegging in die pakhuis maak sin. Dit is beter om herhalings te verbind
van pakhuis met spesifieke kommersiële versoeke en notas.
Meet ROI
Die berekening van ROI in 'n pakhuisopset kan wees
besonder moeilik. Dit is veral moeilik as die leiding
hoof van 'n bepaalde herhaling is iets ontasbaars of
maklik om te meet. 'n Studie het bevind dat gebruikers waarneem
die twee hoofvoordele van BI-inisiatiewe:
▪ Skep die vermoë om besluite te neem
▪ Skep toegang tot inligting
Hierdie voordele is sagte (of ligte) voordele. Dit is maklik om te sien
hoe kan ons 'n ROI bereken op grond van 'n harde rand (o
groter) soos die vermindering van die koste van vervoer, maar hoe
meet ons die vermoë om beter besluite te neem?
Dit is beslis 'n uitdaging vir projekbeplanners wanneer
hulle probeer om die maatskappy te kry om in een spesifieke te belê
pakhuispoging. Verhoging van verkope of vermindering van koste
hulle is nie meer die sentrale temas wat die BI-omgewing dryf nie.
In plaas daarvan soek jy toegang in besigheidsversoeke
die beste na die inligting sodat 'n spesifieke departement kan
neem vinniger besluite. Dit is strategiese dryfvere a
wat toevallig vir die firma ewe belangrik is, maar is
meer dubbelsinnig en moeiliker om te karakteriseer in 'n tasbare metrieke.
In hierdie geval kan die berekening van ROI misleidend wees, indien nie irrelevant nie.
Projekontwerpers moet waarde kan demonstreer
tasbaar vir bestuurders om te besluit of die belegging in
'n bepaalde herhaling tel. Ons sal egter nie 'n nuwe voorstel nie
metode vir die berekening van ROI, en ons sal ook geen pro of argument maak nie
daarteen.
Daar is baie artikels en boeke beskikbaar wat die grondbeginsels vir bespreek
ROI bereken. Daar is spesiale waardeproposisies soos waarde
on Investment (VOI), wat deur groepe soos Gartner aangebied word, wat jy kan
na te vors. In plaas daarvan sal ons fokus op die kernaspekte van enige
ROI of ander waardevoorstelle wat u moet oorweeg.
Pas tans ROI toe
Benewens die argument oor “harde” voordele versus “sagte” voordele
Geassosieer met BI-pogings is daar ander kwessies om te oorweeg
wanneer ons ROI toepas. Byvoorbeeld:
Om te veel besparings toe te skryf aan DW-pogings wat sou kom
Egter
Kom ons sê jou maatskappy het oorgeskakel van 'n argitektuur van
hoofraam na 'n verspreide UNIX-omgewing. So enige
besparings wat moontlik (of nie) deur daardie poging gerealiseer kan word
moet nie uitsluitlik, indien aan almal (?), toegeskryf word aan
pakhuis.
Om nie alles te verreken nie, is duur. En daar is baie dinge om
in ag neem. Oorweeg die volgende lys:
▪ Koste van aanvang, insluitend uitvoerbaarheid.
▪ Koste van toegewyde hardeware met verwante berging e
kommunikasie
▪ Koste van die sagteware, insluitend bestuur van data wat en uitbreidings
kliënt/bediener, ETL-sagteware, DSS-tegnologieë, gereedskap
visualisering, skedulering en vloei toepassings
werk en monitering sagteware,.
▪ Struktuurontwerpkoste data wat, met die besef, en
die optimalisering van
▪ Sagteware-ontwikkelingskoste wat direk met die poging geassosieer word
BI
▪ Koste van tuisondersteuning, insluitend optimering van
werkverrigting, insluitend sagteware weergawebeheer e
bedrywighede te help
Pas "Big-Bang" ROI toe.
Die verwesenliking van die pakhuis as 'n enkele en reusagtige poging
is gebind om te misluk, so ook bereken die ROI vir 'n inisiatief
van groot onderneming Die aanbod is verbasend, en dat die ontwerpers
voortgaan om flou pogings aan te wend om die waarde van die geheel te skat
moeite.
Omdat die ontwerpers probeer om 'n geldwaarde te gee
op die ondernemingsinisiatief as dit algemeen bekend is en dit aanvaar word
is dit moeilik om spesifieke herhalings te skat? Hoe is dit moontlik? Dit is nie
moontlik met min uitsonderings. Moenie dit doen nie.
Noudat ons vasgestel het wat om nie te doen wanneer jy bereken nie
ROI, hier is 'n paar punte wat ons sal help om te definieer
'n betroubare proses om die waarde van jou BI-pogings te skat.
Verkryging van ROI-toestemming. Ongeag joune
keuse van tegniek om die waarde van jou BI-pogings te skat, moet
ooreengekom word deur alle partye, insluitend projekbeplanners,
korporatiewe borge en bestuurders.
Verdeel ROI in identifiseerbare dele. 'n Noodsaaklike stap na in
redelike berekening van 'n ROI is om daardie berekening te konsentreer op a
spesifieke projek. Dit laat jou dan toe om 'n waarde te skat
gebaseer op spesifieke besigheidsvereistes waaraan voldoen word
Definieer die koste. Soos genoem, moet talle koste wees
oorweeg. Verder moet die koste nie net die gepaardgaande koste insluit nie
aan die enkele iterasie maar ook aan die gepaardgaande koste
om voldoening aan korporatiewe standaarde te verseker.
Definieer voordele. Deur ROI duidelik aan vereistes te koppel
spesifieke ambagte, moet ons in staat wees om die te identifiseer
voordele wat sal lei tot voldoening aan die vereistes.
Verminder koste en voordele in dreigende winste. Dit is die manier
beste manier om jou waardasies op netto huidige waarde te baseer
(NPV) anders as om toekomstige waarde in te probeer voorspel
toekomstige verdienste.
Hou die tyd om jou ROI tot 'n minimum te verdeel. EN'
goed gedokumenteer in die lang tyd wat dit in joune gebruik is
ROI.
Gebruik meer as een ROI-formule. Daar is talle metodes vir die
ROI-voorspelling en jy moet beplan of jy een of
plus, insluitend die netto huidige waarde, die interne spoed van die terugvoer
(IRR) en herstel.
Definieer herhaalbare proses. Dit is van kardinale belang vir die berekening
enige langtermynwaarde. Dit moet gedokumenteer word a
enkele herhaalbare proses vir alle projek-volgorde a
volg.
Die probleme wat gelys word, is die algemeenste wat deur kundiges gedefinieer word
van die washuis-omgewing. Bestuur se aandrang op
om 'n "Big-Bang" ROI te lewer is baie verwarrend. As jy begin al die
jou ROI-berekeninge deur dit af te breek in identifiseerbare, tasbare dele, het jy
'n goeie kans om 'n akkurate ROI-evaluering te skat.
Vrae oor ROI-voordele
Wat ook al jou voordele, sag of hard, jy kan gebruik
'n paar fundamentele vrae om die waarde daarvan te bepaal. Om
byvoorbeeld met behulp van 'n eenvoudige skaalstelsel, van 1 tot 10, jy
jy kan die impak van enige poging volg deur die volgende te gebruik
versoeke:
▪ Hoe sou jy begrip van data wat na aanleiding hiervan
projek van jou maatskappy?
▪ Hoe sou jy prosesverbeterings as gevolg van skat
hierdie projek?
▪ Hoe sal jy nou die impak van nuwe insigte en afleidings meet
beskikbaar gestel deur hierdie iterasie
▪ Wat was die impak van nuwe rekenaaromgewings e
presteer as gevolg van wat geleer is?
As die antwoorde op hierdie vrae min is, is dit moontlik dat
die onderneming is nie die belegging werd nie. Vrae met 'n hoë
telling dui op beduidende waardewinste en behoort
dien as riglyne vir verdere ondersoek.
Byvoorbeeld, 'n hoë telling vir prosesverbeterings
dit moet ontwerpers lei om te kyk hoe die prosesse is
verbeter is. Jy kan vind dat sommige of al die winste gemaak word
hulle is tasbaar en daarom kan 'n geldwaarde geredelik wees
toegepas.
Om die meeste uit die eerste iterasie van die
pakhuis
Die grootste resultaat van jou besigheidspoging is dikwels in die
eerste paar herhalings. Hierdie vroeë pogings tradisioneel
die nuttigste inligtingsinhoud vir die publiek vas te stel e
vestig die hulp tot die grondslag van tegnologie vir later
BI toepassings.
Gewoonlik elke daaropvolgende opeenvolging van data wat van projek van
pakhuise bring al hoe minder bykomende waarde vir die onderneming
algemeen. Dit is veral waar as die herhaling misluk
voeg nuwe argumente by of voldoen nie aan die behoefte vir 'n nuwe een nie
gebruikersgemeenskap.
Hierdie bergingsfunksie is ook van toepassing op stapels
groei deur data wat historici. Soos daaropvolgende pogings meer vereis
data wat en hoe meer data wat word mettertyd in die pakhuis gegooi, die meeste van die
data wat dit raak minder relevant vir die analise wat gebruik word. Hierdie data wat is
dikwels genoem data wat aan die slaap en dit is altyd duur om hulle te hou, want
hulle word amper nooit gebruik nie.
Wat beteken dit vir projekborge? In wese, i
eerste borge deel meer as die beleggingskoste.
Dit is primêr omdat hulle die stukrag is vir die stigting van die laag
groot pakhuis hulpbron en tegnologie omgewing,
insluitend organiese.
Maar hierdie eerste stappe dra die hoogste waarde en dus die ontwerpers
van projek moet dikwels die belegging regverdig.
Projekte wat na jou BI-inisiatief gedoen word, kan koste hê
minderwaardig (in vergelyking met die eerste) en direk, maar dra minder waarde
aan die onderneming.
En organisasie-eienaars moet begin oorweeg
gooi die opeenhoping van data wat en minder relevante tegnologieë.
Data-ontginning: Ontginning Dati
Talle argitektoniese komponente vereis variasies van
data-ontginningstegnologieë en -tegnieke—
byvoorbeeld die verskillende "agente" vir die ondersoek van die punte van belang van die
kliënte, die maatskappy se bedryfstelsels en vir dieselfde dw. Hierdie
agente kan gevorderde neurale netwerke opgelei word om
pot tendense, soos toekomstige produk vraag gebaseer op
verkoopspromosies; reëls-gebaseerde enjins vir
reageer op 'n stel Dato van omstandighede, byvoorbeeld diagnose
mediese en behandeling aanbevelings; of selfs eenvoudige agente
met die rol om uitsonderings aan senior bestuurders te rapporteer (bo
uitvoerende beamptes). Oor die algemeen hierdie onttrekking prosesse data wat si
verifieer in reële tyd; daarom moet hulle verenig wees
heeltemal met die beweging van die data wat hulself.
Aanlyn Analitiese Verwerking Verwerking
Aanlyn analise
Die vermoë om te sny, blokkies, rol, boor af
en voer die analise uit
wat-as, is binne die bestek, die doel van die suite
IBM tegnologie. Byvoorbeeld, analitiese behandeling funksies
aanlyn (OLAP) bestaan ​​vir DB2 wat dimensionele analise in die
enjin van databasis dieselfde.
Funksies voeg dimensionele nut by SQL terwyl
benut al die voordele om 'n natuurlike deel van DB2 te wees. Nog een
voorbeeld van OLAP-integrasie is die onttrekkingsinstrument, DB2
OLAP ontleder bediener. Hierdie tegnologie laat die kubusse van die
DB2 OLAP-bediener om vinnig en outomaties te wees
ontleed om waardes van op te spoor en daaroor verslag te doen data wat ongewoon of onverwags
vir al die kubus aan die handel ontleder. En laastens, die funksies van die
DW-sentrum verskaf middele vir argitekte om onder andere na te gaan
ander dinge, profileer 'n DB2 OLAP-bedienerkubus as 'n deel
aard van ETL-prosesse.
Ruimtelike Analise Ruimtelike analise
Ruimte verteenwoordig die helfte van die analitiese ankers (geleidings).
benodig vir 'n panorama
breë analities (tyd verteenwoordig die ander helfte). Die atoomvlak
(atoomvlak ) van die pakhuis, voorgestel in Figuur 1.1,
sluit die grondbeginsels vir beide tyd en ruimte in. Die opnames
Tydgebaseerde ankeranalise vir tyd- en adresinligting
ankeranalise vanuit die ruimte. Tydstempels
voer ontleding betyds uit en spreek inligtingsleidrade aan
ruimtelike analise. Die diagram toon geokodering-proses van
omskakeling van adresse na punte op 'n kaart of punte in die ruimte
sodat konsepte soos afstand en binne/buite kan wees
gebruik in analise – uitgevoer op atoomvlak en ruimtelike analise
wat aan die ontleder beskikbaar gestel word. IBM verskaf uitbreidings
ruimte, ontwikkel met die Environmental System Research Institute (ESRI),
al databasis DB2 sodat ruimtelike objekte kan wees
gehou as 'n normale deel van die databasis relasionele. db2
Ruimtelike uitbreidings, hulle verskaf ook alle SQL-uitbreidings vir
voordeel trek uit ruimtelike analise. Byvoorbeeld, SQL-uitbreidings van
vraag oor
afstand tussen adresse of as 'n punt binne of buite 'n gebied is
gedefinieer veelhoekige, is 'n analitiese standaard met die Ruimtelike
verlengers. Sien hoofstuk 16 vir meer inligting.
Databasis-Inwoner Gereedskap Gereedskap Databasis-
Resident
DB2 het baie SQL BI-inwonende bystandkenmerke
in die ontledingsaksie. Dit sluit in:
▪ Rekursiefunksies om analise uit te voer, soos “vind
alle moontlike vlugpaaie vanaf San Francisco a NY".
▪ Analitiese funksies vir rangorde, kumulatiewe funksies, kubus
en rollups om take wat normaalweg plaasvind te fasiliteer
slegs met OLAP tegnologie, is nou 'n natuurlike deel van die
enjin van databasis
▪ Die vermoë om tabelle te skep wat resultate bevat
Verkopers van databasis leiers meng meer as BI-vermoëns
in databasis dieselfde.
Die belangrikste verskaffers van databasis hulle meng meer as
funksionaliteit van BI in databasis dieselfde.
Dit bied die beste prestasie en meer uitvoering opsies vir les
BI oplossings.
DB2 V8 kenmerke en funksies word bespreek
in detail in die volgende hoofstukke:
Tegniese Argitektuur en Databestuur Grondslae
(Hoofstuk 5)
▪ DB2 BI Fundamentals (Hoofstuk 6)
▪ DB2 gematerialiseerde navraagtabelle (gematerialiseerde navraag
Tabelle) (Hoofstuk 7)
▪ DB2 OLAP-funksies (Hoofstuk 13)
▪ DB2 Verbeterde BI kenmerke en funksies (Verbeterde BI
Kenmerke en funksies) (Hoofstuk 15)
Vereenvoudigde data-afleweringstelsel
Aflewering stelsel van data wat vereenvoudig
Die argitektuur wat in Figuur 1.1 uitgebeeld word, sluit verskeie in
strukture data wat fisies. Een is die pakhuis van data wat bedryf.
Oor die algemeen is 'n ODS objekgeoriënteerd,
geïntegreerd en aktueel. Sou jy 'n ODS bou om te ondersteun, bv
byvoorbeeld die verkoopskantoor. ODS-verkope sal aanvul data wat
van talle verskillende stelsels maar sou net hou, bv
byvoorbeeld vandag se transaksies. Die ODS kan opgedateer word
selfs 'n paar keer per dag. Terselfdertyd, die prosesse
druk ek data wat geïntegreer in ander toepassings. Hierdie fasiliteit is
spesifiek ontwerp om te integreer data wat huidige en dinamiese e
'n waarskynlike kandidaat sal wees om intydse analise te ondersteun,
hoe om diensagente te verskaf kliënte verkoopsinligting
kliëntstrome deur verkoopsneigingsinligting te onttrek
van die pakhuis self. Nog 'n struktuur wat in figuur 1.1 getoon word, is
'n formele status vir die dw. Nie net is dit die plek vir
die uitvoering van die nodige integrasie, kwaliteit van data watEn
van die transformasie van data wat van voorraad kom, maar dit is ook
'n betroubare en tydelike stoorarea vir data wat dit herhaal
kan in intydse analise gebruik word. As jy besluit om
gebruik 'n ODS of staging area, een
van die beste gereedskap om hierdie strukture te bevolk data wat gebruik
verskillende operasionele bronne is DB2 se heterogene verspreide navraag.
Hierdie vermoë word gelewer deur die DB2-opsionele kenmerk
genaamd DB2 Relational Connect (slegs navrae) en deur DB2
DataJoiner ('n aparte produk wat die vraag lewer,
die insetsel, die opdatering en die moontlikheid van kansellasie a
heterogeen verspreide RDBBS'e).
Hierdie tegnologie laat argitekte toe data wat te bind data wat di
produksie met analitiese prosesse. Nie net kan tegnologie
pas by feitlik enige van die replikasieversoeke aan wat
hulle kan dalk met intydse analise vorendag kom, maar dit
hulle kan ook aan 'n wye verskeidenheid basisse koppel data wat Più
gewild, insluitend DB2, Oracle, Sybase, SQL Server,
Informix en ander. DB2 DataJoiner kan gebruik word om te vul
'n struktuur data wat formeel soos 'n ODS of selfs 'n tafel
permanent verteenwoordig in pakhuis wat ontwerp is vir restourasie
vinnig van onmiddellike opdaterings of te koop. Natuurlik,
dieselfde strukture data wat kan gevul word met behulp van
'n ander belangrike tegnologie ontwerp vir replikasie van data wat, IBM
DataPropagator Relasioneel. (DataPropagator is 'n aparte produk
vir sentrale stelsels. DB2 UNIX, Linux, Windows en OS/2 sluit in
replikasie dienste van data wat as 'n standaardkenmerk).
Nog 'n manier om te beweeg data wat rond werk
aan die onderneming is 'n onderneming toepassing integreerder andersins
bekend as 'n boodskap makelaar. Dit
Unieke tegnologie laat ongeëwenaarde beheer toe om te sentreer
(teiken) en beweeg data wat rondom die maatskappy. IBM het die makelaar
van die mees gebruikte boodskap, MQSeries, of 'n variasie
van die produk wat die vereistes van insluit e-commerce, IBM
WebSphere MQ.
Vir meer bespreking oor hoe om MQ te benut om 'n
pakhuis en 'n BI-omgewing, besoek webwerf van die boek. Vir nou is dit
dit is genoeg om te sê dat hierdie tegnologie 'n uitstekende medium vir
vang en transformeer (met MQSeries Integrator) data wat
geteikende werkers gewerf vir BI-oplossings. Daar
MQ-tegnologie is geïntegreer en verpak in UDB V8, wat
beteken dat boodskaprye nou bestuur kan word
asof dit DB2-tabelle is. Die konsep van sweis van
tou boodskappe en die heelal van databasis verhoudingskoppe
na 'n kragtige afleweringsomgewing van data wat.
Zero-Latency Nul latency
Die uiteindelike strategiese doelwit vir IBM is nul latency-analise.
Soos gedefinieer deur
Gartner, 'n BI-stelsel moet kan aflei, assimileer
en verskaf inligting aan ontleders op versoek. Die uitdaging,
natuurlik lê dit in hoe om te meng data wat huidige en in reële tyd
met nodige historiese inligting, soos i data wat verwante model/van
neiging, of die onttrekte begrip, as afbakening van die
kliënt.
Sulke inligting sluit byvoorbeeld die identifikasie van kliënte ad
hoë of lae risiko of watter produkte i kliënte hulle sal baie koop
seker as hulle reeds 'n bietjie kaas in hul karre het
Inkopies.
Om nul latency te kry, is eintlik afhanklik van twee
fundamentele meganismes:
▪ Voltooi samesmelting van data wat wat met die ontleed word
gevestigde tegnieke en met die gereedskap wat deur die BI ontwikkel is
▪ 'n Afleweringstelsel van data wat doeltreffend om dit te verseker
intydse analise is eintlik beskikbaar
Hierdie voorvereistes vir geen latensie verskil nie van die twee nie
doelwitte wat deur IBM vasgestel is en hierbo beskryf is.
Die stywe koppeling van die data wat is deel van die program
naatlose integrasie gereël deur IBM. En skep 'n stelsel
van aflewering van data wat doeltreffend is heeltemal afhanklik van
beskikbare tegnologie wat die afleweringsproses van vereenvoudig
data wat. Gevolglik is twee van IBM se drie doelwitte van kritieke belang
die derde te maak. IBM ontwikkel bewustelik sy eie
tegnologie om te verseker nul latency is 'n werklikheid vir
pakhuispogings.
Opsomming / Sintese
Die BI-organisasie verskaf 'n padkaart vir
skep jou omgewing
iteratief. Dit moet aangepas word om die behoeftes van die
jou besigheid, beide huidige en toekomstige. Sonder 'n argitektoniese visie
wyd, voorraad verteenwoordigers is bietjie meer as
ewekansige sentrale pakhuis implementerings wat min doen
skep 'n breë, inligtingsonderneming.
Die eerste struikelblok vir projekbestuurders is hoe om die te regverdig
beleggings wat nodig is vir die ontwikkeling van die BI-organisasie.
Terwyl die ROI-berekening 'n steunpilaar gebly het vir
pakhuisprestasies, word dit moeiliker om
presies voorspel. Dit het gelei tot ander metodes vir die
vasberadenheid of jy jou geld werd kry. Die
waarde op belegging2 (VOI), byvoorbeeld, word verkry
as 'n oplossing.
Dit is die plig van die argitekte van data wat en op projekbeplanners
doelbewus inligting te genereer en verskaf aan verenigings van
gebruikers en nie net 'n sui-diens gee nie data wat. Daar is 'n
groot verskil tussen die twee. Inligting is iets wat mens doen
verskil in besluitnemingsprosesse en doeltreffendheid; relatief, i
data wat hulle is boustene om daardie inligting af te lei.
Al krities oor die bron data wat versoeke aan te spreek
besigheid, behoort die BI-omgewing 'n groter rol te dien
in die skepping van inligtingsinhoud. Ons moet vat
die bykomende maatreëls om skoon te maak, te integreer, te transformeer of
anders skep 'n inligtingsinhoud waarvolgens die
gebruikers kan aksie neem, en daarom moet ons seker maak dat dit
aksies en daardie besluite, waar redelik, het terugvoer
in die BI-omgewing. As ons die pakhuis degradeer om slegs op te dien data wat,
dit is verseker dat gebruikersverenigings die inhoud sal skep
inligting wat nodig is om op te tree. Dit verseker dat hul
gemeenskap sal beter besluite kan neem, maar die onderneming
ly aan die gebrek aan kennis wat hulle gebruik het.
Dato dat argitekte en projekbeplanners projekte inisieer
spesifiek vir die BI-omgewing, bly hulle aanspreeklik teenoor die onderneming
oor die algemeen. 'n Eenvoudige voorbeeld van hierdie tweeledige kenmerk
gesigte van die iterasies van die BI word in die bron gevind data wat. Al die
data wat ontvang vir spesifieke kommersiële versoeke moet wees
bevolk in die eerste atoomlaag. Dit verseker die ontwikkeling van
korporatiewe inligting bate, sowel as bestuur, roete die
spesifieke gebruikerversoeke wat in die iterasie gedefinieer is.

W atisa D ata W arehouse?
Datastoor dit is die hart van die inligtingstelselargitektuur
sedert 1990 en ondersteun inligtingsprosesse deur 'n soliede aan te bied
geïntegreerde platform van data wat histories geneem as basis vir later
ontledings. DIE data pakhuis bied die gemak van integrasie in 'n
wêreld van onversoenbare toepassingstelsels. Datum
pakhuis het in 'n gier ontwikkel. Datastoor
organiseer en memoriseer i data wat nodig vir inligtingsprosesse e
analities op grond van 'n lang historiese temporele perspektief. Almal
dit behels 'n aansienlike en konstante poging in die konstruksie en
in die instandhouding van data pakhuis.
So wat is 'n data pakhuis? A data pakhuis en:
▪ vakgerig
▪ geïntegreerde stelsel
▪ tydvariasie
▪ nie-vlugtig (kanselleer nie)
'n versameling van data wat gebruik ter ondersteuning van bestuursbesluite in die
implementering van prosesse.
I data wat ingevoeg data pakhuis ontstaan ​​in die meeste van
gevalle uit operasionele omgewings. Die data pakhuis word deur een gemaak
stoor eenheid, fisies geskei van die res van die
stelsel, wat bevat data wat voorheen verwerk deur
toepassings wat op inligting werk wat uit die omgewing afkomstig is
bedryf.
Die letterlike definisie van a data pakhuis verdien 'n deeglike ondersoek
verduideliking aangesien daar belangrike motiverings en betekenisse van
fonds wat die kenmerke van 'n pakhuis beskryf.
VAKORIËNTERING ORIËNTERING
TEMATIEK
Die eerste kenmerk van 'n data pakhuis is dat dit daarop gemik is
groot rolspelers in 'n maatskappy. Die gids van die prosesse deur die
data wat dit is in teenstelling met die meer klassieke metode wat voorsien
die oriëntasie van toepassings op prosesse en funksies,
metode wat meestal deur die meeste gedeel word
ouer rigtingstelsels.
Die bedryfswêreld is ontwerp rondom toepassings en funksies
soos lenings, spaargeld, bankkaarte en trust vir 'n instelling
finansieel. Die wêreld van dw is georganiseer rondom vakke
soos die kliënt, die verkoper, die produk en die aktiwiteit.
Belyning rondom onderwerpe beïnvloed ontwerp en
op die maak van data wat gevind in die dw. Merkwaardigste,
die hoofonderwerp raak die belangrikste deel van die
sleutelstruktuur.
Die wêreld van die toepassing word beide deur die ontwerp van die data beïnvloed
basis as uit die prosesontwerp. Die wêreld van
dw is uitsluitlik gefokus op videomodellering data wat Dit is aan
tekening van databasis. Die ontwerp van die proses (in sy vorm
klassiek) is nie deel van die dw-omgewing nie.
Die verskille tussen die keuse van proses/funksie toepassing en
keuse vir vak word ook geopenbaar as verskille in inhoud
van data wat op 'n gedetailleerde vlak. DIE data wat del dw sluit nie i in nie data wat wat
hulle sal nie vir die DSS-proses gebruik word nie, terwyl toepassings
operasioneel georiënteerd data wat bevat i data wat om te voldoen aan
onmiddellik die funksionele/verwerkingsvereistes wat o
het ten minste enige nut vir DSS-ontleder.
Nog 'n belangrike manier waarop operasioneel georiënteerde toepassings
ai data wat verskil van data wat van dw is in die verslae van data wat. Ek data wat
werkers handhaaf 'n deurlopende verhouding tussen twee of meer tafels
gebaseer op 'n besigheidsreël wat aktief is. DIE data wat deur dw
hulle strek oor 'n spektrum van tyd en die verhoudings wat in die dw gevind word, is
baie. Baie handelsreëls (en dienooreenkomstig baie
verslae van data wat ) word verteenwoordig in die voorraad van data wat tussen twee of
meer tafels.
(Vir 'n gedetailleerde verduideliking van hoe die verhoudings tussen die data wat is
in die DW bestuur word, verwys ons na die Tegniese Onderwerp daaroor
vraag.)
Uit geen ander perspektief as dié van verskil nie
fundamenteel tussen 'n keuse van funksionele/proses en toepassing
'n vakkeuse is daar 'n groter verskil tussen die sisteme
operasionele en data wat en die DW.
INTEGRASIE INTEGRASIE
Die belangrikste aspek van die dw-omgewing is dat i data wat gevind
binne die dw word hulle maklik geïntegreer. ALTYD. SONDER
UITSONDERINGS. Die wese van die dw-omgewing is dat i data wat
vervat binne die perke van die pakhuis is geïntegreer.
Integrasie openbaar hom op baie verskillende maniere – in konvensies
geïdentifiseer konsekwent, tot die mate van konsekwente veranderlikes, in die
konsekwente gekodifiseerde strukture, in die fisiese eienskappe van die data wat
konsekwent, ensovoorts.
Oor die jare het die ontwerpers van verskeie toepassings dit gemaak
besit baie besluite oor hoe 'n aansoek moet
ontwikkel word. Styl en geïndividualiseerde ontwerpbesluite
van die ontwerpers se toepassings word op honderd maniere geopenbaar: in
koderingsverskille, sleutelstruktuur, fisiese eienskappe,
identifikasiekonvensies, ensovoorts. Die kollektiewe kapasiteit van baie
toepassingsontwerpers om inkonsekwente toepassings te skep
dis legendaries. Figuur 3 stel sommige van die meer verskille bloot
belangrik in die maniere waarop toepassings ontwerp word.
Enkodering: Enkodeer:
Toepassingsontwerpers het veldkodering gekies -
seks- op verskillende maniere. 'n Ontwerper verteenwoordig seks as
'n "m" en "f". 'n Ander ontwerper verteenwoordig geslag as 'n "1"
en 'n "0". 'n Ander ontwerper stel geslag voor as 'n "x" en
"y". Nog 'n ontwerper verteenwoordig geslag as "manlik" en
"vroulik". Dit maak regtig nie saak hoe die seks in die DW kom nie. Hulle"
en die "F" is waarskynlik so goed soos almal van
verteenwoordiging.
Wat saak maak is dat van watter oorsprong die seksveld ook al afkomstig is,
daardie veld kom in 'n konsekwente geïntegreerde toestand in die DW aan. Van
gevolg wanneer die veld in die DW gelaai word vanaf
'n toepassing waar dit in formaat uitgepluis is
“M” en “F”, i data wat moet na DW-formaat omgeskakel word.
Meting van eienskappe: Meting van
Kenmerke:
Die toepassingontwerpers het gekies om die pyplyn in te meet
'n verskeidenheid maniere deur die loop
Sommige jare. A ontwerper winkels i data wat van die pypleiding in
sentimeters. Nog 'n toepassingsontwerper stoor die data wat
van die pyplyn in terme van duim. Nog 'n ontwerper van
toepassingswinkels i data wat van die pypleiding in miljoen kubieke voet
per sekonde. En 'n ander ontwerper stoor die inligting van die
pyplyn in terme van werwe. Wat ook al die bron, wanneer die
pyplyninligting kom in die DW wat hulle moet wees
op dieselfde manier gemeet.
Volgens die aanduidings van figuur 3 is die integrasiekwessies
hulle raak byna elke aspek van die ontwerp – die kenmerke
fisiese gode data wat, die dilemma om meer as een bron van te hê data watdie
saak van inkonsekwent geïdentifiseerde monsters, formate van data wat
inkonsekwent, ensovoorts.
Wat ook al die ontwerpargument, die resultaat is dieselfde –
i data wat moet in die DW in 'n enkelvoud e gestoor word
wêreldwyd aanvaarbare wyse selfs wanneer bedryfstelsels van
fondswinkel anders i data wat.
Wanneer die DSS-ontleder na die DW kyk, die ontleder se lens
moet die uitbuiting van wees data wat wat in die pakhuis is,
eerder as om te wonder oor die geloofwaardigheid of konsekwentheid van die
data wat.
TYDSVARIANIE
Al die data wat in die DW is hulle tot op 'n sekere oomblik akkuraat.
Hierdie basiese kenmerk van die data wat in DW is baie anders as data wat
gevind in die bedryfsomgewing. DIE data wat van die bedryfsomgewing is
akkuraat soos ten tyde van toegang. Met ander woorde,
in die bedryfsomgewing wanneer toegang tot 'n eenheid verkry word data wat, daar ja
wag dat dit akkurate waardes weerspieël soos op die tyd van toegang.
Hoekom ek data wat in die DW is akkuraat soos op 'n sekere tyd in die
tyd (d.w.s. nie "op die oomblik nie"), d.w.s data wat gevind in die DW
hulle is "tydafwyking".
Die tydsafwyking van data wat deur DW word op talle maniere na verwys.
Die eenvoudigste manier is dat i data wat van 'n DW verteenwoordig data wat dit is 'n
lang tydhorison – vyf tot tien jaar. Die horison
tyd wat vir die bedryfsomgewing verteenwoordig word, is baie korter
▪ van vandag se huidige waardes van tot sestig en negentig
Toepassings wat goed moet werk en moet wees
beskikbaar vir transaksieverwerking moet die bring
minimum bedrag van data wat as hulle enige graad van erken
buigsaamheid. So operasionele toepassings het 'n horison
kort tydraamwerk, as 'n ontwerpargument van
klank toepassings.
Die tweede manier waarop 'tydafwyking' in die DW verskyn, is in die
sleutelstruktuur. Elke sleutelstruktuur in die DW bevat,
implisiet of eksplisiet, 'n tydelement, soos
dag, week, maand, ens. Die element van tyd is byna altyd
onderaan die aaneengeskakelde sleutel wat in die DW gevind word. In hierdie
geleenthede sal die element van tyd implisiet bestaan, soos toeval
waar 'n hele lêer aan die einde van die maand of kwartaal gedupliseer word.
Die derde manier waarop tydafwyking vertoon word, is dat i data wat del
DW, net behoorlik geregistreer, kan nie
opgedateer. DIE data wat van die DW is, vir alle praktiese doeleindes, 'n lang een
reeks kiekies (snapshot). Natuurlik as die kiekies is
verkeerd geneem is, dan kan die kiekies wees
gewysig. Maar as ons aanvaar dat foto's gedoen word
korrek, hulle word nie verander sodra hulle gemaak word nie. In sekere
gevalle kan dit oneties of selfs ongeldig wees dat die kiekies in die
DW is gewysig. DIE data wat operasioneel, akkuraat soos in
oomblik van toegang, kan hulle opgedateer word soos dit verskyn
die behoefte.
NIE vlugtig nie
Die vierde belangrike eienskap van DW is dat dit nie-vlugtig is.
Opdaterings, invoegings, skrappings en veranderinge word gemaak
gereeld vir rekord-vir-rekord operasionele omgewings. Maar die
basiese manipulasie van data wat wat nodig is in die DW is baie meer
eenvoudig. Daar is slegs twee soorte operasies wat in die
DW – die aanvanklike laai van die data wat en toegang tot data wat. Daar is nie
geen opdatering van data wat (in die algemene sin van
update) in die DW as 'n normale verwerkingsoperasie.
Daar is 'n paar baie kragtige gevolge van hierdie verskil
basis tussen operasionele verwerking en DW-verwerking. Op die vlak
deur ontwerp, die behoefte om versigtig te wees oor opgradering
abnormaal is nie faktor in die DW, aangesien die opdatering van data wat dit is nie
uitgevoer. Dit beteken dat op die fisiese vlak van ontwerp,
vryhede geneem kan word om toegang tot te optimaliseer data wat,
veral in die hantering van die onderwerpe van standaardisering en van
fisiese denormalisering. Nog 'n gevolg van eenvoud
van DW se bedrywighede is in die onderliggende tegnologie wat gebruik word vir
bestuur die DW-omgewing. Om opdaterings te ondersteun
rekord vir rekord inlyn (soos dikwels die geval is met
operasionele verwerking) die tegnologie moet 'n paar hê
baie komplekse fondamente onder 'n skynbare eenvoud.
Die tegnologie wat rugsteun en herstel, transaksies ondersteun
en integriteit van data wat en die ontdekking en oplossing van dooiepunt is
redelik kompleks en nie nodig vir DW-verwerking nie.
Die kenmerke van 'n DW, ontwerporiëntasie,
integrasie van data wat binne die DW, tydafwyking en eenvoud
van bestuur van data wat, alles lei tot 'n omgewing wat baie, baie is
verskil van die klassieke bedryfsomgewing. Die bron van byna almal
data wat van DW is die bedryfsomgewing. Dit is aanloklik om te dink
dat daar massiewe oortolligheid van is data wat tussen die twee omgewings.
Trouens, die eerste indruk wat baie mense het, is dié van
groot oortolligheid van data wat tussen die bedryfsomgewing en die omgewing van
DW uitbreiding. So 'n interpretasie is oppervlakkig en bewys a
gebrek aan begrip wat in die DW gebeur.
Daar is inderdaad 'n minimum van oortolligheid data wat tussen die bedryfsomgewing
en van data wat van die DW. Kom ons oorweeg die volgende:
▪ Ek data wat hulle word gefiltreer Dato wat jy uit die bedryfsomgewing gaan
na die DW-omgewing. Baie data wat hulle raak nooit uit nie
uit die bedryfsomgewing. Net dat ek data wat waarvoor nodig is
DSS-verwerking vind hul rigting in die omgewing
▪ die tydshorison van data wat dit is baie anders as 'n omgewing
na die ander. DIE data wat in die bedryfsomgewing is hulle baie vars. DIE data wat
in die DW is hulle baie ouer. Slegs vanuit perspektief
van die tydshorison is daar baie min oorvleueling
tussen die bedryfsomgewing en die DW.
▪ Die DW bevat data wat van opsomming wat nooit gevind word nie
in die omgewing
▪ Ek data wat sedertdien 'n fundamentele transformasie ondergaan
oomblik wat hulle oorgaan na Figuur 3 illustreer dat die meeste
deel van data wat word aansienlik verander mits
gekies te word en na die DW geskuif te word. Met ander woorde, die
Meeste van data wat is fisies aangepas e
radikaal soos dit na die DW geskuif word. Vanuit die oogpunt
van integrasie is nie dieselfde nie data wat wat woonagtig is
in die bedryfsomgewing.
Gegewe hierdie faktore, die oortolligheid van data wat tussen die twee omgewings is
'n seldsame gebeurtenis, wat lei tot minder as 1% oortolligheid tussen die twee
omgewings.
DIE STRUKTUUR VAN DIE PAKHUIS
DW's het 'n duidelike struktuur. Daar is verskeie vlakke van opsomming en van
detail wat die DW's afbaken.
Die verskillende komponente van 'n DW is:
▪ Metadata
Dati huidige besonderhede
Dati van ou detail
Dati effens opgesom
Dati hoogs opgesom
Verreweg die grootste bekommernis is vir i data wat van detail
strome. Dit is die primêre bekommernis omdat:
▪ Ek data wat huidige besonderhede weerspieël die mees onlangse gebeure,
wat altyd van groot belang is en
▪ i data wat van huidige detail is omvangryk omdat dit is
gestoor op die laagste vlak van korreligheid e
▪ i data wat huidige besonderhede word byna altyd op gestoor
skyfgeheue, wat vinnig toegang is, maar duur en
kompleks van
I data wat van detail is ouer data wat wat op gestoor word
'n bietjie herinnering aan massa. Dit het sporadies toegang en dit is
gestoor op 'n vlak van detail wat versoenbaar is met data wat gedetailleerd
strome. Terwyl dit nie verpligtend is om op 'n medium van te stoor nie
alternatiewe geheue, as gevolg van die groot volume van data wat verenig met
sporadiese toegang van data wat, die stoormedium vir data wat di
ouer besonderhede word gewoonlik nie op skyf gestoor nie.
I data wat ligweg opgesom hulle is data wat wat onder gedistilleer is
vlak van detail gevind op die huidige vlak van detail. Hierdie
DW-vlak word byna altyd in skyfgeheue gestoor. DIE
probleme van ontwerp wat hulself aan die argitek van data wat
in die konstruksie van hierdie vlak van die DW is:
▪ Watter tydseenheid is die opsomming hierbo gedoen
▪ Watter inhoud, eienskappe sal die effens opsom
inhoud van data wat
Die volgende vlak van data wat gevind in die DW is dié van data wat hoogs
opgesom. DIE data wat hoogs opgesom is kompak en maklik
toeganklik. DIE data wat hoogs opgesom word soms gevind
in die DW-omgewing en in ander gevalle i data wat hoogs opgesom hulle is
gevind buite die onmiddellike mure van tegnologie wat die DW huisves.
(in elk geval, i data wat hoogs opgesom is deel van die DW
ongeag waar ek data wat fisies gehuisves word).
Die finale komponent van die DW is die metadata-komponent. In baie opsigte
metadata sit in 'n ander dimensie as ander data wat
van die DW, want die metadata bevat geen Dato direk
uit die bedryfsomgewing geneem. Metadata speel 'n spesiale rol e
baie belangrik in DW. Metadata word gebruik as:
▪ 'n gids om die DSS-ontleder te help om die
DW inhoud,
▪ 'n gids vir die kartering van die data wat van hoe ek data wat Hulle was
getransformeer van die bedryfsomgewing na die DW-omgewing,
▪ 'n gids tot die algoritmes wat gebruik word vir opsomming tussen i data wat di
huidige detail ei data wat effens opgesom, i data wat hoogs
opgesom,
Metadata speel 'n baie groter rol in die DW-omgewing
in vergelyking met wat hulle ooit in die bedryfsomgewing gehad het
OU DETAIL STOOR MEDIUM
Magneetband kan gebruik word om daardie soort te stoor
data wat. Daar is inderdaad 'n wye verskeidenheid bergingsmedia wat
moet oorweeg word vir die bewaring van oud data wat di
besonderhede.
Afhangende van die volume van data wat, toegangsfrekwensie, koste
van die gereedskap en die tipe toegang, is dit heeltemal waarskynlik
dat ander gereedskap die ou vlak van detail sal benodig
in die DW.
VLOEI VAN DATA
Daar is 'n normale en voorspelbare vloei van die data wat binne die DW.
I data wat hulle betree die DW vanuit die bedryfsomgewing. (LET WEL: daar is
'n paar baie interessante uitsonderings op hierdie reël. Maar amper
al die data wat voer die DW vanuit die bedryfsomgewing in). Dato dat ek data wat
hulle betree die DW vanuit die bedryfsomgewing, dit word getransformeer soos dit was
voorheen beskryf. Mits jy die DW invoer, i data wat hulle betree die
huidige vlak van detail, soos getoon. Dit woon daar en word gebruik
totdat een van drie gebeurtenisse plaasvind:
▪ is gesuiwer,
▪ opgesom word, en/of
▪ is
Verouderde proses binne 'n DW beweeg i data wat huidige besonderhede
a data wat van detail oud, volgens die ouderdom van data wat. Die proses
opsomming gebruik die detail van data wat om die te bereken data wat
effens opgesomde en hoogs opgesomde vlakke van die data wat. Daar is
enkele uitsonderings op die vloei wat gewys word (sal later bespreek word).
Maar gewoonlik, vir die oorgrote meerderheid van data wat gevind
binne 'n DW, die vloei van data wat dit is soos voorgestel.
GEBRUIK VAN DIE DATAWAREHUIS
Nie verrassend die verskillende vlakke van data wat binne die DW nie
verskillende vlakke van gebruik ontvang. As 'n reël, hoe hoër die vlak van
opsomming, plus i data wat hulle word gebruik.
Baie gebruike kom voor in die data wat hoogs opgesom, terwyl die ou
data wat detail word byna nooit gebruik nie. Daar is 'n goeie rede in die
skuif die organisasie na die hulpbronbenuttingsparadigma. Meer het
opsomming i data wat, hoe vinniger en doeltreffender is dit om by uit te kom data wat. self
un winkel vind dit doen baie detailvlakverwerking van die DW's,
dan 'n ooreenstemmende groot hoeveelheid masjienhulpbronne
verbruik word. Dit is in almal se beste belang om verhoor te word
soos in 'n hoë vlak van opsomming so gou as moontlik.
Vir baie winkels het die DSS-ontleder in 'n pre-DW-omgewing gebruik
data wat op die vlak van detail. In baie opsigte het die aankoms by data wat gedetailleerd
lyk soos 'n veiligheidskombers, selfs wanneer dit beskikbaar is
ander vlakke van opsomming. Een van die aktiwiteite van die argitek van data wat è
speen die DSS gebruiker van konstante gebruik van data wat op die plusvlak
lae detail. Daar is twee redes beskikbaar
van die argitek van data wat:
▪ die installering van 'n terugbetalingstelsel, waar die eindgebruiker die
hulpbronne verbruik e
▪ wat aandui dat baie goeie reaksietyd kan wees
verkry wanneer die gedrag met i data wat dit is op 'n hoë standaard
van opsomming, terwyl die swak reaksietyd afkomstig is van die
gedrag van data wat op 'n lae vlak van
ANDER OORWEGINGS
Daar is 'n paar ander konstruksie- en bestuursoorwegings
DW uitbreiding.
Die eerste oorweging is dié van indekse. DIE data wat op die hoogste vlakke van
opsomming kan vrylik geïndekseer word, terwyl i data wat
op laer vlakke van detail is hulle so lywig dat dit kan wees
spaarsaam geïndekseer. Uit dieselfde oogpunt, i data wat op die hoë vlakke van
detail kan relatief maklik herstel word,
terwyl die volume van data wat op die laer vlakke is dit so groot dat i data wat nie
hulle kan maklik opgeknap word. Gevolglik is die model
van data wat en die formele werk wat deur die ontwerp poseer die
grondslag vir die DW byna uitsluitlik op die vlak toegepas
detail huidige. Met ander woorde, die modelleringsaktiwiteite van die
data wat hulle is nie in byna elke geval op opsommingsvlakke van toepassing nie.
Nog 'n strukturele oorweging is dié van die onderverdeling van
data wat deur DW.
Partisie kan op twee vlakke gedoen word - op die vlak van dbms en al
toepassing vlak. In die afdeling op die vlak dbmsdie dbms è
van die afdelings ingelig en dienooreenkomstig beheer. In die geval van
afdeling op toepassingsvlak, is slegs die programmeerder
ingelig oor die afdelings en die verantwoordelikheid daarvan
administrasie word aan hom oorgelaat
Onder vlak dbms, word baie werk outomaties gedoen. Daar is
baie onbuigsaamheid wat verband hou met die outomatiese administrasie van
afdelings. In die geval van die afdelingsvlak toepassing van die data wat del
data pakhuis, baie werk val op die programmeerder, maar die
eindresultaat is buigsaamheid in die administrasie van data wat in die datum
pakhuis
ANDER ANOMALIES
Terwyl die komponente van die data pakhuis hulle werk soos beskryf
vir byna almal data wat, daar is 'n paar nuttige uitsonderings wat moet
bespreek word. 'n Uitsondering is dié van data wat openbare opsommings
(openbare opsommingsdata). Hierdie is data wat opsommings wat was
uit bereken data pakhuis maar hulle word deur die samelewing gebruik. DIE data wat
openbare opsommings word gestoor en bestuur in die data pakhuis,
alhoewel soos hierbo genoem is hulle uitgepluis. DIE
rekenmeesters werk om so kwartaalliks te produseer data wat as die
inkomste, kwartaallikse uitgawes, kwartaallikse wins, ensovoorts. Die werk
gedoen deur rekenmeesters is ekstern tot die data pakhuis. I data wat is
"intern" binne die maatskappy gebruik word - vanaf bemarking, verkope, ens.
Nog 'n anomalie, wat nie bespreek sal word nie, is dié van data wat ekstern.
Nog 'n uitstaande tipe data wat wat in 'n data gevind kan word
pakhuis is dié van permanente detaildata. Hierdie veroorsaak die
moet permanent stoor i data wat op een vlak
uiteengesit vir etiese of wetlike redes. As 'n maatskappy i
verwante werkers aan gevaarlike stowwe is daar 'n behoefte aan data wat
gedetailleerd en permanent. As 'n maatskappy 'n produk produseer wat
behels openbare veiligheid, watter dele van 'n vliegtuig daar is
die behoefte om data wat permanente gedetailleerde, sowel as as 'n maatskappy
gevaarlike kontrakte maak.
Die maatskappy kan nie bekostig om die spesifieke hoekoms oor die hoof te sien nie
gedurende die volgende paar jaar, in die geval van 'n regsgeding, 'n herroeping, a
betwiste konstruksiefout, ens. maatskappy blootstelling
dit kan groot wees. As gevolg hiervan is daar 'n unieke tipe data wat
bekend as permanente detail data.
OPSOMMING
Un data pakhuis dit is 'n objekgeoriënteerde, geïntegreerde, variant van
tyd, 'n versameling van data wat nie-vlugtig ter ondersteuning van die behoeftes van
administrasie besluit. Elk van die opvallende kenmerke van
un data pakhuis het sy implikasies. Boonop is daar vier
vlakke van data wat del data pakhuis:
▪ Ou besonderhede
▪ Huidige besonderhede
Dati effens opgesom
Dati hoogs opgesom
Metadata is ook 'n belangrike deel van die data pakhuis.
OPSOMMING
Die konsep van die berging van data wat onlangs ontvang
baie aandag en dit het 'n tendens van die 90's geword
as gevolg van die vermoë van 'n data pakhuis om die te oorkom
beperkings van bestuursondersteuningstelsels soos i
besluitondersteuningstelsels (DSS) en inligtingstelsels
uitvoerende beamptes (EIS).
Alhoewel die konsep van die data pakhuis lyk belowend,
implementeer i data pakhuis kan problematies wees omdat
van grootskaalse pakhuisprosesse. Ten spyte van die
kompleksiteit van pakhuisprojekte data wat, baie verskaffers
en konsultante wat voorraad data wat hulle beweer dit
die berging van data wat bied geen probleem nie.
Aan die begin van hierdie navorsingsprojek, byna geen
onafhanklike, streng en sistematiese navorsing is uitgevoer. Van
Gevolglik is dit moeilik om te sê wat werklik gebeur
in die bedryf wanneer hulle bou data pakhuis.
Hierdie studie het die pakhuispraktyk van data wat
tydgenote wat daarop gemik is om 'n ryker begrip te ontwikkel
van die Australiese praktyk. Die literatuuroorsig het die
konteks en grondslag vir empiriese studie.
Daar is 'n aantal resultate van hierdie navorsing. Eerstens
plek, het hierdie studie die aktiwiteite wat plaasgevind het, aan die lig gebring
tydens die ontwikkeling van data pakhuis. Op baie gebiede, i data wat versamel
het die praktyk wat in die literatuur gerapporteer is, bevestig. Tweedens
webwerf, die kwessies en probleme wat dit kan beïnvloed
ontwikkeling van data pakhuis is deur hierdie studie geïdentifiseer.
Ten slotte, voordele verkry uit Australiese organisasies wat verband hou met
die gebruik van data pakhuis geopenbaar is.
Hoofstuk 1
Soek konteks
Die konsep van datapakhuise het wydverspreide aanvaarding gekry
blootstelling en het verander in 'n opkomende tendens in die
90's (McFadden 1996, TDWI 1996, Shah en Milstein 1997,
Shanks en ander. 1997, Eckerson 1998, Adelman en Oates 2000). Dit is
kan gesien word uit die groeiende aantal artikels oor die data
pakhuise in handelspublikasies (Little en Gibson 1999).
Baie artikels (sien byvoorbeeld Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett en King 1996, Graham et al. 1996,
Sakaguchi en Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997, McCarthy 1997, O'Donnell 1997, Edwards 1998, TDWI
1999) het aansienlike voordele aan organisasies gerapporteer
wat implementeer i data pakhuis. Hulle het hul teorie ondersteun
met anekdotiese bewyse van suksesvolle implementering, die hoë opbrengs
op beleggingsyfers (ROI) en, ook, die verskaffing van die leiding van
verwysing of metodologieë vir die ontwikkeling van data pakhuis
(Shanks et al. 1997, Seddon en Benjamin 1998, Little en Gibson
1999). In 'n uiterste geval het Graham et al. (1996) het
het 'n gemiddelde opbrengs op 'n driejaarbelegging van 401% gerapporteer.
Baie van die huidige literatuur het egter die
kompleksiteite betrokke by die aanpak van sulke projekte. Die projekte van
data pakhuis is normaalweg kompleks en grootskaalse en
daarom impliseer hulle 'n hoë waarskynlikheid om te misluk as hulle nie is nie
noukeurig nagegaan (Shah en Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs en Clymer 1998, Rao
1998). Hulle benodig groot hoeveelhede menslike en menslike hulpbronne
finansieel en tyd en moeite om dit te bou (Hill 1998, Crofts 1998). Die
tipiese tyd en finansiële middele wat benodig word, is onderskeidelik van
ongeveer twee jaar en twee of drie miljoen dollar (Braly 1995, Foley
1997b, Bort 1998, Humphries et al. 1999). Hierdie tye en middele
finansiële instrumente word benodig om baie aspekte te beheer en te konsolideer
verskil van datapakhuis (Cafasso 1995, Hill 1998). Na die kant
van hardeware en sagteware oorwegings, ander funksies, wat verskil
uit die onttrekking van data wat aan die laaiprosesse van data wat, van
geheue kapasiteit om opdaterings te bestuur en meta te gee data wat
vir gebruikersopleiding, oorweeg moet word.
Toe hierdie navorsingsprojek begin het, was daar baie min
akademiese navorsing gedoen op die gebied van datapakhuis,
veral in Australië. Dit was duidelik uit die tekort aan items
gepubliseer oor datapakhuise deur koerante of ander geskrifte
akademici van die tyd. Baie van die akademiese geskrifte
beskikbaar beskryf die Amerikaanse ervaring. Die tekort aan
akademiese navorsing in die sl area datapakhuis het veroorsaak dat die
streng navorsing en empiriese studies vereis (McFadden 1996,
Shanks en ander. 1997, Little en Gibson 1999). In die besonder, studies
navorsing oor die implementeringsproses data pakhuis
gedoen moet word om kennis uit te brei
algemeen oor die implementering van data pakhuis e
sal dien as 'n basis vir 'n toekomstige navorsingstudie (Shanks ed
ander. 1997, Little en Gibson 1999).
Die doel van hierdie studie is dus om te bestudeer wat dit werklik is
dit gebeur wanneer organisasies data in stand hou en gebruik
pakhuis in Australië. Spesifiek sal hierdie studie behels
'n ontleding van 'n hele ontwikkelingsproses van 'n data pakhuis,
vanaf inisiasie en ontwerp deur ontwerp en
implementering en daaropvolgende gebruik binne organisasies
Australiese. Daarbenewens sal die studie ook bydra tot huidige praktyk
die identifisering van areas waar die praktyk verder kan wees
verbeter en ondoeltreffendheid en risiko's kan tot die minimum beperk word of
vermy. Verder sal dit as basis dien vir ander studies oor data pakhuis in
Australië en sal die leemte vul wat tans in die literatuur bestaan.
Navorsingsvrae
Die doel van hierdie navorsing is om die betrokke aktiwiteite te bestudeer
in die implementering van data pakhuis en hul gebruik deur
Australiese organisasies. In die besonder word die elemente bestudeer
rakende projekbeplanning, ontwikkeling, al
werking, gebruik en risiko's betrokke. Vandaar die vraag
van hierdie navorsing is:
“Hoe is die huidige praktyk van die data pakhuis in Australië?"
Om effektief op hierdie probleem te reageer, a
aantal bykomende navorsingsvrae. In die besonder drie
subvrae is uit die literatuur geïdentifiseer, dit wil sê
aangebied in hoofstuk 2, om hierdie navorsingsprojek te rig:
Hoe word geïmplementeer i data pakhuis deur organisasies
Australiese? Wat is die probleme wat ondervind word?
Wat is die voordele wat ervaar word?
In die beantwoording van hierdie vrae is 'n tekening gebruik
verkennende navorsing wat 'n ondersoek gebruik. Hoe ek studeer
verkennend, is die antwoorde op bogenoemde vrae nie volledig nie
(Shanks et al. 1993, Denscombe 1998). In hierdie geval is dit
Triangulasie is nodig om reaksies hierop te verbeter
versoeke. Die ondersoek sal egter 'n stewige grondslag vir
toekomstige werk wat hierdie vrae ondersoek. 'n Gedetailleerde
bespreking oor die regverdiging van die navorsingsmetode en oor die ontwerp
word in hoofstuk 3 aangebied.
Struktuur van die navorsingsprojek
Hierdie navorsingsprojek word in twee dele verdeel: die kontekstuele studie
van die konsep van datapakhuis en empiriese navorsing (sien
Figuur 1.1), wat elk hieronder bespreek word.
Deel I: Kontekstuele studie
Die eerste deel van die navorsing het bestaan ​​uit die hersiening van die
Huidige literatuur oor verskeie tipes datapakhuise insluitend i
besluitondersteuningstelsels (DSS), inligtingstelsels
bestuurders (EIS), die gevallestudies van data pakhuis en datumkonsepte
pakhuis. Ook die resultate van die forums op data pakhuis en gode
vergadering groepe vir kundiges en professionele persone gelei deur die groep van
Monash DSS navorsing, het bygedra tot hierdie fase van die studie
wat bedoel was om die inligting oor die datapraktyk te kry
pakhuis en om die risiko's verbonde aan die aanvaarding daarvan te identifiseer.
Gedurende hierdie tydperk van kontekstuele studie, verstaan
van die probleemarea gevestig is om kennis te verskaf van
grondslag vir daaropvolgende empiriese ondersoeke. Hierdie
was 'n deurlopende proses soos die studie uitgevoer is
navorsing.
Deel II: Empiriese navorsing
Die relatief nuwe konsep van datapakhuis, veral
in Australië, het die behoefte geskep om 'n ondersoek te doen vir
kry 'n breë prentjie van die gebruikservaring. Hierdie
deel is gedoen sodra die probleemdomein was
deur uitgebreide literatuuroorsig vasgestel is. Die konsep
van data-pakhuisformaat tydens die kontekstuele studiefase is
is gebruik as insette tot die aanvanklike vraelys van hierdie studie.
Hierna is die vraelys hersien. Julle is afspraakkenners
pakhuis het aan die toets deelgeneem. Die doel van die toets van
aanvanklike vraelys was om te kontroleer vir volledigheid en akkuraatheid
sommige vrae. Op grond van die toetsresultate is die vraelys
geredigeer en die geredigeerde weergawe is gestuur na
opname deelnemers. Vraelyste wat toe teruggestuur is, was
ontleed vir i data wat in tabelle, diagramme en ander formate. DIE
ontleding resultate van data wat vorm 'n momentopname van die
praktyk van datapakhuise in Australië.
DATA PAGHUIS OORSIG
Die konsep van datapakhuise het met verbeterings ontwikkel
van rekenaartegnologie.
Dit is daarop gemik om die probleme wat groepe ondervind te oorkom
toepassingsondersteuning soos Decision Support System (DSS) e
Uitvoerende Inligtingstelsel (EIS).
In die verlede was die grootste struikelblok van hierdie toepassings
die onvermoë van hierdie toepassings om a databasis
nodig vir die ontleding.
Dit word meestal deur die aard van die werk veroorsaak
leierskap. Die belange van 'n maatskappy se bestuur verskil
voortdurend afhangende van die area wat behandel word. Daarom i data wat
fundamenteel tot hierdie toepassings moet kan
verander vinnig na gelang van die deel wat behandel moet word.
Dit beteken dat i data wat moet in die vorm beskikbaar wees
voldoende vir die vereiste ontledings. Trouens, die ondersteuningsgroepe van
aansoeke het in die verlede baie probleme ondervind om ed
te integreer data wat uit komplekse en diverse bronne.
Die res van hierdie afdeling bied 'n oorsig van die konsep van
data pakhuise en hoe die data pakhuis kan die
Toepassingsondersteuningsgroepkwessies.
Die term “Datastooris in 1990 deur William Inmon vrygestel.
Sy dikwels aangehaalde definisie sien die Datastoor hoe
versameling van data wat vakgerig, geïntegreerd, nie-vlugtig en veranderlik
oor tyd, ter ondersteuning van bestuursbesluite.
Deur hierdie definisie te gebruik, wys Inmon daarop dat i data wat inwoners
in un data pakhuis moet die volgende 4 besit
karakteristiek:
▪ Vakgeoriënteerd
▪ Geïntegreerde
▪ Nie-vlugtig
▪ Veranderlik oor tyd
Met vakgerigte Inmon bedoel dat i data wat in die datum
pakhuis in die grootste organisatoriese gebiede wat was
in die model gedefinieer data wat. Byvoorbeeld almal data wat oor i kliënte
is vervat in die vakgebied kliënte. Net so almal
data wat met betrekking tot die produkte is in die vakgebied vervat
PRODUKTE.
Met Geïntegreerde Inmon beteken dat i data wat vandaan kom
platforms, stelsels en liggings word gekombineer en in gestoor
enigste plek. Gevolglik data wat soortgelyk moet getransformeer word
in konsekwente formate om bygevoeg en vergelyk te word
maklik.
Die manlike en vroulike geslagte word byvoorbeeld verteenwoordig
deur die letters M en F in een stelsel, en met 1 en 0 in 'n ander. Vir
integreer hulle op die regte manier, moet een of albei formate
getransformeer word sodat die twee formate dieselfde is. In hierdie
In die geval kan ons M na 1 en F na 0 verander of omgekeerd. Oriënteer jou daarop
vak en Geïntegreerde dui aan dat die data pakhuis is ontwerp vir
bied 'n funksionele en transversale visie van data wat eenkant
van die maatskappy.
Met Nie-vlugtig bedoel hy dat i data wat in data pakhuis bly
konsekwent en opdatering van data wat dit is nie nodig nie. In plaas daarvan, elke
verander in data wat oorspronklikes word bygevoeg databasis van die datum
pakhuis. Dit beteken dat die historikus van die data wat is vervat in
data pakhuis.
Vir Veranderlikes met tyd dui Inmon aan dat i data wat in data pakhuis
bevat altyd die tempo-aanwysers ei data wat normalmente
oor 'n sekere tydhorison strek. Byvoorbeeld a
data pakhuis kan 5 jaar se historiese waardes van bevat kliënte Dal
1993 tot 1997. Die beskikbaarheid van die geskiedenis en 'n tydreeks
van data wat laat jou toe om tendense te ontleed.
Un data pakhuis hy kan sy eie insamel data wat van stelsels
OLTP; van oorsprong data wat ekstern tot die organisasie en/of deur ander spesiale aanbiedinge
vang stelselprojekte data wat.
I data wat uittreksels kan deur 'n skoonmaakproses gaan, in
hierdie geval i data wat hulle word getransformeer en geïntegreer voordat hulle bestaan
gestoor in databasis del data pakhuis. Dan ek data wat
woonagtig binne die databasis del data pakhuis beskikbaar gestel word
eindgebruikertoegang en herstelhulpmiddels. Met behulp van
hierdie instrumente kan die eindgebruiker toegang tot die geïntegreerde aansig kry
van die organisasie van data wat.
I data wat woonagtig binne die databasis del data pakhuis is
gestoor in beide gedetailleerde en opsommende formate.
Die vlak van opsomming kan afhang van die aard van die data wat. Ek data wat
gedetailleerde kan bestaan ​​uit data wat huidige en data wat stories
I data wat ware is nie ingesluit in die data pakhuis totdat ek data wat
in data pakhuis word weer bygewerk.
Benewens die stoor van die data wat hulself, a data pakhuis kan ook
stoor 'n ander soort Dato genoem METADATA wat
beskryf i data wat woonagtig in syne databasis.
Daar is twee tipes metadata: ontwikkelingsmetadata en volgens metadata
ontledings.
Die ontwikkelingsmetadata word gebruik om die te bestuur en te outomatiseer
prosesse van onttrekking, skoonmaak, kartering en laai van data wat in
data pakhuis.
Die inligting vervat in ontwikkelingsmetadata kan bevat
besonderhede van bedryfstelsels, besonderhede van die elemente wat onttrek moet word, die
Modello data wat del data pakhuis en die maatskappyreëls vir die
omskakeling van data wat.
Die tweede tipe metadata, bekend as analitiese metadata
stel die eindgebruiker in staat om die inhoud van die data te verken
pakhuis om die te vind data wat beskikbaar en hul betekenis in terme
duidelik en nie-tegnies.
Daarom werk die analise-metadata as 'n brug tussen die data
pakhuis- en eindgebruikertoepassings. Hierdie metadata kan
bevat die sakemodel, beskrywings van data wat ooreenstem
na die sakemodel, vooraf gedefinieerde navrae en verslae,
inligting vir gebruikersaanmeldings en indeks.
Metadata van ontleding en ontwikkeling moet in een gekombineer word
geïntegreerde metadata-insluiting om behoorlik te werk.
Ongelukkig het baie van die bestaande gereedskap hul eie
metadata en tans is daar geen bestaande standaarde wat
hulle laat datapakhuishulpmiddels toe om dit te integreer
metadata. Om hierdie situasie reg te stel baie handelaars van
groot datapakhuisinstrumente het Meta Data gevorm
Raad wat later die Meta Data Koalisie geword het.
Die doel van hierdie koalisie is om 'n stel metadata te bou
standaard wat verskillende datapakhuisgereedskap toelaat om
omskep metadata
Hul pogings het gelei tot die geboorte van Meta
Data-uitruilspesifikasie (MDIS) wat die uitruiling sal toelaat
van inligting tussen die Microsoft-argiewe en die verwante MDIS-lêers.
Die bestaan ​​van data wat beide opgesomde/geïndexeerde en gedetailleerde gee
die gebruiker die moontlikheid om 'n DRILL DROWN uit te voer
(boor) kom aan data wat geïndekseer na gedetailleerdes en omgekeerd.
Die bestaan ​​van data wat gedetailleerde geskiedenis laat die verwesenliking van
tendens analise oor tyd. Daarbenewens analise metadata kan
gebruik word as die del-gids databasis del data pakhuis vir
help eindgebruikers om i data wat nodig.
In vergelyking met OLTP-stelsels, met hul vermoë om te ondersteun
analise van data wat en verslagdoening, die data pakhuis dit word as 'n sisteem gesien
meer gepas vir inligtingsprosesse soos uit te voer en
beantwoord navrae en lewer verslae. Die volgende afdeling
sal die verskille van die twee stelsels in detail uitlig.
DATASTOOR TEEN OLTP-STELSELS
Baie van die inligtingstelsels binne organisasies
hulle is bedoel om daaglikse bedrywighede te ondersteun. Hierdie
stelsels bekend as OLTP SYSTEMS, vang transaksies
voortdurend daagliks opgedateer.
I data wat binne hierdie stelsels word dikwels verander, bygevoeg of
geskrap. Byvoorbeeld, 'n kliënt se adres verander amper nie
hy beweeg van plek tot plek. In hierdie geval die nuwe adres
sal geregistreer word deur die adresveld van te verander databasis.
Die hoofdoel van hierdie stelsels is om die koste van
transaksies en terselfdertyd verwerkingstye te verminder.
Voorbeelde van OLTP-stelsels sluit in kritieke aksies soos skryf
bestelrekeningkunde, betaalstaat, fakture, vervaardiging, ai dienste kliënte.
Anders as OLTP-stelsels, wat deur proses geskep is
gebaseer op transaksies en gebeure, i data pakhuis hulle is geskep
om prosesondersteuning te verskaf gebaseer op ontleding van data wat is U
besluitnemingsprosesse.
Dit word gewoonlik bereik deur i data wat van verskeie stelsels
OLTP en eksterne in 'n enkele "houer" van data wat,soos bespreek
in die vorige afdeling.
Monash Data Warehousing Proses Model
Die prosesmodel vir data pakhuis Monash is ontwikkel deur
navorsers by die Monash DSS Navorsingsgroep, is gebaseer op
literatuur van data pakhuis, oor die ervaring in allo-ondersteuning
ontwikkeling van stelselvelde, op gesprekke met verskaffers van
toepassings vir gebruik op data pakhuisop 'n groep kundiges
in die gebruik van data pakhuis.
Die fases is: Inisiasie, Beplanning, Ontwikkeling, Bedryf en
Verduidelikings. Die diagram verduidelik die iteratiewe aard o
evolusionêre ontwikkeling van 'n data pakhuis proses gebruik
tweerigtingpyle tussen die verskillende fases geplaas. In hierdie
"iteratiewe" en "evolusionêre" konteks beteken dat, by elk
stap van die proses, implementering aktiwiteite kan wees
propageer altyd terug na die vorige stadium. Dit is
as gevolg van die aard van die projek a data pakhuis waarin
bykomende versoeke word te eniger tyd gerig
van die eindgebruiker. Byvoorbeeld, tydens die ontwikkelingsfase van 'n
proses van data pakhuis, word een deur die eindgebruiker versoek
nuwe dimensie of vakgebied, wat nie deel was van die
oorspronklike plan, moet dit by die stelsel gevoeg word. Hierdie
'n verandering in die projek veroorsaak. Die gevolg is dat die span van
ontwerp moet die vereistes van die dokumente wat tot dusver geskep is, verander
tydens die ontwerpfase. In baie gevalle is die huidige stand van die
projek moet heeltemal teruggaan na die ontwerpstadium waar
die nuwe versoek moet bygevoeg en gedokumenteer word. Die gebruiker
finaal moet die spesifieke hersiene dokumentasie kan sien ei
veranderinge wat in die ontwikkelingsfase aangebring is. Aan die einde van
hierdie ontwikkelingsiklus moet die projek goeie terugvoer van kry
beide spanne, die ontwikkelingspan en die gebruikersspan. DIE
terugvoer word dan hergebruik om 'n toekomstige projek te verbeter.
Kapasiteitsbeplanning
DW's is geneig om baie groot in grootte te wees en te groei
baie vinnig (Best 1995, Rudin 1997a) na aanleiding van die
bedrag van data wat histories wat hulle van hul duur bewaar. Daar
groei kan ook veroorsaak word deur data wat bykomende vereis deur
gebruikers om die waarde van te verhoog data wat wat hulle reeds het. Van
dienooreenkomstig die bergingsvereistes vir data wat possono
aansienlik verbeter word (Eckerson 1997). So dit is
noodsaaklik om te verseker, deur 'n beplanning van die
kapasiteit, dat die stelsel wat gebou gaan word, kan groei met die
groeiende behoeftes (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
In die beplanning vir dw-skaalbaarheid moet 'n mens die
verwagte groei van pakhuisgrootte, tipe vrae
waarskynlik gemaak sal word, en die aantal eindgebruikers wat ondersteun word (Beste
1995, Rudin 1997b, Foley 1997a). Bou skaalbare toepassings
dit vereis 'n kombinasie van tegniese en skaalbare bedienertegnologieë
van skaalbare toepassingsontwerp (Best 1995, Rudin 1997b.
Beide word vereis om 'n aansoek te bou
uiters skaalbaar. Skaalbare bedienertegnologieë kan
maak dit maklik en gerieflik om berging, geheue en by te voeg
SVE sonder afbrekende werkverrigting (Lang 1997, Telefonie 1997).
Daar is twee primêre skaalbare bedienertegnologieë: Reken
simmetriese multipleksing (SMP) en massiewe verwerking
parallel (MPP) ) (IDC 1997, Humphries et al. 1999). 'n Bediener
SMP het gewoonlik verskeie verwerkers wat 'n geheue deel,
busstelsel en ander hulpbronne (IDC 1997, Humphries et al. 1999).
Bykomende verwerkers kan bygevoeg word om te verhoog
la sua krag rekenkundige. Nog 'n metode om die
krag berekening van die SMP-bediener, is om talle te kombineer
SMP masjiene. Hierdie tegniek staan ​​bekend as groepering (Humphries
et al. 1999). 'n MPP-bediener, aan die ander kant, het verskeie verwerkers elk
met sy eie geheue, busstelsel en ander hulpbronne (IDC 1997,
Humphries et al. 1999). Elke verwerker word 'n nodus genoem. A
toename in krag berekening verkry kan word
bykomende nodusse by MPP-bedieners te voeg (Humphries et al.
1999).
'n Swakheid van SMP-bedieners is dat te veel toevoer-uitsetbewerkings
(I/O) kan die busstelsel verstop (IDC 1997). Hierdie
probleem kom nie binne MPP-bedieners voor nie, aangesien elkeen
verwerker het sy eie busstelsel. Die onderlinge verbindings
tussen elke nodus is oor die algemeen baie stadiger as die busstelsel
van die SMP's. MPP-bedieners kan ook 'n laag byvoeg
bykomende kompleksiteit vir toepassingsontwikkelaars (IDC
1997). Dus kan die keuse tussen SMP- en MPP-bedieners beïnvloed word
deur baie faktore, insluitend die kompleksiteit van die vrae, die verhouding
prys/prestasie, die vereiste verwerkingskapasiteit, die
voorkom dw toepassings en die toename in grootte van databasis
van dw en in die aantal eindgebruikers.
Talle skaalbare toepassingsontwerptegnieke
kan gebruik word in kapasiteitsbeplanning. Een
gebruik verskeie verslagdoeningstydperke soos dae, weke, maande en jare.
Met verskeie kennisgewing tydperke, die databasis verdeel kan word in
stukke maklik gegroepeer (Inmon et al. 1997). Nog een
tegniek is om opsommingstabelle te gebruik wat saamgestel is
opsomming data wat da data wat gedetailleerd. Dus, i data wat opsommings is meer
kompak as gedetailleerd, wat minder geheuespasie verg.
Sodat die data wat van detail kan in 'n eenheid van geargiveer word
minder duur berging, wat selfs meer deposito bespaar.
Alhoewel die gebruik van opsommingstabelle ruimte kan bespaar van
geheue, verg hulle baie moeite om hulle op datum en in te hou
in lyn met kommersiële behoeftes. Hierdie tegniek is egter
wyd gebruik en dikwels saam met die tegniek gebruik
vorige (Beste 1995, Inmon 1996a, Chauduri en Dayal
1997).
definiëring Datastoor Tegniese
Argitekture Definisie van tegnieke
dw argitekture
Aanvanklike aannemers van datapakhuise hoofsaaklik bedink
'n gesentraliseerde implementering van die dw waar al die data wat, ingesluit
i data wat ekstern, is geïntegreer in 'n enkele,
fisiese bewaarplek (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Die grootste voordeel van hierdie benadering is die eindgebruikers
hulle het toegang tot die entrepreneuriese skaalaansig
(onderneming-wye uitsig) dei data wat organisatories (Ovum 1998). Nog een
voordeel is dat dit standaardisering van bied data wat deur
die organisasie, wat beteken daar is net een weergawe of
definisie vir elke terminologie wat in die bewaarplek gebruik word dw
(bewaarplek) metadata (Flanagan en Safdie 1997, Ovum 1998). Die
nadeel van hierdie benadering, aan die ander kant, is dat dit duur en moeilik is
gebou te word (Flanagan en Safdie 1997, Ovum 1998, Inmon et al.
1998). Nie lank na die stoorargitektuur nie data wat
gesentraliseerde gewild geword het, het die konsep van onttrekking ontwikkel
van die kleinste deelversamelings van data wat om die behoeftes van te ondersteun
spesifieke toepassings (Varney 1996, IDC 1997, Berson en Smith
1997, pou 1998). Hierdie klein stelsels is afgelei van die groter
groot data pakhuis gesentraliseer. Hulle word datum genoem
afhanklike departementele pakhuise of afhanklike datamars.
Die afhanklike data mart argitektuur staan ​​bekend as
drie-vlak argitektuur waar die eerste vlak bestaan ​​uit die data
gesentraliseerde pakhuis, die tweede bestaan ​​uit die depots van data wat
departementele en die derde bestaan ​​uit toegang tot data wat en uit die gereedskap van
analise (Demarest 1994, Inmon et al. 1997).
Data marts word gewoonlik gebou na die data pakhuis
gesentraliseerde is gebou om aan die behoeftes van te voldoen
spesifieke eenhede (White 1995, Varney 1996).
Data marts winkel i data wat baie relevant met betrekking tot besonderhede
eenheid (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
Die voordeel van hierdie metode is dat daar geen Dato nie
geïntegreer en dat i data wat hulle sal minder oorbodig wees binne die data
maart sedert al die data wat kom uit 'n deposito van data wat geïntegreer.
Nog 'n voordeel is dat daar minder skakels tussen elkeen sal wees
data mart en verwante bronne van data wat want elke datamart het net
'n bron van data wat. Plus met hierdie argitektuur in plek, gebruikers
gebruikers het steeds toegang tot die oorsig van data wat
korporatiewe organisasies. Hierdie metode staan ​​bekend as die
top-down metode, waar data-marts na die data gebou word
pakhuis (pou 1998, Goff 1998).
Verhoog die behoefte om resultate vroeg te wys, sommige
organisasies het begin met die bou van onafhanklike datamars
(Flanagan en Safdie 1997, White 2000). In hierdie geval, data marts
hulle neem hulle s'n data wat reguit van die basiese beginsels van data wat OLTP en nie sedertdien nie
gesentraliseerde en geïntegreerde berging, dus die behoefte aan
die sentrale bewaarplek in plek hê.
Elke datamark benodig ten minste een skakel na sy bronne
di data wat. Een nadeel van veelvuldige skakels vir elke datum
mart is dat in vergelyking met die vorige twee argitekture, die
oorvloed van data wat aansienlik toeneem.
Elke datamark moet al die stoor data wat plaaslik benodig vir
het geen impak op OLTP-stelsels nie. Dit veroorsaak dat i data wat
hulle word in verskillende datamars gestoor (Inmon et al. 1997).
Nog 'n nadeel van hierdie argitektuur is dat dit lei tot
die skep van komplekse interkonneksies tussen datamarts en hulle s'n
bronne van data wat wat moeilik is om uit te voer en te beheer (Inmon ed
ander. 1997).
Nog 'n nadeel is dat eindgebruikers dalk nie krag nie
toegang tot die maatskappyinligting-oorsig omdat i data wat
van die verskillende datamars is nie geïntegreer nie (Ovum 1998).
Nog 'n nadeel is dat daar meer as een kan wees
definisie vir elke terminologie wat gebruik word in die datamars wat dit genereer
inkonsekwenthede van data wat in organisasie (Ovum 1998).
Ten spyte van die nadele wat hierbo bespreek is, onafhanklike datamars
lok steeds die belangstelling van baie organisasies (IDC 1997).
Een faktor wat hulle aantreklik maak, is dat hulle vinniger ontwikkel
en vereis minder tyd en hulpbronne (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Gevolglik dien hulle meestal
as toetsontwerpe wat gebruik kan word om te identifiseer
vinnig die voordele en/of onvolmaakthede in die projek (Parsaye
1995, Braly 1995, Newing 1996). In hierdie geval, die deel van
implementeer in die loodsprojek moet klein maar belangrik wees
vir organisasie (Newing 1996, Mansell-Lewis 1996).
Deur die prototipe te ondersoek, kan eindgebruikers en administrasie
besluit of om die projek voort te sit of te stop (Flanagan en Safdie
1997).
As die besluit is om voort te gaan, data mars vir ander nywerhede
hulle moet een op 'n slag gebou word. Daar is twee opsies vir
eindgebruikers gebaseer op hul datakonstruksiebehoeftes
onafhanklike matrs: geïntegreerd/gefedereerd en ongeïntegreerd (Ovum
1998)
In die eerste metode moet elke nuwe datamart gebou word
gebaseer op huidige datamars en model data wat gebruik
deur die firma (Varney 1996, Berson en Smith 1997, Peacock 1998).
Die behoefte om die model te gebruik data wat van die maatskappy maak dit nodig
maak seker daar is net een definisie vir elke terminologie
gebruik word deur data marts, dit is ook om te verseker dat data
verskillende maart kan saamgevoeg word om 'n oorsig van te gee
korporatiewe inligting (Bresnahan 1996). Hierdie metode is
genoem die onderstebo en is die beste wanneer daar 'n beperking op is
tyd en finansiële middele (Flanagan en Safdie 1997, Ovum 1998,
pou 1998, Goff 1998). In die tweede metode, data marts
gebou kan slegs die behoeftes van 'n spesifieke eenheid bevredig.
'n Variant van die federated data mart is die data pakhuis versprei
waarin die databasis hub bediener middelware word gebruik om baie saam te smelt
data maart in 'n enkele bewaarplek van data wat versprei (White 1995). In
hierdie geval, i data wat besigheid word in verskeie datamars versprei.
Eindgebruikerversoeke word aangestuur na databasis
hub bediener middelware, wat alles onttrek data wat deur die data aangevra
maart en voer die resultate terug na eindgebruikertoepassings. Hierdie
metode verskaf besigheidsinligting aan eindgebruikers. Maar
data marts probleme is steeds nie uitgeskakel nie
onafhanklik. Daar is 'n ander argitektuur wat gebruik kan word, wat is
bel die data pakhuis virtuele (White 1995). Hierdie
argitektuur, wat in figuur 2.9 beskryf word, is nie 'n argitektuur nie
van berging van data wat werklik aangesien dit nie die vrag beweeg nie
van OLTP-stelsels na data pakhuis (Demarest 1994).
Trouens, versoeke vir data wat deur eindgebruikers verby ai
OLTP-stelsels wat resultate gee na verwerking van e-posse
gebruikersversoeke. Alhoewel hierdie argitektuur gebruikers toelaat
finaal om verslae te genereer en versoeke te formuleer, kan nie die verskaf nie
data wat geskiedenis en oorsig van maatskappy-inligting sedert i data wat
aangesien die verskillende OLTP-stelsels nie geïntegreer is nie. So, hierdie
argitektuur kan nie voldoen aan die ontleding van data wat kompleks soos
voorbeeld voorspellings.
Seleksie van die toegang aansoek en van
herstel van data wat
Die doel van die bou van 'n data pakhuis is om oor te dra
inligting aan eindgebruikers (Inmon et al. 1997, Poe 1996,
McFadden 1996, Shanks et al. 1997, Hammergren 1998); een of
veelvuldige toegang en herstel toepassings data wat verskaf moet word. Om
vandag, daar is 'n wye verskeidenheid van hierdie toepassings wat die gebruiker kan onder
kies (Hammergren 1998, Humphries et al. 1999). Die
geselekteerde toepassings bepaal die sukses van die poging
van berging van data wat in 'n organisasie omdat die
toepassings is die mees sigbare deel van die data pakhuis aan die gebruiker
finaal (Inmon et al. 1997, Poe 1996). Om 'n datum te slaag
pakhuis, moet data-analise-aktiwiteite kan ondersteun data wat
van die eindgebruiker (Poe 1996, Seddon en Benjamin 1998, Eckerson
1999). Die "vlak" van wat die eindgebruiker wil hê moet dus wees
geïdentifiseer (Poe 1996, Mattison 1996, Inmon et al. 1997,
Humphries et al. 1999).
Oor die algemeen kan eindgebruikers in drie gegroepeer word
kategorieë: uitvoerende gebruikers, besigheidsontleders en kraggebruikers (Poe
1996, Humphries et al. 1999). Uitvoerende gebruikers moet
maklike toegang tot voorafbepaalde stelle verslae (Humphries ed
ander 1999). Hierdie verslae kan maklik bereik word met
spyskaartnavigasie (Poe 1996). Daarbenewens moet verslae
inligting aan te bied deur gebruik te maak van grafiese voorstelling
soos tabelle en sjablone om die vinnig te lewer
inligting (Humphries et al. 1999). Besigheidsontleders, wat dit nie doen nie
hulle het dalk die tegniese vermoëns om verhoudings van te bou
nul by hulself, moet in staat wees om die huidige verslae te verander vir
voldoen aan hul spesifieke behoeftes (Poe 1996, Humphries et al
1999). Kraggebruikers, aan die ander kant, is die tipe eindgebruikers wat
het die vermoë om versoeke en verslae te genereer en te skryf van
nul (Poe 1996, Humphries et al. 1999). Dit is hulle wat
ontwikkel verslae vir ander tipe gebruikers (Poe 1996, Humphries
et al. 1999).
Sodra die eindgebruikersvereistes bepaal is, moet dit gedoen word
'n keuse van toegang- en hersteltoepassings data wat onder almal
dié wat beskikbaar is (Poe 1996, Inmon et al. 1997).
Toegang tot data wat en herwinning gereedskap kan wees
geklassifiseer in 4 tipes: OLAP-instrument, EIS/DSS-instrument, navraag-instrument en
verslagdoening en data-ontginning gereedskap.
OLAP-nutsgoed stel gebruikers in staat om ook ad hoc-navrae te skep
dié wat op gemaak is databasis del data pakhuis. Plus hierdie produkte
laat gebruikers toe om af te drill data wat algemeen vir diegene
gedetailleerd.
EIS/DSS-instrumente verskaf uitvoerende verslaggewing soos "wat as"-analise
en toegang tot verslae wat volgens spyskaart georganiseer is. Verslae moet wees
vooraf gedefinieerde en saamgevoeg met spyskaarte vir makliker navigasie.
Navraag- en verslagdoeningsnutsgoed stel gebruikers in staat om verslae te produseer
vooraf gedefinieerde en spesifiek.
Data-ontginningsinstrumente word gebruik om verwantskappe te identifiseer wat
nuwe lig kon werp op die bedrywighede wat in die vergeet is data wat del
datastoor.
Benewens die optimalisering van die vereistes van elke tipe gebruiker, i
geselekteerde gereedskap moet intuïtief, doeltreffend en maklik om te gebruik wees.
Hulle moet ook versoenbaar wees met ander dele van die argitektuur e
in staat is om met bestaande stelsels te werk. Dit word ook voorgestel om
kies datatoegang en herwinningsinstrumente met pryse en vertonings
redelik. Ander kriteria om te oorweeg sluit in die verbintenis van die
verskaffer van die instrument om hul produk en verwante ontwikkelings te ondersteun
self in toekomstige vrystellings sal hê. Om gebruikersbetrokkenheid te verseker
in die gebruik van die datapakhuis, betrek die ontwikkelingspan die
gebruikers in die gereedskapseleksieproses. In hierdie geval
'n praktiese beoordeling van die gebruiker moet gemaak word.
Om die waarde van die datapakhuis te verbeter, kan die ontwikkelingspan
verskaf ook webtoegang tot hul datapakhuise. A
web-geaktiveerde datapakhuis laat gebruikers toe om toegang tot die data wat
van afgeleë plekke of tydens reis. Ook die inligting kan
teen laer koste verskaf word deur koste te verlaag
van opleiding.
2.4.3 Datastoor Operasie fase
Hierdie fase bestaan ​​uit drie aktiwiteite: definisie van datumstrategieë
verfris, beheer van datapakhuisaktiwiteite en bestuur van
data pakhuis sekuriteit.
Definisie van dataverfrisstrategieë
Na aanvanklike laai, i data wat in databasis van die datapakhuis
moet periodiek verfris word om te speel i
veranderinge aangebring op data wat oorspronklikes. So ons moet besluit
wanneer om te verfris, hoe gereeld moet die
verfris en hoe om die te verfris data wat. Dit word voorgestel om die
verfris van die data wat wanneer die stelsel vanlyn geneem kan word. Daar
verversingstempo word bepaal deur die ontwikkelingspan gebaseer
op gebruikersvereistes. Daar is twee benaderings om die te verfris
datapakhuis: die volledige verversing en deurlopende laai van
veranderings.
Die eerste benadering, volle verfris, vereis herlaai van
al die data wat van die begin af. Dit beteken dat al die data wat vereiste moet
onttrek, skoongemaak, getransformeer en by elke verversing geïntegreer word. Hierdie
benadering moet sover moontlik vermy word omdat
dit verg baie tyd en hulpbronne.
'n Alternatiewe benadering is om voortdurend i
veranderinge. Dit voeg i data wat wat verander is
sedert die laaste datapakhuis-verversingsiklus. Die identifikasie van
nuwe of veranderde rekords aansienlik verminder die bedrag van
data wat wat na die datapakhuis in elkeen gepropageer moet word
update aangesien slegs hierdie data wat sal bygevoeg word databasis
van die datapakhuis.
Daar is ten minste 5 benaderings wat gebruik kan word om te onttrek
i data wat nuut of gewysig. Om 'n doeltreffende strategie van te kry
verfris van die data wat 'n mengsel van hierdie benaderings kan nuttig wees
haal alle veranderinge in die stelsel.
Die eerste benadering, wat tydstempels gebruik, neem aan dit kom
aan almal toegewys data wat 'n tydstempel op 'n manier gewysig en opgedateer
om maklik al die te kan identifiseer data wat gewysig en nuut.
Hierdie benadering is egter nie algemeen in die meeste gebruik nie
deel van vandag se bedryfstelsels.
Die tweede benadering is om 'n delta-lêer te gebruik wat deur
'n toepassing wat slegs die veranderinge bevat wat aan die data wat.
Die gebruik van hierdie lêer versterk ook die opdateringsiklus.
Selfs hierdie metode is egter nie in baie gebruik nie
toepassings.
Die derde benadering is om 'n loglêer te skandeer, wat
bevat basies inligting soortgelyk aan die delta-lêer. Die enigste een
verskil is dat 'n loglêer geskep word vir die herstelproses e
dit kan moeilik wees om te verstaan.
Die vierde benadering is om die toepassingskode te wysig.
Die meeste van die toepassingskode is egter oud en
broos; daarom moet hierdie tegniek vermy word.
Die laaste benadering is om i data wat bronne met die lêer
hoofgode data wat.
Monitering van datapakhuisaktiwiteite
Sodra die datapakhuis aan gebruikers vrygestel is, is dit
oor tyd gemonitor moet word. In hierdie geval, die administrateur
van die datapakhuis kan een of meer bestuursinstrumente gebruik, e
beheer om die gebruik van die datapakhuis te monitor. In die besonder
inligting oor mense en die weer kan ingesamel word
wat hulle toegang tot die datapakhuis kry. Komaan data wat ingesamel geskep kan word
'n profiel van die werk wat verrig is wat as insette gebruik kan word
in die gebruikersterugbetalingsimplementering. Die Terugskrywing
laat gebruikers toe om ingelig te word oor die koste van die verwerking van die
datastoor.
Datapakhuisbeheer kan ook gebruik word vir
identifiseer die tipes navrae, hul grootte, die aantal navrae per
dag, die reaksietye op die navraag, die sektore wat bereik is en die hoeveelheid
di data wat verwerk. Nog 'n doel van die doen van die tjek van die
datawarehouse is identifiseer i data wat wat nie in gebruik is nie. Hierdie data wat
hulle kan uit die datapakhuis verwyder word om tyd te verbeter
van navraag uitvoering reaksie en beheer die groei van
data wat wat binne die woon databasis van die datapakhuis.
Datapakhuis sekuriteitsbestuur
'n Datapakhuis bevat data wat geïntegreerde, krities, sensitief dat
kan maklik bereik word. Om hierdie rede moet dit
beskerm teen ongemagtigde gebruikers. 'n manier om
om sekuriteit te implementeer, is om die del-funksie te gebruik DBMS
om verskillende voorregte aan verskillende tipe gebruikers toe te ken. In hierdie
manier, 'n profiel moet gehandhaaf word vir elke tipe gebruiker
toegang. Nog 'n manier om die datapakhuis te beveilig, is om dit te enkripteer
soos dit in geskryf is databasis van die datapakhuis. Toegang tot
data wat en die herwinningsinstrumente moet die dekripteer data wat voor die indiening van i
resultate aan gebruikers.
2.4.4 Datastoor Ontplooiingsfase
Dit is die laaste fase in die datapakhuis-implementeringsiklus. Die
aktiwiteite wat in hierdie fase uitgevoer moet word, sluit in die opleiding van
gebruikers om die datapakhuis te gebruik en resensies te skep
van die datapakhuis.
Gebruikersopleiding
Gebruikersopleiding moet eers gedoen word
van toegang tot data wat van die datapakhuis en die gebruik van gereedskap
herwinning. Oor die algemeen moet sessies begin met
die inleiding tot die konsep van die berging van data watby
data pakhuis inhoud, ai meta data wat en die basiese kenmerke
van die gereedskap. Dan kan meer gevorderde gebruikers ook die
fisiese tabelle en gebruikerskenmerke van datatoegang en gereedskap
herwinning.
Daar is baie benaderings om gebruikersopleiding te doen. Een van
dit maak voorsiening vir 'n seleksie van baie gebruikers of ontleders wat deur a
stel gebruikers, wat op hul leierskap en vaardighede staatmaak
kommunikasie. Hierdie is opgelei in 'n persoonlike hoedanigheid op
alles wat hulle moet weet om vertroud te raak met die
stelsel. Sodra die opleiding verby is, keer hulle terug na hul werk e
hulle begin ander gebruikers leer hoe om die stelsel te gebruik. Op die
gebaseer op wat hulle geleer het, kan ander gebruikers advertensie begin
verken die datapakhuis.
Nog 'n benadering is om baie gebruikers in dieselfde op te lei
tyd, asof jy 'n klaskamerkursus doen. Hierdie metode
dit is geskik wanneer daar baie gebruikers is wat opgelei moet word
op dieselfde tyd. Nog 'n metode is om op te lei
elke gebruiker individueel, een vir een. Hierdie metode is
geskik wanneer daar min gebruikers is.
Die doel van gebruikersopleiding is om hulle vertroud te maak
met toegang tot data wat en die herwinningsinstrumente sowel as die inhoud van die
datastoor. Sommige gebruikers kan egter oorweldig word
deur die hoeveelheid inligting wat tydens die sessie verskaf is
opleiding. So 'n aantal moet gedoen word
update sessies deurlopende hulp en om te reageer
op spesifieke vrae. In sommige gevalle, 'n groep van
gebruikers om hierdie tipe ondersteuning te verskaf.
Versamel terugvoer
Sodra die datapakhuis ontplooi is, kan gebruikers
gebruik i data wat woon in die datapakhuis vir verskeie doeleindes.
Meestal gebruik ontleders of gebruikers i data wat in
datapakhuis vir:
1 Identifiseer maatskappyneigings
2 Ontleed die aankoopprofiele van kliënte
3 Verdeel i kliënte en van
4 Verskaf die beste dienste aan kliënte - pasmaak dienste
5 Formuleer strategieë bemarking
6 Maak mededingende kwotasies vir koste-ontledings en hulp
beheer
7 Ondersteun strategiese besluitneming
8 Identifiseer geleenthede om na vore te kom
9 Verbeter die kwaliteit van huidige besigheidsprosesse
10 Gaan die wins na
Na aanleiding van die ontwikkelingsrigting van die datapakhuis, kon hulle
voer 'n reeks stelseloorsigte uit om terugvoer te verkry
beide van die ontwikkelingspan en van die gemeenskap van gebruikers
eindverbruikers.
Die resultate wat verkry is, kan in ag geneem word vir die
volgende ontwikkelingsiklus.
Aangesien die datapakhuis 'n inkrementele benadering het,
dit is noodsaaklik om te leer uit die suksesse en foute van die voriges
ontwikkelings.
2.5 Opsomming
In hierdie hoofstuk is die benaderings wat in teenwoordig is, bespreek
letterkunde. In afdeling 1 is die konsep van bespreek
datapakhuis en die rol daarvan in besluitkunde. In die
afdeling 2 die belangrikste verskille tussen is beskryf
datapakhuis en OLTP-stelsels. In afdeling 3 het ons die
datapakhuismodel volgens Monash wat gebruik is
in afdeling 4 om die aktiwiteite betrokke by die proses te beskryf
ontwikkeling van 'n datapakhuis, is hierdie tesisse nie gebaseer nie
streng navorsing. Wat in werklikheid gebeur, kan wees
baie anders as wat die literatuur berig, hoe dit ook al sy
resultate kan gebruik word om 'n basiese bagasie te skep wat
jy onderstreep die konsep van datapakhuis vir hierdie navorsing.
Hoofstuk 3
Navorsings- en ontwerpmetodes
Hierdie hoofstuk handel oor navorsing en ontwerpmetodes vir
hierdie studie. Die eerste deel toon 'n generiese siening van die metodes
soekenjins beskikbaar vir inligtingherwinning, boonop
die kriteria vir die keuse van die beste metode vir een word bespreek
spesifieke studie. In Afdeling 2 word twee metodes vervolgens bespreek
gekies met die kriteria wat sopas uiteengesit is; hiervan sal gekies word ed
een aangeneem met die redes uiteengesit in artikel 3 waar hulle is
die redes vir die uitsluiting van die ander maatstaf word ook verduidelik. Daar
afdeling 4 bied die navorsingsprojek aan en afdeling 5 le
gevolgtrekkings.
3.1 Navorsing in inligtingstelsels
Navorsing in inligtingstelsels is nie bloot beperk nie
na die tegnologiese sfeer maar moet ook uitgebrei word om in te sluit
gedrags- en organisatoriese doeleindes.
Ons is dit te danke aan die tesisse van verskeie dissiplines wat wissel van
sosiale wetenskappe tot die natuurlike; dit lei tot die behoefte aan 'n
sekere spektrum van navorsingsmetodes wat kwantitatiewe metodes behels
en kwalitatief om vir inligtingstelsels gebruik te word.
Al die beskikbare navorsingsmetodes is belangrik, trouens verskeie
navorsers soos Jenkins (1985), Nunamaker et al. (1991), en Galliers
(1992) voer aan dat daar geen universele spesifieke metode is nie
om navorsing te doen in die verskillende velde van inligtingstelsels; Inderdaad
'n metode kan geskik wees vir 'n bepaalde navorsing, maar nie
vir ander. Dit bring ons die behoefte om 'n metode te kies wat
is geskik vir ons spesifieke navorsingsprojek: vir hierdie een
keuse Benbasat et al. (1987) noem dat hulle oorweeg moet word
die aard en doel van die navorsing.
3.1.1 Aard van die navorsing
Die verskillende metodes gebaseer op die aard van die navorsing kan wees
geklassifiseer in drie tradisies wat algemeen bekend is in die wetenskap
van inligting: positivistiese, interpreterende en kritiese navorsing.
3.1.1.1 Positivistiese navorsing
Positivistiese navorsing staan ​​ook bekend as wetenskaplike studie of
empiries. Dit poog om: “verduidelik en voorspel wat sal gebeur in
sosiale wêreld deur te kyk na reëlmatighede en oorsaak-en-gevolg verhoudings
onder die elemente wat dit uitmaak” (Shanks et al 1993).
Positivistiese navorsing word ook gekenmerk deur herhaalbaarheid,
vereenvoudigings en weerleggings. Daarbenewens gee positivistiese navorsing toe
die bestaan ​​van a priori-verwantskappe tussen die bestudeerde verskynsels.
Volgens Galliers (1992) is taksonomie 'n navorsingsmetode
opgeneem in die positivistiese paradigma, wat egter nie daartoe beperk is nie,
in werklikheid is daar laboratoriumeksperimente, veldeksperimente,
gevallestudies, stellingbewys, voorspellings en simulasies.
Met behulp van hierdie metodes erken die navorsers dat die verskynsels
bestudeer kan objektief en streng waargeneem word.
3.1.1.2 Interpretatiewe navorsing
Interpretatiewe navorsing, wat dikwels genoem word fenomenologie of
anti-positivisme word deur Neuman (1994) beskryf as “analise
sistematiek van die sosiale betekenis van die handeling deur die direkte en
gedetailleerde waarneming van mense in natuurlike situasies in volgorde
om tot 'n begrip en interpretasie te kom van hoe die
mense skep en onderhou hul sosiale wêreld. Studies
interpretatiewe teorieë verwerp die aanname dat die waargenome verskynsels
objektief waargeneem kan word. Hulle is inderdaad gebaseer
oor subjektiewe interpretasies. Verder doen interpretatiewe navorsers nie
hulle lê a priori betekenisse op die verskynsels wat hulle bestudeer.
Hierdie metode sluit subjektiewe/argumentatiewe studies, aksies van
navorsing, beskrywende/interpretatiewe studies, toekomstige navorsing en speletjies van
rol. Benewens hierdie opnames en gevallestudies kan wees
ingesluit in hierdie benadering aangesien dit die studies van
individue of organisasies in komplekse situasies
van die werklike wêreld.
3.1.1.3 Kritiese navorsing
Kritiese navorsing is die minste bekende benadering in die wetenskappe
sosiaal, maar het onlangs die aandag van navorsers ontvang
op die gebied van inligtingstelsels. Die filosofiese aanname dat die
sosiale werklikheid word histories deur mense geproduseer en gereproduseer,
sowel as sosiale sisteme met hul aksies en interaksies. Hulle
vermoë word egter deur 'n aantal oorwegings bemiddel
sosiaal, kultureel en polities.
Soos interpretatiewe navorsing, argumenteer kritiese navorsing dat die
positivistiese navorsing het niks met die sosiale konteks te doen nie en ignoreer die
die invloed daarvan op menslike optrede.
Kritiese navorsing, aan die ander kant, kritiseer interpretatiewe navorsing vir
te subjektief te wees en hoekom dit nie daarop gemik is om te help nie
mense om hul lewens te verbeter. Die grootste verskil tussen die
kritiese navorsing en die ander twee benaderings is die evaluerende dimensie daarvan.
Terwyl die objektiwiteit van die positivistiese en interpretatiewe tradisies is vir
die status quo of sosiale werklikheid voorspel of verduidelik, kritiese navorsing
het ten doel om die sosiale werklikheid krities te evalueer en te transformeer onder
studio.
Kritiese navorsers opponeer gewoonlik die status quo ten einde
sosiale verskille te verwyder en sosiale toestande te verbeter. Daar
kritiese navorsing het 'n verbintenis tot 'n proses siening van
verskynsels van belang en is dus normaalweg longitudinaal.
Voorbeelde van navorsingsmetodes is langtermyn historiese studies en
etnografiese studies. Kritiese navorsing was egter nie
wyd gebruik in inligtingstelselnavorsing
3.1.2 Doel van die navorsing
Saam met die aard van die soektog kan die doel daarvan gebruik word
om die navorser te lei in die keuse van 'n bepaalde metode van
navorsing. Die doel van 'n navorsingsprojek is nou verwant
na die posisie van die soektog met betrekking tot die soeksiklus wat bestaan ​​uit
drie fases: teoriebou, teorietoetsing en teorieverfyning
teorie. Dus, gebaseer op die momentum versus soeksiklus, a
navorsingsprojek kan 'n verklarende, beskrywende, di
eksplorasie of voorspelling.
3.1.2.1 Verkennende navorsing
Verkennende navorsing is daarop gemik om 'n onderwerp te ondersoek
totaal nuut en vrae en hipoteses vir navorsing te formuleer
toekoms. Hierdie tipe soektog word gebruik in die konstruksie van die
teorie om aanvanklike verwysings in 'n nuwe area te verkry.
Tipies word kwalitatiewe navorsingsmetodes gebruik, soos gevallestudies
van studie of fenomenologiese studies.
Dit is egter ook moontlik om kwantitatiewe tegnieke te gebruik soos
verkennende ondersoeke of eksperimente.
3.1.3.3 Beskrywende soektog
Beskrywende navorsing is hoofsaaklik daarop gemik om te analiseer en te beskryf
besonderhede van 'n spesifieke situasie of organisatoriese praktyk. Hierdie
dit is gepas om teorieë te konstrueer en kan ook vir gebruik word
hipoteses bevestig of betwis. Beskrywende soektog gewoonlik
sluit die gebruik van metings en monsters in. Die mees geskikte navorsingsmetodes
ondersoeke en agtergrondontledings insluit.
3.1.2.3 Verklarende navorsing
Verklarende navorsing probeer verduidelik hoekom dinge gebeur.
Dit is gebou op feite wat reeds bestudeer is en poog om te vind
die redes vir hierdie feite.
Verklarende navorsing word dus normaalweg op navorsing gebou
verkennend of beskrywend en is bykomstig om te toets en te verfyn
die teorieë. Verklarende navorsing maak gewoonlik gebruik van gevallestudies
of opname-gebaseerde navorsingsmetodes.
3.1.2.4 Voorkomende navorsing
Voorkomende navorsing het ten doel om gebeure en gedrag te voorspel
onder waarneming wat bestudeer word (Marshall en Rossman
1995). Voorspelling is die standaard wetenskaplike toets van waarheid.
Hierdie tipe navorsing maak gewoonlik gebruik van opnames of data-analise
data wat historici. (Yin 1989)
Die bespreking hierbo toon dat daar 'n aantal is
moontlike navorsingsmetodes wat in 'n studie gebruik kan word
besonders. Daar moet egter 'n spesifieke metode wees wat meer geskik is
ander vir 'n spesifieke tipe navorsingsprojek. (Galliers
1987, Yin 1989, De Vaus 1991). Elke navorser het dus
moet die sterk- en swakpunte van noukeurig evalueer
verskeie metodes, om te kom tot die aanvaarding van die mees geskikte navorsingsmetode e
versoenbaar is met die navorsingsprojek. (Jenkins 1985, Pervan en Klass
1992, Bonomia 1985, Yin 1989, Himilton en Ives 1992).
3.2. Moontlike soekmetodes
Die doel van hierdie projek was om die ervaring in
Australiese organisasies met i data wat saam met een gestoor word
ontwikkeling van data pakhuis. Dato wat tans een is
gebrek aan navorsing in die datapakhuisgebied in Australië,
hierdie navorsingsprojek is nog in die teoretiese fase van die siklus
navorsing en het 'n verkennende doel. Verken ervaring in
Australiese organisasies wat datapakhuis aanneem
vereis die interpretasie van die werklike samelewing. Gevolglik is die
die filosofiese aanname onderliggend aan die navorsingsprojek volg
die tradisionele interpretasie.
Na 'n streng ondersoek van die beskikbare metodes, is hulle geïdentifiseer
twee moontlike navorsingsmetodes: opnames en gevallestudies
(gevallestudies), wat vir navorsing gebruik kan word
verkennend (Shanks et al. 1993). Galliers (1992) voer aan dat
die geskiktheid van hierdie twee metodes vir hierdie spesifieke studie in die
sy taksonomie hersien deur te sê hulle is geskik vir konstruksie
teoreties. Die volgende twee onderafdelings bespreek elke metode in
besonderhede.
3.2.1 Opnamenavorsingsmetode
Die opname navorsingsmetode kom van die antieke metode van
sensus. 'n Sensus gaan oor die insameling van inligting van
'n hele bevolking. Hierdie metode is duur en onprakties
veral as die bevolking groot is. So in vergelyking met
sensus, 'n opname is normaalweg gefokus op die
versamel inligting vir 'n klein aantal, of steekproef, van die
verteenwoordigers van die bevolking (Fowler 1988, Neuman 1994). A
steekproef weerspieël die populasie waaruit dit getrek is, met verskil
vlakke van akkuraatheid, volgens die struktuur van die monster, die
grootte en die seleksiemetode wat gebruik is (Fowler 1988, Babbie
1982, Neumann 1994).
Die opnamemetode word gedefinieer as "kiekies van praktyke,
situasies of sienings op 'n spesifieke tydstip, onderneem deur gebruik te maak van
vraelyste of onderhoude, waaruit afleidings kan wees
gemaak” (Galliers 1992:153) [kiekie fotografie van praktyke,
situasies of sienings in spesifieke tydstip, onderneem deur gebruik te maak van
vraelyste of onderhoude, waaruit afleidings gemaak kan word]. Die
opnames handel oor die insameling van inligting oor sekere aspekte
van die studie, deur 'n aantal deelnemers, maak
vrae (Fowler 1988). Selfs hierdie vraelyste en onderhoude, wat
sluit telefoononderhoude van aangesig tot aangesig en gestruktureerde onderhoude in,
is die versamelingstegnieke van data wat mees algemeen gebruik in
ondersoeke (Blalock 1970, Nachmias en Nachmias 1976, Fowler
1988), kan waarnemings en ontledings gebruik word (Gable
1994). Van al hierdie metodes om gode te versamel data wat, die gebruik van
vraelys is die gewildste tegniek, aangesien dit verseker dat i data wat
versamel is gestruktureer en geformateer, en fasiliteer dus die
klassifikasie van inligting (Hwang 1987, de Vaus 1991).
In die ontleding van i data wat, 'n ondersoekstrategie gebruik dikwels die
kwantitatiewe tegnieke, soos statistiese analise, maar kan wees
kwalitatiewe tegnieke word ook gebruik (Galliers 1992, Pervan
en Klass 1992, Gable 1994). Normaalweg, i data wat ingesamel is
gebruik om verspreidings en patrone van assosiasies te ontleed
(Fowler 1988).
Alhoewel opnames oor die algemeen geskik is vir soektogte
handel oor die vraag 'wat?' (wat) of daaruit
aflei, soos 'hoeveel' (hoeveel) en 'quant'è' (hoeveel), hulle
kan gevra word via die 'hoekom'-vraag (Sonquist en
Dunkelberg 1977, Yin 1989). Volgens Sonquist en Dunkelberg
(1977), navorsingsondersoek wys op moeilike hipoteses, program di
assessering, die beskrywing van die bevolking en die ontwikkeling van modelle van die
menslike gedrag. Ook kan opnames gebruik word
om 'n sekere opinie van die bevolking, toestande,
opinies, eienskappe, verwagtinge en selfs vorige gedrag
of hede (Neuman 1994).
Die ondersoeke stel die navorser in staat om die verwantskappe tussen die
bevolking en die resultate is gewoonlik meer algemeen as vir
ander metodes (Sonquist en Dunkelberg 1977, Gable 1994). Die
opnames laat navorsers toe om 'n geografiese gebied te dek
wyer en om groot getalle geregistreerde te bereik (Blalock 1970,
Sonquist en Dunkelberg 1977, Hwang en Lin 1987, Gable 1994,
Neumann 1994). Ten slotte kan opnames die inligting verskaf
wat nie elders of in die vorm wat vir ontledings vereis word, beskikbaar is nie
(Fowler 1988).
Daar is egter 'n paar beperkings om 'n opname te doen. Een
nadeel is dat die navorser nie veel inligting kan bekom nie
oor die voorwerp wat bestudeer is. Dit is te wyte aan die feit dat die
ondersoeke word slegs op 'n spesifieke oomblik uitgevoer en daarom,
daar is 'n beperkte aantal veranderlikes en mense wat die navorser kan
studie (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Nog 'n nadeel is wat die uitvoer van 'n opname kan wees
baie duur in terme van tyd en hulpbronne, veral as
behels van aangesig tot aangesig onderhoude (Fowler 1988).
3.2.2. Navorsingsmetode
Die ondersoek-navorsingsmetode behels in-diepte studie van
'n bepaalde situasie binne sy werklike konteks in a
gedefinieerde tydperk, sonder enige ingryping deur die
navorser (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Meestal word hierdie metode gebruik om die verwantskappe tussen te beskryf
die veranderlikes wat in 'n bepaalde situasie bestudeer word
(Galliers 1992). Ondersoeke kan individuele sake behels of
veelvoude, afhangende van die verskynsel wat ontleed is (Franz en Robey 1987,
Eisenhardt 1989, Yin 1989).
Die ondersoekmetode word gedefinieer as "'n ondersoek
empiriese studie wat 'n kontemporêre verskynsel binne die
sy werklike konteks, met behulp van veelvuldige bronne wat uit een o
veelvuldige entiteite soos mense, groepe of organisasies” (Yin 1989).
Daar is geen duidelike skeiding tussen die verskynsel en sy konteks nie e
daar is geen beheer of eksperimentele manipulasie van die veranderlikes nie (Yin
1989, Benbasat et al. 1987).
Daar is 'n verskeidenheid tegnieke om gode te versamel data wat dat hulle kan
aangewend word in die ondersoekmetode, wat die insluit
direkte waarnemings, resensies van argiefrekords, vraelyste,
dokumentasie hersiening en gestruktureerde onderhoude. Om te hê
'n diverse reeks oestegnieke data wat, die ondersoeke
laat navorsers toe om te gaan met beide die data wat kwalitatief dit
hoeveelhede terselfdertyd (Bonoma 1985, Eisenhardt 1989, Yin
1989, Gable 1994). Soos die geval is met die opnamemetode, a
ondersoeknavorser tree op as waarnemer of navorser en nie
as 'n aktiewe deelnemer aan die studie-organisasie.
Benbasat et al. (1987) beweer dat die ondersoekmetode is
veral geskik vir navorsingsteorie konstruksie, wat
dit begin met 'n navorsingsvraag en gaan voort met opleiding
van 'n teorie tydens die proses van versameling data wat. Wees
ook geskik vir verhoog
van teoriekonstruksie stel Franz en Robey (1987) dit voor
die navraagmetode kan ook vir die kompleks gebruik word
teorie fase. In hierdie geval, gebaseer op die getuienis wat ingesamel is, a
gegewe teorie of hipotese word geverifieer of weerlê. Boonop is die ondersoek
ook geskik vir navorsing wat handel oor 'hoe' of 'hoe' vrae
'omdat' (Yin 1989).
In vergelyking met ander metodes, laat opnames die navorser toe om
vang noodsaaklike inligting in meer besonderhede vas (Galliers
1992, Shanks et al. 1993). Verder laat die ondersoeke die
navorser om die aard en kompleksiteit van die prosesse wat bestudeer word, te verstaan
(Benbasat et al. 1987).
Daar is vier hoof nadele verbonde aan die metode
ondersoek. Die eerste is die gebrek aan beheerde aftrekkings. Daar
Navorsersubjektiwiteit kan bevindinge en gevolgtrekkings bevooroordeel
van die studie (Yin 1989). Die tweede nadeel is die gebrek aan
beheerde waarneming. Anders as die eksperimentele metodes, die
ondersoeknavorser kan nie die verskynsels wat bestudeer is, beheer nie
soos hulle in hul natuurlike konteks ondersoek word (Gable 1994). Die
derde nadeel is die gebrek aan herhaalbaarheid. Dit is as gevolg van die feit
dat dit onwaarskynlik is dat die navorser dieselfde gebeure sal waarneem, bv
dit kan nie die resultate van 'n bepaalde studie verifieer nie (Lee 1989).
Ten slotte, as gevolg van nie-repliseerbaarheid, is dit moeilik
veralgemeen die resultate verkry uit een of meer opnames (Galliers
1992, Shanks et al. 1993). Al hierdie probleme is egter nie
is onoorkomelik en kan, in werklikheid, geminimaliseer word deur die
navorser wat toepaslike aksies toepas (Lee 1989).
3.3. Motiveer die navorsingsmetodologie
aangeneem
Uit die twee moontlike navorsingsmetodes vir hierdie studie is die metode van
opname word as die mees geskikte beskou. Die van ondersoek is
weggegooi is na noukeurige oorweging van die verwante
meriete en swakhede. Die gerief of onvanpasheid van elkeen
metode vir hierdie studie word later bespreek.
3.3.1. Onvanpaste navorsingsmetode
van ondersoek
Die ondersoekmetode vereis in-diepte studie oor a
spesifieke situasie binne een of meer organisasies vir a
tydperk (Eisenhardt 1989). In hierdie geval kan die tydperk
die tydsraamwerk wat vir hierdie studie gegee is, oorskry. Nog een
rede om nie die ondersoekmetode te aanvaar nie, is dat die resultate
hulle kan ly aan 'n gebrek aan strengheid (Yin 1989). Die subjektiwiteit
van die navorser kan die resultate en gevolgtrekkings beïnvloed. Nog een
rede is dat hierdie metode meer geskik is vir vraagsoektogte
van die tipe 'hoe' of 'waarom' (Yin 1989), terwyl die navorsingsvraag
vir hierdie studie is dit van die tipe 'wat'. Laaste maar nie die minste nie
Wat belangrik is, is dat dit moeilik is om resultate van slegs een o te veralgemeen
min navrae (Galliers 1992, Shanks et al. 1993). Op die basis van
hierdie rasionaal, die ondersoek navorsingsmetode is nie
is as ongeskik vir hierdie studie gekies.
3.3.2. Gerief van die soekmetode van
ondersoek
Toe hierdie navorsing gedoen is, het die praktyk van datawarehousing
was nie wyd aangeneem deur
Australiese organisasies. So, daar was nie veel inligting nie
met betrekking tot die implementering daarvan binne die
Australiese organisasies. Die beskikbare inligting kom van
van organisasies wat 'n data geïmplementeer of gebruik het
pakhuis. In hierdie geval is die opname-navorsingsmetode die meeste
geskik aangesien dit toelaat om die inligting te bekom wat nie is nie
elders beskikbaar of in die vorm wat vir ontleding vereis word (Fowler 1988).
Daarbenewens laat die opname navorsingsmetode die navorser toe om
kry 'n goeie insig in die praktyke, situasies, of
op 'n gegewe tydstip gesien (Galliers 1992, Denscombe 1998).
'n Oorsig is versoek om die
kennis oor die Australiese datapakhuiservaring.
Weereens meld Sonquist en Dunkelberg (1977) dat die resultate van
Opnamenavorsing is meer algemeen as ander metodes.
3.4. Opname Navorsing Ontwerp
Die opname oor die datapakhuispraktyk is in 1999 uitgevoer.

Die teikenpopulasie het uit organisasies bestaan
geïnteresseerd in datapakhuisstudies, soos hulle was
waarskynlik reeds ingelig oor i data wat watter winkel en
daarom kan dit die nuttige inligting vir hierdie studie verskaf. Daar
Teikenpopulasie is geïdentifiseer met 'n aanvanklike opname van
alle Australiese lede van 'The Data Warehousing Institute' (Tdwiaap).
Hierdie afdeling bespreek navorsingsfase-ontwerp
empiries van hierdie studie.
3.4.1. Versamelingstegniek data wat
Van die drie tegnieke wat algemeen in ondersoekende navorsing gebruik word
(d.w.s. vraelys per pos, telefoononderhoud en onderhoud
persoonlik) (Nachmias 1976, Fowler 1988, de Vaus 1991), vir
hierdie studie is aangeneem die vraelys per pos. Die eerste
rede vir die aanneming van laasgenoemde is dat dit a
geografies verspreide bevolking (Blalock 1970, Nachmias e
Nachmias 1976, Hwang en Lin 1987, de Vaus 1991, Gable 1994).
Tweedens is die posvraelys geskik vir deelnemers
hoogs opgevoed (Fowler 1988). Die vraelys per pos hiervoor
studie is gerig aan datapakhuisprojekborge,
projekdirekteure en/of -bestuurders. Derdens, die vraelyste op
pos is geskik wanneer jy 'n veilige lys van
adresse (Salant en Dilman 1994). TDWI, in hierdie geval, een
betroubare datapakhuisvereniging het die poslys verskaf
van sy Australiese lede. Nog 'n pluspunt van die vraelys
per pos versus telefoonvraelys of onderhoude
persoonlik is dat dit geregistreerde toelaat om met meer te reageer
akkuraatheid, veral wanneer respondente moet konsulteer
maak notas of bespreek vrae met ander mense (Fowler
1988).
'n Potensiële nadeel kan die tyd wees wat nodig is vir
vraelyste per pos uit te voer. Normaalweg 'n vraelys weg
pos word in hierdie volgorde uitgevoer: stuur briewe, wag vir
antwoorde en stuur bevestiging (Fowler 1988, Bainbridge 1989).
Dus kan die totale tyd langer wees as die tyd wat benodig word
persoonlike onderhoude of vir telefoononderhoude. Die
totale tyd kan vooraf bekend wees (Fowler 1988,
Denscombe 1998). Tyd wat spandeer word om onderhoude te voer
persoonlik kan nie vooraf bekend wees nie aangesien dit verskil van
een onderhoud na 'n ander (Fowler 1988). Die telefoniese onderhoude
kan vinniger wees as posvraelyste en e-posse
persoonlike onderhoude, maar hulle kan 'n hoë missyfer hê
reaksie as gevolg van die onbeskikbaarheid van sommige mense (Fowler 1988).
Daarbenewens is telefoononderhoude oor die algemeen beperk tot lyste van
relatief kort vrae (Bainbridge 1989).
Nog 'n swakheid van 'n gepos vraelys is die hoë koers van
gebrek aan reaksie (Fowler 1988, Bainbridge 1989, Neuman
1994). Teenmaatreëls is egter getref deur assosiasie
hierdie studie met 'n betroubare data-instelling
pakhuise (d.w.s. TDWI) (Bainbridge 1989, Neuman 1994), die
wat twee aanmaningsbriewe stuur aan diegene wat nie gereageer het nie
(Fowler 1988, Neuman 1994) en sluit ook 'n brief in
aanvulling wat die doel van die studie verduidelik (Neuman 1994).
3.4.2. Analise eenheid
Die doel van hierdie studie is om die inligting oor
die implementering van datapakhuise en die gebruik daarvan
binne Australiese organisasies. Die teikenbevolking
bestaan ​​uit alle Australiese organisasies wat het
geïmplementeer, of besig is om te implementeer, i data pakhuis. In
individuele organisasies word hieronder genoem. Die vraelys
dit is gepos aan die organisasies wat daarin belangstel om aan te neem
di data pakhuis. Hierdie metode verseker dat die inligting
versamelings kom uit die mees geskikte hulpbronne van elke organisasie
deelnemer.
3.4.3. Opname monster
Die "poslys" van deelnemers aan die opname is verkry uit
TDW uitbreiding. Van hierdie lys, 3000 Australiese organisasies
is gekies as die basis vir steekproefneming. A
aanvullende brief wat die projek en die doel van die ondersoek verduidelik,
saam met 'n antwoordkaart en 'n voorafbetaalde koevert vir
die voltooide vraelys is aan die steekproef gestuur.
Van die 3000 198 organisasies het XNUMX ingestem om deel te neem
studeer. So 'n klein aantal antwoorde is verwag Dato il
groot aantal Australiese organisasies wat hulle toe gehad het
die datumstrategie omhels of was omhels
pakhuise binne hul organisasies. Sodat die
Die teikenpopulasie vir hierdie studie bestaan ​​uit slegs 198
organisasies.
3.4.4. Inhoud van die vraelys
Die vraelysstruktuur was gebaseer op die datummodel
pakhuis Monash (vroeër in deel 2.3 bespreek). Die
vraelysinhoud is gebaseer op die ontleding van
literatuur aangebied in hoofstuk 2. 'n Afskrif van die vraelys
gepos aan opname deelnemers gevind kan word
in Bylaag B. Die vraelys bestaan ​​uit ses afdelings, wat
volg die fases van die behandelde model. Die volgende ses paragrawe
som die inhoud van elke afdeling kortliks op.
Afdeling A: Basiese inligting oor die organisasie
Hierdie afdeling bevat vrae wat verband hou met die profiel van
deelnemende organisasies. Boonop is sommige van die vrae
wat verband hou met die toestand van die datapakhuisprojek
deelnemer. Vertroulike inligting soos naam
van die organisasie is nie in die opname-ontleding bekend gemaak nie.
Afdeling B: Begin
Die vrae in hierdie afdeling hou verband met om te begin
data pakhuis. Vrae is gevra vir hoeveel
dit gaan oor projekinisieerders, borge, vaardighede en kennis
versoeke, datapakhuisontwikkelingsdoelwitte, en
eindgebruiker se verwagtinge.
Afdeling C: Ontwerp
Hierdie afdeling bevat vrae wat verband hou met die aktiwiteite van
beplanning van data pakhuis. Spesifiek, die vrae is
meld oor die omvang van uitvoering, die duur van die projek, die koste
van die projek en die koste/voordeel-ontleding.
Afdeling D: Ontwikkeling
In die ontwikkelingsafdeling is daar vrae wat verband hou met die aktiwiteite van
ontwikkeling van data pakhuis: versameling van gebruikersvereistes
finaal, die bronne van data wat, die logiese model van data wat, prototipes, die
kapasiteitsbeplanning, tegniese argitekture en seleksie van
data pakhuis ontwikkeling gereedskap.
Afdeling E: Werking
Operasionele vrae wat verband hou met operasie ed
tot die uitbreidbaarheid van data pakhuis, soos dit ontwikkel in
volgende fase van ontwikkeling. Daar data kwaliteit, die strategieë van
verfris van die data wat, die korreligheid van data watdata skaalbaarheid
pakhuis en die sekuriteitsprobleme van die data pakhuis hulle was tussen
die tipe vrae wat gevra word.
Afdeling F: Ontwikkeling
Hierdie afdeling bevat vrae wat verband hou met die gebruik van die data
pakhuis deur eindgebruikers. Die navorser was geïnteresseerd
vir die doel en nut van die data pakhuis, hersiening en strategieë
van opleiding wat aangeneem is en die beheerstrategie van die data
pakhuis aangeneem.
3.4.5. Reaksietempo
Alhoewel e-pos opnames gekritiseer word vir die feit dat 'n koers van
lae reaksie, maatreëls is getref om die te verhoog
opbrengskoers (soos vroeër gedeeltelik bespreek is
3.4.1). Die term 'responskoers' verwys na die persentasie van
mense in 'n spesifieke opname steekproef wat gereageer het
vraelys (Denscombe 1998). Die volgende is gebruik
formule om die responskoers vir hierdie studie te bereken:
Aantal mense wat gereageer het
Responskoers =
——————————————————————————– X 100
Totale aantal vraelyste gestuur
3.4.6. Toetsvlieënier
Voordat die vraelys na die steekproef gestuur word, is die vrae
is ondersoek deur die loodstoetse uit te voer, soos deur Luck voorgestel
en Rubin (1987), Jackson (1988) en de Vaus (1991). Die doel van
loodstoetse is om alle ongemaklike, dubbelsinnige en uitdrukkings te openbaar
vrae moeilik om te interpreteer, om enige te verduidelik
definisies en terme wat gebruik word en om die benaderde tyd te identifiseer
vereis om die vraelys te voltooi (Warwick en Lininger 1975,
Jackson 1988, Salant en Dilman 1994). Die loodsproewe was
uitgevoer deur vakke te selekteer met eienskappe soortgelyk aan dié
van die finale vakke, soos voorgestel deur Davis e Cosenza (1993). in
hierdie studie, ses data pakhuise professionele was
as die loodsvakke gekies. Na elke loodstoets is hulle
nodige regstellings gemaak is. Uit die loodstoetse wat uitgevoer is, i
deelnemers het gehelp om die te hervorm en te herstel
finale weergawe van die vraelys.
3.4.7. Metodes van ontleding van Dati
I data wat opname data ingesamel uit geslote vraelyste is
is ontleed met behulp van 'n statistiese sagtewarepakket
na verwys as SPSS. Baie van die antwoorde is ontleed
gebruik van beskrywende statistieke. 'n Aantal vraelyste
hulle het onvolledig teruggekeer. Dié is met ouderling behandel
aandag om seker te maak i data wat vermis was nie een nie
gevolg van data-invoerfoute, maar hoekom nie vrae nie
was geskik vir verklaarder, of verklaarder het besluit nie
beantwoord een of meer spesifieke vrae. Hierdie antwoorde
ontbrekende is geïgnoreer tydens die ontleed van die data wat en was
gekodeer as '-9' om hul uitsluiting van die proses te verseker
ontledings.
By die voorbereiding van die vraelys was geslote vrae
voorafgekodeer deur 'n nommer aan elke opsie toe te ken. Die aantal
dan is dit gebruik om i data wat tydens die ontleding
(Denscombe 1998, Sapsford en Jupp 1996). Daar was byvoorbeeld
ses opsies gelys in vraag 1 van afdeling B: advies
direktoraat, senior bestuurder, IT-afdeling, eenheid
besigheid, konsultante en meer. In die lêer van data wat van SPSS, dit is
'n veranderlike is gegenereer om 'projek inisieerder' aan te dui,
met ses waardeetikette: '1' vir 'bord', '2'
vir 'senior executive' ensovoorts. Die gebruik van die Likertin-skaal
in sommige van die geslote vrae het dit ook toestemming
'n identifikasie wat geen moeite verg gegewe die gebruik van waardes nie
ooreenstemmende nommers wat in SPSS ingevoer is. Vir vrae met die
nie-uitputtende antwoorde, wat mekaar nie uitsluit nie,
elke opsie is as 'n enkele veranderlike met twee behandel
waarde-etikette: '1 ' vir 'gemerk' en '2 ' vir 'ongemerk'.
Oop-einde vrae is anders as vrae behandel
gesluit. Die antwoorde op hierdie vrae is nie geplaas nie
SPSS. In plaas daarvan is hulle met die hand ontleed. Die gebruik hiervan
vraagtipe laat jou toe om inligting oor die idees te bekom
vrylik uitgedruk en die persoonlike ervarings van die geregistreerde
(Bainbridge 1989, Denscombe 1998). Waar moontlik is dit gedoen
'n kategorisering van antwoorde.
Vir die ontleding van data wat, metodes van eenvoudige statistiese analise word gebruik,
soos frekwensie van reaksies, gemiddelde, standaardafwyking
gemiddelde en die mediaan (Argyrous 1996, Denscombe 1998).
Die Gamma-toets was effektief vir die verkryging van kwantitatiewe metings
van die assosiasies tussen data wat ordinale (Norusis 1983, Argyrous 1996).
Hierdie toetse was gepas omdat die ordinale skale wat gebruik is nie
hulle het baie kategorieë gehad en kon in 'n tabel getoon word
(Norusis 1983).
3.5 Opsomming
In hierdie hoofstuk word die navorsingsmetodologie en die
ontwerpe wat vir hierdie studie aangeneem is.
Kies die mees geskikte soekmetode vir 'n
spesifieke studie in ag neem
oorweeg 'n aantal reëls, insluitend aard en tipe
van navorsing, sowel as die meriete en swakpunte van elke moontlike
metode (Jenkins 1985, Benbasat et al. 1097, Galliers en Land 1987,
yin 1989, Hamilton en ives 1992, Galliers 1992, neuman 1994). Beskou
die gebrek aan bestaande kennis en teorie daaroor
van data pakhuis aanneming in Australië, hierdie studie deur
navorsing vereis 'n interpretatiewe navorsingsmetode met 'n vaardigheid
verkennend om die ervarings van organisasies te verken
Australiese. Jou soekmetode is gekies vir
versamel inligting oor die aanvaarding van die datumkonsep
pakhuise deur Australiese organisasies. A
posvraelys is as die insamelingstegniek gekies data wat. Die
regverdigings vir die navorsingsmetode en versamelingstegniek data wat
keuses sal in hierdie hoofstuk verskaf word. Plus dit was
'n bespreking oor die ontledingseenheid, die steekproef, aangebied
gebruik, die responskoerse, die inhoud van die vraelys, die
voortoets van die vraelys en die metode van ontleding van data wat.

Ontwerp van 'n Datastoor:
Die kombinasie van entiteitsverhoudings en dimensionele modellering
OPSOMMING
Stoor i data wat dit is 'n belangrike aktuele kwessie vir baie
organisasies. 'n Sleutelprobleem in ontwikkeling
van die berging van data wat dit is sy ontwerp.
Die ontwerp moet die opsporing van konsepte in die data ondersteun
pakhuis na legacy stelsel en ander bronne van data wat en ook een
maklike begrip en doeltreffende implementering van data
pakhuis.
Baie van die literatuur oor berging van data wat aanbeveel
die gebruik van entiteitsverhoudingsmodellering of dimensionele modellering vir
verteenwoordig die ontwerp van data pakhuis.
In hierdie joernaal wys ons hoe beide
voorstellings gekombineer kan word in 'n benadering vir die
tekening van data pakhuis. Die benadering wat gebruik word, is sistematies
in 'n gevallestudie ondersoek en word in 'n aantal geïdentifiseer
belangrike implikasies met professionele persone.
DATA PAGHUIS
Un data pakhuis word gewoonlik gedefinieer as 'n "vakgeoriënteerde,
geïntegreerde, tydveranderlike en nie-vlugtige versameling van data ter ondersteuning
van bestuur se besluite” (Inmon en Hackathorn, 1994).
Vakgerig en geïntegreerd dui daarop dat die data pakhuis è
ontwerp om die funksionele grense van nalatenskapstelsels oor te steek vir
bied 'n geïntegreerde perspektief van data wat.
Tydvariant is gemoeid met die historiese of tydreeksaard van video data wat in
un data pakhuis, wat dit moontlik maak om tendense te ontleed.
Nie-vlugtig dui aan dat die data pakhuis dit is nie voortdurend nie
opgedateer as 'n databasis van OLTP. Dit word eerder opgedateer
periodiek, met data wat van interne en eksterne bronne. Die
data pakhuis dit is spesifiek ontwerp vir navorsing
eerder as vir opdateringsintegriteit en werkverrigting
bedrywighede.
Die idee om i data wat dit is nie nuut nie, dit was een van die doeleindes
van bestuur van data wat sedert die sestigerjare (Il Martin, 1982).
I data pakhuis hulle bied die infrastruktuur aan data wat vir bestuur
ondersteuningstelsels. Bestuursondersteuningstelsels sluit besluite in
ondersteuningstelsels (DSS) en uitvoerende inligtingstelsels (EIS).
'n DSS is 'n rekenaargebaseerde inligtingstelsel
ontwerp om die proses te verbeter en gevolglik die greep van
menslike besluit. 'n EIS is tipies 'n afleweringstelsel
data wat wat sakebestuurders in staat stel om maklik toegang tot die uitsig te verkry
van data wat.
Die algemene argitektuur van 'n data pakhuis beklemtoon die rol van
data pakhuis in bestuursondersteuning. Benewens die aanbied
die infrastruktuur data wat vir EIS en DSS, al data pakhuis is moontlik
toegang daartoe direk deur navrae. DIE data wat by 'n datum ingesluit
pakhuis is gebaseer op 'n ontleding van die inligting vereistes van
bestuur en word verkry uit drie bronne: interne nalatenskapstelsels,
spesiale doel datavasleggingstelsels en eksterne databronne. DIE
data wat in interne nalatenskapstelsels is dikwels oorbodig,
dun, lae gehalte, en gestoor in verskeie formate
dus moet hulle versoen en skoongemaak word voordat jy hulle in die kan laai
data pakhuis (Inmon, 1992; McFadden, 1996). DIE data wat van
vanaf stoorstelsels data wat ad hoc en uit bronne data wat
ekstern word dikwels gebruik om aan te vul (opdateer, vervang) i
data wat van nalatenskapstelsels.
Daar is baie dwingende redes om 'n data pakhuis,
wat beter besluitneming deur gebruik insluit
effektiewe meer inligting (Ives 1995), ondersteuning vir 'n fokus
op die volledige besigheid (Graham 1996), en die vermindering in koste van
voorsiening van data wat vir EIS en DSS (Graham 1996, McFadden
1996).
'n Onlangse empiriese studie het gemiddeld 'n opbrengs van
beleggings vir i data pakhuis met 401% na drie jaar (Graham,
1996). Die ander empiriese studies van data pakhuis het
beduidende probleme gevind, insluitend probleme met die meting van ed
voordele toeken, gebrek aan duidelike doel, onderskat dit
omvang en kompleksiteit van die proses van berging i data wat, in
veral met betrekking tot die bronne en netheid van die data wat.
Stoor i data wat kan as 'n oplossing beskou word
tot die bestuursprobleem data wat tussen organisasies. Daar
manipulasie van data wat as 'n sosiale hulpbron het dit een van die gebly
sleutelprobleme in die bestuur van inligtingstelsels regdeur die
wêreld vir baie jare (Brancheau et al. 1996, Galliers et al. 1994,
Niederman et al. 1990, Pervan 1993).
'n Gewilde benadering tot batebestuur data wat dit was in die tagtigerjare
die ontwikkeling van 'n model data wat sosiale. Model data wat sosiaal was dit
ontwerp om 'n stabiele basis vir die ontwikkeling van nuwe stelsels te bied
toepassings en databasis en nalatenskapherbou en integrasie
stelsels (Brancheau et al.
1989, Goodhue et al. 1988:1992, Kim en Everest 1994).
Daar is egter baie probleme met hierdie benadering, in
veral die kompleksiteit en koste van elke taak, en die lang tyd
vereis om tasbare resultate te hê (Beynon-Davies 1994, Earl
1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997).
Il data pakhuis dit is 'n aparte databasis wat saam met die nalatenskap bestaan
databasisse eerder as om dit te vervang. Dit laat jou dus toe
rig die bestuur van data wat en vermy duur rekonstruksie
van nalatenskapstelsels.
BESTAANDE BENADERINGS TOT DATA-ONTWERP
WAREHOUSE
Die proses van bou en vervolmaak van 'n data pakhuis
moet meer verstaan ​​word as 'n evolusionêre proses eerder as 'n
tradisionele stelselontwikkeling lewensiklus (Begeerte, 1995, Shanks,
O'Donnell en Arnott 1997a). Daar is baie prosesse betrokke by a
projek van data pakhuis soos inisialisering, skedulering;
inligting verkry uit die vereistes wat van maatskappybestuurders aangevra word;
bronne, transformasies, skoonmaak van data wat en sinkroniseer vanaf nalatenskap
stelsels en ander bronne van data wat; afleweringstelsels onder ontwikkeling;
monitering van data pakhuis; en sinneloosheid van die proses
evolusionêre en konstruksie van 'n data pakhuis (Shinks, O'Donnell
en Arnott 1997b). In hierdie joernaal fokus ons op hoe
teken i data wat in die konteks van hierdie ander prosesse gestoor word.
Daar is 'n aantal voorgestelde benaderings tot data-argitektuur
pakhuis in die literatuur (Inmon 1994, Ives 1995, Kimball 1994
McFadden 1996). Elkeen van hierdie metodologieë het 'n opdrag
hersien met 'n ontleding van hul sterk- en swakpunte.
Inmon (1994) se Benadering vir Datastoor
ontwerp
Inmon (1994) het vier iteratiewe stappe voorgestel om 'n data te ontwerp
pakhuis (sien Figuur 2). Die eerste stap is om 'n sjabloon te ontwerp
data wat sosiaal om te verstaan ​​hoe ek data wat geïntegreer kan word
oor funksionele areas binne 'n organisasie
onderverdeling i data wat stoor in areas. Model data wat dit is gemaak vir
om te stoor data wat met betrekking tot besluitneming, insluitend data wat
histories, en ingesluit data wat afgetrek en saamgevoeg. Die tweede stap is
identifiseer vakgebiede vir implementering. Hierdie is gebaseer
oor prioriteite wat deur 'n bepaalde organisasie bepaal word. Die derde
stap behels die teken van a databasis vir die vakgebied, inhou
spesiale aandag om toepaslike vlakke van granulariteit in te sluit.
Inmon beveel aan om die entiteit- en verhoudingsmodel te gebruik. Vierde
stap is om bronstelsels te identifiseer data wat vereis en ontwikkel
transformasieprosesse om vas te lê, skoon te maak en te formateer i data wat.
Die sterk punte van Inmon se benadering is dat die model data wat sosiale
bied die basis vir die integrasie van data wat binne die organisasie
en beplanning van ondersteunings vir die iteratiewe ontwikkeling van data
pakhuis. Die gebreke daarvan is die moeilikheid en koste van teken
die model data wat sosiaal, die moeilikheid om entiteitsmodelle te verstaan ​​e
verhoudings wat in beide modelle gebruik word, dat data wat sosiale en dié van data wat
geberg deur vakgebied, en die toepaslikheid van die data wat del
tekening van data pakhuis vir die maak van databasis
relasioneel maar nie vir databasis multidimensioneel.
Ives (1995) se Benadering tot Datastoor
ontwerp
Ives (1995) stel 'n vier-stap benadering tot die ontwerp van 'n
inligtingstelsel wat hy van toepassing ag op die ontwerp van 'n datum
pakhuis (sien Figuur 3). Die benadering is baie gebaseer op
Inligtingsingenieurswese vir die ontwikkeling van inligtingstelsels
(Martin 1990). Die eerste stap is om die doelwitte, die faktore te bepaal
suksesverhale en sleutelprestasie-aanwysers. DIE
sleutel besigheidsprosesse en die nodige inligting is
gemodelleer om ons na 'n model te lei data wat sosiale. Die tweede stap
dit behels die ontwikkeling van 'n argitektuur wat definieer data wat
geberg volgens area, databasis di data pakhuis, die komponente
van tegnologie wat benodig word, die stel organisatoriese ondersteuning
vereis om te implementeer en mee te werk data pakhuis. Die derde
stap sluit die keuse van vereiste sagtewarepakkette en gereedskap in.
Die vierde stap is die gedetailleerde ontwerp en konstruksie van die
data pakhuis. Ives merk op dat winkel data wat hy is 'n band
iteratiewe proses.
Die sterkpunt van Ives se benadering is die gebruik van tegniese spesifikasies vir
bepaal inligting vereistes, die gebruik van 'n gestruktureerde
proses om die integrasie van te ondersteun data pakhuis,
die toepaslike hardeware en sagteware seleksie, en die gebruik van veelvuldige
voorstellingstegnieke vir data pakhuis. Sy gebreke
hulle is inherent aan kompleksiteit. Ander sluit probleme in
ontwikkel baie vlakke van databasis all'interno del data pakhuis in
redelike tyd en koste.
Kimball (1994) se benadering tot Datastoor
ontwerp
Kimball (1994) het vyf iteratiewe stappe voorgestel vir die ontwerp van 'n data
pakhuis (sien Figuur 4). Sy benadering is veral
toegewy aan die tekening van slegs een data pakhuis en die gebruik van sjablone
dimensioneel bo entiteit- en verhoudingsmodelle. Kimball
analiseer daardie dimensionele modelle omdat dit makliker is om te verstaan ​​vir i
sakebestuurders, is meer doeltreffend wanneer hulle handel
komplekse konsultasies, en die ontwerp van databasis fisies is meer
doeltreffend (Kimball 1994). Kimball erken dat die ontwikkeling van 'n
data pakhuis is iteratief, en dit data pakhuis aparte blikkie
geïntegreer word deur die verdeling in afmetingstabelle
algemene.
Die eerste stap is om die spesifieke vakgebied te identifiseer
vervolmaak. Die tweede en derde stappe handel oor vorming
dimensioneel. In die tweede stap identifiseer die maatreëls dinge van
belangstelling in die vakgebied en gegroepeer in 'n feitetabel.
Byvoorbeeld, in 'n vakgebied van verkope, die maatstawwe van belang
hulle kan die hoeveelheid items verkoop en die dollar insluit
as 'n verkoopsgeldeenheid. Die derde stap behels die identifisering van die
dimensies wat die maniere is waarop i gegroepeer kan word
feite. In 'n verkoopsvakgebied, relevante dimensies
kan item, ligging en tydperk insluit. Daar
feitetabel het 'n meervoudige sleutel om aan elkeen te koppel
van dimensietabelle en bevat tipies 'n baie groot aantal
groot op feite. Daarteenoor bevat dimensietabelle
beskrywende inligting oor die grootte en ander eienskappe wat
kan gebruik word om feite te groepeer. Die feitetabel e
afmetings wat verband hou met voorstel vorm wat een genoem word
sterpatroon as gevolg van sy vorm. Die vierde stap behels
die konstruksie van 'n databasis multidimensioneel om dit te vervolmaak
ster patroon. Die laaste stap is om bronstelsels te identifiseer data wat
vereis en ontwikkel transformasieprosesse om te verkry, skoon te maak
en formaat i data wat.
Sterkpunte van Kimball se benadering sluit die gebruik van sjablone in
dimensioneel om i data wat gestoor wat dit maak
maklik om te verstaan ​​en lei tot doeltreffende fisiese ontwerp. A
dimensionele model wat ook albei geredelik gebruik
stelsels van databasis relasionele kan vervolmaak word of sisteme
databasis multidimensioneel. Die gebreke daarvan sluit gebrek in
van sommige tegnieke om die beplanning of integrasie van te fasiliteer
baie sterskemas binne een data pakhuis en
moeilikheid om te ontwerp vanaf die uiterste gedenormaliseerde struktuur in a
dimensionele model a data wat in nalatenskapstelsels.
McFadden (1996) se benadering tot data
Pakhuisontwerp
McFadden (1996) stel 'n vyf-stap benadering tot
teken a data pakhuis (sien Figuur 5).
Sy benadering is gebaseer op 'n sintese van idees uit die literatuur
en is daarop gefokus om 'n solo te teken data pakhuis. Die eerste
stap behels 'n vereistesontleding. Alhoewel die besonderhede
tegnieke word nie voorgeskryf nie, McFadden se notas identifiseer die
entiteit data wat spesifikasies en hul eienskappe, en verwys na Watson-lesers
en Frolick (1993) vir die vaslegging van die vereistes.
In die tweede stap word 'n entiteitsverhoudingsmodel geteken
data pakhuis en dan deur maatskappybestuurders bekragtig. Die derde
stap sluit in die bepaling van kartering vanaf nalatenskapstelsel
en eksterne bronne van data pakhuis. Die vierde stap behels
prosesse in ontwikkeling, ontplooiing en sinchronisasie van data wat in
data pakhuis. In die laaste stap is die aflewering van die stelsel
ontwikkel met die klem op 'n gebruikerskoppelvlak.
McFadden wys daarop dat die tekenproses algemeen is
iteratief.
Die sterk punte van McFadden se benadering dui op deelname
deur sakebestuurders in die bepaling van vereistes en ook
die belangrikheid van hulpbronne data wathul skoonmaak en versameling. Sy
kinks hou verband met die gebrek aan 'n proses vir onderverdeling van a
groot projek van data pakhuis in baie geïntegreerde stadiums, en daar
probleme om die entiteit en verhoudingsmodelle te verstaan ​​wat gebruik word in die ontwerp van
data pakhuis.

    0/5 (0 resensies)
    0/5 (0 resensies)
    0/5 (0 resensies)

    Kom meer te wete by Online Web Agency

    Teken in om die nuutste artikels per e-pos te ontvang.

    skrywer avatar
    admin Uitvoerende hoof
    👍Aanlyn Webagentskap | Webagentskap-deskundige in digitale bemarking en SEO. Web Agency Online is 'n Web Agency. Vir Agenzia Web Aanlyn sukses in digitale transformasie is gebaseer op die fondamente van Iron SEO weergawe 3. Spesialiteite: Stelselintegrasie, Ondernemingstoepassingsintegrasie, Diensgeoriënteerde argitektuur, Wolkrekenaars, Datapakhuis, besigheidsintelligensie, Groot Data, portale, intranette, Webtoepassing Ontwerp en bestuur van relasionele en multidimensionele databasisse Ontwerp van koppelvlakke vir digitale media: bruikbaarheid en grafika. Online Web Agency bied maatskappye die volgende dienste: -SEO op Google, Amazon, Bing, Yandex; -Web Analytics: Google Analytics, Google Tag Manager, Yandex Metrica; -Gebruikeromskakelings: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM op Google, Bing, Amazon-advertensies; -Bemarking op sosiale media (Facebook, Linkedin, Youtube, Instagram).
    My Agile Privaatheid
    Hierdie webwerf gebruik tegniese en profielkoekies. Deur op aanvaar te klik, magtig jy alle profielkoekies. Deur op verwerp of die X te klik, word alle profielkoekies verwerp. Deur op pasmaak te klik, is dit moontlik om te kies watter profielkoekies om te aktiveer.
    Hierdie webwerf voldoen aan die Wet op Databeskerming (LPD), Switserse Federale Wet van 25 September 2020, en die GDPR, EU-regulasie 2016/679, met betrekking tot die beskerming van persoonlike data sowel as die vrye beweging van sulke data.