fbpx

Datapakhuis en Ondernemingshulpbronbeplanning | DWH en ERP

ARGIEF DATA SENTRAAL: GESKIEDENIS RED EVOLUSIES

Die twee dominante temas van korporatiewe tegnologie in die 90's was i data pakhuis en ERP. Hierdie twee kragtige strome is vir 'n lang tyd deel van korporatiewe IT sonder om ooit kruisings te hê. Dit was amper asof hulle materie en anti-materie was. Maar die groei van beide verskynsels het onvermydelik gelei tot hul kruising. Vandag staar maatskappye die probleem in die gesig van wat om te doen met ERP en data pakhuis. Hierdie artikel sal uiteensit wat die probleme is en hoe maatskappye dit aanspreek.

AAN DIE BEGIN…

In die begin was daar die data pakhuis. Datastoor is geskep om die transaksieverwerking-toepassingstelsel teë te werk. In die vroeë dae die memorisering van data wat dit was bedoel om net 'n kontrapunt te wees vir transaksieverwerkingsaansoeke. Maar deesdae is daar baie meer gesofistikeerde sienings van wat a data pakhuis. In vandag se wêreld die data pakhuis dit word in 'n struktuur ingevoeg wat Corporate Information Factory genoem kan word.

DIE KORPORATIEWE INLIGTING FABRIEK (CIF)

Die Korporatiewe Inligtingsfabriek het standaard argitektoniese komponente: 'n vlak van transformasie en kode-integrasie wat die data wat terwyl ek data wat hulle beweeg van die toepassingsomgewing na die omgewing van data pakhuis van die maatskappy; a data pakhuis van die maatskappy waar i data wat gedetailleerde en geïntegreerde geskiedenisse. Die data pakhuis van die maatskappy dien as die grondslag waarop alle ander dele van die omgewing gebou kan word data pakhuis; 'n operasionele datastoor (ODS). 'n ODS is 'n hibriede struktuur wat sommige aspekte van die data pakhuis en ander aspekte van 'n OLTP-omgewing; data marts, waar verskillende departemente hul eie weergawe van die data pakhuis; a data pakhuis van eksplorasie waarin die maatskappy se “filosowe” hul navrae vir 72 uur kan indien sonder nadelige uitwerking op die data pakhuis; en 'n nabylyn geheue, waarin data wat oud en data wat grootmaat detail kan goedkoop gestoor word.

WAAR ERP KOMBINEER MET DIE KORPORATIEWE INLIGTING FABRIEK

Die ERP smelt op twee plekke met die Corporate Information Factory saam. Eerstens as 'n basiese toepassing (basislyn) wat i data wat van die aansoek aan data pakhuis. In hierdie geval i data wat, gegenereer as 'n neweproduk van 'n transaksieproses, word geïntegreer en gelaai in die data pakhuis van die maatskappy. Die tweede punt van unie tussen ERP en CIF en ODS. Trouens, in baie omgewings word ERP as 'n klassieke ODS gebruik.

Indien ERP as die basiese toepassing gebruik word, kan dieselfde ERP ook in die CIF as ODS gebruik word. In elk geval, as ERP in beide rolle gebruik gaan word, moet daar 'n duidelike onderskeid tussen die twee entiteite wees. Met ander woorde, wanneer die ERP die rol van 'n kerntoepassing en 'n ODS speel, moet die twee argitektoniese entiteite onderskei word. As 'n enkele ERP-implementering albei rolle gelyktydig probeer verrig, sal daar onvermydelik probleme wees in die ontwerp en implementering van daardie struktuur.

APARTE ODS EN BASIESE TOEPASSINGS

Daar is baie redes wat lei tot die verdeling van argitektoniese komponente. Miskien is die mees sprekende kwessie vir die skeiding van die verskillende komponente van 'n argitektuur dat elke komponent van die argitektuur sy eie siening het. Die basislyntoepassing dien 'n ander doel as die ODS. Probeer om te oorvleuel

'n basislyntoepassingsbeskouing oor die wêreld van 'n ODS of omgekeerd is nie 'n regte manier om te werk nie.

Gevolglik is die eerste probleem van 'n ERP in die CIF om te verifieer of daar 'n onderskeid is tussen die basislyntoepassings en die ODS.

DATAMODELLE IN DIE KORPORATIEWE INLIGTINGSFABRIEK

Om samehang tussen die verskillende komponente van die CIF-argitektuur te verkry, moet daar 'n model wees van data wat. Die modelle van data wat hulle dien as 'n skakel tussen die verskillende komponente van die argitektuur soos die basislyntoepassings en die ODS. Die modelle van data wat hulle word die "intellektuele padkaart" om die regte betekenis uit die verskillende argitektoniese komponente van die CIF te kry.

Hand aan hand met hierdie idee, is die idee dat daar een groot en enkele model van moet wees data wat. Natuurlik moet daar 'n model wees van data wat vir elk van die komponente en ook moet daar 'n sinvolle pad wees wat die verskillende modelle verbind. Elke komponent van die argitektuur – ODS, basislyntoepassings, data pakhuis van die maatskappy, ensovoorts.. – het sy eie model nodig data wat. En dus moet daar 'n presiese definisie wees van hoe hierdie modelle data wat hulle skakel met mekaar.

BEWEEG I DATA VAN DIE ERP DATUM WAREHOUSE

As die oorsprong van die data wat is 'n basislyntoepassing en/of 'n ODS, wanneer die ERP die data wat in data pakhuis, moet hierdie invoeging op die laagste vlak van "granulariteit" plaasvind. Som eenvoudig op of versamel i data wat aangesien hulle uit die ERP-basislyntoepassing of ERP ODS kom, is nie die regte ding om te doen nie. DIE data wat besonderhede word benodig in data pakhuis om die basis van die DSS-proses te vorm. Sulke data wat sal op baie maniere hervorm word deur datamars en verkennings van data pakhuis.

Die verplasing van data wat van die ERP-basislyntoepassingsomgewing na die data pakhuis van die maatskappy op 'n redelike ontspanne wyse gedoen word. Hierdie skuif vind plaas ongeveer 24 uur na die opdatering of skepping in die ERP. Die feit van 'n "lui" beweging van data wat in data pakhuis van die maatskappy laat die data wat kom van die ERP na "deposito". Sodra ek data wat word in die basislyntoepassing gestoor, dan kan u die veilig beweeg data wat van ERP in die onderneming. Nog 'n doel bereikbaar danksy die "lui" beweging van die data wat dit is die duidelike afbakening tussen operasionele prosesse en DSS. Met 'n "vinnige" beweging van die data wat die skeidslyn tussen DSS en operasioneel bly vaag.

Die beweging van data wat van die ODS van die ERP na data pakhuis van die maatskappy word periodiek gedoen, gewoonlik weekliks of maandeliks. In hierdie geval die beweging van data wat dit is gebaseer op die behoefte om die oues te “skoonmaak”. data wat historici. Natuurlik bevat die ODS i data wat wat baie meer onlangs is as die data wat historici gevind in data pakhuis.

Die verplasing van data wat in data pakhuis dit word byna nooit "groothandel" (op 'n groothandelaar manier) gedoen nie. Kopieer 'n tabel van die ERP-omgewing na data pakhuis dit maak nie sin nie. 'n Veel meer realistiese benadering is om geselekteerde eenhede van die te skuif data wat. Slegs die data wat wat verander het sedert die laaste opdatering van data pakhuis dit is hulle wat in die verskuif moet word data pakhuis. Een manier om te weet watter data wat verander het sedert die laaste opdatering is om te kyk na die tydstempels van die data wat gevind in die ERP-omgewing. Die ontwerper kies al die veranderinge wat plaasgevind het sedert die laaste opdatering. Nog 'n benadering is om veranderingsvasleggingstegnieke te gebruik data wat. Met hierdie tegnieke word logs en joernaalbande ontleed om te bepaal watter data wat moet van die ERP-omgewing na dié van verskuif word data pakhuis. Hierdie tegnieke is die beste omdat logboeke en joernaalbande van ERP-lêers gelees kan word sonder om ander ERP-bronne verder te beïnvloed.

ANDER KOMPLIKASIES

Een van die ERP-kwessies in CIF is wat gebeur met ander toepassingsbronne of met data wat van die ODS waartoe moet bydra data pakhuis maar hulle is nie deel van die ERP-omgewing nie. Gegewe die geslote aard van ERP, veral SAP, probeer om sleutels te integreer van eksterne bronne van data wat met i data wat wat van die ERP af kom wanneer die skuif data wat in data pakhuis, dis 'n groot uitdaging. En presies wat is die waarskynlikhede dat i data wat van toepassings of ODS buite die ERP-omgewing sal geïntegreer word in die data pakhuis? Die kans is eintlik baie hoog.

VIND DATA HISTORIES UIT ERP

Nog 'n probleem met die data wat van ERP is wat voortspruit uit die behoefte om te hê data wat historiese binne die data pakhuis. Gewoonlik die data pakhuis behoeftes data wat historici. En ERP-tegnologie stoor dit gewoonlik nie data wat histories, ten minste nie tot die punt waar dit nodig is in die data pakhuis. Wanneer 'n groot hoeveelheid van data wat geskiedenis begin optel in die ERP-omgewing, daardie omgewing moet skoongemaak word. Veronderstel byvoorbeeld dat a data pakhuis moet gelaai word met vyf jaar van data wat histories terwyl die ERP 'n maksimum van ses maande hiervan hou data wat. Solank as wat die maatskappy is tevrede met die invordering van 'n reeks van data wat historici soos die tyd verbygaan, dan is daar geen probleem om die ERP as 'n bron vir die te gebruik nie data pakhuis. Maar wanneer die data pakhuis hy moet terug in tyd en gode kry data wat geskiedenisse wat nie voorheen deur die ERP versamel en gestoor is nie, dan word die ERP-omgewing ondoeltreffend.

ERP EN METADATA

Nog 'n oorweging om te maak oor ERP en data pakhuis is die een op die metadata wat in die ERP-omgewing bestaan. Net soos metadata van die ERP-omgewing na die data pakhuis, moet die metadata op dieselfde manier geskuif word. Verder moet die metadata omskep word in die formaat en struktuur wat deur die infrastruktuur vereis word data pakhuis. Daar is 'n groot verskil tussen operasionele metadata en DSS-metadata. Operasionele metadata is hoofsaaklik vir die ontwikkelaar en die

programmeerder. DSS-metadata is hoofsaaklik vir die eindgebruiker. Bestaande metadata in ERP-toepassings of ODS'e moet omgeskakel word, en hierdie omskakeling is nie altyd maklik en eenvoudig nie.

VERSKAF VAN DIE ERP-data

As die ERP gebruik word as 'n verskaffer van data wat vir die data pakhuis daar moet 'n soliede koppelvlak wees wat die beweeg data wat van ERP-omgewing tot omgewing data pakhuis. Die koppelvlak moet:

  • ▪ maklik wees om te gebruik
  • ▪ toegang tot data wat van die ERP
  • ▪ neem die betekenis van data wat wat op die punt staan ​​om geskuif te word na die data pakhuis
  • ▪ ken die ERP-beperkings wat kan ontstaan ​​wanneer toegang tot die data wat van die ERP:
  • ▪ verwysende integriteit
  • ▪ hiërargiese verhoudings
  • ▪ implisiete logiese verbande
  • ▪ toepassingskonvensie
  • ▪ al die strukture van data wat ondersteun deur die ERP, ensovoorts ...
  • ▪ doeltreffend wees in toegang data wat, deur die verskaffing van:
  • ▪ direkte beweging van data wat
  • ▪ verkryging van verandering data wat
  • ▪ ondersteun tydige toegang tot data wat
  • ▪ die formaat van verstaan data wat, en so aan… INTERFACE MET SAP Die koppelvlak kan van twee tipes wees, tuisgemaak of kommersieel. Sommige van die belangrikste handelskoppelvlakke sluit in:
  • ▪ SAS
  • ▪ Prims Solutions
  • ▪ D2k, ensovoorts... VEELVOUDIGE ERP-TEGNOLOGIEë Om die ERP-omgewing te hanteer asof dit 'n enkele tegnologie is, is 'n groot fout. Daar is baie ERP-tegnologieë, elk met sy eie sterkpunte. Die bekendste verkopers in die mark is:
  • ▪ SAP
  • ▪ Oracle Financials
  • ▪ PeopleSoft
  • ▪ JD Edwards
  • ▪ Baan SAP SAP is die grootste en mees volledige ERP-sagteware. SAP-toepassings sluit baie soorte toepassings op baie gebiede in. SAP het 'n reputasie om:
  • ▪ baie groot
  • ▪ baie moeilik en duur om te implementeer
  • ▪ benodig baie mense en konsultante om geïmplementeer te word
  • ▪ vereis gespesialiseerde mense vir implementering
  • ▪ neem 'n lang tyd om te implementeer Verder het SAP 'n reputasie om dit te memoriseer data wat baie versigtig, wat dit moeilik maak vir iemand buite die SAP-gebied om toegang daartoe te verkry. SAP se sterkpunt is dat dit in staat is om 'n groot hoeveelheid van te vang en te berg data wat. SAP het onlangs sy voorneme aangekondig om sy aansoeke uit te brei na data pakhuis. Daar is baie voor- en nadele daaraan verbonde om SAP as 'n verkoper te gebruik data pakhuis. 'n Voordeel is dat SAP reeds geïnstalleer is en dat meeste konsultante reeds SAP ken.
    Die nadele van SAP as 'n verskaffer van data pakhuis daar is baie: SAP het geen ondervinding in die wêreld van data pakhuis As SAP die verskaffer is van data pakhuis, is dit nodig om "uit te haal" i data wat van SAP al data pakhuis. Dato 'n SAP se rekord van geslote stelsel, is dit onwaarskynlik dat dit maklik sal wees om i vanaf SAP daarin te kry (???). Daar is baie verouderde omgewings wat SAP aandryf, soos IMS, VSAM, ADABAS, ORACLE, DB2, ensovoorts. SAP dring aan op 'n "nie hier uitgedink"-benadering. SAP wil nie met ander verskaffers saamwerk om die te gebruik of te skep nie data pakhuis. SAP dring daarop aan om al sy sagteware self te genereer.

Alhoewel SAP 'n groot en kragtige maatskappy is, probeer om die tegnologie van ELT, OLAP, stelseladministrasie en selfs die kernkode van dbms dit is net gek. In plaas daarvan om 'n samewerkende houding met verskaffers van data pakhuis SAP het lank reeds die “hulle weet die beste”-benadering gevolg. Hierdie houding hou die sukses terug wat SAP op die gebied van data pakhuis.
SAP se weiering om eksterne verskaffers toe te laat om vinnig en grasieus toegang tot hul data wat. Die kern van die gebruik van 'n data pakhuis is maklike toegang tot data wat. SAP se hele geskiedenis is daarop gebaseer dat dit moeilik is om toegang te verkry data wat.
SAP se gebrek aan ondervinding in die hantering van groot volumes van data wat; in die veld van data pakhuis daar is volumes van data wat nooit deur SAP gesien nie en om hierdie groot hoeveelhede van te bestuur data wat jy moet geskikte tegnologie hê. SAP is blykbaar nie bewus van hierdie tegnologiese hindernis wat bestaan ​​om die veld van te betree nie data pakhuis.
SAP se korporatiewe kultuur: SAP het 'n besigheid gemaak om die data wat vanaf die stelsel. Maar om dit te kan doen, moet jy 'n ander mentaliteit hê. Tradisioneel was sagtewaremaatskappye wat goed was om data in 'n omgewing te kry, nie goed om data anderpad te kry nie. As SAP dit regkry om hierdie tipe oorskakeling te maak, sal dit die eerste maatskappy wees wat dit doen.

Kortom, dit is te betwyfel of 'n maatskappy SAP as sy verskaffer moet kies data pakhuis. Daar is baie ernstige risiko's aan die een kant en baie min belonings aan die ander kant. Maar daar is nog 'n rede wat die keuse van SAP as 'n verskaffer ontmoedig data pakhuis. Want elke maatskappy behoort dieselfde te hê data pakhuis van al die ander maatskappye? Die data pakhuis dit is die hart van mededingende voordeel. As elke maatskappy dieselfde aangeneem het data pakhuis dit sou moeilik wees, hoewel nie onmoontlik nie, om 'n mededingende voordeel te behaal. SAP dink blykbaar dat a data pakhuis kan gesien word as 'n koekie en dit is 'n verdere teken van hul "kry die data in" mentaliteit van toepassings.

Geen ander ERP-verskaffer is so dominant soos SAP nie. Daar sal ongetwyfeld maatskappye wees wat SAP se pad vir hulle s'n sal volg data pakhuis maar vermoedelik hierdie data pakhuis SAP sal groot, duur en tydrowend wees om te skep.

Hierdie omgewings sluit aktiwiteite in soos banktellerverwerking, lugrederybesprekingsprosesse, versekeringseiseprosesse, ensovoorts. Hoe beter die transaksiestelsel presteer, hoe duideliker was die behoefte aan skeiding tussen die operasionele proses en die DSS (Decision Support System). Met HR- en personeelstelsels kom jy egter nooit voor groot volumes transaksies te staan ​​nie. En, natuurlik, wanneer 'n persoon gehuur word of die maatskappy verlaat, is dit 'n rekord van 'n transaksie. Maar relatief tot ander stelsels het HR- en personeelstelsels eenvoudig nie baie transaksies nie. Daarom is dit nie heeltemal voor die hand liggend dat daar 'n behoefte aan 'n DataWarehouse is in HR- en personeelstelsels nie. In baie opsigte verteenwoordig hierdie stelsels die samevoeging van DSS-stelsels.

Maar daar is nog 'n faktor wat in ag geneem moet word as jy met datapakhuise en PeopleSoft te doen het. In baie omgewings, i data wat van menslike en persoonlike hulpbronne is sekondêr tot die maatskappy se primêre besigheid. Die meeste maatskappye is betrokke by vervaardiging, verkope, verskaffing van dienste, ensovoorts. Menslike hulpbronne en personeelstelsels is gewoonlik sekondêr tot (of ondersteun) die maatskappy se hoofsake. Daarom is dit dubbelsinnig en ongerieflik data pakhuis apart vir menslike hulpbronne en personeelondersteuning.

PeopleSoft verskil baie van SAP in hierdie opsig. Met SAP is dit verpligtend dat daar 'n data pakhuis. Met PeopleSoft is dit nie so duidelik nie. 'n Datapakhuis is opsioneel met PeopleSoft.

Die beste ding wat gesê kan word vir die data wat PeopleSoft is dat die data pakhuis kan gebruik word om i data wat met betrekking tot ou menslike en persoonlike hulpbronne. 'n Tweede rede waarom 'n maatskappy 'n data pakhuis a

nadeel van die PeopleSoft-omgewing is om toegang en vrye toegang tot analise-instrumente toe te laat, om data wat deur PeopleSoft. Maar buiten hierdie redes kan daar gevalle wees waar dit verkieslik is om nie 'n datapakhuis te hê nie data wat PeopleSoft.

Samevattend

Daar is baie idees oor die konstruksie van 'n data pakhuis binne 'n ERP-sagteware.
Sommige hiervan is:

  • ▪ Dit maak sin om 'n data pakhuis dit is soos enigiets anders in die bedryf?
  • ▪ Hoe buigsaam 'n ERP is data pakhuis sagteware?
  • ▪ 'n ERP data pakhuis sagteware kan 'n volume van hanteer data wat wat geleë is in 'n "data pakhuis arena"?
  • ▪ Wat is die spooraantekening wat die ERP-verskaffer doen in die lig van maklik en goedkoop, in terme van tyd, data wat? (wat is die ERP-verskaffers se rekord van aflewering van goedkoop, betyds, maklik bekombare data?)
  • ▪ Wat is die ERP-verskaffer se begrip van die DSS-argitektuur en korporatiewe inligtingsfabriek?
  • ▪ ERP-verskaffers verstaan ​​hoe om te bereik data wat binne die omgewing, maar ook verstaan ​​hoe om dit uit te voer?
  • ▪ Hoe oop is die ERP-verskaffer vir datapakhuishulpmiddels?
    Al hierdie oorwegings moet gemaak word om te bepaal waar die data pakhuis wat gasheer vir i data wat ERP en ander data wat. Oor die algemeen, tensy daar 'n dwingende rede is om anders te doen, word bou aanbeveel data pakhuis buite die ERP-verskaffer se omgewing. HOOFSTUK 1 Oorsig van die BI-organisasie Sleutelpunte:
    Inligtingsbewaarplekke werk in omgekeerde rigting van besigheidsintelligensie (BI) argitektuur:
    Korporatiewe kultuur en IT kan sukses in die bou van BI-organisasies beperk.

Tegnologie is nie meer die beperkende faktor vir BI-organisasies nie. Die vraag vir argitekte en projekbeplanners is nie of die tegnologie bestaan ​​nie, maar of hulle die beskikbare tegnologie effektief kan implementeer.

Vir baie maatskappye a data pakhuis dit is weinig meer as 'n passiewe deposito wat die versprei data wat aan gebruikers wat dit nodig het. DIE data wat hulle word uit die bronstelsels onttrek en word in teikenstrukture van data pakhuis. Ek data wat hulle kan ook met enige geluk skoongemaak word. Geen bykomende waarde word egter bygevoeg of ingesamel deur data wat tydens hierdie proses.

In wese bied passiewe Dw op sy beste slegs i data wat skoon en operasioneel vir gebruikersverenigings. Inligtingskepping en analitiese begrip is heeltemal aan gebruikers. Beoordeel of die DW (Datastoor) is 'n sukses is subjektief. As ons sukses beoordeel op die vermoë om die doeltreffend te versamel, te integreer en skoon te maak data wat korporatief op 'n voorspelbare basis, dan ja, die DW is 'n sukses. Aan die ander kant, as ons kyk na die versameling, konsolidasie en ontginning van inligting deur die organisasie as geheel, dan is die DW 'n mislukking. 'n DW bied min tot geen inligtingswaarde nie. Gevolglik word gebruikers gedwing om te voldoen en sodoende inligtingsilo's te skep. Hierdie hoofstuk bied 'n omvattende oorsig om die maatskappy se BI (Business Intelligence) argitektuur op te som. Ons begin met 'n beskrywing van BI en beweeg dan na besprekings van inligtingsontwerp en -ontwikkeling, in teenstelling met bloot inligting verskaf. data wat aan gebruikers. Besprekings fokus dan op die berekening van die waarde van jou BI-pogings. Ons sluit af deur te definieer hoe IBM jou organisasie se BI-argitektoniese vereistes aanspreek.

Beskrywing van die argitektuur van organisasie van BI

Kragtige transaksie-georiënteerde inligtingstelsels is nou algemeen in elke groot onderneming, wat die speelveld effektief gelyk maak vir korporasies regoor die wêreld.

Om mededingend te bly, verg egter nou analities-georiënteerde stelsels wat die maatskappy se vermoë om die inligting wat hulle reeds besit, te herontdek en te gebruik, kan rewolusie. Hierdie analitiese sisteme spruit uit die begrip van die rykdom van data wat beskikbaar. BI kan prestasie oor die hele onderneming verbeter. Maatskappye kan kliënt-verskaffer-verhoudings verbeter, die winsgewendheid van produkte en dienste verbeter, nuwe en beter aanbiedinge genereer, risiko beheer en onder vele ander winste uitgawes dramaties besnoei. Met BI begin jou maatskappy uiteindelik klantinligting as 'n mededingende bate gebruik danksy toepassings wat markdoelwitte het.

Om die regte besigheidsinstrumente te hê, beteken om definitiewe antwoorde op sleutelvrae te hê soos:

  • ▪ Watter van ons kliënte laat hulle ons meer verdien, of laat hulle ons geld verloor?
  • ▪ Waar ons beste woon kliënte in verband met winkel/ pakhuis wat hulle gereeld besoek?
  • ▪ Watter van ons produkte en dienste kan die doeltreffendste verkoop word en aan wie?
  • ▪ Watter produkte kan die doeltreffendste verkoop word en aan wie?
  • ▪ Watter verkoopsveldtog is die suksesvolste en hoekom?
  • ▪ Watter verkoopskanale is die effektiefste vir watter produkte?
  • ▪ Hoe ons verhoudings met ons beste mense kan verbeter kliënte? Die meeste maatskappye het data wat rowwe maniere om hierdie vrae te beantwoord.
    Operasionele stelsels genereer groot hoeveelhede produk, kliënt en data wat mark vanaf verkoopspunte, besprekings, kliëntediens en tegniese ondersteuningstelsels. Die uitdaging is om hierdie inligting te onttrek en te ontgin. Baie maatskappye maak net voordeel uit klein fraksies van hulle data wat vir strategiese ontledings.
    I data wat oorblywende, dikwels saamgevoeg met i data wat afgelei van eksterne bronne soos regeringsverslae en ander aangekoopte inligting, is 'n goudmyn wat net wag om verken te word, en data wat hulle moet net verfyn word binne die inligtingkonteks van jou organisasie.

Hierdie kennis kan op verskeie maniere toegepas word, wat wissel van die ontwerp van 'n algehele korporatiewe strategie tot persoonlike kommunikasie met verskaffers, deur inbelsentrums, fakturering, Internet en ander punte. Vandag se besigheidsomgewing bepaal dat DW en verwante BI-oplossings verder ontwikkel as die bestuur van tradisionele besigheidstrukture. data wat wat ek data wat genormaliseer op atoomvlak en "ster/kubusplase".

Wat nodig is om mededingend te bly, is 'n samesmelting van tradisionele en gevorderde tegnologieë in 'n poging om 'n groot analitiese landskap te ondersteun.
Om af te sluit, moet die algemene omgewing die kennis van die maatskappy as geheel verbeter, om te verseker dat die aksies wat geneem word as gevolg van die ontledings wat uitgevoer is, nuttig is sodat almal daarby baat.

Byvoorbeeld, kom ons sê jy rangskik joune kliënte in hoë of lae risiko kategorieë.
As hierdie inligting deur 'n modelonttrekker of ander manier gegenereer word, moet dit in die DW geplaas word en toeganklik gemaak word vir enigiemand, deur middel van enige toegangsinstrument, soos statiese verslae, sigblaaie, tabelle, of aanlyn analitiese verwerking (OLAP) .

Tans bly baie van hierdie tipe inligting egter in silo's data wat van die individue of departemente wat die ontleding genereer. Die organisasie, as geheel, het min tot geen sigbaarheid vir begrip nie. Slegs deur hierdie tipe inligting-inhoud in jou onderneming DW te meng, kan jy inligtingsilo's uitskakel en jou DW-omgewing verhef.
Daar is twee groot struikelblokke vir die ontwikkeling van 'n BI-organisasie.
Eerstens het ons die probleem van die organisasie self en sy dissipline.
Alhoewel ons nie kan help met organisatoriese beleidsveranderinge nie, kan ons help om die komponente van 'n organisasie se BI, sy argitektuur en hoe IBM-tegnologie die ontwikkeling daarvan fasiliteer, te verstaan.
Die tweede hindernis om te oorkom is die gebrek aan geïntegreerde tegnologie en kennis van 'n metode wat die hele BI-ruimte aanspreek, in teenstelling met net 'n klein komponent.

IBM is besig om veranderinge in integrasietegnologie te hanteer. Dit is jou verantwoordelikheid om deurdagte ontwerp te verskaf. Hierdie argitektuur moet ontwikkel word met tegnologie wat gekies is vir onbeperkte integrasie, of ten minste met tegnologie wat aan oop standaarde voldoen. Verder moet jou maatskappybestuur verseker dat die BI-onderneming volgens plan uitgevoer word en nie die ontwikkeling toelaat van inligtingsilo's wat voortspruit uit selfdienende agendas, of doelwitte nie.
Dit is nie te sê dat die BI-omgewing nie sensitief is om op die verskillende behoeftes en vereistes van verskillende gebruikers te reageer nie; in plaas daarvan beteken dit dat die implementering van daardie individuele behoeftes en vereistes tot voordeel van die hele BI-organisasie gedoen word.
'n Beskrywing van die BI-organisasie se argitektuur kan gevind word op bladsy 9 in Figuur 1.1 Die argitektuur demonstreer 'n ryk mengsel van tegnologieë en tegnieke.
Van die tradisionele siening sluit die argitektuur die volgende pakhuiskomponente in

Atoomlaag.

Dit is die grondslag, die hart van die hele DW en dus van strategiese verslagdoening.
I data wat hier gestoor historiese integriteit sal behou, berigte van data wat en sluit afgeleide metrieke in, sowel as om skoongemaak, geïntegreer en gestoor te word deur gebruik te maak van modelonttrekking.
Alle daaropvolgende gebruik van hierdie data wat en verwante inligting word uit hierdie struktuur afgelei. Dit is 'n uitstekende bron vir mynbou data wat en vir verslae met gestruktureerde SQL-navrae

Operasionele deposito van data wat of verslagbasis van data wat(Operasionele datastoor (ODS) of verslagdoening databasis.)

Dit is 'n struktuur van data wat spesifiek ontwerp vir tegniese verslagdoening.

I data wat gestoor en gerapporteer bo hierdie strukture kan uiteindelik voortplant tot in die pakhuis via die opstelarea, waar dit vir strategiese sein gebruik kan word.

Stasie area.

Die eerste stop vir die meeste data wat bedoel vir die pakhuis omgewing is die organisasie sone.
Hier i data wat hulle word geïntegreer, skoongemaak en omskep in data wat winste wat die pakhuisstruktuur sal bevolk

Datum Maart.

Hierdie deel van die argitektuur verteenwoordig die struktuur van data wat spesifiek gebruik vir OLAP. Die teenwoordigheid van datamarts, as i data wat word in die oorvleuelende sterskemas gestoor data wat multidimensioneel in 'n relasionele omgewing, of in die lêers van data wat Vertroulik wat deur spesifieke OLAP-tegnologie gebruik word, soos DB2 OLAP Server, is nie relevant nie.

Die enigste beperking is dat die argitektuur die gebruik van data wat multidimensioneel.
Die argitektuur bevat ook kritiese Bi-tegnologieë en -tegnieke wat uitstaan ​​as:

Ruimtelike analise

Ruimte is 'n inligting meevaller vir die ontleder en is van kritieke belang om die oplossing te voltooi. Ruimte kan inligting verteenwoordig oor die mense wat in 'n sekere plek woon, sowel as inligting oor waar daardie ligging fisies relatief tot die res van die wêreld is.

Om hierdie analise uit te voer, moet jy begin deur jou inligting aan breedte- en lengtegraadkoördinate te koppel. Dit word na verwys as "geokodering" en moet deel wees van die onttrek, transformasie en laai (ETL) proses op die atoomvlak van jou pakhuis.

Data-ontginning.

Die onttrekking van data wat laat ons maatskappye toe om die aantal te groei kliënte, om verkoopsneigings te voorspel en die bestuur van verhoudings met kliënte (CRM), onder andere BI-inisiatiewe.

Die onttrekking van data wat dit moet dus geïntegreer word met die strukture van data wat van die Dwhouse en ondersteun deur pakhuisprosesse om beide die effektiewe en doeltreffende gebruik van die relevante tegnologie en tegnieke te verseker.

Soos aangedui in die BI-argitektuur, is die atoomvlak van die Dwhouse, sowel as datamarts, 'n uitstekende bron van data wat vir onttrekking. Dieselfde fasiliteite moet ook ontvangers van onttrekkingsresultate wees om beskikbaarheid aan die breedste gehoor te verseker.

Agente.

Daar is verskeie “agente” om die kliënt vir elke punt te ondersoek, soos die maatskappy se bedryfstelsels en die dw self. Hierdie agente kan gevorderde neurale netwerke wees wat opgelei is om te leer oor tendense by elke punt, soos toekomstige produkaanvraag gebaseer op verkoopspromosies, reël-gebaseerde enjins om te reageer op 'n Dato stel omstandighede, of selfs eenvoudige agente wat uitsonderings aan "topbestuurders" rapporteer. Hierdie prosesse vind gewoonlik in reële tyd plaas en moet dus nou gekoppel word aan hul beweging data wat. Al hierdie strukture van data wat, tegnologieë en tegnieke waarborg dat jy nie die nag sal spandeer om 'n organisasie van jou BI te genereer nie.

Hierdie aktiwiteit sal in inkrementele stappe ontwikkel word, vir klein punte.
Elke stap is 'n onafhanklike projekpoging en word na verwys as 'n iterasie in jou DW- of BI-inisiatief. Iterasies kan die implementering van nuwe tegnologieë insluit, begin met nuwe tegnieke, die byvoeging van nuwe strukture data wat , laai i data wat addisionele , of met die uitbreiding van ontleding van jou omgewing. Hierdie paragraaf word in meer diepte in hoofstuk 3 bespreek.

Benewens tradisionele DW-strukture en BI-gereedskap is daar ander funksies van jou BI-organisasie waarvoor jy moet ontwerp, soos:

Kliënt raakpunte (kliënt raak wys).

Soos met enige moderne organisasie is daar 'n aantal klante raakpunte wat aandui hoe om 'n positiewe ervaring vir joune te hê kliënte. Daar is tradisionele kanale soos kleinhandelaars, skakelbordoperateurs, direkte pos, multimedia en gedrukte advertensies, sowel as meer huidige kanale soos e-pos en web, data wat produkte met een of ander kontakpunt moet verkry, vervoer, skoongemaak, verwerk en dan by fasiliteite bevolk word data wat van BI.

Basiese beginsels van data wat operasionele en gebruikersverenigings (Operasioneel

databasisse en gebruikersgemeenskappe).
Aan die einde van die kontakpunte van die kliënte jy sal die basiese beginsels van vind data wat toepassing van die maatskappy en gebruikersgemeenskappe. DIE data wat bestaande is data wat tradisionele wat herenig en saamgesmelt moet word met die data wat wat vanaf die kontakpunte vloei om die nodige inligting te bevredig.

Ontleders. (Ontleders)

Die primêre begunstigde van die BI-omgewing is die ontleder. Dit is hy wat baat by die huidige onttrekking van data wat operasionele, geïntegreer met verskillende bronne van data wat , aangevul met kenmerke soos geografiese analise (geokodering) en aangebied in BI-tegnologieë wat onttrekking, OLAP, gevorderde SQL-verslaggewing en geografiese analise moontlik maak. Die primêre ontleder-koppelvlak vir die verslagdoeningsomgewing is die BI-portaal.

Die ontleder is egter nie die enigste een wat voordeel trek uit BI-argitektuur nie.
Bestuurders, groot gebruikersverenigings, en selfs vennote, verskaffers en i kliënte hulle behoort voordele in onderneming BI te vind.

Terugvoerlus.

BI-argitektuur is 'n leeromgewing. 'n Kenmerkende beginsel van ontwikkeling is om volgehoue ​​strukture van toe te laat data wat bygewerk te word deur die BI-tegnologie wat gebruik word en deur aksies wat deur die gebruiker geneem word. 'n Voorbeeld is kliëntetelling.

As die verkoopsafdeling klantetellings modelleer om 'n nuwe diens te gebruik, behoort die verkoopsafdeling nie die enigste groep te wees wat by die diens baat vind nie.

In plaas daarvan moet modelonttrekking uitgevoer word as 'n natuurlike deel van die datavloei binne die onderneming en kliënttellings moet 'n geïntegreerde deel van die pakhuisinligtingkonteks word, sigbaar vir alle gebruikers. Die Bi-bI-sentriese IBM Suite, insluitend DB2 UDB, DB2 OLAP Server sluit die meeste van die belangrikste tegnologiekomponente in, gedefinieer in Figuur 1.1.

Ons gebruik die argitektuur soos dit in hierdie illustrasie uit die boek voorkom om ons 'n vlak van kontinuïteit te gee en te demonstreer hoe elke IBM-produk by die algehele BI-skema inpas.

Die verskaffing van die Inligting-inhoud (Verskaf Inligting inhoud)

Die ontwerp, ontwikkeling en implementering van jou BI-omgewing is 'n uitdagende taak. Die ontwerp moet beide huidige en toekomstige besigheidsvereistes omhels. Die argitektoniese tekening moet volledig wees om alle gevolgtrekkings in te sluit wat tydens die ontwerpfase gevind is. Uitvoering moet verbind bly tot 'n enkele doel: die ontwikkeling van die BI-argitektuur soos formeel in die ontwerp aangebied en gegrond op besigheidsvereistes.

Dit is veral moeilik om te argumenteer dat dissipline relatiewe sukses sal verseker.
Dit is eenvoudig omdat jy nie 'n BI-omgewing op een slag ontwikkel nie, maar jy doen dit mettertyd in klein stappe.

Die identifisering van die BI-komponente van jou argitektuur is egter belangrik om twee redes: Jy sal alle daaropvolgende tegniese argitektuurbesluite lei.
Jy sal bewustelik 'n bepaalde gebruik van tegnologie kan beplan, al kry jy dalk nie 'n herhaling wat die tegnologie vir 'n paar maande nodig het nie.

Om u besigheidsvereistes voldoende te verstaan, sal die tipe produkte wat u vir u argitektuur verkry, beïnvloed.
Die ontwerp en ontwikkeling van jou argitektuur verseker dat jou pakhuis is

nie ’n lukrake gebeurtenis nie, maar eerder ’n noukeurig saamgestelde “goeddeurdagte”. Opera van kuns as 'n mosaïek van gemengde tegnologie.

Ontwerp die inligtinginhoud

Alle aanvanklike ontwerp moet fokus op en identifiseer die sleutel BI-komponente wat nou en in die toekoms deur die algehele omgewing benodig sal word.
Dit is belangrik om die besigheidsvereistes te ken.

Selfs voordat enige formele ontwerp begin, kan die projekbeplanner dikwels dadelik een of twee komponente identifiseer.
Die balans van komponente wat vir jou argitektuur nodig mag wees, kan egter nie maklik gevind word nie. Tydens die ontwerpfase bind die hoofgedeelte van die argitektuur die toepassingsontwikkeling (JAD) sessie aan 'n strewe om besigheidsvereistes te identifiseer.

Soms kan hierdie vereistes toevertrou word aan navraag- en verslagdoeningsinstrumente.
Byvoorbeeld, gebruikers meld dat indien hulle 'n huidige verslag wil outomatiseer, hulle dit handmatig moet genereer deur twee huidige verslae te integreer en berekeninge by te voeg wat afgelei is van die kombinasie van die data wat.
Alhoewel hierdie vereiste eenvoudig is, definieer dit 'n sekere funksionaliteit van die kenmerk wat jy moet insluit wanneer jy verslagdoeningsnutsmiddels vir jou organisasie koop.

Die ontwerper moet ook bykomende vereistes nastreef om 'n volledige prentjie te verkry. Wil gebruikers op hierdie verslag inteken?
Word verslagsubstelle gegenereer en aan verskeie gebruikers per e-pos gestuur? Wil hulle hierdie verslag in die maatskappyportaal sien? Al hierdie vereistes is deel van die eenvoudige behoefte om 'n handleiding verslag te vervang soos versoek deur gebruikers. Die voordeel van hierdie tipe vereistes is dat almal, gebruikers en ontwerpers, 'n begrip het van die konsep van verslae.

Daar is egter ander soorte besighede waarvoor ons moet beplan. Wanneer besigheidsvereistes in die vorm van strategiese besigheidsvrae gestel word, is dit maklik vir die kundige ontwerper om maat/feit en dimensionele vereistes te onderskei.

As JAD-gebruikers nie weet hoe om hul vereistes in die vorm van 'n besigheidsprobleem te stel nie, sal die ontwerper dikwels voorbeelde verskaf om die vereistes-insamelingsessie te laat begin.
Die deskundige ontwerper kan gebruikers help om nie net strategiese handel te verstaan ​​nie, maar ook hoe om dit te vorm.
Die vereistes-insamelingsbenadering word in hoofstuk 3 bespreek; vir nou wil ons net wys op die behoefte om vir alle soorte BI-vereistes te ontwerp.

'n Strategiese besigheidsprobleem is nie net 'n besigheidsvereiste nie, maar ook 'n ontwerp-leidraad. As jy 'n multidimensionele vraag moet beantwoord, dan moet jy memoriseer, aanbied i data wat afmetings, en as jy moet stoor i data wat multidimensioneel, moet jy besluit watter tipe tegnologie of tegniek jy gaan gebruik.

Implementeer jy 'n gereserveerde kubussterskema, of albei? Soos u kan sien, kan selfs 'n eenvoudige besigheidsprobleem die ontwerp aansienlik beïnvloed. Maar hierdie tipe besigheidsvereistes is alledaags en word verstaan, ten minste deur ontwerpers en beplanners met projekervaring.

Daar was genoeg bespreking oor OLAP-tegnologieë en -ondersteuning, en 'n wye reeks oplossings is beskikbaar. Tot dusver het ons die behoefte genoem om eenvoudige verslagdoening saam te bring met besigheidsdimensionele vereistes, en hoe hierdie vereistes tegniese argitektoniese besluite beïnvloed.

Maar wat is die vereistes wat nie maklik deur gebruikers of die Dw-span verstaan ​​word nie? Sal jy ooit ruimtelike analise nodig hê?
Die mynboumodelle van data wat sal hulle 'n noodsaaklike deel van jou toekoms wees? Wie weet?

Dit is belangrik om daarop te let dat hierdie tipe tegnologie nie goed bekend is deur die algemene gebruikersgemeenskappe en Dw-spanlede nie, deels kan dit wees omdat dit tipies deur sommige interne of derdeparty tegniese kundiges hanteer word. Dit is 'n uiterste geval van die probleme wat hierdie tipe tegnologie genereer. As gebruikers nie besigheidsvereistes kan beskryf of dit op 'n manier kan stel wat leiding aan ontwerpers verskaf nie, kan hulle ongemerk bly of, erger, eenvoudig geïgnoreer word.

Meer problematies word dit wanneer die ontwerper en ontwikkelaar nie die toepassing van een van hierdie gevorderde maar kritieke tegnologieë kan herken nie.
Soos ons al dikwels ontwerpers hoor sê het, “wel, hoekom sit ons dit nie opsy totdat ons hierdie ander ding kry nie? “Stel hulle regtig belang in prioriteite, of vermy hulle bloot vereistes wat hulle nie verstaan ​​nie? Dit is heel waarskynlik die laaste hipotese. Kom ons sê jou verkoopspan het 'n besigheidsvereiste gekommunikeer, soos in Figuur 1.3 gestel, soos jy kan sien, is die vereiste in die vorm van 'n besigheidsprobleem opgestel. Die verskil tussen hierdie probleem en die tipiese dimensionele probleem is afstand. In hierdie geval wil die verkoopspan op 'n maandelikse basis weet wat die totale verkope van die produkte, pakhuise en kliënte wat binne 5 myl van die pakhuis woon waar hulle koop.

Ongelukkig kan ontwerpers of argitekte die ruimtelike komponent eenvoudig ignoreer deur te sê: "Ons het die kliënt, die produk en die data wat van die deposito. Kom ons hou die afstand uit tot nog 'n herhaling.

"Verkeerde antwoord. Hierdie tipe besigheidsprobleem gaan alles oor BI. Dit verteenwoordig 'n dieper begrip van ons besigheid en 'n robuuste analitiese ruimte vir ons ontleders. BI is verder as eenvoudige navrae of standaardverslagdoening, of selfs OLAP. Dit is nie te sê dat hierdie tegnologieë nie belangrik is vir jou BI nie, maar hulle alleen verteenwoordig nie die BI-omgewing nie.

Ontwerp vir die inligtingskonteks (Ontwerp vir inligtinginhoud)

Noudat ons die besigheidsvereistes geïdentifiseer het wat verskeie fundamentele komponente onderskei, moet dit in 'n algehele argitektoniese ontwerp ingesluit word. Sommige van die BI-komponente is deel van ons aanvanklike pogings, terwyl sommige vir 'n paar maande nie geïmplementeer sal word nie.

Alle bekende vereistes word egter in die ontwerp weerspieël sodat wanneer ons 'n spesifieke tegnologie moet implementeer, ons bereid is om dit te doen. Iets omtrent die projek sal tradisionele denke weerspieël.

Hierdie stel van data wat word gebruik om latere gebruike van data wat dimensioneel gelei deur die besigheidskwessies wat ons geïdentifiseer het. Soos bykomende dokumente gegenereer word, soos die ontwerpontwikkeling van data wat, sal ons begin om te formaliseer hoe i data wat hulle versprei in die omgewing. Ons het vasgestel die behoefte om i data wat op 'n dimensionele manier, en verdeel hulle (volgens spesifieke spesifieke behoeftes) in datamars.

Die volgende vraag om te beantwoord is: hoe sal hierdie datamars gebou word?
Bou jy die sterre om die kubusse te ondersteun, of net die kubusse, of net die sterre? (of regte kubusse, of regte sterre). Genereer argitektuur vir afhanklike datamars wat 'n atoomlaag vir almal benodig data wat aanwinste? Laat onafhanklike datamars toe om te verkry data wat direk vanaf bedryfstelsels?

Watter kubustegnologie sal jy probeer standaardiseer?

Jy het massiewe hoeveelhede gode data wat benodig vir dimensionele ontleding of benodig jy kubusse van jou nasionale verkoopsmag op 'n weeklikse basis of albei? Bou jy iets so kragtig soos DB2 OLAP Server vir finansies of Cognos PowerPlay-kubusse vir jou verkoopsorganisasie, of albei? Dit is die groot argitektoniese ontwerpbesluite wat u BI-omgewing van hier af sal beïnvloed. Ja, jy het 'n behoefte aan OLAP vasgestel. Nou hoe sal jy daardie tipe tegniek en tegnologie uitvoer?

Hoe beïnvloed sommige van die mees gevorderde tegnologieë jou ontwerpe? Kom ons neem aan jy het 'n ruimtebehoefte in jou organisasie geïdentifiseer. Jy moet nou die argitektoniese tekeninge herroep, selfs al beplan jy nie om ruimtelike komponente vir 'n paar maande te maak nie. Die argitek moet vandag ontwerp op grond van wat nodig is. Voorspel die behoefte aan ruimtelike analise wat genereer, berg, uitvoer en toegang bied tot data wat ruimtelike. Dit moet weer dien as 'n beperking met betrekking tot die tipe sagteware-tegnologie en platformspesifikasies wat jy tans kan oorweeg. Byvoorbeeld, die administrasiestelsel van databasis verhoudingslaag (RDBMS) wat jy vir jou atoomlaag uitvoer, moet robuuste ruimtelike omvang beskikbaar hê. Dit sal maksimum werkverrigting verseker wanneer meetkunde en ruimtelike voorwerpe in jou analitiese toepassings gebruik word. As jou RDBMS nie die data wat (ruimtelik-sentries) intern, so jy sal 'n databasis (ruimtelik-sentries) ekstern. Dit bemoeilik die bestuur van kwessies en kompromitteer jou algehele prestasie, om nie te praat van die bykomende probleme wat vir jou DBA's geskep word nie, aangesien hulle waarskynlik 'n minimale begrip van die basiese beginsels van data wat ook ruimtelik. Aan die ander kant, as jou RDMBS-enjin alle ruimtelike komponente hanteer en die optimaliseerder daarvan is bewus van die spesiale behoeftes (byvoorbeeld indeksering) van ruimtelike voorwerpe, dan kan jou DBA's geredelik die bestuur van die kwessies hanteer en jy kan die werkverrigting maksimeer.

Daarbenewens moet jy die opstelarea en atoomomgewingslaag aanpas om adresopruiming in te sluit (a

sleutelelement tot ruimtelike analise), sowel as die daaropvolgende besparing van ruimte-voorwerpe. Die opeenvolging van tekenuitgawes gaan voort noudat ons die idee van duidelike rigting bekend gestel het. Vir een ding, hierdie toepassing sal die tipe sagteware dikteer wat nodig is vir jou ETL-poging.

Het u produkte soos Trillium nodig om dit van 'n skoon adres te voorsien, of 'n ETL-verskaffer van u keuse om daardie funksionaliteit te verskaf?
Vir nou is dit belangrik dat jy die vlak van ontwerp waardeer wat voltooi moet word voordat jy begin om jou pakhuis te implementeer. Bogenoemde voorbeelde moet die menigte ontwerpbesluite demonstreer wat moet volg op die identifisering van enige spesifieke besigheidsvereiste. As dit korrek geneem word, bevorder hierdie ontwerpbesluite interafhanklikheid tussen die fisiese strukture van jou omgewing, die keuse van tegnologie wat gebruik word, en die vloei van verspreiding van inligtinginhoud. Sonder hierdie konvensionele BI-argitektuur, sal jou organisasie onderhewig wees aan 'n chaotiese mengsel van bestaande tegnologieë, op sy beste losweg saamgestik om oënskynlike stabiliteit te verskaf.

Handhaaf inligtinginhoud

Om die waarde van inligting na jou organisasie te bring is 'n baie moeilike taak. Sonder voldoende begrip en ervaring, of behoorlike beplanning en ontwerp, sal selfs die beste spanne misluk. Aan die ander kant, as jy groot intuïsie en gedetailleerde beplanning het, maar geen dissipline vir uitvoering nie, het jy net jou geld en tyd gemors omdat jou poging gedoem is om te misluk. Die boodskap moet duidelik wees: As jy een of meer van hierdie vaardighede, begrip/ervaring of beplanning/ontwerp of implementering ontbreek, sal dit die bou van die BI-organisasie lamlê of vernietig.

Is jou span voldoende voorbereid? Is daar iemand in jou BI-span wat die uitgestrekte analitiese landskap wat in BI-omgewings beskikbaar is, en die tegnieke en tegnologieë wat nodig is om daardie landskap in stand te hou, verstaan? Is daar iemand in jou span wat die toepassingsverskil tussen gevorderde kan herken

statiese verslagdoening en OLAP, of die verskille tussen ROLAP en OLAP? Herken een van jou spanlede duidelik hoe om te onttrek en hoe dit die pakhuis kan beïnvloed of hoe die pakhuis onttrekkingsprestasie kan ondersteun? 'n Spanlid verstaan ​​die waarde van data wat ruimte of agent-gebaseerde tegnologie? Het jy iemand wat die unieke toepassing van ETL-instrumente teenoor boodskapmakelaar-tegnologie waardeer? As jy nie een het nie, kry een. BI is baie groter as 'n genormaliseerde atoomlaag, OLAP, sterskemas en 'n ODS.

Om die begrip en ervaring te hê om BI-vereistes en hul oplossings te erken, is noodsaaklik vir jou vermoë om gebruikersbehoeftes behoorlik te formaliseer en hul oplossings te ontwerp en te implementeer. As jou gebruikersgemeenskap sukkel om vereistes te beskryf, is dit die pakhuisspan se taak om daardie begrip te verskaf. Maar as die pakhuis span

erken nie die spesifieke toepassing van BI nie - byvoorbeeld data-ontginning - dan is dit nie die beste ding dat BI-omgewings dikwels beperk word tot passiewe bewaarplekke nie. Om hierdie tegnologieë te ignoreer, verminder egter nie hul belangrikheid en die effek wat dit het op die ontstaan ​​van jou organisasie se besigheidsintelligensievermoëns, sowel as die inligtinglandskap wat jy beplan om te bevorder nie.

Beplanning moet die idee van tekening insluit, en beide vereis 'n bekwame individu. Daarbenewens vereis ontwerp 'n spanpakhuisfilosofie en voldoening aan standaarde. Byvoorbeeld, as jou maatskappy 'n standaardplatform gevestig het of 'n spesifieke RDBMS geïdentifiseer het wat jy oor die platform wil standaardiseer, rus die onus op almal in die span om aan daardie standaarde te voldoen. Oor die algemeen stel 'n span die behoefte aan standaardisering bloot (aan gebruikersgemeenskappe), maar die span self is nie bereid om te voldoen aan standaarde wat ook op ander gebiede in die maatskappy of dalk selfs in soortgelyke maatskappye vasgestel is nie. Dit is nie net skynheilig nie, maar dit stel vas dat die maatskappy nie in staat is om bestaande hulpbronne en beleggings te ontgin nie. Dit beteken nie dat daar geen situasies is wat 'n nie-gestandaardiseerde platform of tegnologie regverdig nie; egter die pakhuis pogings

hulle moet die onderneming se standaarde jaloers waak totdat sakevereistes anders voorskryf.

Die derde sleutelkomponent wat nodig is om 'n BI-organisasie te bou, is dissipline.
Dit hang in totaal af, ewe veel van individue en die omgewing. Projekbeplanners, borge, argitekte en gebruikers moet die dissipline waardeer wat nodig is om die maatskappy se inligtingslandskap te bou. Ontwerpers moet hul ontwerppogings op so 'n manier rig dat dit ander nodige pogings in die samelewing aanvul.

Byvoorbeeld, kom ons sê jou maatskappy bou 'n ERP-toepassing wat 'n pakhuiskomponent het.
Daarom is dit die verantwoordelikheid van die ERP-ontwerpers om met die pakhuisomgewingspan saam te werk om nie mee te ding of werk wat reeds begin is te dupliseer nie.

Dissipline is ook 'n onderwerp wat deur die hele organisasie aangespreek moet word en word gewoonlik gevestig en aan 'n uitvoerende vlak toevertrou.
Is bestuurders bereid om 'n ontwerpte benadering te volg? ’n Benadering wat beloof om inligtingsinhoud te skep wat uiteindelik waarde vir alle areas van die onderneming sal bring, maar dalk individuele of departementele agendas in gedrang bring? Onthou die gesegde "Om aan alles te dink is belangriker as om net aan een ding te dink". Hierdie gesegde is waar vir BI-organisasies.

Ongelukkig fokus baie pakhuise hul pogings daarop om 'n spesifieke departement of spesifieke gebruikers te probeer teiken en waarde te bring, met min inagneming van die organisasie in die algemeen. Gestel die bestuur versoek bystand van die washuisspan. Die span reageer met 'n poging van 90 dae wat nie net die lewering van die kennisgewingvereistes wat deur die bestuurder gedefinieer is, insluit nie, maar om te verseker dat alle data wat basis word op atoomvlak gemeng voordat dit in die voorgestelde kubustegnologie ingevoer word.
Hierdie ingenieursbyvoeging verseker dat die washuisonderneming daarby baat sal vind data wat benodig deur die bestuurder.
Die uitvoerende hoof het egter met eksterne konsultasiefirmas gepraat wat 'n soortgelyke aansoek met aflewering in minder as 4 weke voorgestel het.

Met die veronderstelling dat die interne pakhuisspan bekwaam is, het die uitvoerende beampte 'n keuse. Wie kan die bykomende ingenieursdissipline ondersteun wat nodig is om die onderneming se inligtingsbate te kweek of kan kies om vinnig hul eie oplossing te bou. Die laaste een blyk heeltemal te dikwels gekies te word en dien slegs om houers van inligting te skep wat slegs 'n paar of die individu bevoordeel.

Kort- en langtermyn doelwitte

Argitekte en projekontwerpers moet 'n langtermynvisie van die algehele argitektuur en planne vir groei in 'n BI-organisasie formaliseer. Hierdie kombinasie van korttermynwins en langtermynbeplanning verteenwoordig die twee kante van BI-pogings. Korttermynwins is die faset van BI wat geassosieer word met iterasies van jou pakhuis.

Dit is waar beplanners, argitekte en borge daarop fokus om aan spesifieke kommersiële vereistes te voldoen. Dit is op hierdie vlak waar fisiese strukture gebou word, tegnologie aangekoop en tegnieke geïmplementeer word. Hulle is geensins gemaak om spesifieke vereistes soos gedefinieer deur spesifieke gebruikersgemeenskappe aan te spreek nie. Alles word gedoen om spesifieke vereistes aan te spreek wat deur 'n spesifieke gemeenskap gedefinieer is.
Langtermynbeplanning is egter die ander faset van BI. Dit is hier waar die planne en ontwerpe verseker het dat enige fisiese struktuur gebou is, die tegnologieë gekies en die tegnieke wat geïmplementeer is gemaak met die oog op die onderneming. Dit is langtermynbeplanning wat die samehang verskaf wat nodig is om te verseker dat besigheidsvoordele voortspruit uit enige korttermynwinste wat gevind word.

Regverdig jou BI-poging

Un data pakhuis op sigself het dit geen inherente waarde nie. Met ander woorde, daar is geen inherente waarde tussen pakhuistegnologieë en implementeringstegnieke nie.

Die waarde van enige pakhuispoging word gevind in die aksies wat uitgevoer word as gevolg van die pakhuisomgewing en die inligtinginhoud wat oor tyd gekweek is. Dit is 'n kritieke punt om te verstaan ​​voordat jy ooit probeer om die waarde van enige wherehouse-inisiatief te skat.

Te dikwels poog argitekte en ontwerpers om waarde toe te pas op die fisiese en tegniese komponente van die pakhuis, terwyl die waarde in werklikheid gebaseer is op die besigheidsprosesse wat positief deur die pakhuis en die goed-verworwe inligting beïnvloed word.

Hier lê die uitdaging om BI te vestig: Hoe regverdig jy die belegging? As die waarhuis self geen intrinsieke waarde het nie, moet projekontwerpers die voordele wat verkry word deur daardie individue wat die pakhuis sal gebruik om spesifieke besigheidsprosesse of die waarde van beskermde inligting, of albei te verbeter, ondersoek, definieer en formaliseer.

Om sake te bemoeilik, kan enige besigheidsproses wat deur pakhuispogings geraak word "aansienlike" of "geringe" voordele bied. Aansienlike voordele bied 'n tasbare maatstaf om opbrengs op belegging (ROI) te meet - byvoorbeeld om voorraad 'n bykomende tyd gedurende 'n spesifieke tydperk te verander of vir laer vervoerkoste per besending. Dit is moeiliker om subtiele voordele, soos verbeterde toegang tot inligting, in terme van tasbare waarde te definieer.

Koppel jou projek om die besigheidsversoeke

Te dikwels probeer projekbeplanners om pakhuiswaarde aan amorfe ondernemingsdoelwitte te koppel. Deur te verklaar dat "die waarde van 'n pakhuis gebaseer is op ons vermoë om strategiese versoeke te bevredig" open ons die bespreking op 'n aangename manier. Maar dit alleen is nie genoeg om te bepaal of belegging in voorraad sin maak nie. Dit is die beste om pakhuisiterasies met spesifieke, bekende besigheidsvereistes te koppel.

Meet ROI

Die berekening van ROI in 'n pakhuisomgewing kan besonder moeilik wees. Dit is veral moeilik as die voordeel

hoof van 'n spesifieke herhaling is iets wat nie tasbaar of maklik is om te meet nie. Een studie het bevind dat gebruikers twee hoofvoordele van BI-inisiatiewe sien:

  • ▪ Skep die vermoë om besluite te neem
  • ▪ Skep toegang tot inligting
    Hierdie voordele is sagte (of ligte) voordele. Dit is maklik om te sien hoe ons 'n ROI kan bereken op grond van 'n harde (of groot) voordeel soos verminderde vervoerkoste, maar hoe meet ons die vermoë om beter besluite te neem?
    Dit is beslis 'n uitdaging vir projekbeplanners wanneer hulle die maatskappy probeer oortuig om in 'n spesifieke pakhuispoging te belê. Toenemende verkope of dalende koste is nie meer die sentrale temas wat die BI-omgewing dryf nie.
    In plaas daarvan kyk jy na besigheidsversoeke vir beter toegang tot inligting sodat 'n spesifieke departement vinniger besluite kan neem. Dit is strategiese dryfvere wat toevallig ewe belangrik vir die onderneming is, maar meer dubbelsinnig en moeiliker is om in 'n tasbare maatstaf te karakteriseer. In hierdie geval kan die berekening van ROI misleidend wees, indien nie irrelevant nie.
    Projekbeplanners moet tasbare waarde vir bestuurders kan demonstreer om te besluit of die belegging in 'n spesifieke iterasie die moeite werd is. Ons sal egter nie 'n nuwe metode vir die berekening van ROI voorstel nie, en ons sal ook geen argumente daarvoor of daarteen aanvoer nie.
    Daar is baie artikels en boeke beskikbaar wat die grondbeginsels van die berekening van ROI bespreek. Daar is spesiale waardevoorstelle soos waarde op belegging (VOI), wat deur groepe soos Gartner aangebied word, wat jy kan navors. In plaas daarvan sal ons fokus op kernaspekte van enige ROI of ander waardevoorstelle wat u moet oorweeg. Pas tans ROI toe Behalwe die argument oor "harde" voordele teenoor "sagte" voordele wat verband hou met BI-pogings, is daar ander kwessies om in ag te neem wanneer ROI toegepas word. Byvoorbeeld:

Ken te veel besparings toe aan DW-pogings wat in elk geval sou kom
Kom ons sê jou maatskappy het van 'n hoofraamargitektuur na 'n verspreide UNIX-omgewing beweeg. So enige besparing wat moontlik (of nie) uit daardie poging gerealiseer kan word, moet nie uitsluitlik, indien enigsins (?), aan die pakhuis toegeskryf word nie.

Om nie alles te verreken nie, is duur. En daar is baie dinge om in ag te neem. Oorweeg die volgende lys:

  • ▪ Aanvangskoste, insluitend haalbaarheid.
  • ▪ Koste van toegewyde hardeware met verwante berging en kommunikasie
  • ▪ Koste van die sagteware, insluitend bestuur data wat en kliënt/bediener-uitbreidings, ETL-sagteware, DSS-tegnologieë, visualiseringsinstrumente, skedulering- en werkvloeitoepassings, en moniteringsagteware, .
  • ▪ Struktuurontwerpkoste data wat, met die skepping en optimalisering van
  • ▪ Sagteware-ontwikkelingskoste wat direk met die BI-poging verband hou
  • ▪ Koste van ondersteuning op die perseel, insluitend werkverrigtingoptimalisering, insluitend sagtewareweergawebeheer en hulpbedrywighede Pas "Big-Bang" ROI toe. Die bou van die pakhuis as 'n enkele, reusagtige poging is gedoem om te misluk, so bereken selfs die ROI vir 'n groot onderneming-inisiatief. Die aanbod is verrassend, en beplanners gaan voort om flou pogings aan te wend om die waarde van die hele poging te skat. Waarom probeer beplanners om 'n geldelike waarde op die besigheidsinisiatief te plaas as dit algemeen bekend is en aanvaar word dat dit moeilik is om spesifieke herhalings te skat? Hoe is dit moontlik? Dit is nie moontlik met 'n paar uitsonderings nie. Moenie dit doen nie. Noudat ons vasgestel het wat om nie te doen wanneer ROI bereken word nie, hier is 'n paar punte wat ons sal help om 'n betroubare proses te vestig om die waarde van jou BI-pogings te skat.

Verkryging van ROI konsensus. Ongeag jou keuse van tegniek om die waarde van jou BI-pogings te skat, moet daar ooreengekom word deur alle partye, insluitend projekontwerpers, borge en sakebestuurders.

Verminder ROI in identifiseerbare dele. 'n Noodsaaklike stap in die rigting van die redelike berekening van 'n ROI is om daardie berekening op 'n spesifieke projek te fokus. Dit laat jou dan toe om 'n waarde te skat gebaseer op spesifieke besigheidsvereistes waaraan voldoen word

Definieer die koste. Soos genoem, moet talle koste oorweeg word. Verder moet koste nie net dié insluit wat met die enkele iterasie geassosieer word nie, maar ook die koste verbonde aan die versekering van voldoening aan ondernemingstandaarde.

Definieer voordele. Deur ROI duidelik aan spesifieke besigheidsvereistes te koppel, behoort ons die voordele te kan identifiseer wat daartoe sal lei dat aan die vereistes voldoen word.

Verminder koste en voordele in dreigende winste. Dit is die beste manier om jou waardasies op netto huidige waarde (NHW) te baseer in plaas daarvan om toekomstige waarde in toekomstige verdienste te probeer voorspel.

Hou die tydsberekening van die verdeling van jou ROI tot 'n minimum. Dit is goed gedokumenteer oor die lang tydperk wat dit in jou ROI gebruik is.

Gebruik meer as een ROI-formule. Daar is talle metodes om ROI te voorspel en jy moet beplan of jy een of meer daarvan moet gebruik, insluitend netto huidige waarde, interne opbrengskoers (IRR) en terugbetaling.

Definieer herhaalbare proses. Dit is van kardinale belang vir die berekening van enige langtermynwaarde. 'n Enkele herhaalbare proses moet gedokumenteer word sodat alle projekvolgorde kan volg.

Die probleme wat gelys word, is die algemeenste wat deur kundiges in die washuisomgewing gedefinieer word. Die bestuur se aandrang om 'n "Big-Bang" ROI te lewer is baie disoriënterend. As jy al jou ROI-berekeninge begin deur dit op te breek in identifiseerbare, tasbare stukke, het jy 'n goeie kans om 'n akkurate ROI-gradering te skat.

Vrae oor ROI-voordele

Wat ook al jou voordele is, sag of hard, jy kan 'n paar basiese vrae gebruik om die waarde daarvan te bepaal. Byvoorbeeld, deur 'n eenvoudige skaalstelsel van 1 tot 10 te gebruik, kan jy die impak van enige poging meet deur die volgende vrae te gebruik:

  • Hoe sou jy begrip van beoordeel data wat Volg jy hierdie projek van jou maatskappy?
  • Hoe sou jy prosesverbeterings as gevolg van hierdie projek skat?
  • Hoe sal jy die impak meet van nuwe insigte en afleidings wat nou deur hierdie iterasie beskikbaar gestel word
  • Wat was die impak van nuwe en werkende rekenaaromgewings as gevolg van wat geleer is? As die antwoorde op hierdie vrae min is, is dit moontlik dat die maatskappy nie die belegging werd is nie. Vrae met 'n hoë telling dui op aansienlike waardewinste en moet as riglyne vir verdere ondersoek dien. Byvoorbeeld, 'n hoë telling vir prosesverbeterings behoort ontwerpers te lei om te ondersoek hoe prosesse verbeter is. Jy kan vind dat sommige of al die winste wat gemaak word, tasbaar is en daarom kan 'n geldwaarde geredelik aangewend word. Om die meeste uit die eerste iterasie van die pakhuis Die grootste resultaat van jou ondernemingspoging is dikwels in die eerste paar herhalings. Hierdie vroeë pogings vestig tradisioneel die nuttigste inligtingsinhoud vir die publiek en help om die tegnologie-grondslag vir daaropvolgende BI-toepassings te vestig. Gewoonlik elke daaropvolgende opeenvolging van data wat van pakhuisprojekte bring al hoe minder bykomende waarde vir die onderneming in die algemeen. Dit is veral waar as die herhaling nie nuwe onderwerpe byvoeg of aan die behoeftes van 'n nuwe gebruikersgemeenskap voldoen nie.

Hierdie bergingsfunksie is ook van toepassing op groeiende stapels van data wat historici. Soos daaropvolgende pogings meer vereis data wat en hoe meer data wat word mettertyd in die pakhuis gegooi, die meeste van die data wat dit raak minder relevant vir die analise wat gebruik word. Hierdie data wat hulle word dikwels genoem data wat dormant en dit is altyd duur om hulle te hou, want hulle word amper nooit gebruik nie.

Wat beteken dit vir projekborge? In wese deel vroeë borge meer as wat die belegging kos. Dit is primêr omdat hulle die stukrag is vir die vestiging van die pakhuis se breë tegnologie- en hulpbronomgewingslaag, insluitend organies.

Maar hierdie eerste stappe bring die hoogste waarde en daarom moet projekontwerpers dikwels die belegging regverdig.
Projekte wat na jou BI-inisiatief gedoen word, kan laer (in vergelyking met die eerste) en direkte koste hê, maar bring minder waarde vir die maatskappy.

En organisasie-eienaars moet dit begin oorweeg om die opeenhoping weg te gooi data wat en minder relevante tegnologieë.

Data-ontginning: Ontginning Dati

Talle argitektoniese komponente vereis variasies in data-ontginningtegnologieë en -tegnieke—
byvoorbeeld die verskillende "agente" vir die ondersoek van die punte van belang van die kliënte, die maatskappy se bedryfstelsels en vir die dw self. Hierdie agente kan gevorderde neurale netwerke wees wat opgelei is op POT-neigings, soos toekomstige produkaanvraag gebaseer op verkoopspromosies; reëls-gebaseerde enjins om op 'n stel te reageer Dato van omstandighede, byvoorbeeld mediese diagnose en behandelingsaanbevelings; of selfs eenvoudige agente met die rol om uitsonderings aan topbestuurders te rapporteer. Oor die algemeen hierdie onttrekking prosesse data wat si

verifieer in reële tyd; daarom moet hulle heeltemal verenig word met die beweging van data wat hulself.

Aanlyn Analitiese Verwerking Verwerking

Aanlyn analise

Die vermoë om te sny, in blokkies te sny, te rol, af te boor en analise uit te voer
wat-as, is binne die bestek, die fokus van die IBM-tegnologiesuite. Byvoorbeeld, aanlyn analitiese verwerking (OLAP) funksies bestaan ​​vir DB2 wat dimensionele analise in die sagteware-enjin bring. databasis dieselfde.

Die funksies voeg dimensionele nut by SQL terwyl hulle voordeel trek uit al die voordele om 'n natuurlike deel van DB2 te wees. Nog 'n voorbeeld van OLAP-integrasie is die onttrekkingsinstrument, DB2 OLAP Server Analyzer. Hierdie tegnologie laat DB2 OLAP Server-kubusse toe om vinnig en outomaties ontleed te word om waardewaardes op te spoor en daaroor verslag te doen data wat ongewoon of onverwags regdeur die kubus aan die sake-ontleder. En laastens bied DW-sentrumkenmerke 'n manier vir argitekte om onder andere die profiel van 'n DB2 OLAP-bedienerkubus as 'n natuurlike deel van ETL-prosesse te beheer.

Ruimtelike Analise Ruimtelike analise

Ruimte verteenwoordig die helfte van die analitiese ankers (leidrade) wat nodig is vir 'n panorama
analities breed (tyd verteenwoordig die ander helfte). Die atoomvlak van die pakhuis, uitgebeeld in Figuur 1.1, sluit beide tyd- en ruimtegrondbeginsels in. Tydstempels anker ontledings volgens tyd en spreek inligtingsankerontledings volgens ruimte aan. Tydstempels voer ontleding volgens tyd uit, en adresinligting voer ontleding deur ruimte uit. Die diagram toon geokodering – die proses om adresse na punte in 'n kaart of punte in die ruimte om te skakel sodat konsepte soos afstand en binne/buite in die analise gebruik kan word – uitgevoer op atoomvlak en die ruimtelike analise wat beskikbaar gestel word aan die ontleder. IBM verskaf ruimtelike uitbreidings, ontwikkel met die Environmental System Research Institute (ESRI), om databasis DB2 sodat ruimte-voorwerpe as 'n normale deel van die databasis relasionele. db2

Ruimtelike uitbreidings verskaf ook al die SQL-uitbreidings om voordeel te trek uit ruimtelike analise. Byvoorbeeld, die SQL-uitbreidings waarteen navraag gedoen moet word
afstand tussen adresse of of 'n punt binne of buite 'n gedefinieerde veelhoekige area is, is 'n analitiese standaard met die Spatial Extender. Sien hoofstuk 16 vir meer inligting.

Databasis-Inwoner Gereedskap Gereedskap Databasis- Inwoner

DB2 het baie BI-inwonende SQL-kenmerke wat help met die aksie van analise. Dit sluit in:

  • Rekursiefunksies om analise uit te voer, soos om alle moontlike vlugroetes van te vind San Francisco a NY".
  • Analitiese funksies vir rangorde, kumulatiewe funksies, kubus en oprol om take te fasiliteer wat gewoonlik net met OLAP-tegnologie plaasvind, is nou 'n natuurlike deel van die enjin databasis
  • Die vermoë om tabelle te skep wat resultate bevat
    Verkopers van databasis leiers meng meer van BI-vermoëns in die databasis dieselfde.
    Die belangrikste verskaffers van databasis hulle meng meer van BI-vermoëns in die databasis dieselfde.
    Dit bied beter werkverrigting en meer uitvoeringsopsies vir BI-oplossings.
    Die kenmerke en funksies van DB2 V8 word breedvoerig in die volgende hoofstukke bespreek:
    Tegniese Argitektuur en Databestuur Grondslae (Hoofstuk 5)
  • DB2 BI Fundamentals (Hoofstuk 6)
  • DB2 gematerialiseerde navraagtabelle (Hoofstuk 7)
  • DB2 OLAP-funksies (Hoofstuk 13)
  • DB2 Verbeterde BI-kenmerke en -funksies (Hoofstuk 15) Vereenvoudigde data-afleweringstelsel Aflewering stelsel van data wat vereenvoudig

Die argitektuur wat in Figuur 1.1 uitgebeeld word, sluit talle strukture in data wat fisies. Een is die pakhuis van data wat bedryf. Oor die algemeen is 'n ODS 'n onderwerpgeoriënteerde, geïntegreerde en huidige objek. Jy sal 'n ODS bou om byvoorbeeld die verkoopskantoor te ondersteun. ODS-verkope sal aanvul data wat van talle verskillende stelsels, maar sou net byvoorbeeld vandag se transaksies behou. Die ODS kan ook baie keer per dag opgedateer word. Terselfdertyd stoot die prosesse die data wat geïntegreer in ander toepassings. Hierdie struktuur is spesifiek ontwerp om te integreer data wat huidige en dinamies en sal 'n waarskynlike kandidaat wees om intydse analise te ondersteun, soos verskaffing aan diensagente kliënte 'n kliënt se huidige verkoopsinligting deur verkoopsneigingsinligting uit die pakhuis self te onttrek. 'n Ander struktuur wat in Figuur 1.1 getoon word, is 'n formele toestand vir die dw. Nie net is dit die plek vir die uitvoering van die nodige integrasie, die kwaliteit van data wat, en van die transformasie van data wat van inkomende pakhuis, maar dit is ook 'n betroubare en tydelike stoorarea vir data wat replikate wat in intydse ontledings gebruik kan word. As jy besluit om 'n ODS of 'n opstelarea te gebruik, een van die beste hulpmiddels om hierdie strukture te vul data wat die gebruik van verskillende operasionele bronne is DB2 se heterogene verspreide navraag. Hierdie vermoë word gelewer deur die opsionele DB2-kenmerk genaamd DB2 Relational Connect (slegs navraag) en deur DB2 DataJoiner ('n aparte produk wat navraag-, invoeg-, opdateer- en uitveevermoë aan heterogene verspreide RDBMS'e lewer).

Hierdie tegnologie laat argitekte toe data wat te bind data wat produksie met analitiese prosesse. Nie net kan die tegnologie aanpas by feitlik enige van die replikasie-eise wat met intydse analise mag ontstaan ​​nie, maar dit kan ook aan 'n wye verskeidenheid databasisse koppel. data wat gewildste, insluitend DB2, Oracle, Sybase, SQL Server, Informix en ander. DB2 DataJoiner kan gebruik word om 'n struktuur te vul data wat formeel as 'n ODS of selfs 'n permanente tafel verteenwoordig in die pakhuis ontwerp vir vinnige herstel van onmiddellike opdaterings of te koop. Natuurlik, hierdie selfde strukture data wat kan gevul word met behulp van

'n ander belangrike tegnologie ontwerp vir replikasie van data wat, IBM DataPropagator Relational. (DataPropagator is 'n aparte produk vir sentrale stelsels. DB2 UNIX, Linux, Windows en OS/2 sluit data-replikasiedienste in data wat as 'n standaardkenmerk).
Nog 'n manier om te beweeg data wat wat rondom die onderneming werksaam is, is 'n ondernemingstoepassingsintegreerder andersins bekend as 'n boodskapmakelaar. Hierdie unieke tegnologie laat ongeëwenaarde beheer toe vir teiken en skuif data wat rondom die maatskappy. IBM het die mees gebruikte boodskapmakelaar, MQSeries, of 'n variasie van die produk wat die vereistes van e-commerce, IBM WebSphere MQ.
Vir meer bespreking oor hoe om MQ te benut om 'n pakhuis en BI-omgewing te ondersteun, besoek webwerf van die boek. Vir eers is dit genoeg om te sê dat hierdie tegnologie 'n uitstekende manier is om vas te lê en te transformeer (met MQSeries Integrator) data wat gesentreerde (geteikende) operateurs wat vir BI-oplossings gewerf is. MQ-tegnologie is geïntegreer en verpak in UDB V8, wat beteken dat boodskaprye nou bestuur kan word asof dit DB2-tabelle is. Die konsep van sweis tou boodskappe en die heelal van databasis relasionele koppe na 'n kragtige afleweringsomgewing van data wat.

Zero-Latency Nul latency

Die uiteindelike strategiese doelwit vir IBM is nul-latency-analise. Soos gedefinieer deur
Gartner, moet 'n BI-stelsel kan aflei, assimileer en inligting aan ontleders op aanvraag verskaf. Die uitdaging is natuurlik hoe om te meng data wat huidige en intydse met nodige historiese inligting, soos i data wat verwante patroon/tendens, of onttrekde begrip, soos klanteprofilering.

Sulke inligting sluit byvoorbeeld die identifikasie van kliënte hoë of lae risiko of watter produkte i kliënte hulle sal heel waarskynlik koop as hulle reeds kaas in hul inkopietrollies het.

Die bereiking van nul latency is eintlik afhanklik van twee fundamentele meganismes:

  • Volledige unie van data wat wat ontleed word met die gevestigde tegnieke en gereedskap wat deur BI geskep is
  • N aflewering stelsel van data wat doeltreffend om te verseker dat intydse analise werklik beskikbaar is. Hierdie voorvereistes vir geen latensie verskil nie van die twee doelwitte wat deur IBM gestel is en hierbo beskryf is nie. Die noue paring van data wat Dit is deel van IBM se naatlose integrasieprogram. En skep 'n afleweringstelsel van data wat doeltreffend is heeltemal afhanklik van die beskikbare tegnologie wat die afleweringsproses van vereenvoudig data wat. Gevolglik is twee van IBM se drie doelwitte van kritieke belang om die derde te verwesenlik. IBM ontwikkel sy tegnologie bewustelik om te verseker dat geen latency 'n werklikheid is vir pakhuispogings. Opsomming / Sintese Die BI-organisasie verskaf 'n padkaart vir die bou van jou omgewing
    iteratief. Dit moet aangepas word om die behoeftes van jou besigheid, beide huidige en toekomstige, te weerspieël. Sonder 'n breë argitektoniese visie is pakhuisiterasies weinig meer as lukraak implementerings van die sentrale pakhuis wat min doen om 'n breë, insiggewende onderneming te skep. Die eerste struikelblok vir projekbestuurders is hoe om die beleggings wat nodig is om die BI-organisasie te ontwikkel, te regverdig. Terwyl ROI-berekening 'n steunpilaar van pakhuisimplementerings gebly het, word dit moeiliker om akkuraat te voorspel. Dit het gelei tot ander metodes om te bepaal of jy jou geld werd kry. Die waarde op belegging2 (VOI) word byvoorbeeld as 'n oplossing bevorder. Dit is die plig van die argitekte van data wat en projekbeplanners genereer en verskaf doelbewus inligting aan gebruikersverenigings en lewer nie bloot 'n diens aan hulle nie data wat. Daar is 'n groot verskil tussen die twee. Inligting is iets wat 'n verskil maak in besluitneming en doeltreffendheid; relatief, i data wat hulle is boustene om daardie inligting af te lei.

Al krities oor die bron data wat Om sakeversoeke aan te spreek, moet die BI-omgewing 'n groter rol dien in die skep van inligtingsinhoud. Ons moet die ekstra stappe neem om inligtinginhoud skoon te maak, te integreer, te transformeer of andersins te skep waarop gebruikers kan reageer, en dan moet ons verseker dat daardie aksies en besluite, waar redelik, in die BI-omgewing weerspieël word. As ons die pakhuis degradeer om net op te dien data wat, word verseker dat gebruikersverenigings die inligtinginhoud sal skep wat nodig is om aksie te neem. Dit verseker dat hul gemeenskap beter besluite sal kan neem, maar die onderneming ly onder die gebrek aan kennis wat hulle gebruik het. Dato Aangesien argitekte en projekbeplanners spesifieke projekte in die BI-omgewing inisieer, bly hulle aanspreeklik teenoor die onderneming as geheel. 'n Eenvoudige voorbeeld van hierdie tweesydige kenmerk van BI-iterasies word in die bron gevind data wat. Al die data wat ontvang vir spesifieke besigheidsversoeke moet in die eerste atoomlaag gevul word. Dit verseker die ontwikkeling van die onderneming se inligting bate, sowel as bestuur, adres die spesifieke gebruiker versoeke gedefinieer in die iterasie.

WhatisaDataWarehouse?

Datastoor dit is sedert 1990 die hart van inligtingstelselargitektuur en ondersteun inligtingsprosesse deur 'n soliede geïntegreerde platform te bied data wat historiese data geneem as basis vir daaropvolgende ontledings. DIE data pakhuis hulle bied gemak van integrasie in 'n wêreld van onversoenbare toepassingstelsels. Datastoor dit het in 'n neiging ontwikkel. Datastoor organiseer en memoriseer i data wat nodig vir inligting en analitiese prosesse gebaseer op 'n lang historiese temporele perspektief. Dit alles behels 'n aansienlike en konstante verbintenis in die konstruksie en instandhouding van data pakhuis.

So wat is 'n data pakhuis? A data pakhuis en:

  • ▪ vakgerig
  • ▪ geïntegreerde stelsel
  • ▪ variant tyd
  • ▪ nie-vlugtig (kan nie uitgevee word nie)

'n versameling van data wat gebruik om bestuursbesluite te ondersteun in die implementering van prosesse.
I data wat ingevoeg data pakhuis in die meeste gevalle kom hulle uit operasionele omgewings. Die data pakhuis dit word geskep deur 'n stooreenheid, fisies geskei van die res van die stelsel, wat dit bevat data wat voorheen getransformeer deur toepassings wat werk op inligting wat afkomstig is van die bedryfsomgewing.

Die letterlike definisie van a data pakhuis verdien 'n in-diepte verduideliking aangesien daar belangrike motiverings en onderliggende betekenisse is wat die kenmerke van 'n pakhuis beskryf.

VAKORIËNTERING ORIËNTERING TEMATIEK

Die eerste kenmerk van 'n data pakhuis is dat dit gerig is op die belangrikste rolspelers in 'n maatskappy. Die gids van die proewe deur die data wat dit is in teenstelling met die meer klassieke metode wat die oriëntering van toepassings na prosesse en funksies behels, 'n metode wat meestal deur die meeste van die minder onlangse bestuurstelsels gedeel word.

Die operasionele wêreld is ontwerp rondom toepassings en funksies soos lenings, spaargeld, bankkaarte en trust vir 'n finansiële instelling. Die wêreld van dw is georganiseer rondom hoofvakke soos die kliënt, die verkoper, die produk en die aktiwiteit. Belyning rondom onderwerpe beïnvloed die ontwerp en implementering van data wat gevind in die dw. Nog belangriker, die hoofonderwerp raak die belangrikste deel van die sleutelstruktuur.

Die wêreld van die toepassing word beïnvloed deur beide die ontwerp van die databasis en die prosesontwerp. Die wêreld van dw is uitsluitlik gefokus op modellering data wat en op die ontwerp van die databasis. Prosesontwerp (in sy klassieke vorm) is nie deel van die dw-omgewing nie.

Die verskille tussen die keuse van proses-/funksietoepassing en die keuse van vak word ook geopenbaar as verskille in die inhoud van die data wat op 'n gedetailleerde vlak. DIE data wat del dw sluit nie i in nie data wat wat nie vir die DSS-proses tydens toepassings gebruik sal word nie

operasioneel georiënteerd data wat bevat i data wat om onmiddellik aan funksionele/verwerkingsvereistes te voldoen wat enige nut vir die DSS-ontleder mag hê of nie.
Nog 'n belangrike manier waarop operasionele-georiënteerde toepassings data wat verskil van data wat van dw is in die verslae van data wat. Ek data wat bedrywighede handhaaf 'n deurlopende verhouding tussen twee of meer tabelle gebaseer op 'n besigheidsreël wat aktief is. DIE data wat van dw kruis 'n spektrum van tyd en die verwantskappe wat in die dw gevind word, is baie. Baie handel reëls (en dienooreenkomstig, baie verhoudings van data wat ) word verteenwoordig in die voorraad van data wat tussen twee of meer tafels.

(Vir 'n gedetailleerde verduideliking van hoe die verhoudings tussen die data wat in die DW hanteer word, verwys ons na die Tegniese Onderwerp oor daardie kwessie.)
Vanuit geen ander perspektief as dié van die fundamentele verskil tussen 'n funksionele/prosestoepassingskeuse en 'n vakkeuse nie, is daar 'n groter verskil tussen bedryfstelsels en data wat en die DW.

INTEGRASIE INTEGRASIE

Die belangrikste aspek van die dw-omgewing is dat i data wat gevind binne die dw is maklik geïntegreer. ALTYD. SONDER UITSONDERINGS. Die wese van die dw-omgewing is dat i data wat vervat binne die perke van die pakhuis is geïntegreer.

Integrasie openbaar hom op baie verskillende maniere – in konsekwent geïdentifiseerde konvensies, in konsekwente veranderlike meting, in konsekwente gekodeerde strukture, in die fisiese eienskappe van data wat konsekwent, ensovoorts.

Oor die jare het ontwerpers van verskeie toepassings baie besluite geneem oor hoe 'n toepassing ontwikkel moet word. Die styl en geïndividualiseerde ontwerpbesluite van ontwerpers se toepassings openbaar hulleself op honderd maniere: in verskille in kodering, sleutelstruktuur, fisiese eienskappe, identifisering van konvensies, ensovoorts. Die gesamentlike vermoë van baie toepassingsontwerpers om inkonsekwente toepassings te skep, is legendaries. Figuur 3 lê sommige van die belangrikste verskille in die maniere waarop toepassings ontwerp word uiteen.

Enkodering: Enkodeer:

Toepassingsontwerpers het die enkodering van die veld – seks – op verskillende maniere gekies. 'n Ontwerper stel seks voor as 'n "m" en "f". 'n Ander ontwerper verteenwoordig geslag as 'n "1" en 'n "0". 'n Ander ontwerper stel seks voor as 'n "x" en "y". 'n Ander ontwerper stel seks voor as "manlik" en "vroulik". Dit maak nie veel saak hoe die seks in die DW kom nie. Die "M" en "F" is waarskynlik so goed soos die hele toneelstuk.

Wat saak maak is dat van watter oorsprong die seksveld ook al afkomstig is, daardie veld in 'n konsekwente geïntegreerde toestand in die DW aankom. Gevolglik wanneer die veld in die DW gelaai word vanaf 'n toepassing waar dit in die formaat "M" en "F" voorgestel is, sal die data wat moet na DW-formaat omgeskakel word.

Meting van eienskappe: Meting van Kenmerke:

Toepassingsontwerpers het oor die jare gekies om pypleiding op 'n verskeidenheid maniere te meet. 'n Ontwerper stoor die data wat van die pypleiding in sentimeter. Nog 'n toepassingsontwerper stoor die data wat van die pyplyn in terme van duim. Nog 'n toepassingsontwerper stoor die data wat van pypleiding in miljoen kubieke voet per sekonde. En 'n ander ontwerper stoor pyplyninligting in terme van werwe. Wat ook al die bron is, wanneer pyplyninligting in die DW aankom, moet dit op dieselfde manier gemeet word.

Volgens die aanduidings in figuur 3 raak integrasiekwessies byna elke aspek van die projek – die fisiese kenmerke van data wat, die dilemma om meer as een bron van te hê data wat, die kwessie van inkonsekwent geïdentifiseerde monsters, formate van data wat inkonsekwent, ensovoorts.

Wat ook al die ontwerponderwerp is, die resultaat is dieselfde – i data wat moet op 'n enkelvoudige en globaal aanvaarbare wyse in die DW gestoor word, selfs wanneer die onderliggende bedryfstelsels dit anders stoor data wat.

Wanneer die DSS-ontleder na die DW kyk, moet die ontleder se doelwit wees om die te ontgin data wat wat in die pakhuis is,

eerder as om te wonder oor die geloofwaardigheid of konsekwentheid van die data wat.

TYDSVARIANIE

Al die data wat in die DW is hulle tot op 'n sekere tydstip akkuraat. Hierdie basiese kenmerk van die data wat in DW is baie anders as data wat gevind in die bedryfsomgewing. DIE data wat van die bedryfsomgewing is so presies soos op die oomblik van toegang. Met ander woorde, in die bedryfsomgewing wanneer toegang tot 'n skyf verkry word data wat, word verwag dat dit presiese waardes sal weerspieël soos op die tyd van toegang. Want ek data wat in die DW is presies soos op 'n sekere tyd in die tyd (d.w.s. nie "op die oomblik nie"), word gesê dat i data wat wat in die DW gevind word, is "tydafwyking".
Die tydsafwyking van data wat deur DW word op talle maniere na verwys.
Die eenvoudigste manier is dat i data wat van 'n DW verteenwoordig data wat oor ’n lang tydhorison – vyf tot tien jaar. Die tydhorison wat vir die bedryfsomgewing verteenwoordig word, is baie korter as vandag se huidige waardes van tot sestig en negentig
Aansoeke wat goed moet funksioneer en beskikbaar moet wees vir transaksieverwerking moet die minimum bedrag van data wat as hulle enige mate van buigsaamheid toelaat. Operasionele toepassings het dus 'n kort tydshorison, soos 'n oudiotoepassingsontwerponderwerp.
Die tweede manier waarop 'tydafwyking' in die DW voorkom, is in die sleutelstruktuur. Elke sleutelstruktuur in die DW bevat, implisiet of eksplisiet, 'n tydelement, soos dag, week, maand, ens. Die tydelement is byna altyd onderaan die aaneengeskakelde sleutel wat in die DW gevind word. By hierdie geleenthede sal die tydelement implisiet bestaan, soos die geval waar 'n hele lêer aan die einde van die maand of kwartaal gedupliseer word.
Die derde manier waarop tydafwyking vertoon word, is dat i data wat van die DW, sodra dit korrek geregistreer is, kan nie bygewerk word nie. DIE data wat van die DW is, vir alle praktiese doeleindes, 'n lang reeks kiekies. Natuurlik as die foto's verkeerd geneem is, kan die foto's verander word. Maar as die kiekies korrek geneem word, word dit nie gewysig sodra dit geneem word nie. In sekere

In sommige gevalle kan dit oneties of selfs ongeldig wees dat foto's in die DW gewysig word. DIE data wat operasioneel, aangesien dit presies is soos op die oomblik van toegang, kan hulle opgedateer word soos die behoefte ontstaan.

NIE vlugtig nie

Die vierde belangrike eienskap van DW is dat dit nie-vlugtig is.
Opdaterings, invoegings, skrappings en wysigings word gereeld aan die operasionele omgewings aangebring op 'n rekord-vir-rekord basis. Maar die basiese manipulasie van die data wat wat in die DW benodig word, is baie eenvoudiger. Daar is net twee soorte bewerkings wat in die DW voorkom – die aanvanklike laai van data wat en toegang tot data wat. Daar is geen opdatering van die data wat (in die algemene sin van opdatering) in die DW as 'n normale verwerkingsoperasie. Daar is 'n paar baie kragtige gevolge van hierdie basiese verskil tussen operasionele verwerking en DW verwerking. Op die ontwerpvlak is die behoefte om versigtig te wees oor abnormale opdatering nie 'n faktor in die DW nie, aangesien die opdatering van data wat uitgevoer word nie. Dit beteken dat op die fisiese ontwerpvlak vryhede geneem kan word om toegang tot die optimalisering te optimaliseer data wat, veral in die hantering van die onderwerpe van fisiese normalisering en denormalisering. Nog 'n gevolg van die eenvoud van DW-bedrywighede is in die onderliggende tegnologie wat gebruik word om die DW-omgewing te bestuur. Om inlyn rekord-vir-rekord-opdaterings te ondersteun (soos dikwels die geval is met operasionele verwerking) vereis dat die tegnologie 'n baie komplekse fondament onder oënskynlike eenvoud het.
Die tegnologie wat rugsteun en herstel, transaksies en integriteit van ondersteun data wat en die opsporing en oplossing van dooiepunttoestand is redelik kompleks en nie nodig vir DW-verwerking nie. Die kenmerke van 'n DW, ontwerporiëntasie, integrasie van data wat binne die DW, tydafwyking en eenvoud van bestuur data wat, dit alles lei tot 'n omgewing wat baie, baie anders is as die klassieke bedryfsomgewing. Die bron van byna almal data wat van DW is die bedryfsomgewing. Dit is aanloklik om te dink dat daar massiewe oortolligheid van data wat tussen die twee omgewings.
Trouens, die eerste indruk wat baie mense het, is dié van groot oortolligheid data wat tussen die bedryfsomgewing en die omgewing van

DW. So 'n interpretasie is oppervlakkig en demonstreer 'n gebrek aan begrip van wat in die DW gebeur.
Daar is inderdaad 'n minimum van oortolligheid data wat tussen die bedryfsomgewing en i data wat van die DW. Oorweeg die volgende:I data wat hulle word gefiltreer Dato oorskakeling van die bedryfsomgewing na die DW-omgewing. Baie data wat hulle gaan nooit buite die bedryfsomgewing verby nie. Behalwe dat ek data wat wat nodig is vir DSS-verwerking vind hul rigting in die omgewing

▪ die tydshorison van data wat dit verskil baie van een omgewing na 'n ander. DIE data wat in die bedryfsomgewing is hulle baie vars. DIE data wat in die DW is hulle baie ouer. Slegs vanuit die tydhorison-perspektief is daar baie min oorvleueling tussen die operasionele omgewing en die DW.

▪ Die DW bevat data wat opsomming wat nooit in die omgewing gevind word nie

▪ Ek data wat 'n fundamentele transformasie ondergaan soos hulle oorgaan na Figuur 3 illustreer dat die meeste data wat word aansienlik gewysig mits hulle gekies en na die DW geskuif word. Anders gestel, die meeste van die data wat dit word fisies en radikaal verander namate dit in die DW ingeskuif word. Vanuit 'n integrasie-oogpunt is hulle nie dieselfde nie data wat wat in die bedryfsomgewing woon. In die lig van hierdie faktore is die oortolligheid van data wat tussen die twee omgewings is 'n seldsame gebeurtenis, wat lei tot minder as 1% oortolligheid tussen die twee omgewings. DIE STRUKTUUR VAN DIE PAKHUIS DW's het 'n duidelike struktuur. Daar is verskeie vlakke van opsomming en detail wat die DW's afbaken.
Die verskillende komponente van 'n DW is:

  • Metadata
  • Dati huidige besonderhede
  • Dati van ou detail
  • Dati effens opgesom
  • Dati hoogs opgesom

Verreweg die grootste bekommernis is vir i data wat huidige besonderhede. Dit is die grootste bekommernis omdat:

  • I data wat huidige besonderhede weerspieël die mees onlangse gebeure, wat altyd van groot belang is en
  • i data wat van huidige detail is omvangryk omdat dit op die laagste vlak van korreligheid gestoor word en
  • i data wat Huidige besonderhede word byna altyd op skyfgeheue gestoor, wat vinnig toegang is, maar duur en ingewikkeld om te gebruik data wat van detail is ouer data wat wat in een of ander geheue gestoor word massa. Dit word sporadies verkry en word gestoor op 'n vlak van detail wat versoenbaar is met data wat huidige besonderhede. Alhoewel dit nie verpligtend is om op 'n alternatiewe bergingsmedium te stoor nie, as gevolg van die groot volume van data wat gekombineer met sporadiese toegang van data wat, die stoormedium vir data wat ouer detaildata word gewoonlik nie op skyf gestoor nie. DIE data wat ligweg opgesom hulle is data wat wat gedistilleer word vanaf die lae vlak van detail wat gevind word tot die huidige vlak van detail. Hierdie vlak van die DW word byna altyd op skyfberging gestoor. Die ontwerpprobleme waarmee die argitek te kampe het data wat in die konstruksie van hierdie vlak van die DW is:
  • Watter tydseenheid is die opsomming hierbo gemaak
  • Watter inhoud, eienskappe sal die inhoud van die effens opsom data wat Die volgende vlak van data wat gevind in die DW is dié van data wat hoogs opgesom. DIE data wat hoogs opgesom is kompak en maklik toeganklik. DIE data wat hoogs opgesom word soms in die DW-omgewing gevind en in ander gevalle i data wat hoogs opgesom word gevind buite die onmiddellike mure van die tegnologie wat die DW huisves. (in elk geval, i data wat hoogs opgesom is deel van die DW ongeag waar i data wat fisies gehuisves word). Die finale komponent van die DW is die metadata. In baie opsigte sit metadata in 'n ander dimensie as ander data wat van die DW, want die metadata bevat geen Dato direk uit die bedryfsomgewing geneem. Metadata speel 'n spesiale en baie belangrike rol in DW. Metadata word gebruik as:
  • 'n gids om die DSS-ontleder te help om die inhoud van die DW op te spoor,
  • 'n gids vir die kartering van die data wat van hoe ek data wat van die operasionele omgewing na die DW-omgewing getransformeer is,
  • 'n gids tot die algoritmes wat gebruik word vir opsomming tussen die data wat van huidige besonderhede ei data wat effens opgesom, i data wat hoogs opgesom, Metadata speel 'n baie groter rol in die DW-omgewing as wat dit ooit in die operasionele omgewing gehad het OU DETAIL STOOR MEDIUM Magneetband kan gebruik word om daardie soort te stoor data wat. Trouens, daar is 'n wye verskeidenheid bergingsmedia wat oorweeg moet word vir ou berging data wat van detail. Afhangende van die volume van data wat, die frekwensie van toegang, die koste van die gereedskap en die tipe toegang, is dit heeltemal waarskynlik dat ander gereedskap die ou vlak van detail in die DW sal benodig. VLOEI VAN DATA Daar is 'n normale en voorspelbare vloei van die data wat binne die DW.
    I data wat hulle betree die DW vanuit die bedryfsomgewing. (LET WEL: Daar is 'n paar baie interessante uitsonderings op hierdie reël. Maar byna almal data wat voer die DW vanuit die bedryfsomgewing in). Dato dat ek data wat die DW vanuit die bedryfsomgewing binnegaan, word dit getransformeer soos dit voorheen beskryf is. Op voorwaarde om die DW te betree, i data wat voer die huidige vlak van detail in, soos getoon. Dit woon daar en word gebruik totdat een van drie gebeurtenisse plaasvind:
  • is gesuiwer,
  • word opgesom, en/of ▪è Die verouderde proses binne 'n DW beweeg i data wat huidige besonderhede a data wat van detail oud, volgens die ouderdom van data wat. Die proses

opsomming gebruik die detail van data wat om die te bereken data wat effens opgesomde en hoogs opgesomde vlakke van die data wat. Daar is 'n paar uitsonderings op die vloei wat gewys word (sal later bespreek word). Maar gewoonlik, vir die oorgrote meerderheid van data wat gevind binne 'n DW, die vloei van data wat dit is soos voorgestel.

GEBRUIK VAN DIE DATAWAREHUIS

Nie verrassend die verskillende vlakke van data wat binne die DW ontvang hulle nie verskillende vlakke van gebruik nie. As 'n reël, hoe hoër die vlak van opsomming, hoe meer i data wat hulle word gebruik.
Baie gebruike kom voor in die data wat hoogs opgesom, terwyl die ou data wat detail word byna nooit gebruik nie. Daar is 'n goeie rede om die organisasie na die hulpbronbenuttingsparadigma te skuif. Meer opgesom i data wat, hoe vinniger en doeltreffender is dit om by uit te kom data wat. As 'n winkel vind dat dit baie prosesse op die detailvlak van die DW doen, dan word 'n ooreenstemmende groot hoeveelheid masjienhulpbronne verbruik. Dit is in almal se beste belang om so spoedig moontlik so hoë vlak van opsomming te verwerk.

Vir baie winkels het die DSS-ontleder in 'n pre-DW-omgewing gebruik data wat op die vlak van detail. In baie opsigte het die aankoms by data wat gedetailleerde opsomming lyk soos 'n sekuriteitskombers, selfs wanneer ander vlakke van opsomming beskikbaar is. Een van die argitek se aktiwiteite data wat is om die DSS-gebruiker te speen van konstante gebruik van data wat op die laagste vlak van detail. Daar is twee motiverings beskikbaar vir die argitek van data wat:

  • deur 'n terugbetalingstelsel te installeer, waar die eindgebruiker betaal vir die hulpbronne wat verbruik word en
  • wat aandui dat baie goeie reaksietyd behaal kan word wanneer die gedrag met i data wat is op 'n hoë vlak van opsomming, terwyl die swak reaksietyd afkomstig is van die gedrag van die data wat op 'n lae vlak van ANDER OORWEGINGS Daar is 'n paar ander DW-konstruksie- en bestuursoorwegings.
    Die eerste oorweging is dié van indekse. DIE data wat op hoër vlakke van opsomming kan hulle vrylik geïndekseer word, terwyl i data wat

op laer vlakke van detail is hulle so lywig dat hulle spaarsamig geïndekseer kan word. Uit dieselfde oogpunt, i data wat op hoë vlakke van detail kan relatief maklik herstruktureer word, terwyl die volume van data wat op die laer vlakke is dit so groot dat i data wat hulle kan nie maklik opgeknap word nie. Gevolglik is die model van data wat en die formele werk wat deur die ontwerp gedoen is, lê die grondslag vir die DW wat feitlik uitsluitlik op die huidige vlak van detail toegepas word. Met ander woorde, die modelleringsaktiwiteite van data wat hulle is nie in byna elke geval op opsommingsvlakke van toepassing nie. Nog 'n strukturele oorweging is dié van die onderverdeling van data wat deur DW.

Partisie kan op twee vlakke gedoen word - op die vlak van dbms en op toepassingsvlak. In die afdeling op die vlak dbmsdie dbms word ingelig oor die afdelings en beheer dit dienooreenkomstig. In die geval van verdeling op toepassingsvlak word slegs die programmeerder van die afdelings ingelig en die verantwoordelikheid vir die administrasie daarvan word aan hom oorgelaat.

Onder vlak dbms, word baie werk outomaties gedoen. Daar is baie onbuigsaamheid verbonde aan die outomatiese administrasie van afdelings. In die geval van verdelings op die toepassingsvlak van data wat del data pakhuis, baie werk weeg op die programmeerder, maar die eindresultaat is buigsaamheid in die administrasie van data wat in data pakhuis

ANDER ANOMALIES

Terwyl die komponente van die data pakhuis Hulle werk soos beskryf vir byna almal data wat, is daar 'n paar nuttige uitsonderings wat bespreek moet word. 'n Uitsondering is dié van data wat openbare opsommingsdata. Hierdie is data wat opsommings wat uit die bereken is data pakhuis maar hulle word deur die samelewing gebruik. DIE data wat openbare opsommings word gestoor en bestuur in die data pakhuis, alhoewel hulle, soos voorheen genoem, uitgereken is. Rekenmeesters werk om dit kwartaalliks te produseer data wat soos inkomste, kwartaallikse uitgawes, kwartaallikse wins, ensovoorts. Die werk wat deur rekenmeesters gedoen word, is ekstern tot data pakhuis. I data wat word "intern" binne die maatskappy gebruik - vanaf bemarking, verkope, ens. Nog 'n anomalie, wat nie bespreek sal word nie, is dié van data wat ekstern.

Nog 'n uitstaande tipe data wat wat gevind kan word in 'n data pakhuis is dié van die permanente detail data. Dit veroorsaak die behoefte om die permanent te stoor data wat op 'n gedetailleerde vlak vir etiese of wetlike redes. As 'n maatskappy sy werkers aan gevaarlike stowwe blootstel, is dit nodig data wat gedetailleerd en permanent. As 'n maatskappy 'n produk vervaardig wat openbare veiligheid behels, soos vliegtuigonderdele, is daar 'n behoefte om data wat permanente besonderhede, asook as 'n maatskappy gevaarlike kontrakte aangaan.

Die maatskappy kan nie bekostig om besonderhede oor die hoof te sien nie, want oor die volgende paar jaar, in die geval van 'n regsgeding, herroeping, betwiste konstruksiefout, ens. die maatskappy se blootstelling kan groot wees. As gevolg hiervan is daar 'n unieke tipe data wat bekend as permanente detail data.

OPSOMMING

Un data pakhuis is 'n objekgeoriënteerde, geïntegreerde, tydvariant, 'n versameling van data wat nie-vlugtig om die besluitnemingsbehoeftes van die administrasie te ondersteun. Elk van die belangrikste funksies van a data pakhuis het sy implikasies. Plus daar is vier vlakke van data wat del data pakhuis:

  • Ou detail
  • Huidige detail
  • Dati effens opgesom
  • Dati hoogs opgesomde Metadata is ook 'n belangrike deel van die data pakhuis. OPSOMMING Die konsep van die berging van data wat Dit het onlangs baie aandag gekry en het 'n neiging van die jare 90. Dit is te danke aan die vermoë van 'n data pakhuis om die beperkings van bestuursondersteuningstelsels soos besluitondersteuningstelsels (DSS) en uitvoerende inligtingstelsels (EIS) te oorkom. Selfs al is die konsep van data pakhuis lyk belowend, implementeer i data pakhuis kan problematies wees as gevolg van grootskaalse pakhuisprosesse. Ten spyte van die kompleksiteit van pakhuisprojekte data wat, baie verskaffers en konsultante wat voorraad data wat hulle beweer dat die berging van data wat stroom veroorsaak geen probleme nie. Aan die begin van hierdie navorsingsprojek was byna geen onafhanklike, streng en sistematiese navorsing egter uitgevoer nie. Gevolglik is dit moeilik om te sê wat werklik in die bedryf gebeur wanneer hulle gebou word data pakhuis. Hierdie studie het die pakhuispraktyk van data wat tydgenote wat daarop gemik is om 'n ryker begrip van Australiese praktyk te ontwikkel. Die literatuuroorsig het die konteks en grondslag vir die empiriese studie verskaf. Daar is 'n aantal bevindinge uit hierdie navorsing. Eerstens het hierdie studie die aktiwiteite aan die lig gebring wat tydens die ontwikkeling van die data pakhuis. Op baie gebiede, i data wat versamel het bevestig die praktyk wat in die literatuur gerapporteer is. Tweedens, die kwessies en probleme wat die ontwikkeling van die data pakhuis is deur hierdie studie geïdentifiseer. Ten slotte, voordele verkry deur Australiese organisasies wat verband hou met die gebruik van data pakhuis geopenbaar is.

Hoofstuk 1

Soek konteks

Die konsep van datapakhuis het wydverspreide blootstelling gekry en het in die 90's 'n opkomende tendens geword (McFadden 1996, TDWI 1996, Shah en Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman en Oates 2000). Dit kan gesien word uit die groeiende aantal artikels oor datapakhuise in handelspublikasies (Little en Gibson 1999). Baie artikels (sien byvoorbeeld Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett en King 1996, Graham et al. 1996, Sakaguchi en Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, Don McCarthy 1997, 1997'1998, 1999 McCarthy, XNUMX Edwards XNUMX, TDWI XNUMX) het beduidende voordele gerapporteer wat verkry is deur organisasies wat i implementeer data pakhuis. Hulle het hul teorie ondersteun met anekdotiese bewyse van suksesvolle implementering, hoë opbrengs op belegging (ROI) syfers en ook deur riglyne of metodologieë te verskaf vir die ontwikkeling van die data pakhuis

(Shanks et al. 1997, Seddon en Benjamin 1998, Little en Gibson 1999). In 'n uiterste geval het Graham et al. (1996) het 'n gemiddelde opbrengs op 'n driejaarbelegging van 401% gerapporteer.

Baie van die huidige literatuur het egter die kompleksiteite wat betrokke is by die aanpak van sulke projekte oor die hoof gesien. Die projekte van data pakhuis hulle is normaalweg kompleks en grootskaalse en dra dus 'n hoë waarskynlikheid van mislukking as hulle nie noukeurig beheer word nie (Shah en Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs en Clymer 1998, Rao 1998). Hulle vereis groot hoeveelhede van beide menslike en finansiële hulpbronne, en tyd en moeite om dit te bou (Hill 1998, Crofts 1998). Die tipiese tyd en finansiële middele wat benodig word, is onderskeidelik ongeveer twee jaar en twee tot drie miljoen dollar (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Hierdie tyd en finansiële middele word benodig om baie verskillende aspekte van datapakhuis te beheer en te konsolideer (Cafasso 1995, Hill 1998). Benewens die hardeware en sagteware oorwegings, ander funksies, wat wissel van die onttrekking van data wat aan die laaiprosesse van data wat, die geheuekapasiteit om opdaterings te bestuur en die meta data wat vir gebruikersopleiding, oorweeg moet word.

Toe hierdie navorsingsprojek begin het, was daar baie min akademiese navorsing wat op die gebied van datapakhuis gedoen is, veral in Australië. Dit was duidelik uit die gebrek aan gepubliseerde artikels oor datapakhuise uit joernale of ander akademiese geskrifte van die tyd. Baie van die beskikbare akademiese geskrifte het die Amerikaanse ervaring beskryf. Die gebrek aan akademiese navorsing op die gebied van datapakhuise het oproepe vir streng navorsing en empiriese studies veroorsaak (McFadden 1996, Shanks et al. 1997, Little en Gibson 1999). In die besonder, navorsingstudies oor die implementeringsproses van data pakhuis moet uitgevoer word om algemene kennis aangaande die implementering van uit te brei data pakhuis en sal dien as basis vir 'n toekomstige navorsingstudie (Shanks et al. 1997, Little en Gibson 1999).

Die doel van hierdie studie is dus om te bestudeer wat werklik gebeur wanneer organisasies i data pakhuis in Australië. Spesifiek sal hierdie studie 'n ontleding van 'n hele ontwikkelingsproses van 'n data pakhuis, vanaf inisiasie en beplanning deur ontwerp en implementering en daaropvolgende gebruik binne Australiese organisasies. Daarbenewens sal die studie ook bydra tot huidige praktyk deur areas te identifiseer waar praktyk verder verbeter kan word en ondoeltreffendheid en risiko's tot die minimum beperk of vermy kan word. Verder sal dit as basis dien vir ander studies oor data pakhuis in Australië en sal die leemte vul wat tans in die literatuur bestaan.

Navorsingsvrae

Die doel van hierdie navorsing is om die aktiwiteite betrokke by die implementering van te bestudeer data pakhuis en die gebruik daarvan deur Australiese organisasies. Veral elemente rakende projekbeplanning, ontwikkeling, bedryf, gebruik en die betrokke risiko's word bestudeer. Die vraag van hierdie navorsing is dus:

“Hoe is die huidige praktyk van die data pakhuis in Australië?"

Om hierdie vraag effektief te beantwoord, word 'n aantal bykomende navorsingsvrae vereis. Veral drie subvrae is uit die literatuur, wat in hoofstuk 2 aangebied word, geïdentifiseer om hierdie navorsingsprojek te rig: Hoe is die data pakhuis van Australiese organisasies? Watter probleme het jy teëgekom?

Wat is die voordele wat ervaar word?
In die beantwoording van hierdie vrae is 'n verkennende navorsingsontwerp gebruik wat 'n opname gebruik. As 'n verkennende studie is die antwoorde op bogenoemde vrae nie volledig nie (Shanks et al. 1993, Denscombe 1998). In hierdie geval is triangulasie nodig om die antwoorde op hierdie vrae te verbeter. Die ondersoek sal egter 'n stewige grondslag bied vir toekomstige werk om hierdie vrae te ondersoek. 'n Gedetailleerde bespreking oor die regverdiging en ontwerp van navorsingsmetodes word in Hoofstuk 3 aangebied.

Struktuur van die navorsingsprojek

Hierdie navorsingsprojek word in twee dele verdeel: die kontekstuele studie van die datapakhuiskonsep en die empiriese navorsing (sien Figuur 1.1), wat elk hieronder bespreek word.

Deel I: Kontekstuele studie

Die eerste deel van die navorsing het bestaan ​​uit die hersiening van die huidige literatuur oor verskeie tipes datapakhuise insluitend besluitondersteuningstelsels (DSS), uitvoerende inligtingstelsels (EIS), gevallestudies van data pakhuis en die konsepte van data pakhuis. Verder die resultate van die forums data pakhuis en kundige- en praktisynvergaderingsgroepe gelei deur die Monash DSS-navorsingspan, het bygedra tot hierdie fase van die studie wat bedoel was om insigte te verkry in die praktyk van data pakhuis en om die risiko's verbonde aan die aanneming daarvan te identifiseer. Gedurende hierdie kontekstuele studietydperk is begrip van die probleemarea gevestig om die agtergrondkennis vir daaropvolgende empiriese ondersoeke te verskaf. Dit was egter 'n voortdurende proses tydens die uitvoer van die navorsingstudie.

Deel II: Empiriese navorsing

Die relatief nuwe konsep van datapakhuis, veral in Australië, het die behoefte geskep vir 'n opname om 'n breë prentjie van die gebruikerservaring te kry. Hierdie deel is uitgevoer nadat die probleemdomein deur uitgebreide literatuuroorsig vasgestel is. Die data-pakhuiskonsep wat tydens die kontekstuele studiefase gevorm is, is as insette vir die aanvanklike vraelys van hierdie studie gebruik. Hierna is die vraelys ondersoek. Julle is kundiges in data pakhuis aan die toets deelgeneem. Die doel van die toets van die aanvanklike vraelys was om die volledigheid en akkuraatheid van die vrae na te gaan. Op grond van die toetsresultate is die vraelys gewysig en die gewysigde weergawe is aan die opname-deelnemers gestuur. Die terugbesorgde vraelyste is dan ontleed vir i data wat in tabelle, diagramme en ander formate. DIE

ontleding resultate van data wat hulle vorm 'n momentopname van datapakhuispraktyke in Australië.

DATA PAGHUIS OORSIG

Die konsep van datapakhuise het ontwikkel met verbeterings in rekenaartegnologie.
Dit is daarop gemik om die probleme te oorkom waarmee toepassingsondersteuningsgroepe soos Besluitondersteuningstelsel (DSS) en Uitvoerende Inligtingstelsel (EIS) te kampe het.

In die verlede was die grootste struikelblok van hierdie toepassings die onvermoë van hierdie toepassings om 'n databasis nodig vir die ontleding.
Dit word hoofsaaklik veroorsaak deur die aard van bestuur se werk. Die belange van 'n maatskappy se bestuur wissel voortdurend na gelang van die gebied wat gedek word. Daarom i data wat fundamenteel vir hierdie toepassings moet hulle vinnig kan verander na gelang van die onderdeel wat behandel moet word.
Dit beteken dat i data wat moet in die toepaslike vorm vir die gevraagde ontledings beskikbaar wees. Trouens, toepassingsondersteuningsgroepe het dit in die verlede baie moeilik gevind om te versamel en te integreer data wat uit komplekse en diverse bronne.

Die res van hierdie afdeling bied 'n oorsig van die konsep van datapakhuis en bespreek hoe die data pakhuis kan die probleme van toepassingsondersteuningsgroepe oorkom.
Die term “Datastoor” is gewild gemaak deur William Inmon in 1990. Sy dikwels aangehaalde definisie sien die Datastoor as 'n versameling van data wat vakgerig, geïntegreerd, nie-vlugtig en veranderlik oor tyd, ter ondersteuning van bestuursbesluite.

Deur hierdie definisie te gebruik, wys Inmon daarop dat i data wat woonagtig in 'n data pakhuis hulle moet die volgende 4 eienskappe besit:

  • ▪ Vakgerig
  • ▪ Geïntegreerde
  • ▪ Nie-vlugtig
  • ▪ Veranderlik oor tyd Met vakgerigte Inmon beteken dat i data wat in data pakhuis in die grootste organisatoriese gebiede wat was

in die model gedefinieer data wat. Byvoorbeeld almal data wat oor i kliënte is vervat in die vakgebied kliënte. Net so almal data wat met betrekking tot die produkte is vervat in die PRODUKTE vakgebied.

Met Geïntegreerde Inmon beteken dat i data wat afkomstig van verskillende platforms, stelsels en liggings word gekombineer en op een plek gestoor. Gevolglik data wat soortgelyke formate moet omskep word in konsekwente formate sodat hulle maklik bygevoeg en vergelyk kan word.
Byvoorbeeld, manlike en vroulike geslag word voorgestel deur die letters M en F in een stelsel, en deur 1 en 0 in 'n ander. Om hulle behoorlik te integreer, moet een of albei formate getransformeer word sodat die twee formate dieselfde is. In hierdie geval kan ons M na 1 en F na 0 of andersom verander. Vakgerig en Geïntegreerd dui aan dat die data pakhuis is ontwerp om 'n funksionele en transversale visie van data wat deur die maatskappy.

Met Nie-vlugtig bedoel hy dat i data wat in data pakhuis bly konsekwent en die opdatering van data wat dit is onnodig. In plaas daarvan, elke verandering in data wat oorspronklikes word bygevoeg databasis del data pakhuis. Dit beteken dat die historiese dei data wat is vervat in data pakhuis.

Vir Veranderlikes met tyd dui Inmon aan dat i data wat in data pakhuis bevat altyd die tempo-aanwysers ei data wat hulle kruis gewoonlik 'n sekere tydhorison. Byvoorbeeld a
data pakhuis kan 5 jaar se historiese waardes van bevat kliënte vanaf 1993 tot 1997. Die beskikbaarheid van die geskiedenis en 'n tydreeks van data wat laat jou toe om tendense te ontleed.

Un data pakhuis hy kan sy eie insamel data wat van OLTP-stelsels; van bronne data wat ekstern tot die organisasie en/of deur ander spesiale vangstelselprojekte data wat.
I data wat uittreksels kan deur 'n skoonmaakproses gaan, in hierdie geval i data wat word getransformeer en geïntegreer voordat dit in die gestoor word databasis del data pakhuis. Dan ek data wat

woonagtig binne die databasis del data pakhuis word beskikbaar gestel aan eindgebruikersaanmeldings en herstelnutsgoed. Deur hierdie instrumente te gebruik, kan die eindgebruiker toegang kry tot die geïntegreerde aansig van die organisasie van data wat.

I data wat woonagtig binne die databasis del data pakhuis hulle word beide in detail en in opsommingsformate gestoor.
Die vlak van opsomming kan afhang van die aard van die data wat. Ek data wat gedetailleerde kan bestaan ​​uit data wat huidige en data wat stories
I data wat ware is nie ingesluit in die data pakhuis totdat ek data wat in data pakhuis word weer bygewerk.
Benewens die stoor van die data wat hulself, a data pakhuis dit kan ook 'n ander tipe stoor Dato genoem METADATA beskryf die data wat woonagtig in syne databasis.
Daar is twee tipes metadata: ontwikkelingsmetadata en analitiese metadata.
Ontwikkeling metadata word gebruik om die onttrekking, skoonmaak, kartering en laai prosesse van die te bestuur en te outomatiseer data wat in data pakhuis.
Die inligting vervat in die ontwikkelingsmetadata kan besonderhede van bedryfstelsels bevat, besonderhede van die elemente wat onttrek moet word, die model data wat del data pakhuis en besigheidsreëls vir omskakeling data wat.

Die tweede tipe metadata, bekend as analitiese metadata, stel die eindgebruiker in staat om die inhoud van die data pakhuis om die te vind data wat beskikbaar en hul betekenis in duidelike, nie-tegniese terme.

Daarom werk analitiese metadata as 'n brug tussen die data pakhuis en eindgebruikertoepassings. Hierdie metadata kan die sakemodel bevat, beskrywings van data wat wat ooreenstem met die besigheidsmodel, vooraf gedefinieerde navrae en verslae, inligting vir gebruikerstoegang en die indeks.

Ontleding en ontwikkeling metadata moet gekombineer word in 'n enkele geïntegreerde insluiting metadata om behoorlik te funksioneer.

Ongelukkig het baie van die bestaande instrumente hul eie metadata en daar is tans geen bestaande standaarde daarvoor nie

laat datapakhuisnutsgoed toe om hierdie metadata te integreer. Om hierdie situasie reg te stel, het baie handelaars van die belangrikste datapakhuisinstrumente die Meta Data Council gevorm wat later die Meta Data Coalition geword het.

Die doel van hierdie koalisie is om 'n standaard metadatastel te bou wat verskillende datapakhuisinstrumente toelaat om die metadata om te skakel
Hul pogings het gelei tot die geboorte van die Meta Data Interchange Specification (MDIS) wat die uitruil van inligting tussen Microsoft-argiewe en die verwante MDIS-lêers sal toelaat.

Die bestaan ​​van data wat beide opgesom/geïndexeer en gedetailleerd gee die gebruiker die moontlikheid om 'n DRILL DROWN (boor) uit te voer vanaf data wat geïndekseer na gedetailleerdes en omgekeerd. Die bestaan ​​van data wat gedetailleerde geskiedenisse laat die skepping van tendensontledings oor tyd toe. Daarbenewens kan die analitiese metadata gebruik word as 'n gids van databasis del data pakhuis eindgebruikers te help om die op te spoor data wat nodig.

In vergelyking met OLTP-stelsels, met hul vermoë om analise van te ondersteun data wat en verslagdoening, die data pakhuis dit word gesien as 'n meer geskikte stelsel vir inligtingsprosesse soos die maak en reageer op navrae en die vervaardiging van verslae. Die volgende afdeling sal die verskille van die twee stelsels in detail uitlig.

DATASTOOR TEEN OLTP-STELSELS

Baie van die inligtingstelsels binne organisasies is bedoel om daaglikse bedrywighede te ondersteun. Hierdie stelsels bekend as OLTP SYSTEMS, vang voortdurend bygewerkte daaglikse transaksies.

I data wat binne hierdie stelsels word hulle dikwels gewysig, bygevoeg of uitgevee. Byvoorbeeld, 'n kliënt se adres verander soos hy van een plek na 'n ander beweeg. In hierdie geval sal die nuwe adres geregistreer word deur die adresveld te wysig databasis. Die hoofdoel van hierdie stelsels is om transaksiekoste te verminder en terselfdertyd verwerkingstye te verminder. Voorbeelde van OLTP-stelsels sluit in kritieke aksies soos bestellinginvoer, betaalstaat, faktuur, vervaardiging, kliëntediens kliënte.

Anders as OLTP-stelsels, wat geskep is vir transaksie- en gebeurtenisgebaseerde prosesse, i data pakhuis is geskep om ondersteuning te bied vir analise-gebaseerde prosesse data wat en besluitnemingsprosesse.

Dit word gewoonlik bereik deur i data wat van verskeie OLTP en eksterne stelsels in 'n enkele "houer" van data wat,soos in die vorige afdeling bespreek.

Monash Data Warehousing Proses Model

Die prosesmodel vir data pakhuis Monash is ontwikkel deur navorsers by die Monash DSS Navorsingsgroep, en is gebaseer op die literatuur van data pakhuis, oor ondervinding in die ondersteuning van die ontwikkeling van stelselvelde, oor gesprekke met verskaffers van toepassings vir gebruik op data pakhuis, op 'n groep kundiges in die gebruik van data pakhuis.

Die fases is: Aanvang, Beplanning, Ontwikkeling, Bedryf en Verduidelikings. Die diagram verduidelik die iteratiewe of evolusionêre aard van die ontwikkeling van a data pakhuis verwerk deur tweerigtingpyle wat tussen die verskillende fases geplaas is. In hierdie konteks beteken "iteratief" en "evolusionêr" dat implementeringsaktiwiteite by elke stap van die proses altyd agteruit na die vorige fase kan voortplant. Dit is as gevolg van die aard van 'n projek data pakhuis waarin bykomende versoeke van die eindgebruiker te eniger tyd ontstaan. Byvoorbeeld, tydens die ontwikkelingsfase van 'n proses data pakhuis, word 'n nuwe dimensie of vakgebied deur die eindgebruiker versoek, wat nie deel van die oorspronklike plan was nie, moet dit by die stelsel gevoeg word. Dit veroorsaak 'n verandering in die projek. Die gevolg is dat die ontwerpspan die vereistes van die dokumente wat tot dusver geskep is tydens die ontwerpfase moet verander. In baie gevalle moet die huidige stand van die projek teruggaan na die ontwerpfase waar die nuwe vereiste bygevoeg en gedokumenteer moet word. Die eindgebruiker moet die spesifieke dokumentasie wat nagegaan is en die veranderinge wat in die ontwikkelingsfase aangebring is, kan sien. Aan die einde van hierdie ontwikkelingsiklus moet die projek uitstekende terugvoer van beide die ontwikkeling- en gebruikersspanne kry. Die terugvoer word dan hergebruik om 'n toekomstige projek te verbeter.

Kapasiteitsbeplanning
Dw is geneig om baie groot in grootte te wees en baie vinnig te groei (Best 1995, Rudin 1997a) as gevolg van die hoeveelheid data wat geskiedenisse wat hulle van hul duur behou. Groei kan ook veroorsaak word deur data wat byvoegings versoek deur gebruikers om die waarde van te verhoog data wat wat hulle reeds het. Gevolglik is die bergingsvereistes vir data wat aansienlik verbeter kan word (Eckerson 1997). Dit is dus noodsaaklik om te verseker, deur kapasiteitsbeplanning uit te voer, dat die stelsel wat gebou word, kan groei soos wat behoeftes groei (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
By die beplanning vir skaalbaarheid van die databasis moet 'n mens die verwagte groei in die grootte van die pakhuis ken, die tipe navrae wat waarskynlik gemaak sal word, en die aantal eindgebruikers wat ondersteun word (Best 1995, Rudin 1997b, Foley 1997a). Die bou van skaalbare toepassings vereis 'n kombinasie van skaalbare bedienertegnologieë en skaalbare toepassingsontwerptegnieke (Best 1995, Rudin 1997b. Beide is nodig om 'n hoogs skaalbare toepassing te bou. Skaalbare bedienertegnologieë kan dit maklik en voordelig maak om berging, geheue en SVE by te voeg sonder om dit te verneder. uitvoering (Lang 1997, Telefonie 1997).

Daar is twee hoof-skaalbare bedienertegnologieë: simmetriese veelvuldige verwerking (SMP) en massief parallelle verwerking (MPP) (IDC 1997, Humphries et al. 1999). 'n SMP-bediener het tipies veelvuldige verwerkers wat 'n geheue, stelselbus en ander hulpbronne deel (IDC 1997, Humphries et al. 1999). Bykomende verwerkers kan bygevoeg word om sy te verhoog krag rekenkundige. Nog 'n metode om die krag van die SMP-bediener, is om talle SMP-masjiene te kombineer. Hierdie tegniek staan ​​bekend as groepering (Humphries et al. 1999). ’n MPP-bediener, aan die ander kant, het veelvuldige verwerkers elk met sy eie geheue, busstelsel en ander hulpbronne (IDC 1997, Humphries et al. 1999). Elke verwerker word 'n nodus genoem. 'n Toename in krag berekening verkry kan word

bykomende nodusse by MPP-bedieners te voeg (Humphries et al. 1999).

'n Swakheid van SMP-bedieners is dat te veel invoer-uitset (I/O) bewerkings die stelselbus kan verstop (IDC 1997). Hierdie probleem kom nie binne MPP-bedieners voor nie aangesien elke verwerker sy eie busstelsel het. Die onderlinge verbindings tussen elke nodus is egter oor die algemeen baie stadiger as die SMP-busstelsel. Daarbenewens kan MPP-bedieners 'n bykomende vlak van kompleksiteit by toepassingsontwikkelaars voeg (IDC 1997). Die keuse tussen SMP- en MPP-bedieners kan dus deur baie faktore beïnvloed word, insluitend die kompleksiteit van die toepassings, die prys/prestasie-verhouding, die vereiste verwerkingskapasiteit, die verhinderde dw-toepassings en die toename in grootte van die databasis van dw en in die aantal eindgebruikers.

Talle skaalbare toepassingsontwerptegnieke kan in kapasiteitsbeplanning aangewend word. ’n Mens gebruik verskeie kennisgewingtydperke soos dae, weke, maande en jare. Met verskeie kennisgewing tydperke, die databasis dit kan in hanteerbaar gegroepeerde stukke verdeel word (Inmon et al. 1997). Nog 'n tegniek is om opsommingstabelle te gebruik wat deur opsomming saamgestel word data wat da data wat gedetailleerd. Dus, i data wat opgesom is meer kompak as gedetailleerd, wat minder geheuespasie verg. Sodat die data wat detail kan in 'n goedkoper stooreenheid gestoor word, wat selfs meer berging bespaar. Alhoewel die gebruik van opsommingstabelle geheuespasie kan bespaar, verg dit baie moeite om dit op datum te hou en in lyn met besigheidsbehoeftes te hou. Hierdie tegniek word egter wyd gebruik en word dikwels saam met die vorige tegniek gebruik (Best 1995, Inmon 1996a, Chauduri en Dayal
1997).

definiëring Datastoor Tegniese argitekture Definisie van dw argitektuur tegnieke

Vroeë aannemers van datapakhuis was hoofsaaklik bedink van 'n gesentraliseerde implementering van die dw waarin al die data wat, insluitend i data wat ekstern, is geïntegreer in 'n enkele,
fisiese bewaarplek (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Die grootste voordeel van hierdie benadering is dat eindgebruikers toegang tot die ondernemingwye siening van die data wat organisatories (Ovum 1998). Nog 'n voordeel is dat dit standaardisering van data wat deur organisasie, wat beteken daar is net een weergawe of definisie vir elke terminologie wat in die dw-bewaarplek (metadata) gebruik word (Flanagan en Safdie 1997, Ovum 1998). Die nadeel van hierdie benadering, aan die ander kant, is dat dit duur en moeilik is om te bou (Flanagan en Safdie 1997, Ovum 1998, Inmon et al. 1998). Nie lank na die stoorargitektuur nie data wat gesentraliseerde gewild geword het, die konsep van die onttrekking van kleiner subsets van die geëvolueerde data wat om die behoeftes van spesifieke toepassings te ondersteun (Varney 1996, IDC 1997, Berson en Smith 1997, peacock 1998). Hierdie klein stelsels is afgeleides van die groter een data pakhuis gesentraliseer. Hulle word genoem data pakhuis afhanklike departementele of afhanklike datamars. Die afhanklike datamart-argitektuur staan ​​bekend as drievlak-argitektuur waar die eerste vlak bestaan ​​uit die data pakhuis gesentraliseerde, die tweede bestaan ​​uit die deposito's van data wat departementele en die derde bestaan ​​uit toegang tot data wat en deur analise-instrumente (Demarest 1994, Inmon et al. 1997).

Data marts word gewoonlik gebou na die data pakhuis gesentraliseerd is gebou om aan die behoeftes van spesifieke eenhede te voldoen (White 1995, Varney 1996).
Data marts winkel i data wat baie relevant met betrekking tot bepaalde eenhede (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

Die voordeel van hierdie metode is dat daar geen Dato nie geïntegreer nie en dat i data wat sal minder oorbodig wees binne data marts as almal data wat kom uit 'n deposito van data wat geïntegreer. Nog 'n voordeel is dat daar min verbindings tussen elke datamark en sy bronne sal wees data wat want elke datamart het net een bron van data wat. Plus met hierdie argitektuur in plek, kan eindgebruikers steeds toegang tot die oorsig van kry data wat

korporatiewe organisasies. Hierdie metode staan ​​bekend as die top-down metode, waar data marts gebou word na die data pakhuis (pou 1998, Goff 1998).
Sommige organisasies het begin om onafhanklike data-marts te bou (Flanagan en Safdie 1997, White 2000), wat die behoefte verhoog om resultate vroeg te toon. In hierdie geval kry datamars hul eie data wat reguit van die basiese beginsels van data wat OLTP en nie van die gesentraliseerde en geïntegreerde pakhuis nie, en elimineer dus die behoefte om die sentrale pakhuis op die perseel te hê.

Elke datamark benodig ten minste een skakel na sy bronne data wat. 'n Nadeel van veelvuldige verbindings vir elke datamark is dat, in vergelyking met die vorige twee argitekture, die oorvloed van data wat aansienlik toeneem.

Elke datamark moet al die stoor data wat plaaslik vereis om geen effek op OLTP-stelsels te hê nie. Dit veroorsaak dat i data wat hulle word in verskillende datamars gestoor (Inmon et al. 1997). Nog 'n nadeel van hierdie argitektuur is dat dit lei tot die skepping van komplekse interkonneksies tussen datamars en hul databronne. data wat wat moeilik is om uit te voer en te beheer (Inmon et al. 1997).

Nog 'n nadeel is dat eindgebruikers nie toegang tot die oorsig van maatskappyinligting kan kry nie omdat i data wat van die verskillende datamars is nie geïntegreer nie (Ovum 1998).
Nog 'n ander nadeel is dat daar meer as een definisie kan wees vir elke terminologie wat in datamarts gebruik word, wat teenstrydighede van data wat in organisasie (Ovum 1998).
Ten spyte van die nadele wat hierbo bespreek is, lok onafhanklike datamark steeds die belangstelling van baie organisasies (IDC 1997). Een faktor wat hulle aantreklik maak, is dat hulle vinniger ontwikkel en minder tyd en hulpbronne verg (Bresnahan 1996, Berson en Smith 1997, Ovum 1998). Gevolglik dien hulle hoofsaaklik as toetsprojekte wat gebruik kan word om vinnig voordele en/of onvolmaakthede in die projek te identifiseer (Parsaye 1995, Braly 1995, Newing 1996). In hierdie geval moet die deel wat in die loodsprojek geïmplementeer moet word, klein maar belangrik vir die organisasie wees (Newing 1996, Mansell-Lewis 1996).

Deur die prototipe te ondersoek, kan eindgebruikers en administrasie besluit of die projek voortgesit of gestaak word (Flanagan en Safdie 1997).
As die besluit is om voort te gaan, moet datamars vir ander bedrywe een op 'n slag gebou word. Daar is twee opsies vir eindgebruikers gebaseer op hul behoeftes in die bou van onafhanklike datamatrikse: geïntegreerd/gefedereerd en ongeïntegreerd (Ovum 1998)

In die eerste metode moet elke nuwe datamark gebou word op grond van die huidige datamart en die model data wat deur die maatskappy gebruik (Varney 1996, Berson en Smith 1997, Peacock 1998). Die behoefte om die model te gebruik data wat van die maatskappy beteken dat daar verseker moet word dat daar slegs een definisie is vir elke terminologie wat oor datamarts gebruik word, dit is ook om te verseker dat verskillende datamars gekombineer kan word om 'n oorsig van maatskappyinligting te gee (Bresnahan 1996). Hierdie metode word bottom-up genoem en is die beste wanneer daar 'n beperking op finansiële middele en tyd is (Flanagan en Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). In die tweede metode kan die gekonstrueerde datamars slegs die behoeftes van 'n spesifieke eenheid bevredig. 'n Variant van die federated data mart is die data pakhuis versprei waarin die databasis Hub Server-middelware word gebruik om baie datamarkte in 'n enkele bewaarplek saam te voeg data wat versprei (White 1995). In hierdie geval, i data wat maatskappye word in verskeie datamars versprei. Eindgebruikerversoeke word aangestuur na databasis hub bediener middelware, wat alles onttrek data wat aangevra deur data marts en stuur die resultate aan eindgebruikertoepassings terug. Hierdie metode verskaf besigheidsinligting aan eindgebruikers. Die probleme van onafhanklike datamars is egter steeds nie uitgeskakel nie. Daar is 'n ander argitektuur wat gebruik kan word wat die genoem word data pakhuis virtuele (White 1995). Hierdie argitektuur, wat in Figuur 2.9 beskryf word, is egter nie 'n databergingsargitektuur nie. data wat werklik aangesien dit nie laai van OLTP-stelsels na beweeg nie data pakhuis (Demarest 1994).

Trouens, versoeke vir data wat vanaf eindgebruikers word deurgegee na OLTP-stelsels wat resultate gee nadat gebruikersversoeke verwerk is. Alhoewel hierdie argitektuur eindgebruikers toelaat om verslae te genereer en versoeke te rig, kan dit nie die

data wat geskiedenis en oorsig van maatskappy-inligting sedert i data wat van die verskillende OLTP-stelsels is nie geïntegreer nie. Gevolglik kan hierdie argitektuur nie die ontleding van bevredig nie data wat kompleks soos voorspellings.

Seleksie van toegang en herstel toepassings data wat

Die doel van die bou van 'n data pakhuis is om inligting aan eindgebruikers oor te dra (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); een of meer toegangs- en hersteltoepassings data wat verskaf moet word. Tot op hede is daar 'n wye verskeidenheid van hierdie toepassings waaruit die gebruiker kan kies (Hammergren 1998, Humphries et al. 1999). Die toepassings wat u kies, bepaal die sukses van u pakhuispoging data wat in 'n organisasie, want toepassings is die mees sigbare deel van data pakhuis aan die eindgebruiker (Inmon et al. 1997, Poe 1996). Om suksesvol te wees a data pakhuis, moet die ontledingsaktiwiteite van kan ondersteun data wat van die eindgebruiker (Poe 1996, Seddon en Benjamin 1998, Eckerson 1999). Die “vlak” van wat die eindgebruiker wil hê moet dus geïdentifiseer word (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

Oor die algemeen kan eindgebruikers in drie kategorieë gegroepeer word: uitvoerende gebruikers, besigheidsontleders en gesaggebruikers (Poe 1996, Humphries et al. 1999). Uitvoerende gebruikers benodig maklike toegang tot voorafbepaalde stelle verslae (Humphries et al. 1999). Hierdie verhoudings kan maklik verkry word met spyskaartnavigasie (Poe 1996). Daarbenewens moet verslae inligting aanbied deur gebruik te maak van grafiese voorstelling soos tabelle en sjablone om inligting vinnig oor te dra (Humphries et al. 1999). Besigheidsontleders, wat dalk nie die tegniese vermoëns het om verslae van nuuts af op hul eie te ontwikkel nie, moet huidige verslae kan wysig om aan hul spesifieke behoeftes te voldoen (Poe 1996, Humphries et al. 1999). Kraggebruikers, aan die ander kant, is die tipe eindgebruikers wat die vermoë het om versoeke en verslae van nuuts af te genereer en te skryf (Poe 1996, Humphries et al. 1999). Dit is hulle wat

hulle ontwikkel verslae vir ander tipe gebruikers (Poe 1996, Humphries et al. 1999).

Sodra die eindgebruikersvereistes bepaal is, moet 'n keuse van toegangs- en hersteltoepassings gemaak word data wat onder al die beskikbaar (Poe 1996, Inmon et al. 1997).
Toegang tot data wat en herwinningsgereedskap kan in 4 tipes geklassifiseer word: OLAP-nutsmiddels, EIS/DSS-nutsgoed, navraag- en verslagdoeningsnutsmiddels en data-ontginningnutsmiddels.

OLAP-nutsgoed stel gebruikers in staat om ad hoc-navrae te skep sowel as dié wat op die databasis del data pakhuis. Boonop laat hierdie produkte gebruikers toe om af te drill data wat algemeen tot gedetailleerde.

EIS/DSS-nutsmiddels verskaf uitvoerende verslaggewing soos "wat as"-analise en toegang tot spyskaartgedrewe verslae. Verslae moet vooraf gedefinieer en saamgevoeg word met spyskaarte vir makliker navigasie.
Navraag- en verslagdoeningsnutsgoed stel gebruikers in staat om voorafbepaalde en spesifieke verslae te produseer.

Data-ontginningsinstrumente word gebruik om verhoudings te identifiseer wat nuwe lig kan werp op vergete bedrywighede in die data wat van die datapakhuis.

Benewens die optimalisering van die vereistes van elke tipe gebruiker, moet die gereedskap wat gekies word intuïtief, doeltreffend en maklik wees om te gebruik. Hulle moet ook versoenbaar wees met ander dele van die argitektuur en in staat wees om met bestaande stelsels te werk. Dit word ook aanbeveel om datatoegang- en herwinningsnutsmiddels met billike pryse en werkverrigting te kies. Ander kriteria om in ag te neem, sluit in die instrumentverskaffer se verbintenis om hul produk te ondersteun en hoe dit in toekomstige vrystellings sal ontwikkel. Om gebruikersbetrokkenheid by die gebruik van die datapakhuis te verseker, betrek die ontwikkelingspan gebruikers by die gereedskapseleksieproses. In hierdie geval moet 'n praktiese gebruikersassessering uitgevoer word.

Om die waarde van die datapakhuis te verbeter, kan die ontwikkelingspan ook webtoegang tot hul datapakhuis verskaf. 'n Web-geaktiveerde datapakhuis laat gebruikers toe om toegang tot die data wat van afgeleë plekke of tydens reis. Ook die inligting kan

teen laer koste verskaf word deur 'n vermindering in opleidingskoste.

2.4.3 Datastoor Operasie fase

Hierdie fase bestaan ​​uit drie aktiwiteite: definisie van dataverfrisstrategieë, beheer van datapakhuisaktiwiteite en bestuur van datapakhuissekuriteit.

Definisie van dataverfrisstrategieë

Na aanvanklike laai, i data wat in databasis van die datapakhuis moet periodiek verfris word om die veranderinge wat aan hulle gemaak is, te reproduseer data wat oorspronklikes. U moet dus besluit wanneer om te verfris, hoe gereeld die verversing geskeduleer moet word en hoe om die data te verfris data wat. Dit word voorgestel om die te verfris data wat wanneer die stelsel vanlyn geneem kan word. Die herlaaifrekwensie word deur die ontwikkelingspan bepaal op grond van gebruikersvereistes. Daar is twee benaderings om die datapakhuis te verfris: die volledige verversing en die voortdurende laai van veranderinge.

Die eerste benadering, volle verfris, vereis dat almal herlaai word data wat van die begin af. Dit beteken dat al die data wat vereis moet onttrek, skoongemaak, getransformeer en geïntegreer word in elke verversing. Hierdie benadering moet sover moontlik vermy word omdat dit baie tyd en hulpbronne verg.

'n Alternatiewe benadering is om voortdurend veranderinge op te laai. Dit voeg i data wat wat verander is sedert die laaste datapakhuis-verversingsiklus. Die identifisering van nuwe of gewysigde rekords verminder die hoeveelheid aansienlik data wat wat in elke opdatering na die datapakhuis gepropageer moet word, aangesien slegs hierdie data wat sal bygevoeg word databasis van die datapakhuis.

Daar is ten minste 5 benaderings wat gebruik kan word om te onttrek i data wat nuut of gewysig. Om 'n doeltreffende data-verfrisstrategie te verkry data wat 'n mengsel van hierdie benaderings wat alle veranderinge in die stelsel vasvang, kan nuttig wees.

Die eerste benadering, wat tydstempels gebruik, veronderstel dat almal toegewys is data wat 'n tydstempel gewysig en opgedateer sodat jy almal maklik kan identifiseer data wat gewysig en nuut. Hierdie benadering is egter nie algemeen in die meeste van vandag se bedryfstelsels gebruik nie.
Die tweede benadering is om 'n delta-lêer te gebruik wat gegenereer word deur 'n toepassing wat slegs die veranderinge bevat wat aangebring is data wat. Die gebruik van hierdie lêer versterk ook die opdateringsiklus. Selfs hierdie metode is egter nie in baie toepassings gebruik nie.
Die derde benadering is om 'n loglêer te skandeer, wat basies inligting bevat soortgelyk aan die delta-lêer. Die enigste verskil is dat 'n loglêer vir die herstelproses geskep word en moeilik kan wees om te verstaan.
Die vierde benadering is om die toepassingskode te wysig. Die meeste toepassingskode is egter oud en broos; daarom moet hierdie tegniek vermy word.
Die laaste benadering is om i data wat bronne met die hoof dei lêer data wat.

Monitering van datapakhuisaktiwiteite

Sodra die datapakhuis aan gebruikers vrygestel is, moet dit oor tyd gemonitor word. In hierdie geval kan die datapakhuisadministrateur een of meer bestuurs- en beheerinstrumente gebruik om die gebruik van die datapakhuis te monitor. Veral inligting kan ingesamel word oor mense en die tyd waarin hulle toegang tot die datapakhuis kry. Komaan data wat ingesamel word, kan 'n profiel van die werk wat verrig is, geskep word wat gebruik kan word as insette in die gebruiker se terugskrywing implementering. Terugskrywing laat gebruikers toe om ingelig te word oor die datapakhuisverwerkingskoste.

Verder kan die datapakhuisoudit ook gebruik word om die tipe navrae, hul grootte, die aantal navrae per dag, die navrae reaksietye, die sektore wat bereik is en die hoeveelheid navrae te identifiseer data wat verwerk. Nog 'n doel om datapakhuisoudit te doen is om die data wat wat nie in gebruik is nie. Hierdie data wat hulle kan uit die datapakhuis verwyder word om tyd te verbeter

van navraag uitvoering reaksie en beheer die groei van data wat wat binne die woon databasis van die datapakhuis.

Datapakhuis sekuriteitsbestuur

'n Datapakhuis bevat data wat geïntegreerd, krities, sensitief wat maklik bereik kan word. Om hierdie rede moet dit beskerm word teen ongemagtigde gebruikers. Een manier om sekuriteit te implementeer is om die del-funksie te gebruik DBMS om verskillende voorregte aan verskillende tipe gebruikers toe te ken. Op hierdie manier moet 'n toegangsprofiel vir elke tipe gebruiker gehandhaaf word. Nog 'n manier om die datapakhuis te beveilig, is om dit te enkripteer soos geskryf in die databasis van die datapakhuis. Toegang tot data wat en die herwinningsinstrumente moet die dekripteer data wat voordat die resultate aan gebruikers aangebied word.

2.4.4 Datastoor Ontplooiingsfase

Dit is die laaste fase in die datapakhuis-implementeringsiklus. Die aktiwiteite wat in hierdie fase uitgevoer moet word, sluit in die opleiding van gebruikers om die datapakhuis te gebruik en die uitvoering van hersiening van die datapakhuis.

Gebruikersopleiding

Gebruikersopleiding moet gedoen word voordat toegang tot die data wat van die datapakhuis en die gebruik van herwinningsinstrumente. Oor die algemeen moet sessies begin met 'n inleiding tot die konsep van berging data wat, die inhoud van die datapakhuis, die meta data wat en die basiese kenmerke van die gereedskap. Dan kan meer gevorderde gebruikers ook die fisiese tabelle en gebruikerskenmerke van datatoegang en herwinningsnutsmiddels bestudeer.

Daar is baie benaderings om gebruikersopleiding te doen. Een hiervan behels 'n seleksie van baie gebruikers of ontleders wat uit 'n stel gebruikers gekies word, gebaseer op hul leierskap- en kommunikasievaardighede. Hulle word persoonlik opgelei oor alles wat hulle moet weet om vertroud te raak met die stelsel. Sodra die opleiding voltooi is, keer hulle terug na hul werk en begin ander gebruikers leer hoe om die stelsel te gebruik. Op die

Op grond van wat hulle geleer het, kan ander gebruikers die datapakhuis begin verken.
Nog 'n benadering is om baie gebruikers op dieselfde tyd op te lei, asof jy 'n klaskamerkursus volg. Hierdie metode is geskik wanneer daar baie gebruikers is wat terselfdertyd opgelei moet word. Nog 'n metode is om elke gebruiker individueel, een vir een op te lei. Hierdie metode is geskik wanneer daar min gebruikers is.

Die doel van gebruikersopleiding is om jou vertroud te maak met toegang tot die data wat en herwinningsinstrumente sowel as die inhoud van die datapakhuis. Sommige gebruikers kan egter oorweldig word deur die hoeveelheid inligting wat tydens die opleidingsessie verskaf word. Daarom moet 'n sekere aantal opknappingsessies uitgevoer word vir deurlopende hulp en om spesifieke vrae te beantwoord. In sommige gevalle word 'n gebruikersgroep gevorm om hierdie tipe ondersteuning te verskaf.

Versamel terugvoer

Sodra die datapakhuis ontplooi is, kan gebruikers i data wat wat vir verskeie doeleindes in die datapakhuis woon. Meestal gebruik ontleders of gebruikers i data wat in die datapakhuis vir:

  1. 1 Identifiseer maatskappyneigings
  2. 2 Ontleed die aankoopprofiele van kliënte
  3. 3 Verdeel i kliënte en van
  4. 4 Verskaf die beste dienste aan kliënte - pasmaak dienste
  5. 5 Formuleer strategieë bemarking
  6. 6 Verskaf mededingende kwotasies vir koste-ontledings en help beheer
  7. 7 Ondersteun strategiese besluitneming
  8. 8 Identifiseer geleenthede om uit te staan
  9. 9 Verbeter die kwaliteit van huidige besigheidsprosesse
  10. 10 Gaan die wins na

Na aanleiding van die ontwikkelingsrigting van die datapakhuis, kan 'n reeks resensies aan die stelsel gedoen word om terugvoer te verkry

beide van die ontwikkelingspan en van die eindgebruikersgemeenskap.
Die resultate wat verkry is, kan in ag geneem word vir die volgende ontwikkelingsiklus.

Aangesien die datapakhuis 'n inkrementele benadering het, is dit van kardinale belang om uit die suksesse en foute van vorige ontwikkelings te leer.

2.5 Opsomming

In hierdie hoofstuk is die benaderings wat in die literatuur voorkom, bespreek. In afdeling 1 is die konsep van datapakhuis en die rol daarvan in besluitkunde bespreek. Afdeling 2 het die belangrikste verskille tussen datapakhuise en OLTP-stelsels beskryf. In afdeling 3 het ons die Monash-datapakhuismodel bespreek wat in afdeling 4 gebruik is om die aktiwiteite betrokke by die proses van die ontwikkeling van 'n datapakhuis te beskryf, hierdie tesisse was nie op streng navorsing gebaseer nie. Wat in werklikheid gebeur, kan baie verskil van wat die literatuur rapporteer, maar hierdie resultate kan gebruik word om 'n basiese agtergrond te skep wat die konsep van datapakhuis vir hierdie navorsing onderstreep.

Hoofstuk 3

Navorsings- en ontwerpmetodes

Hierdie hoofstuk spreek die navorsings- en ontwerpmetodes vir hierdie studie aan. Die eerste deel toon 'n generiese siening van die navorsingsmetodes wat beskikbaar is vir inligtingsherwinning, verder word die kriteria vir die keuse van die beste metode vir 'n bepaalde studie bespreek. In afdeling 2 word twee metodes wat gekies is met die kriteria wat pas blootgelê is, vervolgens bespreek; hiervan sal een gekies en aangeneem word met die redes uiteengesit in artikel 3 waar die redes vir die uitsluiting van die ander maatstaf ook uiteengesit word. Afdeling 4 bied die navorsingsontwerp en afdeling 5 die gevolgtrekkings.

3.1 Navorsing in inligtingstelsels

Navorsing in inligtingstelsels is nie net beperk tot die tegnologiese domein nie, maar moet ook uitgebrei word om gedrags- en organisatoriese doeleindes in te sluit.
Ons het dit te danke aan die tesisse van verskeie dissiplines wat wissel van sosiale tot natuurwetenskappe; dit lei tot die behoefte aan 'n sekere spektrum van navorsingsmetodes wat kwantitatiewe en kwalitatiewe metodes behels om vir inligtingstelsels gebruik te word.
Alle beskikbare navorsingsmetodes is belangrik, trouens verskeie navorsers soos Jenkins (1985), Nunamaker et al. (1991), en Galliers (1992) voer aan dat daar geen spesifieke universele metode is om navorsing in die verskillende velde van inligtingstelsels uit te voer nie; in werklikheid kan 'n metode geskik wees vir 'n spesifieke navorsing, maar nie vir ander nie. Dit bring ons die behoefte om 'n metode te kies wat geskik is vir ons spesifieke navorsingsprojek: vir hierdie keuse Benbasat et al. (1987) meld dat die aard en doel van die navorsing in ag geneem moet word.

3.1.1 Aard van die navorsing

Die verskillende metodes gebaseer op die aard van die navorsing kan geklassifiseer word in drie tradisies wat algemeen bekend is in inligtingwetenskap: positivistiese, interpretatiewe en kritiese navorsing.

3.1.1.1 Positivistiese navorsing

Positivistiese navorsing staan ​​ook bekend as wetenskaplike of empiriese studie. Dit poog om: "verduidelik en voorspel wat in die sosiale wêreld gaan gebeur deur te kyk na die reëlmatighede en oorsaak-gevolg verhoudings tussen die elemente wat dit daarstel" (Shanks et al 1993).

Positivistiese navorsing word ook gekenmerk deur herhaalbaarheid, vereenvoudigings en weerleggings. Verder erken positivistiese navorsing die bestaan ​​van a priori-verwantskappe tussen die verskynsels wat bestudeer is.
Volgens Galliers (1992) is taksonomie 'n navorsingsmetode wat in die positivistiese paradigma ingesluit is, wat egter nie daartoe beperk is nie, in werklikheid is daar laboratoriumeksperimente, veldeksperimente, gevallestudies, demonstrasies van stellings, voorspellings en simulasies. Deur hierdie metodes te gebruik, erken navorsers dat die verskynsels wat bestudeer is objektief en streng waargeneem kan word.

3.1.1.2 Interpretatiewe navorsing

Interpretatiewe navorsing, wat dikwels fenomenologie of anti-positivisme genoem word, word deur Neuman (1994) beskryf as "die sistematiese analise van die sosiale betekenis van aksie deur direkte en gedetailleerde waarneming van mense in natuurlike situasies, ten einde by 'n begrip en tot die interpretasie van hoe mense hul sosiale wêreld skep en in stand hou.” Interpretatiewe studies verwerp die aanname dat waargenome verskynsels objektief waargeneem kan word. In werklikheid is hulle gebaseer op subjektiewe interpretasies. Verder lê interpretatiewe navorsers nie a priori betekenisse af op die verskynsels wat hulle bestudeer nie.

Hierdie metode sluit subjektiewe/argumentatiewe studies, aksienavorsing, beskrywende/interpretatiewe studies, toekomstige navorsing en rolspel in. Benewens hierdie opnames en gevallestudies kan by hierdie benadering ingesluit word aangesien dit betrekking het op studies van individue of organisasies binne komplekse werklike situasies.

3.1.1.3 Kritiese navorsing

Kritiese ondersoek is die minste bekende benadering in die sosiale wetenskappe, maar het onlangs aandag van inligtingstelselnavorsers ontvang. Die filosofiese aanname dat sosiale werklikheid histories geproduseer en gereproduseer word deur mense, sowel as sosiale sisteme met hul aksies en interaksies. Hul vermoë word egter bemiddel deur 'n aantal sosiale, kulturele en politieke oorwegings.

Soos interpretatiewe navorsing, hou kritiese navorsing vol dat positivistiese navorsing niks met die sosiale konteks te doen het nie en ignoreer die invloed daarvan op menslike handelinge.
Kritiese navorsing, aan die ander kant, kritiseer interpretatiewe navorsing omdat dit te subjektief is en nie daarop gemik is om mense te help om hul lewens te verbeter nie. Die grootste verskil tussen kritiese navorsing en die ander twee benaderings is die evaluatiewe dimensie daarvan. Terwyl die objektiwiteit van die positivistiese en interpretatiewe tradisies is om die status quo of sosiale werklikheid te voorspel of te verduidelik, het kritiese navorsing ten doel om die sosiale werklikheid wat bestudeer word krities te evalueer en te transformeer.

Kritiese navorsers is gewoonlik teen die status quo om sosiale verskille te verwyder en sosiale toestande te verbeter. Kritiese navorsing het 'n verbintenis tot 'n prosessuele siening van die verskynsels van belang en is dus normaalweg longitudinaal. Voorbeelde van navorsingsmetodes is langtermyn-historiese studies en etnografiese studies. Kritiese navorsing is egter nie wyd in inligtingstelselnavorsing gebruik nie

3.1.2 Doel van die navorsing

Saam met die aard van die navorsing kan die doel daarvan gebruik word om die navorser te lei in die keuse van 'n bepaalde navorsingsmetode. Die doel van 'n navorsingsprojek hou nou verband met die posisie van die navorsing in verhouding tot die navorsingsiklus wat uit drie fases bestaan: teoriebou, teorietoetsing en teorieverfyning. Dus, gebaseer op die tydsberekening van die navorsingsiklus, kan 'n navorsingsprojek 'n verklarende, beskrywende, verkennende of voorspellende doel hê.

3.1.2.1 Verkennende navorsing

Verkennende navorsing het ten doel om 'n totaal nuwe onderwerp te ondersoek en vrae en hipoteses vir toekomstige navorsing te formuleer. Hierdie tipe navorsing word in teoriebou gebruik om aanvanklike verwysings in 'n nuwe area te verkry. Tipies word kwalitatiewe navorsingsmetodes gebruik, soos gevallestudies of fenomenologiese studies.

Dit is egter ook moontlik om kwantitatiewe tegnieke soos verkennende opnames of eksperimente te gebruik.

3.1.3.3 Beskrywende soektog

Beskrywende navorsing het ten doel om 'n bepaalde organisatoriese situasie of praktyk in groot detail te ontleed en te beskryf. Dit is geskik vir die bou van teorieë en kan ook gebruik word om hipoteses te bevestig of uit te daag. Beskrywende navorsing sluit gewoonlik die gebruik van maatstawwe en monsters in. Die mees geskikte navorsingsmetodes sluit opnames en ontleding van antesedente in.

3.1.2.3 Verklarende navorsing

Verklarende navorsing probeer verduidelik hoekom dinge gebeur. Dit is gebou op feite wat reeds bestudeer is en probeer om die redes vir hierdie feite te vind.
Verklarende navorsing word dus normaalweg op verkennende of beskrywende navorsing gebou en is bykomstig tot toetsing en verfyning van teorieë. Verklarende navorsing maak gewoonlik gebruik van gevallestudies of opname-gebaseerde navorsingsmetodes.

3.1.2.4 Voorkomende navorsing

Voorkomende navorsing het ten doel om die gebeure en gedrag onder waarneming wat bestudeer word, te voorspel (Marshall en Rossman 1995). Voorspelling is die standaard wetenskaplike toets van waarheid. Hierdie tipe navorsing maak gewoonlik gebruik van opnames of ontleding van data wat historici. (Yin 1989)

Bogenoemde bespreking demonstreer dat daar 'n aantal moontlike navorsingsmetodes is wat in 'n bepaalde studie gebruik kan word. Daar moet egter een spesifieke metode wees wat meer geskik is as die ander vir 'n bepaalde tipe navorsingsprojek. (Galliers 1987, Yin 1989, De Vaus 1991). Elke navorser moet dus die sterk- en swakpunte van verskeie metodes noukeurig evalueer om die mees geskikte en versoenbare navorsingsmetode met die navorsingsprojek aan te neem. (Jenkins 1985, Pervan en Klass 1992, Bonomia 1985, Yin 1989, Himilton en Ives 1992).

3.2. Moontlike soekmetodes

Die doel van hierdie projek was om die ervaring in Australiese organisasies met i data wat gestoor met 'n ontwikkeling van data pakhuis. Dato dat daar tans 'n gebrek aan navorsing op die gebied van datapakhuise in Australië is, is hierdie navorsingsprojek steeds in die teoretiese fase van die navorsingsiklus en het 'n verkennende doel. Om die ervaring in Australiese organisasies wat datapakhuis aanneem, te ondersoek, vereis interpretasie van die werklike samelewing. Gevolglik volg die filosofiese aanname onderliggend aan die navorsingsprojek die tradisionele interpretasie.

Na 'n streng ondersoek van beskikbare metodes is twee moontlike navorsingsmetodes geïdentifiseer: opnames en gevallestudies, wat vir verkennende navorsing gebruik kan word (Shanks et al. 1993). Galliers (1992) argumenteer vir die geskiktheid van hierdie twee metodes vir hierdie spesifieke studie in sy hersiene taksonomie deur te sê dat hulle geskik is vir teoriebou. Die volgende twee onderafdelings bespreek elke metode in detail.

3.2.1 Opnamenavorsingsmetode

Die opname-navorsingsmetode kom van die antieke sensusmetode. 'n Sensus bestaan ​​uit die insameling van inligting van 'n hele bevolking. Hierdie metode is duur en onprakties, veral as die bevolking groot is. Dus, in vergelyking met 'n sensus, fokus 'n opname normaalweg op die insameling van inligting vir 'n klein aantal, of steekproef, van die bevolking se verteenwoordigers (Fowler 1988, Neuman 1994). 'n Steekproef weerspieël die populasie waaruit dit getrek is, met verskillende vlakke van akkuraatheid, afhangende van die steekproefstruktuur, -grootte en seleksiemetode wat gebruik is (Fowler 1988, Babbie 1982, Neuman 1994).

Die opnamemetode word gedefinieer as "kiekies van praktyke, situasies of sienings op 'n bepaalde tydstip, onderneem deur gebruik te maak van vraelyste of onderhoude, waaruit afleidings kan word
gemaak” (Galliers 1992:153) [kiekie van praktyke, situasies of sienings op bepaalde tydstip, onderneem deur gebruik te maak van vraelyste of onderhoude, waaruit afleidings gemaak kan word]. Opnames handel oor die insameling van inligting oor een of ander aspek van die studie, van 'n sekere aantal deelnemers, deur vrae te vra (Fowler 1988). Hierdie vraelyste en onderhoude, wat telefoniese onderhoude van aangesig tot aangesig en gestruktureerde onderhoude insluit, is ook die insamelingstegnieke van data wat mees algemeen in ondersoeke aangewend (Blalock 1970, Nachmias en Nachmias 1976, Fowler 1988), kan waarnemings en ontledings gebruik word (Gable 1994). Van al hierdie metodes om die in te samel data wat, is die gebruik van vraelys die gewildste tegniek, aangesien dit verseker dat i data wat

versamel is gestruktureer en geformateer, en vergemaklik dus die klassifikasie van inligting (Hwang 1987, de Vaus 1991).

In die ontleding van i data wat, 'n ondersoekstrategie gebruik dikwels kwantitatiewe tegnieke, soos statistiese analise, maar kwalitatiewe tegnieke kan ook aangewend word (Galliers 1992, Pervan

en Klass 1992, Gable 1994). Normaalweg, i data wat versamel word gebruik om verspreidings en patrone van assosiasies te ontleed (Fowler 1988).

Alhoewel opnames oor die algemeen geskik is vir navorsing wat handel oor die vraag 'wat?' (wat) of afgelei daarvan, soos 'hoeveel' en 'hoeveel', kan hulle gevra word via die vraag 'waarom' (Sonquist en Dunkelberg 1977, Yin 1989). Volgens Sonquist en Dunkelberg (1977) het ondersoekende navorsing ten doel om hipoteses uit te daag, programme te evalueer, die bevolking te beskryf en modelle van menslike gedrag te ontwikkel. Verder kan opnames gebruik word om 'n sekere bevolkingsopinie, toestande, opinies, kenmerke, verwagtinge en selfs vorige of huidige gedrag te bestudeer (Neuman 1994).

Opnames laat die navorser toe om verwantskappe tussen die bevolking te ontdek en die resultate is gewoonlik meer algemeen as ander metodes (Sonquist en Dunkelberg 1977, Gable 1994). Opnames laat navorsers toe om 'n groter geografiese gebied te dek en baie respondente te bereik (Blalock 1970, Sonquist en Dunkelberg 1977, Hwang en Lin 1987, Gable 1994, Neuman 1994). Ten slotte kan opnames inligting verskaf wat nie elders beskikbaar is nie of in die vorm wat vir ontledings vereis word (Fowler 1988).

Daar is egter sekere beperkings in die uitvoering van 'n opname. 'n Nadeel is dat die navorser nie veel inligting oor die voorwerp wat bestudeer is, kan bekom nie. Dit is te wyte aan die feit dat die opnames slegs op 'n bepaalde tyd uitgevoer word en daarom is daar 'n beperkte aantal veranderlikes en mense wat die navorser kan

studie (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Nog 'n nadeel is dat die uitvoering van 'n opname baie duur kan wees in terme van tyd en hulpbronne, veral as dit van aangesig tot aangesig onderhoude behels (Fowler 1988).

3.2.2. Navorsingsmetode

Die ondersoek-navorsingsmetode behels in-diepte studie van 'n bepaalde situasie binne sy werklike konteks oor 'n bepaalde tydperk, sonder enige ingryping van die kant van die navorser (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Hierdie metode word hoofsaaklik gebruik om die verwantskappe tussen die veranderlikes wat in 'n bepaalde situasie bestudeer word, te beskryf (Galliers 1992). Ondersoeke kan enkele of meervoudige gevalle behels, afhangende van die verskynsel wat ontleed is (Franz en Robey 1987, Eisenhardt 1989, Yin 1989).

Die ondersoek-navorsingsmetode word gedefinieer as "'n empiriese ondersoek wat 'n kontemporêre verskynsel binne sy werklike konteks bestudeer, deur gebruik te maak van veelvuldige bronne wat van een of meer entiteite soos mense, groepe of organisasies versamel is" (Yin 1989). Daar is geen duidelike skeiding tussen die verskynsel en die konteks daarvan nie en daar is geen eksperimentele beheer of manipulasie van die veranderlikes nie (Yin 1989, Benbasat et al. 1987).

Daar is 'n verskeidenheid tegnieke om gode te versamel data wat wat in die ondersoekmetode aangewend kan word, wat direkte waarnemings, hersiening van argiefrekords, vraelyste, dokumentasie-oorsig en gestruktureerde onderhoude insluit. Met 'n diverse reeks oestegnieke data wat, laat ondersoeke navorsers toe om beide te hanteer data wat kwalitatief en kwantitatief tegelykertyd (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Soos die geval met die opnamemetode, dien 'n opname-navorser as 'n waarnemer of navorser en nie as 'n aktiewe deelnemer in die organisasie wat bestudeer word nie.

Benbasat et al. (1987) beweer dat die ondersoekmetode veral geskik is vir die bou van navorsingsteorie, wat met 'n navorsingsvraag begin en met onderwys voortgaan.

van 'n teorie tydens die proses van versameling data wat. Om ook geskik vir die verhoog te wees

van teoriebou stel Franz en Robey (1987) voor dat die ondersoekmetode ook vir die komplekse teoriefase gebruik kan word. In hierdie geval, gebaseer op die bewyse wat ingesamel is, word 'n gegewe teorie of hipotese geverifieer of weerlê. Daarbenewens is die opname ook geskik vir navorsing wat handel oor 'hoe' of 'waarom'-vrae (Yin 1989).

In vergelyking met ander metodes laat opnames die navorser toe om noodsaaklike inligting in meer besonderhede vas te lê (Galliers 1992, Shanks et al. 1993). Verder laat opnames die navorser toe om die aard en kompleksiteit van die prosesse wat bestudeer is, te verstaan ​​(Benbasat et al. 1987).

Daar is vier hoofnadele verbonde aan die opnamemetode. Die eerste is die gebrek aan beheerde aftrekkings. Die subjektiwiteit van die navorser kan die resultate en gevolgtrekkings van die studie verander (Yin 1989). Die tweede nadeel is die gebrek aan gekontroleerde waarneming. Anders as eksperimentele metodes kan die ondersoeknavorser nie die verskynsels wat bestudeer word, beheer nie aangesien dit in hul natuurlike konteks ondersoek word (Gable 1994). Die derde nadeel is die gebrek aan herhaalbaarheid. Dit is omdat dit onwaarskynlik is dat die navorser dieselfde gebeure sal waarneem, en nie die resultate van 'n bepaalde studie kan verifieer nie (Lee 1989). Ten slotte, as gevolg van nie-repliseerbaarheid, is dit moeilik om die resultate wat uit een of meer ondersoeke verkry is, te veralgemeen (Galliers 1992, Shanks et al. 1993). Al hierdie probleme is egter nie onoorkombaar nie en kan in werklikheid deur die navorser geminimaliseer word deur toepaslike aksies toe te pas (Lee 1989).

3.3. Motiveer die navorsingsmetodologie aangeneem

Uit die twee moontlike navorsingsmetodes vir hierdie studie word die opnamemetode as die mees geskikte beskou. Die ondersoek is van die hand gewys na deeglike oorweging van die relevantes

meriete en swakhede. Die toepaslikheid of onvanpasheid van elke metode vir hierdie studie word hieronder bespreek.

3.3.1. Onvanpaste navorsingsmetode van ondersoek

Die ondersoekmetode vereis in-diepte studie oor 'n bepaalde situasie binne een of meer organisasies oor 'n tydperk (Eisenhardt 1989). In hierdie geval kan die tydperk die tydraamwerk wat vir hierdie studie gegee is, oorskry. Nog 'n rede waarom die opnamemetode nie gebruik word nie, is dat die resultate onder 'n gebrek aan strengheid kan ly (Yin 1989). Die subjektiwiteit van die navorser kan die resultate en gevolgtrekkings beïnvloed. Nog 'n rede is dat hierdie metode meer geskik is vir navorsing oor 'hoe' of 'waarom' tipe vrae (Yin 1989), terwyl die navorsingsvraag vir hierdie studie van die 'wat' tipe is. Laastens, maar nie die minste nie, is dit moeilik om bevindinge uit net een of enkele ondersoeke te veralgemeen (Galliers 1992, Shanks et al. 1993). Op grond van hierdie rasionaal is die opname-navorsingsmetode nie gekies nie aangesien dit nie geskik was vir hierdie studie nie.

3.3.2. Gerief van die soekmetode van ondersoek

Toe hierdie navorsing gedoen is, is die praktyk van datapakhuis nie algemeen deur Australiese organisasies aanvaar nie. Daar was dus nie veel inligting oor die implementering daarvan binne Australiese organisasies nie. Die beskikbare inligting het gekom van organisasies wat a data pakhuis. In hierdie geval is die opname-navorsingsmetode die mees geskikte, aangesien dit die verkryging van inligting moontlik maak wat nie elders beskikbaar is nie of in die vorm wat vereis word vir analise (Fowler 1988). Daarbenewens laat die opname-navorsingsmetode die navorser toe om 'n goeie insig te verkry in praktyke, situasies of sienings op 'n bepaalde tydstip (Galliers 1992, Denscombe 1998). 'n Oorsig was nodig om kennis oor die Australiese datapakhuiservaring te vergroot.

Verder meld Sonquist en Dunkelberg (1977) dat die resultate van opnamenavorsing meer algemeen is as ander metodes.

3.4. Opname Navorsing Ontwerp

Die opname oor datapakhuispraktyke is in 1999 uitgevoer. Die teikenpopulasie is gevorm deur Australiese organisasies wat belangstel in datapakhuisstudies, aangesien hulle waarskynlik reeds ingelig was oor die data wat wat hulle stoor en dus nuttige inligting vir hierdie studie kan verskaf. Die teikenpopulasie is geïdentifiseer deur 'n aanvanklike opname van alle Australiese lede van The Data Warehousing Institute (Tdwi-aap). Hierdie afdeling bespreek die ontwerp van die empiriese navorsingsfase van hierdie studie.

3.4.1. Versamelingstegniek data wat

Uit die drie tegnieke wat algemeen in opnamenavorsing gebruik word (d.i. posvraelys, telefoononderhoud en persoonlike onderhoud) (Nachmias 1976, Fowler 1988, de Vaus 1991), is die posvraelys vir hierdie studie gebruik. Die eerste rede vir die aanneming van laasgenoemde is dat dit 'n geografies verspreide bevolking kan bereik (Blalock 1970, Nachmias en Nachmias 1976, Hwang en Lin 1987, de Vaus 1991, Gable 1994). Tweedens is die posvraelys geskik vir hoogs opgevoede deelnemers (Fowler 1988). Die posvraelys vir hierdie studie is aan datapakhuisprojekborge, direkteure en/of projekbestuurders gerig. Derdens is posvraelyste geskik wanneer 'n veilige poslys beskikbaar is (Salant en Dilman 1994). TDWI, in hierdie geval, het 'n betroubare datapakhuisvereniging die poslys van sy Australiese lede verskaf. Nog 'n voordeel van die posvraelys bo die telefoonvraelys of persoonlike onderhoude is dat dit respondente in staat stel om meer akkuraat te reageer, veral wanneer respondente notas moet raadpleeg of vrae met ander mense moet bespreek (Fowler 1988).

'n Potensiële nadeel kan die tyd wees wat nodig is om vraelyste per pos uit te voer. Normaalweg word 'n posopname in hierdie volgorde uitgevoer: pos briewe, wag vir antwoorde en stuur bevestiging (Fowler 1988, Bainbridge 1989). Die totale tyd kan dus langer wees as die tyd wat benodig word vir persoonlike onderhoude of telefoononderhoude. Die totale tyd kan egter vooraf bekend wees (Fowler 1988, Denscombe 1998). Die tyd wat spandeer word aan die voer van persoonlike onderhoude kan nie vooraf bekend wees nie aangesien dit van een onderhoud tot 'n ander verskil (Fowler 1988). Telefoononderhoude kan vinniger wees as posvraelyste en persoonlike onderhoude, maar kan 'n hoë nie-responskoers hê as gevolg van die onbeskikbaarheid van sommige mense (Fowler 1988). Daarbenewens is telefoononderhoude oor die algemeen beperk tot relatief kort lyste vrae (Bainbridge 1989).

Nog 'n swakheid van 'n posvraelys is die hoë nie-responskoers (Fowler 1988, Bainbridge 1989, Neuman 1994). Teenmaatreëls is egter getref deur hierdie studie te assosieer met 'n betroubare datapakhuisinstelling (d.w.s. TDWI) (Bainbridge 1989, Neuman 1994), wat twee aanmaningsbriewe aan nie-antwoorders stuur (Fowler 1988, Neuman 1994) en ook 'n bykomende brief insluit verduideliking van die doel van die studie (Neuman 1994).

3.4.2. Analise eenheid

Die doel van hierdie studie is om inligting te bekom oor die implementering van datapakhuis en die gebruik daarvan binne Australiese organisasies. Die teikenpopulasie bestaan ​​uit alle Australiese organisasies wat geïmplementeer het, of implementeer, i data pakhuis. Die individuele organisasies word dan in die naam geregistreer. Die vraelys is per pos gestuur aan organisasies wat belangstel om aan te neem data pakhuis. Hierdie metode verseker dat die inligting wat ingesamel word uit die mees geskikte hulpbronne van elke deelnemende organisasie kom.

3.4.3. Opname monster

Die "poslys" van deelnemers aan die opname is van TDWI verkry. Uit hierdie lys is 3000 Australiese organisasies gekies as die basis vir steekproefneming. 'n Bykomende brief wat die projek en doel van die opname verduidelik, tesame met 'n antwoordblad en 'n voorafbetaalde koevert vir die terugstuur van die voltooide vraelys is aan die steekproef gestuur. Van die 3000 198 organisasies het XNUMX ingestem om aan die studie deel te neem. So 'n klein aantal antwoorde is verwag Dato die groot aantal Australiese organisasies wat toe datapakhuisstrategie binne hul organisasies aangeneem het of besig was om te aanvaar. Die teikenpopulasie vir hierdie studie bestaan ​​dus uit slegs 198 organisasies.

3.4.4. Inhoud van die vraelys

Die struktuur van die vraelys was gebaseer op die Monash-datapakhuismodel (wat voorheen in deel 2.3 bespreek is). Die inhoud van die vraelys is gebaseer op die literatuurontleding wat in hoofstuk 2 aangebied is. 'n Afskrif van die vraelys wat aan die deelnemers aan die opname gestuur is, kan in Bylaag B gevind word. Die vraelys bestaan ​​uit ses afdelings wat die fases van die gedek model volg. Die volgende ses paragrawe som die inhoud van elke afdeling kortliks op.

Afdeling A: Basiese inligting oor die organisasie
Hierdie afdeling bevat vrae wat verband hou met die profiel van deelnemende organisasies. Daarbenewens hou sommige van die vrae verband met die deelnemer se datapakhuisprojekstatus. Vertroulike inligting soos die naam van die organisasie is nie in die opname-analise bekend gemaak nie.

Afdeling B: Begin
Die vrae in hierdie afdeling hou verband met die taak om datapakhuis te begin. Vrae is gevra oor projekinisieerders, borge, vereiste vaardighede en kennis, datapakhuisontwikkelingsdoelwitte en eindgebruikerverwagtinge.

Afdeling C: Ontwerp
Hierdie afdeling bevat vrae wat verband hou met beplanningsaktiwiteite data pakhuis. Die vrae was veral oor die omvang van uitvoering, die duur van die projek, die koste van die projek en die koste/voordeel-ontleding.

Afdeling D: Ontwikkeling
In die ontwikkelingsafdeling is daar vrae wat verband hou met die ontwikkelingsaktiwiteite van die data pakhuis: versameling van eindgebruikersvereistes, bronne van data wat, die logiese model van data wat, prototipes, kapasiteitsbeplanning, tegniese argitekture en keuse van datapakhuisontwikkelingsinstrumente.

Afdeling E: Werking
Operasionele vrae wat verband hou met die werking en uitbreidbaarheid van die data pakhuis, hoe dit in die volgende fase van ontwikkeling ontwikkel. Daar data kwaliteit, die verfrisstrategieë van data wat, die korreligheid van data wat, skaalbaarheid van data pakhuis en die sekuriteitskwessies van data pakhuis was onder die tipe vrae wat gevra is.

Afdeling F: Ontwikkeling
Hierdie afdeling bevat vrae wat verband hou met die gebruik van die data pakhuis deur eindgebruikers. Die navorser was geïnteresseerd in die doel en bruikbaarheid van die data pakhuis, die hersiening en opleidingstrategieë wat aangeneem is en die beheerstrategie van data pakhuis aangeneem.

3.4.5. Reaksietempo

Alhoewel posopnames gekritiseer word omdat dit 'n lae responskoers het, is maatreëls getref om die terugkeerkoers te verhoog (soos voorheen bespreek in deel 3.4.1). Die term 'responskoers' verwys na die persentasie mense in 'n bepaalde opnamesteekproef wat op die vraelys reageer (Denscombe 1998). Die volgende formule is gebruik om die responskoers vir hierdie studie te bereken:

Aantal mense wat gereageer het
Responskoers = ———————————————————————————– X 100 Totale aantal vraelyste gestuur

3.4.6. Toetsvlieënier

Voordat die vraelys aan die steekproef gestuur is, is die vrae ondersoek deur loodstoetse uit te voer, soos voorgestel deur Luck en Rubin (1987), Jackson (1988) en de Vaus (1991). Die doel van die loodstoetse is om enige ongemaklike, dubbelsinnige uitdrukkings en vrae te openbaar wat moeilik is om te interpreteer, om enige definisies en terme wat gebruik word te verduidelik en om die benaderde tyd wat nodig is om die vraelys te voltooi, te identifiseer (Warwick en Lininger 1975, Jackson 1988, Salant en Dilman 1994). Die loodstoetse is uitgevoer deur vakke te selekteer met eienskappe soortgelyk aan dié van die finale vakke, soos voorgestel deur Davis e Cosenza (1993). In hierdie studie is ses datapakhuispersoneel as die loodsvakke gekies. Na elke loodstoets is die nodige regstellings gemaak. Uit die loodstoetse wat uitgevoer is, het die deelnemers bygedra om die finale weergawe van die vraelys te hervorm en terug te stel.

3.4.7. Metodes van ontleding van Dati

I data wat van opnames wat van die geslote vraelyste ingesamel is, is ontleed met behulp van 'n statistiese programpakket genaamd SPSS. Baie van die antwoorde is ontleed met behulp van beskrywende statistieke. 'n Aantal vraelyste is onvolledig teruggestuur. Hierdie is met groter sorg behandel om te verseker dat i data wat ontbreek was nie 'n gevolg van data-invoerfoute nie, maar omdat die vrae nie geskik was vir die geregistreerde nie, of die geregistreerde besluit het om nie een of meer spesifieke vrae te beantwoord nie. Hierdie ontbrekende antwoorde is tydens die analise geïgnoreer data wat en is as '- 9' gekodeer om hul uitsluiting van die ontledingsproses te verseker.

Met die voorbereiding van die vraelys is die geslote vrae vooraf gekodeer deur 'n nommer aan elke opsie toe te ken. Die nommer is toe gebruik om die voor te berei data wat tydens die analise (Denscombe 1998, Sapsford en Jupp 1996). Daar was byvoorbeeld ses opsies gelys in vraag 1 van afdeling B: direksie, senior uitvoerende beampte, IT-afdeling, besigheidseenheid, konsultante en ander. In die lêer van data wat van SPSS is 'n veranderlike gegenereer om 'die projek-inisieerder' aan te dui, met ses waarde-etikette: '1' vir 'raad van direkteure', '2' vir 'senior uitvoerende beampte' ensovoorts. Die gebruik van die Likertin-skaal in sommige van die geslote vrae het ook voorsiening gemaak vir moeitelose identifikasie gegewe die gebruik van die ooreenstemmende numeriese waardes wat in SPSS ingevoer is. Vir vrae met nie-uitputtende antwoorde, wat nie onderling uitsluitend was nie, is elke opsie as 'n enkele veranderlike met twee waarde-etikette behandel: '1' vir 'gemerk' en '2' vir 'nie gemerk'.

Oop vrae is anders as geslote vrae behandel. Die antwoorde op hierdie vrae is nie in SPSS ingevoer nie. In plaas daarvan is hulle met die hand ontleed. Die gebruik van hierdie tipe vrae stel ons in staat om inligting oor die vryuitgedrukte idees en persoonlike ervarings van die respondente te bekom (Bainbridge 1989, Denscombe 1998). Waar moontlik is 'n kategorisering van die antwoorde gemaak.

Vir die ontleding van data wat, word eenvoudige statistiese ontledingsmetodes gebruik, soos responsfrekwensie, gemiddelde, standaardafwyking en mediaan (Argyrous 1996, Denscombe 1998).
Die Gamma-toets het goed gevaar vir die verkryging van kwantitatiewe maatstawwe van die assosiasies tussen data wat ordinale (Norusis 1983, Argyrous 1996). Hierdie toetse was gepas omdat die ordinale skale wat gebruik is, nie baie kategorieë gehad het nie en in 'n tabel getoon kon word (Norusis 1983).

3.5 Opsomming

In hierdie hoofstuk is die navorsingsmetodologie en -ontwerp wat vir hierdie studie aanvaar is, bespreek.

Die keuse van die mees geskikte navorsingsmetode vir 'n spesifieke studie neem in ag
oorweging van 'n aantal reëls, insluitend die aard en tipe navorsing, sowel as die meriete en swakhede van elke moontlike metode (Jenkins 1985, Benbasat et al. 1097, Galliers en Land 1987, yin 1989, Hamilton en ives 1992, Galliers 1992, Neuman 1994). Gegewe die gebrek aan bestaande kennis en teorie rakende die aanvaarding van datapakhuise in Australië, vereis hierdie navorsingstudie 'n interpreterende navorsingsmetode met 'n verkennende vermoë om die ervarings van Australiese organisasies te verken. Die gekose navorsingsmetode is gekies om inligting in te samel rakende die aanvaarding van die datapakhuiskonsep deur Australiese organisasies. 'n Posvraelys is gekies as die insamelingstegniek data wat. Regverdigings vir die navorsingsmetode en versamelingstegniek data wat geselekteerde sal in hierdie hoofstuk verskaf word. Verder is 'n bespreking gelewer oor die ontledingseenheid, die steekproef wat gebruik is, die persentasies antwoorde, die inhoud van die vraelys, die voortoets van die vraelys en die metode van ontleding van die data wat.

Ontwerp van 'n Datastoor:

Die kombinasie van entiteitsverhoudings en dimensionele modellering

OPSOMMING
Stoor i data wat is 'n groot aktuele kwessie vir baie organisasies. 'n Sleutelkwessie in die ontwikkeling van rekenaarberging data wat dit is sy ontwerp.
Die ontwerp moet die opsporing van konsepte in die data pakhuis na nalatenskapstelsel en ander bronne van data wat en ook maklike begrip en doeltreffendheid in die implementering van data pakhuis.
Baie van die literatuur oor berging van data wat beveel die gebruik van entiteitsverhoudingsmodellering of dimensionele modellering aan om die ontwerp van voor te stel data pakhuis.
In hierdie vraestel wys ons hoe beide voorstellings gekombineer kan word in een benadering vir tekening data pakhuis. Die benadering wat gebruik word, is sistematies

word in 'n gevallestudie ondersoek en word in 'n aantal belangrike implikasies met praktisyns geïdentifiseer.

DATA PAGHUIS

Un data pakhuis dit word gewoonlik gedefinieer as 'n "onderwerp-georiënteerde, geïntegreerde, tyd-variante en nie-vlugtige versameling van data ter ondersteuning van bestuur se besluite" (Inmon en Hackathorn, 1994). Vakgerig en geïntegreerd dui daarop dat die data pakhuis is ontwerp om die funksionele grense van Legaci-stelsels oor te steek om 'n geïntegreerde perspektief van te bied data wat.
Tydvariant is gemoeid met die historiese of tydreeksaard van video data wat in un data pakhuis, wat dit moontlik maak om tendense te ontleed. Nie-vlugtig dui aan dat die data pakhuis dit word nie voortdurend opgedateer soos a databasis van OLTP. Dit word eerder periodiek opgedateer, met data wat van interne en eksterne bronne. Die data pakhuis dit is spesifiek ontwerp vir soek eerder as om integriteit en werkverrigting op te dateer.
Die idee om i data wat is nie nuut nie, dit was een van die bestuursdoeleindes van data wat sedert die sestigerjare (Il Martin, 1982).
I data pakhuis hulle bied die infrastruktuur aan data wat vir bestuursondersteuningstelsels. Bestuursondersteuningstelsels sluit besluitondersteuningstelsels (DSS) en uitvoerende inligtingstelsels (EIS) in. 'n DSS is 'n rekenaargebaseerde inligtingstelsel wat ontwerp is om menslike besluitneming te verbeter. 'n EIS is tipies 'n afleweringstelsel van data wat wat sakeleiers in staat stel om maklik toegang tot die siening van data wat.
Die algemene argitektuur van 'n data pakhuis beklemtoon die rol van data pakhuis in bestuursondersteuning. Sowel as die aanbied van die infrastruktuur data wat vir EIS en DSS, al data pakhuis dit kan direk deur navrae verkry word. DIE data wat ingesluit in a data pakhuis is gebaseer op 'n ontleding van bestuursinligtingvereistes en word uit drie bronne verkry: interne nalatenskapstelsels, spesialedoel-datavasleggingstelsels en eksterne databronne. DIE data wat in interne nalatenskapstelsels is hulle dikwels oorbodig, inkonsekwent, lae gehalte en gestoor in verskillende formate, sodat hulle versoen en skoongemaak moet word voordat hulle in die

data pakhuis (Inmon, 1992; McFadden, 1996). DIE data wat afkomstig van stoorstelsels data wat ad hoc en uit bronne data wat ekstern word dikwels gebruik om aan te vul (opdateer, vervang) i data wat van nalatenskapstelsels.

Daar is baie dwingende redes om 'n data pakhuis, wat verbeterde besluitneming insluit deur die effektiewe gebruik van meer inligting (Ives 1995), ondersteuning vir 'n fokus op hele transaksies (Graham 1996), en vermindering in data wat vir EIS en DSS (Graham 1996, McFadden 1996).

'n Onlangse empiriese studie het gemiddeld 'n opbrengs op belegging vir data pakhuis met 401% na drie jaar (Graham, 1996). Die ander empiriese studies van data pakhuis beduidende probleme gevind, insluitend probleme om voordele te meet en toe te ken, gebrek aan duidelike doel, onderskat die doel en kompleksiteit van die proses om voordele te berg data wat, in die besonder met betrekking tot die bronne en netheid van data wat. Berging i data wat kan as 'n oplossing vir die bestuursprobleem beskou word data wat tussen organisasies. Die manipulasie van data wat as 'n sosiale hulpbron het dit vir baie jare een van die sleutelprobleme in die bestuur van inligtingstelsels regoor die wêreld gebly (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

'n Gewilde benadering tot batebestuur data wat in die tagtigerjare was dit die ontwikkeling van 'n model data wat sosiale. Model data wat social is ontwerp om 'n stabiele basis te bied vir die ontwikkeling van nuwe toepassingstelsels en databasis en die rekonstruksie en integrasie van nalatenskapstelsels (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kim en Everest 1994). Daar is egter baie probleme met hierdie benadering, veral die kompleksiteit en koste van elke taak, en die lang tyd wat nodig is om tasbare resultate te lewer (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il data pakhuis dit is 'n aparte databasis wat saam met ou databasisse bestaan ​​eerder as om dit te vervang. Dit laat jou dus toe om die bestuur van te rig data wat en vermy duur rekonstruksie van nalatenskapstelsels.

BESTAANDE BENADERINGS TOT DATA-ONTWERP

WAREHOUSE

Die proses van bou en vervolmaak van 'n data pakhuis dit moet meer verstaan ​​word as 'n evolusionêre proses eerder as 'n ontwikkelingslewensiklus van tradisionele stelsels (Begeerte, 1995, Shanks, O'Donnell en Arnott 1997a). Daar is baie prosesse betrokke by 'n projek data pakhuis soos inisialisering, beplanning; inligting verkry uit die vereistes wat van maatskappybestuurders gevra word; bronne, transformasies, skoonmaak van data wat en sinchronisasie vanaf nalatenskapstelsels en ander bronne data wat; afleweringstelsels in ontwikkeling; monitering van data pakhuis; en sinneloosheid van die evolusionêre proses en konstruksie van 'n data pakhuis (Stinchi, O'Donnell en Arnott 1997b). In hierdie joernaal fokus ons op hoe om die te teken data wat in die konteks van hierdie ander prosesse gestoor word. Daar is 'n aantal voorgestelde benaderings tot argitektuur data pakhuis in letterkunde (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Elkeen van hierdie metodologieë het 'n kort oorsig met 'n ontleding van hul sterk- en swakpunte.

Inmon (1994) se Benadering vir Datastoor ontwerp

Inmon (1994) het vier iteratiewe stappe voorgestel om a data pakhuis (sien Figuur 2). Die eerste stap is om 'n sjabloon te ontwerp data wat sosiaal om te verstaan ​​hoe ek data wat hulle kan oor funksionele areas binne 'n organisasie geïntegreer word deur die te verdeel data wat stoor in areas. Model data wat dit is gemaak vir berging data wat met betrekking tot besluitneming, insluitend data wat histories, en ingesluit data wat afgelei en saamgevoeg. Die tweede stap is om vakgebiede vir implementering te identifiseer. Dit is gebaseer op prioriteite wat deur 'n spesifieke organisasie bepaal word. Die derde stap behels die teken van a databasis vir die vakgebied, let veral daarop om toepaslike vlakke van korreligheid in te sluit. Inmon beveel aan om die entiteite- en verhoudingsmodel te gebruik. Die vierde stap is om bronstelsels te identifiseer data wat vereis en ontwikkel transformasieprosesse om vas te lê, skoon te maak en te formateer i data wat.

Die sterk punte van Inmon se benadering is dat die model data wat sosiale verskaf die basis vir die integrasie van data wat binne die organisasie en beplanning van ondersteunings vir die iteratiewe ontwikkeling van data pakhuis. Die gebreke daarvan is die moeilikheid en koste om die model te ontwerp data wat sosiale, die moeilikheid om modelle van entiteite en verhoudings wat in beide modelle gebruik word, te verstaan, dat data wat sosiale en dié van data wat geberg deur vakgebied, en die toepaslikheid van die data wat van die tekening van data pakhuis vir die maak van databasis relasioneel maar nie vir databasis multidimensioneel.

Ives (1995) se Benadering tot Datastoor ontwerp

Ives (1995) stel 'n vierstap-benadering voor om 'n inligtingstelsel te ontwerp wat hy glo van toepassing is op die ontwerp van 'n data pakhuis (sien Figuur 3). Die benadering is baie gebaseer op Inligtingsingenieurswese vir die ontwikkeling van inligtingstelsels (Martin 1990). Die eerste stap is om die doelwitte, kritieke en suksesfaktore en sleutelprestasie-aanwysers te bepaal. Sleutel besigheidsprosesse en nodige inligting word gemodelleer om ons na 'n model te lei data wat sosiale. Die tweede stap behels die ontwikkeling van 'n bepalende argitektuur data wat geberg volgens area, databasis di data pakhuis, die tegnologiekomponente wat benodig word, die stel organisatoriese ondersteuning wat nodig is om te implementeer en mee te werk data pakhuis. Die derde stap sluit die keuse van vereiste sagtewarepakkette en gereedskap in. Die vierde stap is die gedetailleerde ontwerp en konstruksie van die data pakhuis. Ives merk op dat winkel data wat dit is 'n ingeperkte iteratiewe proses.

Die sterkpunte van die Ives-benadering is die gebruik van spesifieke tegnieke om inligtingsvereistes te bepaal, die gebruik van 'n gestruktureerde proses om die integrasie van data pakhuis, die toepaslike hardeware en sagteware seleksie, en die gebruik van veelvuldige voorstellingstegnieke vir die data pakhuis. Die gebreke daarvan is inherent aan kompleksiteit. Ander sluit in probleme met die ontwikkeling van baie vlakke van databasis all'interno del data pakhuis in redelike tye en koste.

Kimball (1994) se benadering tot Datastoor ontwerp

Kimball (1994) het vyf iteratiewe stappe voorgestel om a data pakhuis (sien Figuur 4). Sy benadering is veral toegewy aan die ontwerp van 'n solo data pakhuis en oor die gebruik van dimensionele modelle bo entiteit- en verhoudingsmodelle. Kimball ontleed daardie dimensionele modelle omdat dit makliker is vir sakeleiers om besigheid te verstaan, dit is meer doeltreffend wanneer komplekse konsultasies hanteer word, en die ontwerp van databasis fisies is meer doeltreffend (Kimball 1994). Kimball erken dat die ontwikkeling van 'n data pakhuis is iteratief, en dit data pakhuis aparte tabelle kan geïntegreer word deur dit in tabelle met algemene afmetings te verdeel.

Die eerste stap is om die spesifieke vakgebied te identifiseer wat vervolmaak moet word. Die tweede en derde stappe handel oor dimensionele modellering. In die tweede stap identifiseer die maatreëls dinge van belang in die vakgebied en groepeer dit in 'n feitetabel. Byvoorbeeld, in 'n verkoopsvakgebied kan die maatstawwe van belang die hoeveelheid items verkoop en die dollar as die verkoopsgeldeenheid insluit. Die derde stap behels die identifisering van dimensies wat die maniere is waarop feite gegroepeer kan word. In 'n verkoopsonderwerparea kan relevante dimensies item, ligging en tydperk insluit. Die feitetabel het 'n meervoudige sleutel om dit aan elk van die dimensietabelle te koppel en bevat tipies 'n baie groot aantal feite. Daarteenoor bevat dimensietabelle beskrywende inligting oor dimensies en ander eienskappe wat gebruik kan word om feite te groepeer. Die gepaardgaande voorgestelde feite- en dimensietabel vorm wat 'n sterskema genoem word vanweë die vorm daarvan. Die vierde stap behels die bou van 'n databasis multidimensioneel om die sterpatroon te vervolmaak. Die laaste stap is om bronstelsels te identifiseer data wat vereis en ontwikkel transformasieprosesse om vas te lê, skoon te maak en te formateer i data wat.

Die sterk punte van Kimball se benadering sluit in die gebruik van dimensionele modelle om die voor te stel data wat gestoor wat dit maklik maak om te verstaan ​​en lei tot doeltreffende fisiese ontwerp. N dimensionele model wat ook geredelik beide stelsels van gebruik databasis relasionele kan vervolmaak word of sisteme databasis multidimensioneel. Die gebreke daarvan sluit in die gebrek aan sommige tegnieke om beplanning of integrasie van baie sterpatrone binne 'n data pakhuis en die moeilikheid om te ontwerp vanaf die uiterste gedenormaliseerde struktuur in 'n dimensionele model a data wat in nalatenskapstelsels.

McFadden (1996) se benadering tot data Pakhuisontwerp

McFadden (1996) stel 'n vyf-stap benadering voor om 'n data pakhuis (sien Figuur 5).
Sy benadering is gebaseer op 'n sintese van idees uit die literatuur en is gefokus op die ontwerp van 'n enkele data pakhuis. Die eerste stap behels 'n vereistesontleding. Alhoewel die tegniese spesifikasies nie voorgeskryf word nie, identifiseer McFadden se aantekeninge die entiteite data wat spesifikasies en hul eienskappe, en verwys na lesers Watson en Frolick (1993) vir vereistes vaslegging.
In die tweede stap word 'n entiteitsverhoudingsmodel geteken data pakhuis en dan deur sakeleiers bekragtig. Die derde stap sluit in die bepaling van die kartering vanaf nalatenskapstelsels en eksterne bronne data pakhuis. Die vierde stap behels prosesse in ontwikkeling, ontplooiing en sinchronisasie data wat in data pakhuis. In die laaste stap word die stelsellewering ontwikkel met besondere klem op 'n gebruikerskoppelvlak. McFadden merk op dat die tekenproses oor die algemeen iteratief is.

Die sterk punte van McFadden se benadering dui op die deelname van sakeleiers in die bepaling van die vereistes en ook die belangrikheid van hulpbronne data wat, hul skoonmaak en versameling. Die gebreke daarvan sluit in die gebrek aan 'n proses om 'n groot projek af te breek data pakhuis in baie geïntegreerde stadiums, en daar

probleme om die entiteit en verhoudingsmodelle te verstaan ​​wat gebruik word in die ontwerp van data pakhuis.

Ons word nie net gekies deur die naaste aan ons nie.

    0/5 (0 resensies)
    0/5 (0 resensies)
    0/5 (0 resensies)

    Kom meer te wete by Online Web Agency

    Teken in om die nuutste artikels per e-pos te ontvang.

    skrywer avatar
    admin Uitvoerende hoof
    👍Aanlyn Webagentskap | Webagentskap-deskundige in digitale bemarking en SEO. Web Agency Online is 'n Web Agency. Vir Agenzia Web Aanlyn sukses in digitale transformasie is gebaseer op die fondamente van Iron SEO weergawe 3. Spesialiteite: Stelselintegrasie, Ondernemingstoepassingsintegrasie, Diensgeoriënteerde argitektuur, Wolkrekenaars, Datapakhuis, besigheidsintelligensie, Groot Data, portale, intranette, Webtoepassing Ontwerp en bestuur van relasionele en multidimensionele databasisse Ontwerp van koppelvlakke vir digitale media: bruikbaarheid en grafika. Online Web Agency bied maatskappye die volgende dienste: -SEO op Google, Amazon, Bing, Yandex; -Web Analytics: Google Analytics, Google Tag Manager, Yandex Metrica; -Gebruikeromskakelings: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM op Google, Bing, Amazon-advertensies; -Bemarking op sosiale media (Facebook, Linkedin, Youtube, Instagram).
    My Agile Privaatheid
    Hierdie webwerf gebruik tegniese en profielkoekies. Deur op aanvaar te klik, magtig jy alle profielkoekies. Deur op verwerp of die X te klik, word alle profielkoekies verwerp. Deur op pasmaak te klik, is dit moontlik om te kies watter profielkoekies om te aktiveer.
    Hierdie webwerf voldoen aan die Wet op Databeskerming (LPD), Switserse Federale Wet van 25 September 2020, en die GDPR, EU-regulasie 2016/679, met betrekking tot die beskerming van persoonlike data sowel as die vrye beweging van sulke data.