fbpx

Datuma Stokado kaj Entreprena Rimeda Planado | DWH kaj ERP

ARCHIVO DATUMO CENTRA : HISTORIO ED EVOLUCIO

La du dominaj temoj de entreprena teknologio en la 90-aj jaroj estis i datuma magazeno kaj la ERP. Dum longa tempo ĉi tiuj du potencaj fluoj estis partoj de kompania IT sen iam ajn intersekciĝo. Estis preskaŭ kvazaŭ ili estus materio kaj kontraŭmaterio. Sed la kresko de ambaŭ fenomenoj neeviteble kondukis al ilia intersekco. Hodiaŭ kompanioj alfrontas la problemon, kion fari kun ERP kaj datuma magazeno. Ĉi tiu artikolo klarigos, kio estas la problemoj kaj kiel ili estas traktitaj de kompanioj.

ĈE KOMENCO...

En la komenco estis la datuma magazeno. Datuma magazeno ĝi naskiĝis por kontraŭstari la transakcian pretigan aplikaĵsistemon. En la fruaj tagoj enmemorigo de dati ĝi estis intencita esti nur kontraŭpunkto al transakciaj pretigaj aplikoj. Sed nuntempe ekzistas multe pli kompleksaj vizioj pri kio a datuma magazeno. En la nuna mondo la datuma magazeno ĝi estas enigita ene de strukturo kiu povas esti nomita la Korporacia Informa Fabriko.

LA ENTREPRENA INFORMA UZINO (CIF)

La Korporacia Informo-Fabriko havas normajn arkitekturajn komponentojn: koda integriĝo kaj transformtavolo kiu integras i dati dum mi dati ili moviĝas de la aplika medio al la medio de la datuma magazeno de la kompanio; a datuma magazeno de la firmao kie la dati detalaj kaj integritaj historiistoj. La datuma magazeno de la entrepreno funkcias kiel la fundamento sur kiu ĉiuj aliaj partoj de la medio povas esti konstruitaj datuma magazeno; operacia datumbutiko (ODS). ODS estas hibrida strukturo kiu enhavas iun aspekton de la datuma magazeno kaj aliaj aspektoj de OLTP-medio; datumvendejoj, kie malsamaj fakoj povas havi sian propran version de la datuma magazeno; a datuma magazeno esplorado kie firmaaj pensuloj povas sendi siajn 72-horajn demandojn sen malutila efiko al la datuma magazeno; kaj proksima linia memoro, en kiu dati maljuna kaj dati pograndaj detaloj povas esti stokitaj malmultekoste.

KIE LA ERP KOMBINAS KUN LA ENTREPRENA INFORMA fabriko

La ERP kunfandiĝas kun la Korporacia Informa Fabriko en du lokoj. Ĉefe kiel baza aplikaĵo kiu provizas i dati de la aplikaĵo al datuma magazeno. En ĉi tiu kazo i dati, generitaj kiel kromprodukto de transakcia procezo, estas integritaj kaj ŝarĝitaj en la datuma magazeno de la kompanio. La dua ligo inter ERP kaj CIF estas la ODS. Efektive, en multaj medioj ERP estas uzata kiel klasika ODS.

En kazo ERP estas uzata kiel baza aplikaĵo, la sama ERP ankaŭ povas esti uzata en la CIF kiel ODS. Ĉiukaze, se ERP estas uzota en ambaŭ roloj, devas esti klara distingo inter la du estaĵoj. Alivorte, kiam ERP ludas la rolon de baza aplikaĵo kaj ODS, la du arkitekturaj unuoj devas esti distingitaj. Se ununura efektivigo de ERP provas plenumi ambaŭ rolojn samtempe, neeviteble estos problemoj en la dezajno kaj efektivigo de tiu strukturo.

DISPARAJ ODS KAJ BAZAJ APLIKAJROJ

Estas multaj kialoj kondukantaj al la dividado de arkitekturaj komponentoj. Eble la plej rimarkinda punkto en apartigado de la malsamaj komponentoj de arkitekturo estas ke ĉiu komponento de la arkitekturo havas sian propran vidon. La baza aplikaĵo servas malsaman celon ol la ODS. Provu interkovri

bazlinia aplikvido pri la mondo de ODS aŭ inverse ne estas justa maniero labori.

Sekve, la unua problemo de ERP en la CIF devas kontroli ĉu ekzistas distingo inter la bazliniaplikoj kaj la ODS.

DATUMODELOJ EN LA KORPORACIO INFORMA UZINO

Por atingi koherecon inter la malsamaj komponentoj de la CIF-arkitekturo, devas ekzisti modelo de dati. La modeloj de dati ili funkcias kiel ligo inter la diversaj komponentoj de la arkitekturo kiel ekzemple la bazliniaplikoj kaj la ODS. La modeloj de dati ili fariĝas la "intelekta vojmapo" por ricevi la ĝustan signifon de la malsamaj arkitekturaj komponentoj de la CIF.

Irante man en mano kun ĉi tiu nocio, la ideo estas ke devus esti unu granda kaj ununura ŝablono dati. Evidente devas esti ŝablono de dati por ĉiu el la komponantoj kaj krome devas esti prudenta vojo liganta la malsamajn modelojn. Ĉiu komponento de la arkitekturo - ODS, bazliniaplikoj, datuma magazeno de la firmao, kaj tiel plu.. – bezonas propran modelon de dati. Kaj do devas esti preciza difino de kiel tiuj modeloj de dati ili interfacas unu kun la alia.

MOVO MI DATUMO DE LA ERP EN LA DATUMO VERKO

Se la origino de la dati estas baza aplikaĵo kaj/aŭ ODS, kiam la ERP enigas i dati nel datuma magazeno, tiu ĉi enmeto devas okazi ĉe la plej malalta nivelo de "granuleco". Simple resumu aŭ aldoni i dati ĉar ili eliras el la ERP baza aplikaĵo aŭ ERP ODS ne estas la ĝusta afero. LA dati detaloj necesas en la datuma magazeno formi la bazon de la DSS-procezo. Tia dati ili estos multmaniere transformitaj per datumvendejoj kaj esplorado datuma magazeno.

La movo de dati de la ERP bazlinia aplika medio al la datuma magazeno de la firmao estas farita en racie malstreĉita maniero. Ĉi tiu movo okazas proksimume 24 horojn post la ĝisdatigo aŭ kreado en la ERP. La fakto havi "maldiligentan" movadon de la dati nel datuma magazeno de la firmao permesas la dati venante de la ERP por "solvi". Iam mi dati estas konservitaj en la baza aplikaĵo, tiam vi povas sekure movi la dati de la ERP en la firmao. Alia celo, kiun oni povas atingi dank' al la "pigra" movado de la dati estas la klara limado inter funkciaj procezoj kaj DSS. Kun "rapida" movo de la dati la linio inter DSS kaj funkcia restas neklara.

La movado de dati de la ODS de la ERP al datuma magazeno de la firmao estas farata periode, kutime ĉiusemajne aŭ monate. En ĉi tiu kazo la movado de dati ĝi baziĝas sur la bezono "purigi" la malnovajn dati historiistoj. Nature, la ODS enhavas i dati kiuj estas multe pli novaj ol la dati historiistoj trovitaj en la datuma magazeno.

La movo de dati nel datuma magazeno ĝi preskaŭ neniam fariĝas "pogranda" (pogranda maniero). Kopiu tabelon de la ERP-medio al datuma magazeno ĝi ne havas sencon. Multe pli realisma aliro estas movi elektitajn unuojn de dati. Nur la dati kiuj ŝanĝiĝis ekde la lasta ĝisdatigo de la datuma magazeno estas tiuj, kiuj devus esti movitaj en la datuma magazeno. Unu maniero scii kiuj dati ŝanĝiĝis ekde la lasta ĝisdatigo estas rigardi la tempomarkojn de dati trovita en la ERP-medio. La dezajnisto elektas ĉiujn ŝanĝojn, kiuj okazis ekde la lasta ĝisdatigo. Alia aliro estas uzi ŝanĝajn kaptajn teknikojn dati. Kun ĉi tiuj teknikoj tagaloj kaj ĵurnalaj bendoj estas analizitaj por determini kiuj dati devas esti movita de la ERP-medio al tiu de datuma magazeno. Ĉi tiuj teknikoj estas plej bonaj ĉar protokoloj kaj ĵurnalaj bendoj povas esti legitaj de ERP-dosieroj sen plia efiko al aliaj ERP-resursoj.

ALIAJ Komplikaĵoj

Unu el la ERP-problemoj en la CIF estas kio okazas al aliaj aplikaĵfontoj aŭ ai dati de la ODS al kiuj ili devas kontribui datuma magazeno sed ili ne estas parto de la ERP-medio. Donita la fermita naturo de ERP, precipe SAP, provante integri ŝlosilojn de eksteraj fontoj de dati kun i dati kiuj venas de la ERP en la momento de translokiĝo i dati nel datuma magazeno, ĝi estas granda defio. Kaj kiaj precize estas la probabloj ke i dati de aplikoj aŭ ODS ekster la ERP-medio estos integritaj en la datuma magazeno? La probabloj estas fakte tre altaj.

TROVU DATUMO HISTORIA EL ERP

Alia problemo kun i dati de ERP estas tiu derivanta de la bezono havi dati historiistoj ene de la datuma magazeno. Kutime la datuma magazeno bezonoj dati historiistoj. Kaj ERP-teknologio kutime ne stokas ĉi tiujn dati historia, almenaŭ ne tiom kiom necesas en la datuma magazeno. Kiam granda kvanto da dati ŝtipoj komencas aldoni en la ERP-medio, tiu medio devas esti purigita. Ekzemple, supozu a datuma magazeno devus esti ŝarĝita kun kvin jaroj de dati historia dum la ERP konservas maksimume ses monatojn de ĉi tiuj dati. Tiel longe kiel la kompanio estas kontenta kolekti kelkajn dati historia kiel tempo pasas, tiam ne estas problemo uzi la ERP kiel fonton por la datuma magazeno. Sed kiam la datuma magazeno devas reiri en la tempo kaj preni diojn dati historio kiu ne estis antaŭe kolektita kaj ŝparita de la ERP, tiam la ERP-medio iĝas malefika.

ERP KAJ METADATUJ

Alia konsidero fari pri ERP e datuma magazeno estas tiu pri la ekzistantaj metadatenoj en la ERP-medio. Same kiel metadatenoj moviĝas de la ERP-medio al la datuma magazeno, la metadatenoj devas esti movitaj en la sama maniero. Krome, la metadatenoj devas esti transformitaj en la formaton kaj strukturon postulatajn de la infrastrukturo datuma magazeno. Estas granda diferenco inter operaciaj metadatenoj kaj DSS-metadatumoj. Funkciaj metadatenoj estas plejparte por la programisto kaj por la

programisto. DSS-metadatenoj estas ĉefe por la finuzanto. Ekzistantaj metadatenoj en ERP-aplikoj aŭ ODS-oj devas esti konvertitaj kaj ĉi tiu konvertiĝo ne ĉiam estas facila kaj simpla.

FONTO DE LA ERP-DATUMOJ

Se la ERP estas uzata kiel provizanto de dati po il datuma magazeno devas esti solida interfaco, kiu movas i dati de la ERP-medio al la medio datuma magazeno. La interfaco devas:

  • ▪ esti facile uzebla
  • ▪ permesi aliron al dati de la ERP
  • ▪ repreni la signifon de dati al kiuj estas movitaj datuma magazeno
  • ▪ koni la limojn de la ERP, kiuj povus aperi kiam oni aliras la dati de la ERP:
  • ▪ referenca integreco
  • ▪ hierarkiaj rilatoj
  • ▪ implicaj logikaj rilatoj
  • ▪ aplika konvencio
  • ▪ ĉiuj strukturoj de dati subtenata de la ERP, kaj tiel plu...
  • ▪ esti efika en aliro dati, provizante:
  • ▪ rekta movo de dati
  • ▪ akiro de ŝanĝo dati
  • ▪ subteni ĝustatempan aliron al dati
  • ▪ kompreni la formaton de la dati, kaj tiel plu… INTERFACIO KUN SAP La interfaco povas esti de du tipoj, memfara aŭ komerca. Kelkaj el la ĉefaj komercaj interfacoj inkluzivas:
  • ▪ SAS
  • ▪ Primaj Solvoj
  • ▪ D2k, kaj tiel plu... MULTOBLAJ ERP-TEKNOLOGIOJ Trakti la ERP-medion kvazaŭ ĝi estus ununura teknologio estas granda eraro. Estas multaj ERP-teknologioj, ĉiu kun siaj fortoj. La plej konataj vendistoj en la merkato estas:
  • ▪ SAP
  • ▪ Oracle Financials
  • ▪ PeopleSoft
  • JD Edwards
  • ▪ Baans SAP SAP estas la plej granda kaj plej ampleksa ERP-programaro. SAP-aplikoj inkluzivas multajn specojn de aplikoj en multaj lokoj. SAP havas reputacion por esti:
  • ▪ tre granda
  • ▪ tre malfacila kaj multekosta efektivigi
  • ▪ bezonas multajn homojn kaj konsilistojn por efektivigi
  • ▪ bezonas specialigitajn homojn por la efektivigo
  • ▪ bezonas multan tempon por efektivigi Ankaŭ SAP havas reputacion por enmemorigi ĝian dati proksime, malfaciligante al iu ekster la SAP-areo aliri ilin. La forto de SAP estas, ke ĝi kapablas kapti kaj stoki grandan kvanton da dati. SAP lastatempe anoncis sian intencon etendi siajn aplikojn al datuma magazeno. Estas multaj avantaĝoj kaj malavantaĝoj uzi SAP kiel vendisto datuma magazeno. Avantaĝo estas, ke SAP jam estas instalita kaj la plej multaj konsultistoj jam konas SAP.
    La malavantaĝoj de havi SAP kiel provizanto de datuma magazeno estas multaj: SAP ne havas sperton en la mondo de datuma magazeno Se SAP estas la provizanto de datuma magazeno, necesas "elpreni" i dati de SAP al datuma magazeno. dato la rekordon de SAP de fermita sistemo, verŝajne ne estos facile akiri i de SAP en ĝi (???). Estas multaj heredaj medioj funkciantaj SAP, kiel IMS, VSAM, ADABAS, ORACLE, DB2, ktp. SAP insistas pri "ne inventita ĉi tie" aliro. SAP ne volas partneri kun aliaj vendistoj por uzi aŭ krei la datuma magazeno. SAP insistas pri generado de sia propra programaro mem.

Kvankam SAP estas granda kaj potenca kompanio, la fakto provi reverki la teknologion de ELT, OLAP, sistema administrado kaj eĉ la kodbazo de la dbms ĝi estas nur freneza. Anstataŭ preni kunlaboran sintenon kun la provizantoj datuma magazeno Delonge, SAP sekvis la aliron, kiun ili "konas plej bone". Ĉi tiu sinteno retenas la sukceson, kiun SAP povus havi en la areo datuma magazeno.
La rifuzo de SAP permesi al eksteraj vendistoj rapide kaj gracie aliri siajn dati. La esenco mem uzi a datuma magazeno estas facila aliro al dati. La tuta historio de SAP baziĝas sur malfaciligado de aliro dati.
La manko de SAP de sperto pri traktado de grandaj volumoj de dati; en la kampo de datuma magazeno estas volumoj de dati neniam vidita de SAP kaj manipuli ĉi tiujn grandajn kvantojn de dati vi devas havi la ĝustan teknologion. SAP ŝajne ne konscias pri ĉi tiu teknologia baro, kiu ekzistas por eniri la kampon de datuma magazeno.
La kompania kulturo de SAP: SAP konstruis komercon por akiri i dati de la sistemo. Sed por fari tion vi devas havi malsaman menson. Tradicie, softvarfirmaoj, kiuj estis lertaj pri ricevi datumojn en medion, ne bonis ricevi datumojn alidirekten. Se SAP sukcesos fari ĉi tiun tipon de ŝanĝo, ĝi estos la unua kompanio kiu faros tion.

Resume, estas dubinde ĉu kompanio elektu SAP kiel provizanton de datuma magazeno. Estas tre gravaj riskoj unuflanke kaj tre malmultaj rekompencoj aliflanke. Sed estas alia kialo, kiu malinstigas elekti SAP kiel provizanton datuma magazeno. Ĉar ĉiu kompanio devus havi la samon datuma magazeno de ĉiuj aliaj kompanioj? La datuma magazeno ĝi estas la koro de konkurenciva avantaĝo. Se ĉiu kompanio adoptus la samon datuma magazeno estus malfacile, kvankam ne maleble, atingi konkurencivan avantaĝon. SAP ŝajnas pensi ke a datuma magazeno povas esti vidita kiel kuketo kaj ĉi tio estas ankoraŭ alia signo de ilia pensmaniero "ricevi la datumojn en" aplikoj.

Neniu alia ERP-vendisto estas tiel domina kiel SAP. Sendube ekzistos kompanioj, kiuj iros la vojon SAP por siaj datuma magazeno sed supozeble tiuj ĉi datuma magazeno SAP-oj estos grandaj, multekostaj kaj tempopostulaj por krei.

Ĉi tiuj medioj inkluzivas tiajn agadojn kiel bankkasistopretigo, aviadkompaniaj rezervadprocezoj, asekuraj plendoj, ktp. Ju pli bone plenumas la transakcian sistemon, des pli evidenta estis la bezono de apartigo inter la operacia procezo kaj la DSS (Decision Support System). Tamen, kun HR kaj personaj sistemoj, vi neniam alfrontas grandajn volumojn da transakcioj. Kaj, kompreneble, kiam persono estas dungita aŭ forlasas la kompanion ĉi tio estas rekordo de transakcio. Sed rilate al aliaj sistemoj, HR kaj personaj sistemoj simple ne havas multajn transakciojn. Tial, en HR kaj personaraj sistemoj ne estas tute evidente, ke necesas DataWarehouse. Laŭ multaj manieroj tiuj sistemoj estas fuzioj de DSS-sistemoj.

Sed estas alia faktoro, kiu devas esti konsiderata kiam vi traktas datumejon kaj PeopleSoft. En multaj rondoj, i dati HR kaj personaj rimedoj estas malĉefaj al la ĉefa komerco de la kompanio. Plej multaj el la kompanioj fabrikas, vendas, provizas servojn ktp. HR- kaj personarsistemoj estas kutime malĉefaj al (aŭ subtenaj de) la ĉefkomerco de la firmao. Tial, ĝi estas dusenca kaj maloportuna a datuma magazeno aparta por HR kaj personaj rimedoj subteno.

PeopleSoft estas tre malsama de SAP ĉi-rilate. Kun SAP, estas devige ke ekzistas a datuma magazeno. Kun PeopleSoft, ĝi ne estas tute klara. Datumstokejo estas laŭvola kun PeopleSoft.

La plej bona afero, kiun oni povas diri por la dati PeopleSoft estas ke la datuma magazeno povas esti uzata por arkivi i dati rilata al malnovaj homaj kaj personaj rimedoj. Dua kialo kial firmao volus uzi a datuma magazeno a

malavantaĝo de la PeopleSoft-medio estas permesi aliron kaj liberan aliron al analiziloj, ai dati de PeopleSoft. Sed preter ĉi tiuj kialoj, povas ekzisti kazoj, kie estas preferinde ne havi datuman stokejon por dati PeopleSoft.

En resumo

Estas multaj ideoj, kiuj rilatas al la konstruado de a datuma magazeno ene de ERP-programaro.
Kelkaj el ĉi tiuj estas:

  • ▪ Havas sencon havi a datuma magazeno kiu aspektas kiel iu alia en la industrio?
  • ▪ Kiom fleksebla estas ERP datuma magazeno programaro?
  • ▪ ERP datuma magazeno programaro povas pritrakti volumon de dati kiu situas en adatuma magazeno areno"?
  • ▪ Kio estas la spuro de la ERP-vendisto faras antaŭ facila kaj malmultekosta, tempopostula, ai dati? (Kio estas la rekordo de la ERP-vendistoj pri livero de malmultekostaj, ĝustatempe, facile alireblaj datumoj?)
  • ▪ Kio estas la kompreno de la ERP-vendisto pri la DSS-arkitekturo kaj la kompania informfabriko?
  • ▪ ERP-vendistoj komprenas kiel akiri dati ene de la medio, sed ankaŭ kompreni kiel eksporti ilin?
  • ▪ Kiom malfermita estas la ERP-vendisto al datum-stokaj iloj?
    Ĉiuj ĉi tiuj konsideroj devas esti faritaj kiam determini kie meti la datuma magazeno kiu gastigos i dati de la ERP kaj aliaj dati. Ĝenerale, krom se estas deviga kialo fari alie, konstrui estas rekomendita datuma magazeno ekster la ERP-vendistmedio. ĈAPITRO 1 Superrigardo de la BI-Organizo Ĉefpunktoj:
    Informo-deponejoj funkcias en la kontraŭa maniero al komercinteligenta (BI) arkitekturo:
    Korporacia kulturo kaj IT povas limigi la sukceson konstrui BI-organizojn.

Teknologio ne plu estas la limiga faktoro por BI-organizoj. La problemo por arkitektoj kaj projektplanistoj ne estas ĉu la teknologio ekzistas, sed ĉu ili povas efike efektivigi la disponeblan teknologion.

Por multaj kompanioj a datuma magazeno estas malmulte pli ol pasiva deponejo, kiu distribuas i dati al uzantoj, kiuj bezonas ĝin. LA dati estas ĉerpitaj de fontsistemoj kaj estas loĝitaj en celstrukturojn per datuma magazeno. mi dati ili ankaŭ povas esti purigitaj kun ajna sorto. Tamen neniu aldona valoro estas aldonita aŭ kolektita de la dati dum ĉi tiu procezo.

Esence, pasiva dw, en la plej bona kazo, nur provizas i dati pura kaj funkcia al uzant-asocioj. Kreado de informoj kaj analiza kompreno estas tute dependaj de uzantoj. Juĝante ĉu la DW (Datuma magazeno) ĉu sukceso estas subjektiva. Se ni juĝas sukceson laŭ la kapablo efike kolekti, integri kaj purigi i dati kompania sur antaŭvidebla bazo, tiam jes, la DW estas sukceso. Aliflanke, se ni rigardas la kolekton, solidigon kaj ekspluaton de informoj la organizo kiel tuto, tiam la DW estas fiasko. DW provizas malmulte aŭ neniun informvaloron. Kiel rezulto, uzantoj estas devigitaj fari, tiel kreante informajn silojn. Ĉi tiu ĉapitro prezentas ampleksan vizion por resumi la arkitekturon BI (Business Intelligence). Ni komencas kun priskribo de BI kaj poste transiras en diskutojn pri informdezajno kaj evoluo, kontraste al simple liverado dati al uzantoj. Diskutoj tiam koncentriĝas pri kalkulado de la valoro de viaj BI-klopodoj. Ni finas difinante kiel IBM traktas la BI-arkitekturajn postulojn de via organizo.

Arkitektura priskribo de BI-organizo

Potencaj transakciaj informsistemoj nun estas la ordo de la tago en ĉiu granda entrepreno, efike ebenigante la ludkampon por korporacioj ĉirkaŭ la mondo.

Resti konkurenciva, tamen, nun postulas analize orientitajn sistemojn, kiuj povas revolucii la kapablon de la firmao retrovi kaj uzi la informojn, kiujn ili jam havas. Ĉi tiuj analizaj sistemoj venas de kompreno de la riĉeco de dati disponebla. BI povas plibonigi rendimenton tra ĉiuj informoj tra la entrepreno. Komercoj povas plibonigi klient-provizantajn rilatojn, plibonigi produkton kaj servan profitecon, generi novajn kaj pli bonajn interkonsentojn, kontroli riskon, kaj inter multaj aliaj gajnoj draste tranĉi elspezojn. Kun BI, via kompanio finfine komencas uzi klientajn informojn kiel konkurencivan valoraĵon danke al aplikoj, kiuj havas merkatajn celojn.

Havi la ĝustajn rimedojn de komerco signifas havi definitivajn respondojn al ŝlosilaj demandoj kiel ekzemple:

  • ▪ Kiu el niaj klientoj Ĉu ili igas nin enspezi pli, aŭ ĉu ili igas nin perdi monon?
  • ▪ Kie vivas niaj plej bonaj klientoj rilate al butiko/ magazenon ili frekventas?
  • ▪ Kiuj el niaj produktoj kaj servoj povas esti venditaj plej efike kaj al kiu?
  • ▪ Kiuj produktoj povas esti venditaj plej efike kaj al kiu?
  • ▪ Kiu venda kampanjo estas pli sukcesa kaj kial?
  • ▪ Kiuj vendokanaloj estas plej efikaj por kiuj produktoj?
  • ▪ Kiel ni povas plibonigi rilatojn kun nia plej bona klientoj? Plej multaj kompanioj havas dati malglate respondi ĉi tiujn demandojn.
    Operaciaj sistemoj generas grandajn kvantojn da produkto, kliento kaj kosto dati de la vendlokoj, rezervoj, klientservo kaj teknikaj helpsistemoj. La defio estas ĉerpi kaj ekspluati ĉi tiun informon. Multaj kompanioj profitas nur de malgrandaj frakcioj de siaj dati por strategiaj analizoj.
    I dati restanta, ofte kombinita kun i dati derivaj eksteraj fontoj kiel registaraj raportoj, kaj aliaj aĉetitaj informoj, estas orminejo nur atendanta esti esplorita, kaj dati ili nur devas esti rafinitaj en la informa kunteksto de via organizo.

Ĉi tiu scio povas esti aplikata laŭ pluraj manieroj, de dezajnado de ĝenerala kompania strategio ĝis persona komunikado kun provizantoj, tra vokcentroj, fakturado, interreto kaj aliaj punktoj. La hodiaŭa komerca medio diktas, ke DW kaj rilataj BI-solvoj evoluas preter kurado de tradiciaj komercaj strukturoj. dati kiel i dati atomnivela normaligita kaj "stelo/kubbienoj".

Kio estas postulata por resti konkurenciva estas fuzio de tradiciaj kaj altnivelaj teknologioj por subteni larĝan analizan pejzaĝon.
Fine, la ĝenerala medio devas plibonigi la konon de la kompanio kiel tuto, certigante, ke la agoj faritaj kiel rezulto de la analizoj faritaj estas utilaj por ke ĉiuj profitu.

Ekzemple, ni diru, ke vi rangigas vian propran klientoj en alta aŭ malalta risko kategorioj.
Ĉu ĉi tiuj informoj estas generitaj de modela minado aŭ aliaj rimedoj, ĝi devas esti metita en la DW kaj fariĝi alirebla por iu ajn, uzante ajnan alirilon, kiel senmovaj raportoj, kalkultabeloj, tabeloj aŭ enreta analiza prilaborado (OLAP).

Tamen, nuntempe, granda parto de ĉi tiu tipo de informoj restas en siloj dati de la individuoj aŭ fakoj generantaj la analizon. La organizo kiel tuto havas malmulte aŭ neniun videblecon por kompreno. Nur miksante ĉi tiun tipon de informenhavo en vian entreprenan DW, vi povas forigi informsilojn kaj altigi vian DW-medion.
Estas du gravaj obstakloj por disvolvi BI-organizon.
Unue, ni havas la problemon de la organizo mem kaj ĝia disciplino.
Kvankam ni ne povas helpi pri organizaj politikaj ŝanĝoj, ni povas helpi kompreni la komponentojn de BI de organizo, ĝian arkitekturon, kaj kiel la teknologio de IBM faciligas ĝian evoluon.
La dua baro por venki estas la manko de integra teknologio kaj la scio pri metodo kiu nomas la tutan BI-spacon kontraste al nur malgranda komponento.

IBM respondas al ŝanĝoj en integra teknologio. Estas via respondeco provizi konscian dezajnon. Ĉi tiu arkitekturo devas esti evoluigita kun teknologio elektita por senlima integriĝo, aŭ almenaŭ, kun teknologio kiu aliĝas al malfermaj normoj. Ankaŭ, via kompanio-administrado devas certigi, ke la Bi-entrepreno estas efektivigita laŭhoraro kaj ne tiu de permesi la disvolviĝon de informaj siloj kiuj ekestiĝas de memservaj tagordoj, aŭ celoj.
Ĉi tio ne signifas, ke la BI-medio ne estas sentema al reago al la malsamaj bezonoj kaj postuloj de malsamaj uzantoj; anstataŭe, ĝi signifas ke la efektivigo de tiuj individuaj bezonoj kaj postuloj estas farita por la avantaĝo de la tuta BI-organizo.
Priskribo de la arkitekturo de la BI-organizo troveblas sur paĝo 9 en Figuro 1.1 La arkitekturo montras riĉan miksaĵon de teknologioj kaj teknikoj.
De la tradicia vido, la arkitekturo inkluzivas la sekvajn stokajn komponentojn

Atoma tavolo (Atoma Tavolo).

Ĉi tio estas la fundamento, la koro de la tuta Dw kaj tial de strategia raportado.
I dati stokita ĉi tie konservos la historian integrecon, raportoj de dati kaj inkluzivi derivitajn metrikojn, same kiel esti purigitaj, integritaj kaj stokitaj uzante minindustriajn modelojn.
Ĉia posta uzo de ĉi tiuj dati kaj rilataj informoj estas derivitaj de ĉi tiu strukturo. Ĉi tio estas bonega fonto por minado dati kaj por raportoj kun strukturitaj SQL-demandoj

Funkcia magazeno de dati aŭ raportbazo de dati(Operacia datumvendejo (ODS) aŭ raportado DataBase.)

Ĉi tio estas strukturo de dati specife desegnita por teknika raportado.

I dati stokita kaj raportita super tiuj strukturoj povas poste disvastiĝi en la stokejon per la surscenejo, kie ĝi povus esti uzita por strategia signalado.

Scenejo.

La unua halto por la plimulto dati destinita por la magazena medio estas la organiza zono.
Jen mi dati estas integritaj, purigitaj kaj transformitaj en dati profitoj kiuj popolos la stokstrukturon

Datmartoj.

Ĉi tiu parto de la arkitekturo reprezentas la strukturon de dati uzata specife por OLAP. La ĉeesto de datumvendoj, se i dati ili estas stokitaj en la stelskemoj kiujn ili superkovras dati plurdimensia en interrilata medio, aŭ en la dosieroj de dati proprieta uzata de specifa OLAP-teknologio, kiel DB2 OLAP-Servilo, ne gravas.

La sola limo estas, ke la arkitekturo faciligas la uzon de dati plurdimensia.
La arkitekturo ankaŭ inkludas kritikajn Bi-teknologiojn kaj teknikojn kiuj estas distingitaj kiel:

Spaca analizo

Spaco estas informa gajno por la analizisto kaj estas kritika por kompleta rezolucio. Spaco povas reprezenti informojn pri la homoj kiuj loĝas en certa loko, same kiel informojn pri kie tiu loko estas fizike rilate al la resto de la mondo.

Por fari ĉi tiun analizon, vi devas komenci ligi viajn informojn al latitudo kaj longitudo koordinatoj. Ĉi tio estas nomata "geokodado" kaj devas esti parto de la procezo de ekstrakto, transformo kaj ŝarĝo (ETL) ĉe la atomnivelo de via magazeno.

Minado de datumoj.

La eltiro de dati permesas al niaj kompanioj kreskigi la nombron da klientoj, por antaŭdiri vendajn tendencojn kaj ebligi rilatadministradon kun i klientoj (CRM), inter aliaj BI-iniciatoj.

La eltiro de dati ĝi devas do esti integrita kun la strukturoj de dati magazeno kaj subtenata de magazenaj procezoj por konstati kaj efikan kaj efikan uzon de teknologio kaj rilataj teknikoj.

Kiel indikite en la BI-arkitekturo, la atomnivelo Dwhouse, same kiel datumaroj, estas bonega fonto de dati por eltiro. Tiuj samaj trajtoj ankaŭ devas esti ricevantoj de ekstraktaj rezultoj por certigi haveblecon al la plej larĝa spektantaro.

Agentoj.

Estas diversaj "agentoj" por ekzameni la klienton por ajna punkto kiel, la operaciumoj de la firmao kaj la dw mem. Ĉi tiuj agentoj povas esti progresintaj neŭralaj retoj trejnitaj por lerni pri tendencoj ĉe ĉiu punkto, kiel estonta produkta postulo bazita sur vendaj promocioj, regul-bazitaj motoroj por reagi al datumoj aro de cirkonstancoj, aŭ eĉ simplaj agentoj raportantaj esceptojn al ĉefaj oficuloj. Ĉi tiuj procezoj ĝenerale okazas en reala tempo kaj, tial, devas esti forte kunligitaj kun la movado de la procezoj dati. Ĉiuj ĉi tiuj strukturoj de dati, teknologioj kaj teknikoj certigas, ke vi ne pasigos la nokton generante organizon de via BI.

Ĉi tiu agado estos disvolvita en pliigaj paŝoj, por malgrandaj punktoj.
Ĉiu paŝo estas sendependa projekta penado, kaj estas nomata ripeto en via BI dw aŭ iniciato. Ripetoj povas inkluzivi efektivigi novajn teknologiojn, komencante kun novaj teknikoj, aldonante novajn kadrojn al dati , ŝarĝante i dati pliaj , aŭ kun la analiza ekspansio de via medio. Ĉi tiu alineo estas diskutita pli detale en ĉapitro 3.

Krom tradiciaj DW kadroj kaj BI-iloj ekzistas aliaj aspektoj de via BI-organizo por kiuj vi devas desegni, kiel ekzemple:

Kliento-tuŝpunktoj (Kliento-tuŝo punktoj).

Kiel ĉe iu ajn moderna organizo, ekzistas kelkaj klientaj tuŝpunktoj, kiuj indikas kiel havi pozitivan sperton por via klientoj. Ekzistas tradiciaj kanaloj kiel komercistoj, ŝaltpanelfunkciigistoj, rekta poŝto, plurmedia kaj presaĵreklamo, same kiel pli aktualaj kanaloj kiel ekzemple retpoŝto kaj la reto, dati produktoj kun iu punkto de kontakto devas esti akiritaj, transportitaj, purigitaj, prilaboritaj kaj poste loĝitaj ĉe instalaĵoj dati de la BI.

Bazoj de dati operaciaj kaj uzantaj asocioj (Operaciaj

datumbazoj kaj uzantkomunumoj).
Fine de la kontaktpunktoj de la klientoj la fundamentoj estas trovitaj dati de la aplikaĵo kaj uzantkomunumoj de la firmao. LA dati ekzistantaj estas dati tradicia kiu devas esti kunigita kaj kunfandita kun la dati fluanta de la tuŝpunktoj por renkonti la necesajn informojn.

Analizistoj. (Analizistoj)

La primara profitanto de la BI-medio estas la analizisto. Estas li, kiu profitas el la nuna eltiro de dati operacia , integrita kun malsamaj fontoj de dati , pliigita kun ecoj kiel ekzemple geografia analizo (geokodigo) kaj prezentita en BI-teknologioj kiuj permesas minadon, OLAP, altnivelan SQL-raportadon kaj geografian analizon. La primara interfaco por la analizisto al la raporta medio estas la BI-portalo.

Tamen, la analizisto ne estas la sola kiu profitas de la BI-arkitekturo.
Ekzekutivoj, grandaj uzant-asocioj, kaj eĉ membroj, provizantoj kaj i klientoj devus trovi avantaĝojn en entrepreno BI.

Reen nutra buklo.

BI-arkitekturo estas lerna medio. Karakteriza principo de evoluo estas permesi persistajn strukturojn de dati esti ĝisdatigita per BI-teknologio uzata kaj per uzant-agoj faritaj. Ekzemplo estas kliento-poentado.

Se la venda fako faras minindustrian modelon de klientpoentaroj kiel uzi novan servon, tiam la venda fako ne estu la sola grupo profitanta de la servo.

Anstataŭe, modelminado devus esti farita kiel natura parto de la datumfluo ene de la entrepreno kaj klientpoentaro devus iĝi integra parto de la magazena informkunteksto, videbla por ĉiuj uzantoj. Bi-bI-centra IBM Suite inkluzive de DB2 UDB, DB2 OLAP-Servilo inkluzivas plej gravajn teknologiajn komponentojn, difinitajn en figuro 1.1.

Ni uzas la arkitekturon kiel ĝi aperas en ĉi tiu figuro de la libro por doni al ni nivelon de kontinueco kaj pruvi kiel ĉiu el la produktoj de IBM konvenas al la ĝenerala BI-skemo.

Provizante Informenhavon (Provizo informenhavo)

Projekti, disvolvi kaj efektivigi vian BI-medion estas timiga tasko. La dezajno devas ampleksi kaj nunajn kaj estontajn komercajn postulojn. La arkitektura desegnaĵo devas esti ampleksa por inkludi ĉiujn konkludojn trovitajn dum la dezajnofazo. Ekzekuto devas resti engaĝita al ununura celo: evoluigi la BI-arkitekturon kiel formale prezentitan en la dezajno kaj bazita en komercaj postuloj.

Estas precipe malfacile argumenti, ke disciplino certigos relativan sukceson.
Ĉi tio estas simpla ĉar vi ne disvolvas BI-medion samtempe, sed en etaj paŝoj laŭlonge de la tempo.

Tamen, identigi la BI-komponentojn de via arkitekturo estas grava pro du kialoj: Vi kondukos ĉiujn postajn teknikajn arkitekturdecidojn.
Vi povos konscie plani apartan uzon de teknologio kvankam vi eble ne ricevos ripeton bezonante la teknologion dum pluraj monatoj.

Kompreni viajn komercajn postulojn sufiĉe influos la tipon de produktoj, kiujn vi akiras por via arkitekturo.
La dezajno kaj disvolviĝo de via arkitekturo certigas, ke via magazeno estas

ne hazarda evento, sed prefere bone pripensita, zorge konstruita reklamo opero de arto kiel mozaiko de miksita teknologio.

Dezajni informenhavon

Ĉiu komenca dezajno devas fokusigi kaj identigi la ĉefajn BI-komponentojn, kiuj estos bezonitaj de la ĝenerala medio nun kaj en la estonteco.
Koni la komercajn postulojn gravas.

Eĉ antaŭ ol iu formala planado komenciĝis, la projektplanisto ofte povas identigi unu aŭ du komponentojn tuj.
La ekvilibro de komponantoj, kiuj povas esti bezonataj por via arkitekturo, tamen ne povas esti facile trovita. Dum la dezajnofazo, la ĉefparto de la arkitekturo ligas la aplikaĵ-evoluosesion (JAD) al esplorado por identigi komercajn postulojn.

Kelkfoje ĉi tiuj postuloj povas esti konfiditaj al konsulti kaj raporti ilojn.
Ekzemple, uzantoj deklaras ke se ili volas aŭtomatigi aktualan raporton, ili devas permane generi integrante du aktualajn raportojn kaj aldonante la kalkulojn derivitajn de la kombinaĵo de la dati.
Kvankam ĉi tiu postulo estas simpla, ĝi difinas certan funkcion, kiun vi devas inkluzivi kiam vi aĉetas raportajn ilojn por via organizo.

La dezajnisto ankaŭ devas plenumi pliajn postulojn por akiri kompletan bildon. Ĉu uzantoj volas aboni ĉi tiun raporton?
Ĉu raportaj subaroj estas generitaj kaj retpoŝtaj al diversaj uzantoj? Ĉu vi volas vidi ĉi tiun raporton en la kompania portalo? Ĉiuj ĉi tiuj postuloj estas parto de la simpla bezono anstataŭigi manan raporton laŭ la bezono de uzantoj. La avantaĝo de ĉi tiuj tipoj de postuloj estas, ke ĉiuj, uzantoj kaj projektistoj, konas la koncepton de raportoj.

Estas aliaj specoj de entreprenoj, tamen, pri kiuj ni devas plani. Kiam komercaj postuloj estas deklaritaj en la formo de strategiaj komercaj demandoj, estas facile por la sperta planisto distingi dimensiajn kaj mezuri/faktajn postulojn.

Se JAD-uzantoj ne scias kiel deklari siajn postulojn en la formo de komerca problemo, la dizajnisto ofte liveros ekzemplojn por salti-komenci la postkolektan sesion.
La sperta planisto povas helpi uzantojn kompreni ne nur strategian komercon, sed ankaŭ kiel formi ĝin.
La postkolekta aliro estas diskutita en ĉapitro 3; nuntempe ni nur volas atentigi la bezonon desegni por ĉiaj BI-postuloj.

Strategia komerca problemo ne estas nur komerca postulo, sed ankaŭ projektindiko. Se vi devas respondi plurdimensian demandon, tiam vi devas enmemorigi, prezenti la dati dimensia, kaj se vi bezonas parkerigi la dati plurdimensia, vi devas decidi kian teknologion aŭ teknikon vi uzos.

Ĉu vi efektivigas rezervitan kuban stelskemon, aŭ ambaŭ? Kiel vi povas vidi, eĉ simpla komerca afero povas multe influi la dezajnon. Sed ĉi tiuj specoj de komercaj postuloj estas kutimaj kaj kompreneble, almenaŭ de spertaj projektplanistoj kaj projektistoj.

Okazis sufiĉe da debato pri OLAP-teknologioj kaj subteno, kaj ampleksa vario de solvoj haveblas. Ĝis nun ni tuŝis la bezonon kunigi simplan raportadon kun dimensiaj komercaj postuloj, kaj kiel ĉi tiuj postuloj influas teknikajn arkitekturajn decidojn.

Sed kiuj estas la postuloj, kiuj ne estas facile kompreneblaj de uzantoj aŭ la Dw-teamo? Ĉu vi iam bezonos spacan analizon?
La minindustriaj modeloj de dati Ĉu ili estos necesa parto de via estonteco? Kiu scias?

Gravas noti, ke ĉi tiuj specoj de teknologioj ne estas bone konataj de la ĝeneralaj uzantkomunumoj kaj DW-teamanoj, parte, tio povus esti ĉar ili estas kutime pritraktitaj de iuj internaj aŭ triaj teknikaj fakuloj. Ĝi estas randa kazo de la problemoj ĉi tiuj specoj de teknologioj generas. Se uzantoj ne povas priskribi komercajn postulojn aŭ enkadrigi ilin por liveri gvidadon al dizajnistoj, ili povas pasi nerimarkitaj aŭ, pli malbone, simple ignoritaj.

Pli problema ĝi fariĝas kiam la dizajnisto kaj programisto ne povas rekoni la aplikon de unu el ĉi tiuj progresintaj sed kritikaj teknologioj.
Kiel ni ofte aŭdis la Dizajnistojn diri, “nu, kial ni ne forĵetas ĝin ĝis ni ricevos ĉi tiun alian aferon? “Ĉu ili vere interesiĝas pri prioritatoj, aŭ ĉu ili simple evitas postulojn, kiujn ili ne komprenas? Estas plej verŝajne la lasta supozo. Ni diru, ke via venda teamo komunikis komercan postulon, kiel dirite en Figuro 1.3, kiel vi povas vidi, la postulo estas enkadrigita en la formo de komerca problemo. La diferenco inter ĉi tiu problemo kaj la tipa dimensia problemo estas distanco. En ĉi tiu kazo, la venda teamo volas scii, ĉiumonate, la totalajn vendojn de produktoj, magazenoj kaj klientoj kiuj loĝas ene de 5 mejloj de la magazeno kie ili aĉetas.

Bedaŭrinde, dizajnistoj aŭ arkitektoj povas simple ignori la spacan komponenton dirante, "Ni havas la klienton, la produkton kaj la dati de la deponejo. Ni tenu la distancon ĝis alia ripeto.

"Malĝusta respondo. Ĉi tiu tipo de komerca problemo temas pri BI. Ĝi reprezentas pli profundan komprenon de nia komerco kaj fortikan analizan spacon por niaj analizistoj. BI estas preter simpla demandado aŭ norma raportado, aŭ eĉ OLAP. Tio ne signifas, ke ĉi tiuj teknologioj ne estas gravaj por via BI, sed ili per si mem ne reprezentas la BI-medion.

Dezajno por informa kunteksto (Dezajno por Informa Enhavo)

Nun kiam ni identigis la Komercajn Postulojn, kiuj distingas diversajn kernajn komponentojn, ili devas esti inkluzivitaj en ĝenerala arkitektura desegnaĵo. Kelkaj el la BI-komponentoj estas parto de niaj komencaj klopodoj, dum kelkaj ne estos efektivigitaj dum pluraj monatoj.

Tamen, ĉiuj konataj postuloj estas reflektitaj en la dezajno tiel ke kiam ni devas efektivigi specialan teknologion, ni estas pretaj fari tion. Io pri la projekto reflektos tradician pensadon.

Ĉi tiu aro de dati estas uzata por subteni postajn uzojn de dati dimensia movita de la komercaj aferoj, kiujn ni identigis. Ĉar pliaj dokumentoj estas generitaj, kiel la projekt-disvolviĝo de la dati, ni komencos formaligante kiel i dati ili disvastiĝas en la medio. Ni konstatis la bezonon reprezenti i dati en dimensia maniero, dividante ilin (laŭ specifaj specifaj bezonoj) en datumvendejoj.

La sekva demando por respondi estas: Kiel ĉi tiuj datumvendejoj estos konstruitaj?
Ĉu vi konstruas la stelojn por subteni la kubojn, aŭ nur kubojn, aŭ nur la stelojn? (aŭ dekstraj kuboj, aŭ dekstraj steloj). Generu la arkitekturon por dependaj datumvendejoj, kiuj postulas atoman tavolon por ĉiuj dati ĉu vi akiras? Permesu al sendependaj datumvendejoj akiri i dati rekte de operaciumoj?

Kian Kuban Teknologion vi provos normigi?

Vi havas amasajn kvantojn da dioj dati bezonata por dimensia analizo aŭ ĉu vi bezonas kubojn de via nacia venda forto ĉiusemajne aŭ ambaŭ? Ĉu vi konstruas potencan objekton kiel DB2 OLAP Servilo por financo aŭ Cognos PowerPlay-kuboj por via venda organizo aŭ ambaŭ? Ĉi tiuj estas la grandaj arkitekturaj projektaj decidoj, kiuj influos vian BI-medion antaŭen. Jes, vi identigis bezonon de OLAP. Nun kiel vi efektivigos tian teknikon kaj teknologion?

Kiel iuj el la pli altnivelaj teknologioj influas viajn dezajnojn? Ni supozu, ke vi identigis spacan bezonon en via organizo. Nun vi devas rememori la arkitekturajn desegnajn eldonojn eĉ se vi ne planas fari spacajn komponantojn dum pluraj monatoj. La arkitekto devas projekti hodiaŭ surbaze de tio, kion oni bezonas. Anticipu la bezonon de spaca analizo, kiu generas, konservas, konservas kaj provizas aliron al dati spaca. Ĉi tio siavice devus servi kiel limo rilate la tipon de programaro teknologio kaj platformaj specifoj, kiujn vi povas nuntempe konsideri. Ekzemple, la administra sistemo de Datumbazo interrilata (RDBMS) kiun vi konservas por via atomtavolo devas havi fortikan spacan amplekson disponebla. Ĉi tio certigus maksimuman rendimenton kiam vi uzas geometrion kaj spacajn objektojn en viaj analizaj aplikoj. Se via RDBMS ne povas trakti la dati (spac-centra) interne, do vi devos establi a Datumbazo (spatial-centric) ekstera. Ĉi tio malfaciligas la administradon de problemoj kaj kompromitas vian ĝeneralan rendimenton, sen mencii la kromajn problemojn, kiujn ĝi kreas por viaj DBA-oj, ĉar ili verŝajne havas minimuman komprenon pri la bazaĵoj de dati spaca ankaŭ. Aliflanke, se via RDMBS-motoro pritraktas ĉiujn spacajn komponentojn kaj ĝia optimumiganto konscias pri la specialaj bezonoj (ekz., indeksado) de spacaj objektoj, tiam viaj DBA-oj povas facile trakti administradajn aferojn kaj vi povas maksimumigi rendimenton.

Ankaŭ, vi devas ĝustigi la surscenejon kaj atoman medio-tavolon por inkluzivi adrespurigon (a

ŝlosila elemento al spaca analizo), same kiel la posta ŝparado de spacaj objektoj. La sinsekvo de dezajnaj eldonoj daŭras nun kiam ni enkondukis la nocion de adrespureco. Unue, ĉi tiu aplikaĵo diktos la tipon de programaro, kiun vi bezonas por via ETL-forto.

Ĉu vi bezonas produktojn kiel Trillium por provizi al vi puran adreson, aŭ ETL-vendiston de via elekto por provizi tiun funkcion?
Nuntempe gravas, ke vi aprezas la nivelon de dezajno, kiu devas esti kompletigita antaŭ ol vi komencos konservi vian magazenon. La supraj ekzemploj devus montri la amason da dezajndecidoj kiuj devas sekvi la identigon de iu speciala komerca postulo. Se faritaj ĝuste, ĉi tiuj desegnaj decidoj antaŭenigas interdependecon inter la fizikaj strukturoj de via medio, la elekto de teknologio uzata kaj la disvastigo de informenhavo. Sen ĉi tiu konvencia BI-arkitekturo, via organizo estos submetita al kaosa miksaĵo de ekzistantaj teknologioj, en la plej bona kazo loze kunligitaj por disponigi ŝajnan stabilecon.

Konservu informenhavon

Alporti la valoron de informoj al via organizo estas tre malfacila tasko. Sen sufiĉa kompreno kaj sperto, aŭ taŭga inĝenierado kaj dezajno, eĉ la plej bonaj teamoj malsukcesus. Aliflanke, se vi havas bonegan intuicion kaj detalan dezajnon sed neniun disciplinon por ekzekuti, vi ĵus malŝparis vian monon kaj tempon ĉar via peno estas kondamnita al malsukceso. La mesaĝo devas esti klara: Se vi mankas unu aŭ pli el ĉi tiuj kapabloj, kompreno/sperto aŭ planado/dezajno aŭ efektiviga disciplino, ĉi tio kondukos al kripligo aŭ detruo de la konstruaĵo de la BI-organizo.

Ĉu via teamo estas sufiĉe preta? Ĉu iu el via BI-teamo komprenas la vastan analizan pejzaĝon disponeblan en BI-medioj, kaj la teknikojn kaj teknologiojn necesajn por konservi tiun pejzaĝon? Ĉu estas iu en via teamo, kiu povas rimarki la diferencon en aplikado de progresinta

senmova raportado kaj OLAP, aŭ la diferencoj inter ROLAP kaj OLAP? Ĉu unu el viaj teamanoj klare rekonas la manieron de minado kaj kiel ĝi povus influi la magazenon aŭ kiel la magazeno povas subteni minadon? Teamano komprenas la valoron de dati spaco aŭ agent-bazita teknologio? Ĉu vi havas iun, kiu estimas la unikajn ilajn aplikojn de la teknologio ETL vs Message Broker? Se vi ne havas ĝin, akiru unu. BI estas multe pli granda ol normaligita atomtavolo, OLAP, stelskemoj kaj ODS.

Havi la komprenon kaj sperton por rekoni BI-postulojn kaj iliajn solvojn estas esenca por via kapablo konvene formaligi uzantbezonojn kaj desegni kaj efektivigi iliajn solvojn. Se via uzantkomunumo malfacilas priskribi postulojn, dependas de la magazena teamo provizi tiun komprenon. Sed se la teamo de magazeno

ne rekonas la specifan aplikon de BI - ekzemple, datumminado - tiam ne estas plej bone ke BI-medioj ofte estas limigitaj al esti pasivaj deponejoj. Tamen, ignori ĉi tiujn teknologiojn ne malpliigas ilian gravecon kaj la efikon, kiun ili havas sur la apero de komercaj inteligentecaj kapabloj de via organizo, same kiel la informan valoraĵon, kiun vi planas antaŭenigi.

Dezajno devas inkluzivi la nocion de desegnaĵo, kaj ambaŭ postulas kompetentan individuon. Krome, planado postulas teaman loĝdoman filozofion kaj konformecon al normoj. Ekzemple, se via kompanio establis platforman normon aŭ identigis apartan RDBMS, kiun ĝi volas normigi tra la platformo, estas nepre, ke ĉiuj en la teamo aliĝu al tiuj normoj. Ĝenerale teamo esprimas la bezonon de normigado (al uzantkomunumoj), sed la teamo mem ne volas aliĝi al la normoj establitaj en aliaj areoj de la firmao aŭ eble eĉ en similaj kompanioj. Ne nur ĉi tio estas hipokrita, sed ĝi establas, ke la kompanio ne kapablas ekspluati ekzistantajn rimedojn kaj investojn. Ĝi ne signifas, ke ne ekzistas situacioj, kiuj garantias ne-normigitan platformon aŭ teknologion; tamen, la klopodoj de la magazeno

ili devus ĵaluze gardi la normojn de la entrepreno ĝis komercaj postuloj diktas alie.

La tria ŝlosila komponanto necesa por konstrui BI-organizon estas disciplino.
Ĝi dependas entute, egale de individuoj kaj de la medio. Projektaj planistoj, sponsoroj, arkitektoj kaj uzantoj devas aprezi la disciplinon necesan por konstrui la informajn aktivaĵojn de la kompanio. Dizajnistoj devas direkti siajn dezajnoklopodojn por kompletigi aliajn klopodojn necesajn en socio.

Ekzemple, ni diru, ke via kompanio konstruas ERP-aplikaĵon, kiu havas stokan komponanton.
Tiel estas la respondeco de la ERP-dezajnistoj kunlabori kun la magazena medio-teamo por ne konkuri aŭ duobligi la jam komencitan laboron.

Disciplino ankaŭ estas temo, kiu devas esti traktita de la tuta organizo kaj estas kutime establita kaj postulita je administra nivelo.
Ĉu ekzekutivoj pretas aliĝi al desegnita aliro? Aliro, kiu promesas krei informenhavon, kiu finfine liveros valoron al ĉiuj areoj de la entrepreno, sed eble kompromis individuajn aŭ departementajn tagordojn? Memoru la diron "Pensi pri ĉio estas pli grava ol pensi pri unu afero". Ĉi tiu diro validas por BI-organizoj.

Bedaŭrinde, multaj magazenoj enfokusigas siajn klopodojn provi celi kaj liveri valoron al aparta fako aŭ specifaj uzantoj, kun malmulte da konsidero por la organizo ĝenerale. Supozu, ke la manaĝero petas helpon de la teamdomeja teamo. La teamo respondas per 90-taga penado, kiu inkluzivas ne nur liveri la sciigajn postulojn difinitajn de la ekzekutivo, sed certigi, ke ĉiuj dati bazo estas miksitaj en la atomnivelon antaŭ esti enkondukitaj en la proponitan kubteknologion.
Ĉi tiu inĝenieristiko aldono certigas, ke la homdoma entrepreno profitos el la dati bezonata de la administranto.
Tamen, la ekzekutivo parolis kun eksteraj konsultfirmaoj kiuj proponis similan aplikon kun livero en malpli ol 4 semajnoj.

Supozante, ke la interna loĝdoma teamo estas kompetenta, la oficulo havas elekton. Kiu povas subteni la kroman inĝenieran disciplinon necesan por kreskigi la entreprenan informan valoraĵon aŭ povas elekti konstrui sian propran solvon rapide. Ĉi-lasta ŝajnas esti elektita tro ofte kaj nur servas por krei ujojn da informoj, kiuj profitas al kelkaj aŭ al la individuo.

Mallongaj kaj longtempaj celoj

Arkitektoj kaj projektplanistoj devas formaligi longperspektivan vizion de la totala arkitekturo kaj planojn por kreskigado de BI-organizo. Ĉi tiu kombinaĵo de mallongperspektiva gajno kaj longperspektiva planado estas la du flankoj de BI-klopodoj. Mallongdaŭra enspezo estas la aspekto de BI, kiu rilatas al ripetoj de via magazeno.

Ĉi tio estas kie planistoj, arkitektoj kaj sponsoroj koncentriĝas pri renkonti specifajn komercajn postulojn. Estas sur ĉi tiu nivelo kie fizikaj strukturoj estas konstruitaj, teknologio estas aĉetita kaj teknikoj estas efektivigitaj. Ili neniel estas faritaj por trakti specifajn postulojn kiel difinitajn de apartaj uzantkomunumoj. Ĉio estas farita kun la celo trakti specifajn postulojn difinitajn de aparta komunumo.
Longdistanca planado, tamen, estas la alia aspekto de BI. Ĉi tie la planoj kaj dezajnoj certigis ke ajna fizika strukturo estis konstruita, la teknologioj elektitaj kaj la teknikoj plenumitaj faritaj kun okulo al la entrepreno. Estas longdaŭra planado, kiu provizas la kohezion necesan por certigi, ke firmaj gajnoj estas derivitaj de iuj mallongperspektivaj gajnoj trovitaj.

Pravigu vian BI-penon

Un datuma magazeno per si mem ĝi ne havas propran valoron. Alivorte, ne ekzistas eneca valoro inter stokaj teknologioj kaj efektivigteknikoj.

La valoro de iu magazena penado troviĝas en la agoj faritaj kiel rezulto de la magazena medio kaj informenhavo kultivita laŭlonge de la tempo. Ĉi tio estas kritika punkto por kompreni antaŭ ol vi iam provos taksi la valoron de iu ajn iniciato.

Tro ofte, arkitektoj kaj planistoj provas apliki valoron al la fizikaj kaj teknikaj komponentoj de la magazeno kiam fakte la valoro estas bazita en la komercaj procezoj kiuj estas pozitive trafitaj de la magazeno kaj bone kaptitaj informoj.

Ĉi tie kuŝas la defio fondi BI: Kiel vi pravigas la investon? Se la loĝdomo mem havas neniun internan valoron, projektplanistoj devas esplori, difini kaj formaligi la avantaĝojn al tiuj individuoj kiuj uzos la stokejon por plibonigi specifajn komercprocezojn aŭ la valoron de protektitaj informoj, aŭ ambaŭ.

Por malfaciligi aferojn, ajna komerca procezo trafita de stokejoj povus disponigi "grandajn" aŭ "mildajn" avantaĝojn. Signifaj avantaĝoj disponigas palpeblan metrikon por mezuri revenon de investo (ROI) - ekzemple, turnu inventaron plian tempon dum specifa periodo aŭ por pli malalta kosto de transportado per sendo. Estas pli malfacile difini subtilajn avantaĝojn, kiel ekzemple plibonigitan aliron al informoj, laŭ palpebla valoro.

Konektu vian projekton por scii la komercaj petoj

Tro ofte, projektplanistoj provas ligi stokvaloron kun amorfaj entreprenaj celoj. Deklarante ke "la valoro de magazeno baziĝas sur nia kapablo kontentigi strategiajn petojn" ni malfermas la diskuton en agrabla maniero. Sed tio sole ne sufiĉas por determini ĉu investi en la magazeno havas sencon. Plej bone estas konekti magazenajn reprezentantojn kun specifaj komercaj enketoj kaj notoj.

Mezuri ROI

Kalkuli ROI en magazeno povas esti aparte malfacila. Estas precipe malfacila se la plumbo

de aparta ripeto estas io netuŝebla aŭ facile mezurebla. Unu studo trovis, ke uzantoj perceptas la du ĉefajn avantaĝojn de BI-iniciatoj:

  • ▪ Krei la kapablon fari decidojn
  • ▪ Krei aliron al informoj
    Ĉi tiuj avantaĝoj estas mildaj (aŭ mildaj) avantaĝoj. Estas facile vidi kiel ni povas kalkuli ROI surbaze de malfacila (aŭ pli granda) profito kiel reduktita ŝarĝkosto, sed kiel ni mezuras la kapablon fari pli bonajn decidojn?
    Ĉi tio certe estas defio por projektaj planistoj, kiam ili provas igi la kompanion investi en aparta stokada penado. Kreskigado de vendo aŭ malpliigo de kostoj ne plu estas la centraj temoj pelantaj la BI-medion.
    Anstataŭe, vi serĉas komercajn petojn por pli bona aliro al informoj por ke aparta fako povu fari decidojn pli rapide. Ĉi tiuj estas strategiaj ŝoforoj, kiuj hazarde estas same gravaj por la entrepreno, sed estas pli ambiguaj kaj pli malfacile karakterizeblaj en palpebla metriko. En ĉi tiu kazo, kalkuli ROI povas esti misgvida, se ne sensignifa.
    Projektdizajnistoj devas povi pruvi palpeblan valoron por ekzekutivoj por decidi ĉu la investo en aparta ripeto valoras ĝin. Tamen, ni ne proponos novan metodon por kalkuli ROI, nek faros argumentojn por aŭ kontraŭ ĝi.
    Estas multaj artikoloj kaj libroj haveblaj, kiuj diskutas la bazojn pri kalkulo de ROI. Estas specialaj valorproponoj kiel valoro pri investo (VOI), ofertitaj de grupoj kiel Gartner, kiujn vi povas esplori. Anstataŭe, ni koncentriĝos pri la kernaj aspektoj de ajna ROI aŭ aliaj valorproponoj, kiujn vi devas konsideri. Aplikante ROI Preter la argumento pri la "malmolaj" kontraŭ "molaj" avantaĝoj asociitaj kun BI-klopodoj ekzistas aliaj aferoj por konsideri kiam aplikante ROI. Ekzemple:

Atribuante tro multajn ŝparaĵojn al DW-klopodoj, kiuj tamen venus
Ni diru, ke via kompanio transiris de komputila arkitekturo al distribuita UNIX-medio. Do ajna ŝparaĵo kiu povas (aŭ ne) realiĝas el tiu klopodo ne estu atribuita nur, se entute (?), al la magazeno.

Ne kalkuli ĉion estas multekosta. Kaj estas multaj aferoj por konsideri. Konsideru la sekvan liston:

  • ▪ Kosto de ekfunkciigo, inkluzive de farebleco.
  • ▪ Kosto de dediĉita aparataro kun rilata stokado kaj komunikado
  • ▪ Kosto de la programaro, inkluzive de administrado de dati kaj kliento/servilaj etendaĵoj, ETL-softvaro, DSS-teknologioj, bildigaj iloj, planado kaj laborfluaplikoj, kaj monitoradsoftvaro, .
  • ▪ Kosto de dezajno de strukturo dati, kun la kreado, kaj optimumigo de
  • ▪ Kosto de disvolviĝo de programaro rekte asociita kun la penado de BI
  • ▪ Kosto de hejma subteno, inkluzive de agado-optimumigo, inkluzive de programara versio-kontrolo kaj helpoperacioj Apliki "Big-Bang" ROI. Konstrui la magazenon kiel ununura, giganta penado estas kondamnita al malsukceso, do ankaŭ kalkulu ROI por granda entreprena iniciato La propono estas surpriza, kaj ke planistoj daŭre faras malfortajn provojn taksi la valoron de la tuta penado. Kial planistoj provas meti monan valoron al komerca iniciato se estas vaste konata kaj akceptita, ke taksi specifajn ripetojn estas malfacila? Kiel eblas? Ĝi ne eblas kun malmultaj esceptoj. Ne faru ĝin. Nun kiam ni establis kion ne fari dum kalkulado de ROI, jen kelkaj punktoj, kiuj helpos vin establi fidindan procezon por taksi la valoron de viaj BI-klopodoj.

Akiro de ROI-konsento. Sendepende de via elekto de tekniko por taksi la valoron de viaj BI-klopodoj, ĝi devas esti interkonsentita de ĉiuj partioj, inkluzive de projektplanistoj, sponsoroj kaj kompaniaj ekzekutivoj.

Rompu ROI en identigeblajn partojn. Necesa paŝo al akceptebla ROI-kalkulo estas enfokusigi tiun kalkulon sur specifa projekto. Ĉi tio tiam permesas al vi taksi valoron bazitan sur specifaj komercaj postuloj kiuj estas plenumitaj

Difinu la kostojn. Kiel menciite, multaj kostoj devas esti pripensitaj. Aldone, kostoj devas inkluzivi ne nur tiujn asociitajn kun la individua ripeto sed ankaŭ kostojn asociitajn kun certigado de konformeco al entreprenaj normoj.

Difinu avantaĝojn. Klare ligante ROI al specifaj komercaj postuloj, ni devus povi identigi la avantaĝojn, kiuj kondukos al plenumi la postulojn.

Redukti kostojn kaj profitojn en baldaŭaj gajnoj. Estas la plej bona maniero bazi viajn taksojn sur neta nuna valoro (NPV) kontraste al provi antaŭdiri estontan valoron en estontaj enspezoj.

Tenu la tempon por dividi vian ROI al minimumo. Ĝi estas bone dokumentita longtempe, ĝi estis uzata en via ROI.

Uzu pli ol unu ROI-formulon. Estas multaj metodoj por antaŭdiri ROI, kaj vi devus plani uzi unu aŭ pli el ili, inkluzive de neta nuna valoro, interna rendimento (IRR) kaj repago.

Difinu ripeteblan procezon. Ĉi tio estas decida por kalkuli ajnan longtempan valoron. Ununura ripetebla procezo devus esti dokumentita por ĉiuj postaj projektaj subsekvencoj.

La problemoj listigitaj estas la plej oftaj difinitaj de fakuloj pri medioj de homdomoj. La insisto de administrado pri liverado de "Big-Bang" ROI estas tre konfuza. Se vi komencas ĉiujn viajn ROI-kalkulojn disigante ilin en identigeblajn, palpeblajn partojn, vi havas bonan ŝancon taksi precizan ROI-takson.

Demandoj pri ROI-profitoj

Kiaj ajn estas viaj avantaĝoj, mildaj aŭ malmolaj, vi povas uzi kelkajn bazajn demandojn por determini ilian valoron. Ekzemple uzante simplan skalsistemon, de 1 ĝis 10, vi povas mezuri la efikon de iu ajn peno uzante la jenajn demandojn:

  • Kiel vi taksus komprenon pri dati sekvante ĉi tiun projekton de via kompanio?
  • Kiel vi taksus la procezajn plibonigojn rezulte de ĉi tiu projekto?
  • Kiel vi mezurus la efikon de novaj komprenoj kaj konkludoj nun disponeblaj per ĉi tiu ripeto
  • Kio estis la efiko de novaj kaj pli bonaj komputilaj medioj kiel rezulto de tio, kio estis lernita? Se la respondoj al ĉi tiuj demandoj estas malmultaj, eblas, ke la entrepreno ne valoras la investon faritan. Altpoentadaj demandoj montras signifajn valorgajnojn kaj devus servi kiel gvidiloj por plia esploro. Ekzemple, alta poentaro por procezplibonigoj devus igi dizajnistojn ekzameni kiel procezoj estis plibonigitaj. Vi eble trovos, ke iuj aŭ ĉiuj el la gajnoj faritaj estas palpeblaj kaj tial mona valoro povas esti facile aplikita. Eltiri la plej grandan parton de la unua ripeto de la magazeno La plej granda rekompenco de via entreprena penado ofte estas en la unuaj malmultaj ripetoj. Tiuj fruaj klopodoj tradicie establas la plej utilan informenhavon por publiko kaj helpas establi la teknologian fundamenton por postaj BI-aplikoj. Kutime ĉiu posta sinsekvo de dati de magazenaj projektoj alportas malpli kaj malpli aldonan valoron al la entrepreno entute. Ĉi tio estas precipe vera se la ripeto ne aldonas novajn temojn aŭ ne renkontas la bezonojn de nova uzantkomunumo.

Ĉi tiu stoka funkcio ankaŭ validas por kreskantaj stakoj de dati historiistoj. Ĉar postaj klopodoj postulas pli dati kaj kiom pli dati estas verŝitaj en la magazenon laŭlonge de la tempo, plejparto de la dati ĝi fariĝas malpli grava por la analizo uzata. Ĉi tiuj dati ili estas ofte nomataj dati neaktivaj kaj estas ĉiam multekoste konservi ilin ĉar ili estas preskaŭ neniam uzataj.

Kion ĉi tio signifas por projektsponsoroj? Esence, la unuaj sponsoroj dividas pli ol la investkostoj. Ĉi tio estas primara ĉar ili estas la impulso por fondi la larĝan teknologian kaj rimedan mediotavolon de la magazeno, inkluzive de organika.

Sed ĉi tiuj unuaj paŝoj portas la plej grandan valoron kaj tial projektplanistoj ofte devas pravigi la investon.
Projektoj faritaj post via BI-iniciato eble havas pli malaltajn (kompare kun la unua) kaj rektajn kostojn, sed alportas malpli da valoro al la entrepreno.

Kaj posedantoj de organizaĵoj devas komenci pripensi ĵeti la amasiĝon dati kaj malpli rilataj teknologioj.

Minado de Datumoj: Eltiro dati

Multaj arkitekturaj komponentoj postulas variojn de datumminadaj teknologioj kaj teknikoj—
ekzemple, la malsamaj "agentoj" por ekzamenado de la interespunktoj de la klientoj, la operaciumoj de la firmao kaj por la sama dw. Ĉi tiuj agentoj povas esti progresintaj neŭralaj retoj trejnitaj pri pottendencoj, kiel estonta produkta postulo bazita sur vendopromocioj; regul-bazitaj motoroj por reagi al aro datumoj de cirkonstancoj, ekzemple, medicina diagnozo kaj kuracaj rekomendoj; aŭ eĉ simplaj agentoj kun la rolo raporti esceptojn al ĉefaj ekzekutivoj. Ĝenerale ĉi tiuj eltiraj procezoj dati si

kontroli en reala tempo; tial, ili devas esti tute kunigitaj kun la movado de la dati sin mem.

Enreta Analiza Pretigo

Interreta analizo

La kapablo tranĉi, tranĉi, ruliĝi, bori kaj fari analizon
kio-se, estas ene de la amplekso, la amplekso de la IBM-teknologia serio. Ekzemple, reta analiza pretigo (OLAP) funkcioj ekzistas por DB2 kiu alportas dimensian analizon en la motoron de la DataBase sama .

Funkcioj aldonas dimensian utilecon al SQL rikoltante ĉiujn avantaĝojn de esti natura parto de DB2. Alia ekzemplo de OLAP-integriĝo estas la eltira ilo, DB2 OLAP Analyzer Server. Ĉi tiu teknologio permesas al DB2 OLAP Server-kuboj esti rapide kaj aŭtomate skanitaj por lokalizi kaj raporti pri la valoroj de dati nekutima aŭ neatendita por iu ajn kubo al la komerca analizisto. Kaj finfine, la funkcioj de DW Center provizas rimedon por arkitektoj por kontroli, interalie, la profilon de DB2 OLAP-kubservilo kiel natura parto de ETL-procezoj.

Spatial Analysis Spatial Analysis

Spaco reprezentas duonon de la analizaj ankroj (kondukadoj) necesaj por panoramo
larĝa analiza (tempo reprezentas la alian duonon). La atomnivelo de la magazeno, reprezentita en Figuro 1.1, inkluzivas la fundamentojn por kaj tempo kaj spaco. Tempomarkoj ankras analizojn laŭ tempo kaj adresinformojn ankras analizojn laŭ spaco. Tempmarkoj faras la analizon laŭ tempo, kaj adresinformoj faras la analizon laŭ spaco. La diagramo montras geokodigon - la procezon de konvertado de adresoj al punktoj en mapo aŭ punktoj en spaco tiel ke konceptoj kiel ekzemple distanco kaj ene/ekstere povas esti uzitaj en la analizo - farita sur la atomnivelo kaj la spaca analizo estanta disponigita al la analizisto. IBM disponigas spacajn etendaĵojn, evoluigitajn kun la Environmental System Research Institute (ESRI), al DataBase DB2 tiel ke spacaj objektoj povas esti konservitaj kiel normala parto de la DataBase rilataj. db2

Spatial Extenders, ankaŭ provizas ĉiujn SQL-etendaĵojn por utiligi spacan analizon. Ekzemple, la SQL-etendaĵoj por pridemandi
distanco inter adresoj aŭ ĉu punkto estas ene aŭ ekster difinita plurlatera areo, estas analiza normo kun la Spaca Etendilo. Vidu ĉapitron 16 por pliaj informoj.

Datumbazo-Loĝantaj Iloj Iloj Datumbazo-Loĝanto

DB2 havas multajn SQL BI-loĝantajn funkciojn kiuj helpas en la analiza ago. Ĉi tiuj inkluzivas:

  • Rekursaj funkcioj por fari analizon, kiel "trovi ĉiujn eblajn flugvojojn de San-Francisko a Novjorko".
  • Analizaj funkcioj por ranking, akumulaj, kubaj kaj kunigfunkcioj por faciligi taskojn kiuj normale okazas nur kun OLAP-teknologio, nun estas natura parto de la motoro de la DataBase
  • La kapablo krei tabelojn kiuj enhavas rezultojn
    La vendistoj de DataBase gvidantoj miksas pli el la BI-ecoj en la DataBase same.
    La ĉefaj provizantoj de Datumbazo ili miksas pli da BI-ecoj en la DataBase same.
    Ĉi tio provizas pli bonan rendimenton kaj pli da ekzekuteblecoj por BI-solvoj.
    La funkcioj kaj funkcioj de DB2 V8 estas diskutitaj detale en la sekvaj ĉapitroj:
    Fundamentoj pri Teknika Arkitekturo kaj Administrado de Datumoj (Ĉapitro 5)
  • DB2 BI Fundamentoj (Ĉapitro 6)
  • DB2-Materiigitaj Demandaj Tabeloj (Ĉapitro 7)
  • DB2 OLAP-Funkcioj (Ĉapitro 13)
  • DB2 Plibonigitaj BI-Ecoj kaj Funkcioj (Ĉapitro 15) Simpligita Datuma Liversistemo Liversistemo de dati simpligita

La arkitekturo prezentita en Figuro 1.1 inkluzivas multajn strukturojn dati fizika. Unu estas la magazeno de dati funkcianta. Ĝenerale, ODS estas objektoorientita, integra kaj aktuala. Vi konstruus ODS por subteni, ekzemple, la venda oficejo. ODS-vendo kompletigus dati de multaj malsamaj sistemoj sed nur konservus, ekzemple, la hodiaŭajn transakciojn. La ODS ankaŭ povas esti ĝisdatigita multfoje tage. Samtempe, la procezoj puŝas i dati integrita en aliaj aplikoj. Ĉi tiu strukturo estas specife desegnita por integriĝi dati aktuala kaj dinamika kaj estus verŝajna kandidato por subteni realtempajn analizojn, kiel provizanta servo-agentojn klientoj la aktualajn vendajn informojn de kliento ĉerpante vendotendenformojn de la stokregistro mem. Alia strukturo montrita en figuro 1.1 estas formala stato por la dw. Ne nur ĉi tio estas la loko por la ekzekuto de la necesa integriĝo, de la kvalito de dati, kaj de la transformo de dati de envenanta magazeno, sed ankaŭ estas fidinda kaj provizora stokejo por dati kopioj kiuj povus esti uzitaj en realtempa analizo. Se vi decidas uzi ODS aŭ surscenejon, unu el la plej bonaj iloj por popoli ĉi tiujn strukturojn dati uzi malsamajn funkciajn fontojn estas la heterogena distribuita demando de DB2. Ĉi tiu kapablo estas liverita per la laŭvola DB2-trajto nomita DB2 Relational Connect (nurdemandoj) kaj per DB2 DataJoiner (aparta produkto kiu liveras pridemandon, enmeton, ĝisdatigon kaj forigon al heterogenaj distribuitaj RDBMSoj).

Ĉi tiu teknologio permesas al arkitektoj dati ligi dati de produktado kun analizaj procezoj. Ne nur la teknologio povas adaptiĝi al praktike iuj el la reproduktaj postuloj, kiuj povus aperi kun realtempa analizo, sed ĝi ankaŭ povas konektiĝi al ampleksa vario de dati plej popularaj, inkluzive de DB2, Oracle, Sybase, SQL Server, Informix kaj aliaj. DB2 DataJoiner povas esti uzata por plenigi strukturon dati formala kiel ODS aŭ eĉ konstanta tablo reprezentita en la magazeno desegnita por rapida reakiro de tujaj ĝisdatigoj aŭ por vendo. Kompreneble, ĉi tiuj strukturoj mem dati povas esti popolita uzante

alia grava teknologio dizajnita por reproduktado de dati, IBM DataPropagator Relational. (DataPropagator estas aparta produkto por centraj sistemoj. DB2 UNIX, Linukso, Vindozo kaj OS/2 inkluzivas reproduktajn servojn de dati kiel norma trajto).
Alia metodo por moviĝi dati operacianta ĉirkaŭ la entrepreno estas entreprena aplika integristo alie konata kiel mesaĝmakleristo. Ĉi tiu unika teknologio permesas nekompareblan kontrolon por celado kaj movo. dati ĉirkaŭ la kompanio. IBM havas la plej vaste uzatan mesaĝmakleriston, MQSeries, aŭ varion de la produkto kiu inkluzivas la postulojn por elektronika komerco, IBM WebSphere MQ.
Por pli da diskuto pri kiel utiligi MQ por subteni magazenon kaj BI-medion, vizitu retejo de la libro. Nuntempe, sufiĉas diri, ke ĉi tiu teknologio estas bonega rimedo por kapti kaj transformi (uzante MQSeries Integrator) dati celitaj agentoj rekrutitaj por BI-solvoj. MQ-teknologio estis integrita kaj pakita en UDB V8, kio signifas, ke mesaĝvostoj nun povas esti administritaj kvazaŭ ili estus DB2-tabloj. La koncepto de veldado de vostomesaĝoj kaj la universo de DataBase rilataj direktas al potenca medio de livero de dati.

Zero-Latency Nula latenco

La finfina strategia celo por IBM estas nula latenteca analizo. Kiel difinite de
Gartner, BI-sistemo devas povi konkludi, konsumi kaj provizi informojn por analizistoj laŭ postulo. La defio, kompreneble, estas kiel miksi dati aktuala kaj realtempa kun necesaj historiaj informoj, kiel i dati rilata tendenco/ŝablono, aŭ ĉerpita kompreno, kiel klientprofilado.

Tiaj informoj inkluzivas, ekzemple, la identigon de klientoj alta aŭ malalta risko aŭ kiuj produktoj i klientoj ili plej verŝajne aĉetos, se ili jam havas fromaĝon en siaj aĉetĉaroj.

Akiri nul latentecon fakte dependas de du fundamentaj mekanismoj:

  • Plena kuniĝo de dati kiuj estas analizitaj per la establitaj teknikoj kaj per la iloj kreitaj de la BI
  • Liversistemo de dati efika por certigi, ke realtempaj analizoj estas vere haveblaj. Ĉi tiuj antaŭkondiĉoj por nula latencia ne diferencas de la du celoj establitaj de IBM kaj priskribitaj supre. La malloza kunigo de la dati ĝi estas parto de la senjunta integriga programo de IBM. Kaj krei liversistemon de dati efika estas tute dependa de la disponebla teknologio kiu simpligas la liverprocezon dati. Sekve, du el la tri celoj de IBM estas kritikaj por atingi la trian. IBM konscie disvolvas sian teknologion por certigi, ke nula latenteco estas realaĵo por stokaj klopodoj. Resumo / Sintezo Via BI-organizo disponigas vojmapon por konstrui vian medion
    ripete. Ĝi devas esti ĝustigita por reflekti la bezonojn de via komerco, kaj nunaj kaj estontaj. Sen larĝa arkitektura vizio, magazenaj ripetoj estas malmulte pli ol hazardaj efektivigoj de la centra stokejo, kiuj faras malmulton por krei grandan, informan entreprenon. La unua obstaklo por projektestroj estas kiel pravigi la investon necesan por kreskigi la BI-organizon. Dum ROI-kalkuloj restis ĉefa bazo de inventaraj atingoj, fariĝas pli malfacile antaŭdiri precize. Ĉi tio kondukis al aliaj metodoj por determini ĉu vi ricevas la valoron de via mono. Valoro sur Investo2 (VOI), ekzemple, estas akirita kiel solvo. Ĝi estas deva al la arkitektoj de dati kaj pri projektoplanistoj intence generas kaj provizas informojn al uzant-asocioj kaj ne simple donas servon dati. Estas grandega diferenco inter la du. Informoj estas io, kio faras diferencon en decidiĝo kaj efikeco; relative, i dati ili estas konstrubriketoj por derivi tiujn informojn.

Eĉ se kritike de la fonto dati por trakti komercajn postulojn, la BI-medio devus servi pli grandan rolon en kreado de informenhavo. Ni devas fari la kromajn paŝojn por purigi, integri, transformi aŭ alie krei informan enhavon, pri kiu uzantoj povas agi, kaj tiam ni devas certigi, ke tiuj agoj kaj decidoj, kie raciaj, estas reflektitaj en la BI-medio. Se ni relegas la magazenon por servi nur sur dati, estu certa, ke uzant-asocioj kreos la informenhavon necesan por agi. Ĉi tio certigas, ke ilia komunumo povos fari pli bonajn decidojn, sed la entrepreno suferas pro manko de scio, kiun ili uzis. dato ke arkitektoj kaj projektplanistoj iniciatas specifajn projektojn en la BI-medio, ili restas respondecaj al la entrepreno kiel tutaĵo. Simpla ekzemplo de ĉi tiu duflanka trajto de BI-ripetoj troviĝas en la fonto dati. Ĉiuj la dati ricevita por specifaj komercaj petoj devas esti popolita en la unua atoma tavolo. Ĉi tio certigas la disvolviĝon de la entreprena informa aktivo, kaj ankaŭ administri, trakti la specifajn uzantpetojn difinitajn en la ripeto.

Kio estas Datuma Stokejo?

Datuma magazeno estis la koro de informsistemo-arkitekturo ekde 1990 kaj subtenas informajn procezojn proponante solidan integran platformon de dati historio prenita kiel bazo por postaj analizoj. LA datuma magazeno ili ofertas facilecon de integriĝo en mondon de nekongruaj aplikaĵsistemoj. Datuma magazeno ĝi evoluis por fariĝi manito. Datuma magazeno organizi kaj enmemorigi i dati necesaj por informaj kaj analizaj procezoj surbaze de longa historia tempa perspektivo. Ĉio ĉi implicas konsiderindan kaj konstantan penadon en la konstruado kaj prizorgado de la datuma magazeno.

Do kio estas a datuma magazeno? A datuma magazeno kaj:

  • ▪ subjekto orientita
  • ▪ integra sistemo
  • ▪ tempa variado
  • ▪ nevolatile (ne nuligas)

kolekto de dati uzata por subteni manaĝerajn decidojn en la efektivigo de procezoj.
I dati enigita en datuma magazeno ili venas en la plej multaj kazoj de operaciaj medioj. La datuma magazeno ĝi estas farita el stoka unuo, fizike aparta de la resto de la sistemo, kiun ĝi enhavas dati antaŭe transformite per aplikaĵoj kiuj funkcias sur informoj devenantaj de la operaciumo.

La laŭvorta difino de a datuma magazeno ĝi meritas ĝisfundan klarigon, ĉar estas gravaj motivoj kaj subaj signifoj, kiuj priskribas la karakterizaĵojn de magazeno.

TEMA ORIENTADO ORIENTADO TEMATIKO

La unua trajto de a datuma magazeno estas ke ĝi estas orientita al la ĉefaj temoj de firmao. La gvidilo de la procezoj tra la dati ĝi estas kontraste kun la pli klasika metodo kiu zorgas pri la orientiĝo de aplikoj direkte al procezoj kaj funkcioj, metodo plejparte dividita per la plej multaj el la malpli lastatempaj administradsistemoj.

La operacia mondo estas desegnita ĉirkaŭ aplikoj kaj funkcioj kiel pruntoj, ŝparaĵoj, bankkartoj kaj fido por financa institucio. La mondo de dw estas organizita ĉirkaŭ ĉefaj temoj kiel la kliento, la vendisto, la produkto kaj la agado. Paraleligo ĉirkaŭ temoj influas la dezajnon kaj efektivigon de dati trovita en la dw. Plej grave, la ĉefa temo influas la plej gravan parton de la ŝlosila strukturo.

La mondo de aplikoj estas influita de kaj datumbaza dezajno kaj proceza dezajno. La mondo de dw estas koncentrita nur al videomodelado dati kaj pri la dezajno de la DataBase. Proceza dezajno (en ĝia klasika formo) ne estas parto de la dw-medio.

La diferencoj inter la elekto de procezo/funkcia apliko kaj la elekto de temo ankaŭ estas malkaŝitaj kiel diferencoj en la enhavo de la dati sur detala nivelo. LA dati del dw ne inkluzivas i dati kiu ne estos uzata por prilabori DSS dum aplikoj

operacia orientita dati enhavi i dati tuj kontentigi funkciajn/pretigajn postulojn kiuj povas aŭ eble ne havas ajnan uzon por la DSS-analizisto.
Alia grava maniero ke operaciaj orientitaj aplikoj por dati diferenci de dati de dw estas en la raportoj de dati. mi dati agentoj konservas daŭrantan rilaton inter du aŭ pli da tabloj bazitaj sur komerca regulo kiu estas aktiva. LA dati de dw ampleksas spektron de tempo kaj la raportoj trovitaj en la dw estas multaj. Multaj komercaj reguloj (kaj konforme, multaj raportoj pri dati ) estas reprezentitaj en la stoko de dati inter du aŭ pli da tabloj.

(Por detala klarigo pri kiel la rilatoj inter la dati estas administritaj en la DW, bonvolu raporti al la Teknika Temo pri tiu afero.)
De neniu alia perspektivo ol tiu de la fundamenta diferenco inter funkcia/proceza aplikelekto kaj temo elekto, ĉu ekzistas grava diferenco inter operaciumoj kaj dati kaj la DW.

INTEGRADO INTEGRADO

La plej grava aspekto de la dw-medio estas ke i dati trovitaj ene de la dw estas integritaj facile. ĈIAM. SEN ESceptoj. La esenco mem de la dw-medio estas ke i dati enhavitaj ene de la limoj de la magazeno estas integritaj.

Integriĝo rivelas sin laŭ multaj malsamaj manieroj - en konsekvencaj identigitaj konvencioj, en konsekvenca mezurado de variabloj, en konsekvencaj kodigitaj strukturoj, en fizikaj atributoj de dati konsekvenca, ktp.

Tra la jaroj la dizajnistoj de malsamaj aplikoj faris multajn decidojn pri kiel aplikiĝo devus esti evoluigita. La stilo kaj individuigitaj dezajnodecidoj de la aplikoj de la dizajnistoj estas malkaŝitaj en cent manieroj: en diferencoj en kodigo, ŝlosila strukturo, fizikaj trajtoj, identigaj konvencioj, ktp. La kolektiva kapablo de multaj aplikaĵdizajnistoj krei malkonsekvencan aplikojn estas legenda. Figuro 3 elmontras kelkajn el la plej gravaj diferencoj en kiel aplikoj estas dizajnitaj.

Kodigado: Kodigo:

Aplikaĵdezajnistoj elektis kampokodigon - sekson - en pluraj manieroj. Dizajnisto reprezentas sekson kiel "m" kaj "f". Alia dizajnisto reprezentas sekson kiel "1" kaj "0". Alia dizajnisto reprezentas sekson kiel "x" kaj "y." Alia dizajnisto reprezentas sekson kiel "maskla" kaj "ino." Vere ne gravas kiel la sekso eniras la DW. La "M" kaj "F" verŝajne estas same bonaj kiel iu ajn reprezento.

Gravas, ke de kia ajn fonto venas la seksa kampo, tiu kampo alvenas en la DW en konsekvenca integra stato. Sekve kiam la kampo estas ŝarĝita en la DW de aplikaĵo kie ĝi estis reprezentita ekstere en la formato "M" kaj "F", la dati devas esti konvertita al DW-formato.

Mezurado de Atributoj: Mezurado de Atributoj:

Aplikaj dizajnistoj elektis mezuri dukton en diversaj manieroj tra la jaroj. Dezajnisto stokas i dati de la dukto en centimetroj. Alia aplikaĵdezajnisto stokas la dati de la dukto laŭ coloj. Alia aplikaĵdezajnisto stokas la dati de la dukto en milionoj da kubaj piedoj je sekundo. Kaj alia dizajnisto konservas informojn pri dukto laŭ jardoj. Kia ajn la fonto, kiam dukto informoj alvenas en la DW ĝi devas esti mezurita en la sama maniero.

Kiel montrite en figuro 3, integriĝaj aferoj influas preskaŭ ĉiun aspekton de la projekto - la fizikajn trajtojn de la dati, la dilemo havi pli ol unu fonton de dati, la afero de malkonsekvencaj identigitaj specimenoj, formatoj de dati malkonsekvenca, ktp.

Kia ajn la dezajno argumento, la rezulto estas la sama - i dati devas esti konservita en la DW en unika kaj tutmonde akceptebla maniero eĉ kiam subestaj operaciumoj stokas i dati.

Kiam la DSS-analizisto rigardas la DW, la fokuso de la analizisto devus esti la ekspluatado de dati kiuj estas en la magazeno,

prefere ol scivoli pri la kredindeco aŭ konsistenco de la dati.

TEMPO VARIANCO

Ĉio mi dati en la DW ili estas precizaj al iu momento en la tempo. Ĉi tiu baza trajto de la dati en DW estas tre malsama de dati trovita en la operaciumo. LA dati de la operaciumo estas tiel precizaj kiel en la momento de aliro. Alivorte, en la operaciumo kiam unuo estas alirita dati, ĝi atendas reflekti valorojn tiel precizajn kiel en la momento de aliro. Kial mi dati en la DW estas precizaj kiel en iu momento en la tempo (t.e., ne "nuntempe"), mi dati trovitaj en la DW estas "tempa varianco".
La tempovarianco de dati de DW estas referencata en multaj manieroj.
La plej simpla maniero estas ke i dati de DW reprezentas dati super longa tempohorizonto - kvin ĝis dek jaroj. La tempa horizonto prezentita por la operaciumo estas multe pli mallonga ol la nunaj valoroj ĝis sesdek naŭdek.
Aplikoj, kiuj devas funkcii bone kaj devas esti disponeblaj por transakcia prilaborado, devas porti la minimuman kvanton dati se ili permesas ajnan gradon de fleksebleco. Do funkciaj aplikoj havas mallongan tempohorizonton, kiel ekzemple aŭda aplika temo.
La dua maniero kiel "tempa varianco" aperas en la DW estas en la ŝlosila strukturo. Ĉiu ŝlosila strukturo en la DW enhavas, implicite aŭ eksplicite, tempoelementon, kiel tago, semajno, monato, ktp. La tempo-elemento estas preskaŭ ĉiam ĉe la fundo de la kunligita ŝlosilo trovita en la DW. En ĉi tiuj okazoj, la tempo-elemento ekzistos implicite, kiel ekzemple la kazo kie tuta dosiero estas duobligita fine de la monato aŭ kvarono.
La tria maniero tempa varianco estas montrita estas ke i dati de la DW, nur ĝuste registrita, ne povas esti ĝisdatigita. LA dati de la DW estas, por ĉiuj praktikaj celoj, longa serio de momentfotoj. Kompreneble se la momentfoto estis malĝuste prenita, tiam la momentfotoj povas esti modifitaj. Sed supozante ke la momentfotoj estas prenitaj ĝuste, ili ne estas ŝanĝitaj tuj kiam ili estas prenitaj. En iuj

kazoj povas esti maletika aŭ eĉ nevalida ke la momentfotoj en la DW estas modifitaj. LA dati funkcianta, estante tiel preciza kiel en la momento de la aliro, povas esti ĝisdatigita laŭ la bezono.

NE VOLATILA

La kvara grava karakterizaĵo de DW estas ke ĝi estas ne-volatile.
Ĝisdatigoj, enmetoj, forigoj kaj ŝanĝoj estas faritaj regule al la operaciaj medioj laŭ rekorda bazo. Sed la baza manipulado de la dati bezonata en la DW estas multe pli facila. Estas nur du specoj de operacioj kiuj okazas en la DW - la komenca ŝarĝo de la dati kaj aliro al dati. Ne estas ĝisdatigo de la dati (en la ĝenerala senco de ĝisdatigo) en la DW kiel normala pretigoperacio. Estas kelkaj tre potencaj konsekvencoj de ĉi tiu baza diferenco inter funkcia pretigo kaj DW-pretigo. Je la dezajnonivelo, la bezono esti singarda pri nenormala ĝisdatigo ne estas faktoro en la DW, ĉar la ĝisdatigo de dati ĝi ne estas efektivigita. Ĉi tio signifas, ke ĉe la fizika nivelo de dezajno, liberecoj povas esti prenitaj por optimumigi aliron al dati, precipe en traktado de la temoj de normaligo kaj fizika malnormaligo. Alia sekvo de la simpleco de operacio de DW estas en la subesta teknologio uzita por prizorgi la DW-medion. Devi subteni interretajn rekordajn ĝisdatigojn (kiel ofte okazas kun funkcia pretigo) postulas, ke la teknologio havu tre kompleksan fundamenton sub ŝajna simpleco.
La teknologio, kiu subtenas sekurkopion kaj reakiron, transakciojn kaj datuman integrecon dati kaj detekto kaj rimedo de blokiĝo estas sufiĉe kompleksaj kaj nenecesaj por DW-prilaborado. La karakterizaĵoj de DW, dezajno orientiĝo, integriĝo de dati ene de la DW, tempovarianco kaj facileco de administrado de dati, ĉio kondukas al medio kiu estas tre, tre malsama de la klasika operaciumo. La fonto de preskaŭ ĉiuj dati de DW estas la operaciumo. Tente pensi, ke estas amasa redundo de dati inter la du medioj.
Ja la unua impreso, kiun havas multaj homoj, estas tiu de granda redundo dati inter la mastruma medio kaj la medio de

DW etendo. Tia interpreto estas supraĵa kaj pruvas mankon de kompreno de kio okazas en la DW.
Ja estas minimuma redundo dati inter la operacianta medio kaj i dati de la DW. Konsideru la jenon:I dati ili estas filtritaj datumoj ke vi ŝanĝu de la operaciumo al la DW-medio. Multaj dati ili neniam iras ekster la operaciumo. Nur tio i dati kiuj estas postulataj por DSS-pretigo trovas sian direkton en la medio

▪ la tempohorizonto de dati ĝi estas tre malsama de unu medio al alia. LA dati en la operacia medio ili estas tre freŝaj. LA dati en la DW ili estas multe pli aĝaj. Nur de tempohorizonta perspektivo, estas tre malmulte da interkovro inter la operaciumo kaj la DW.

▪ La DW enhavas dati resumo kiuj neniam estas en la medio

▪ mi dati suferas fundamentan transformon dum ili transiras al Figuro 3 ilustras ke la plej granda parto de la dati estas signife modifitaj kondiĉe ke ili estas elektitaj kaj movitaj al la DW. Dirite alimaniere, plejparto de la dati ĝi estas fizike kaj radikale ŝanĝita kiam ĝi estas movita en la DW. El la vidpunkto de integriĝo ili ne estas la samaj dati loĝante en la operaciumo. Donita ĉi tiujn faktoroj, la redundo de dati inter la du medioj estas malofta okazaĵo, kondukante al malpli ol 1% redundo inter la du medioj. LA STRUKTURO DE LA STOKEJO DWoj havas klaran strukturon. Ekzistas diversaj niveloj de resumo kaj detalo kiuj limas la DWojn.
La diversaj komponentoj de DW estas:

  • metadatumoj
  • dati aktualaj detaloj
  • dati de malnova detalo
  • dati iomete resumita
  • dati tre resumita

Komprene la ĉefa zorgo estas pri i dati aktualaj detaloj. Ĝi estas la ĉefa zorgo ĉar:

  • I dati Nunaj detaloj reflektas la plej lastatempajn eventojn, kiuj ĉiam estas tre interesaj kaj
  • i dati nunaj detaldatenoj estas volumenaj ĉar ĝi estas stokita ĉe la plej malalta nivelo de granulareco kaj
  • i dati de aktualaj detaloj preskaŭ ĉiam estas stokitaj en diskmemoro, kiu estas rapide alirebla, sed multekosta kaj kompleksa de I dati de detaloj estas pli malnovaj dati kiuj estas konservitaj sur iu memoro pri maso. Ĝi estas alirita sporade kaj stokita je nivelo de detalo kongrua kun dati aktualaj detaloj. Dum ne estas devige stoki sur alternativa stokado medio, pro la granda volumo de dati kunigita kun la sporada aliro de la dati, la konserva medio por dati de pli malnovaj detaloj ne estas kutime konservitaj sur disko. LA dati malpeze resumitaj ili estas dati kiuj estas distilataj de la trovita malalta nivelo de detalo ĝis la nuna detalonivelo. Ĉi tiu nivelo de DW preskaŭ ĉiam estas konservita en diskmemoro. La problemoj de dezajno, kiuj prezentas sin al la arkitekto de la dati en la konstruado de ĉi tiu nivelo de la DW estas:
  • Kia tempounuo estas la resumo farita supre
  • Kia enhavo, atributoj iomete resumos la enhavon de la dati La sekva nivelo de dati trovita en la DW estas tiu de dati tre resumita. LA dati tre resumitaj estas kompaktaj kaj facile alireblaj. LA dati tre resumitaj troviĝas foje en la DW-medio kaj aliaj kazoj i dati tre abstraktitaj estas trovitaj ekster la tujaj muroj de la teknologio gastiganta la DW. (ĉiaokaze, i dati tre resumitaj estas parto de la DW sendepende de kie i dati estas fizike loĝigitaj). La fina komponento de la DW estas la metadatenkomponento. En multaj rilatoj metadatenoj sidas en malsama dimensio ol aliaj dati de la DW, ĉar la metadatenoj enhavas neniun datumoj rekte prenite de la operaciumo. Metadatenoj havas specialan kaj gravegan rolon en DW. Metadatenoj estas uzataj kiel:
  • dosierujo por helpi la DSS-analiziston lokalizi la enhavon de la DW,
  • gvidilo al mapado dati de kiel mi dati estis transformitaj de la operaciumo al la DW-medio,
  • gvidilo al la algoritmoj uzataj por resumo inter i dati aktualaj detaloj ei dati iomete resumita, i dati tre resumite, Metadatumoj ludas multe pli grandan rolon en la DW-medio ol ĝi iam faris en la funkcia medio. MALNOVA DETALO STOKADA MEZONO Magneta bendo povas esti uzata por konservi tian dati. Efektive ekzistas ampleksa vario de konservado de rimedoj, kiujn oni devas konsideri por konservi malnovajn dati de detalo. Depende de la volumeno de dati, ofteco de aliro, kosto de iloj kaj tipo de aliro, estas tute verŝajne, ke aliaj iloj bezonos la malnovan nivelon de detalo en la DW. FLUXO DE DATUMO Estas normala kaj antaŭvidebla fluo de la dati ene de la DW.
    I dati ili eniras la DW de la operaciumo. (NOTU: Estas kelkaj tre interesaj esceptoj al ĉi tiu regulo. Tamen, preskaŭ ĉiuj dati enigu la DW el la operaciumo). dato ke mi dati ili eniras la DW de la operaciumo, ĝi estas transformita kiel priskribite supre. Kondiĉe ke vi enigas la DW, i dati enigu la nunan nivelon de detalo, kiel montrite. Ĝi loĝas tie kaj estas uzita ĝis unu el tri okazaĵoj okazas:
  • estas purigita,
  • estas resumita, kaj/aŭ ▪estas La malnoviĝinta procezo ene de DW movas i dati aktualaj detaloj a dati de detalo malnova, laŭ la aĝo de dati. La procezo

resumo uzas la detalon de dati por kalkuli la dati iomete resumitaj kaj tre resumitaj niveloj de la dati. Estas kelkaj esceptoj al la montrita fluo (diskutota poste). Tamen, kutime, por la granda plimulto de dati trovita ene de DW, la fluo de dati ĝi estas kiel reprezentita.

UZANTE LA DATUMOJN

Ne surprize la diversaj niveloj de dati ene de la DW ili ne ricevas malsamajn nivelojn de uzo. Kiel regulo, ju pli alta la nivelo de resumo, des pli i dati ili estas uzataj.
Multaj uzoj okazas en la dati tre resumita, dum la malnova dati de detalo preskaŭ neniam estas uzataj. Estas bona kialo por ŝanĝi la organizon al la paradigmo de uzado de rimedoj. Pli resumite i dati, des pli rapide kaj efika ĝi estas alveni dati. Se a butiko trovas ke ĝi faras multe da detalnivela pretigo de la DW, tiam kongrue granda kvanto de maŝinresursoj estas konsumita. Estas ĉies plej bone prilabori tian altnivelan resumon kiel eble plej baldaŭ.

Por multaj vendejoj, la DSS-analizisto en antaŭ-DW medio uzis dati je la nivelo de detalo. Multrilate la alveno ĉe dati detala aspektas kiel sekureca kovrilo, eĉ kiam aliaj niveloj de resumo estas disponeblaj. Unu el la agadoj de la arkitekto de dati estas dekutigi la DSS-uzanto de konstanta uzo de dati je la plej malalta nivelo de detalo. Estas du motivoj disponeblaj al la arkitekto dati:

  • instali ŝarĝon sistemon, kie la finuzanto pagas por la resursoj konsumitaj ekz
  • kiuj indikas ke tre bona respondtempo povas esti akirita kiam la konduto kun i dati estas je alta nivelo de resumo, dum la malbona respondtempo venas de la konduto de la dati je malalta nivelo de ALIAJ Konsideroj Estas kelkaj aliaj DW-konstruaj kaj administradaj konsideroj.
    La unua konsidero estas tiu de indeksoj. LA dati ĉe pli altaj niveloj de resumo ili povas esti libere indeksitaj, dum i dati

ĉe pli malaltaj niveloj de detalo ili estas tiel volumenaj ke ili povas esti indeksitaj ŝpareme. El la sama signo, i dati je altaj niveloj de detalo povas esti restrukturita relative facile, dum la volumo de dati ĉe la pli malaltaj niveloj ĝi estas tiel granda, ke i dati ili ne povas facile renovigi. Sekve, la modelo de la dati kaj la formala laboro farita per la dezajno amorigas la fundamenton por DW aplikita preskaŭ ekskluzive al la nuna nivelo de detalo. Alivorte, la modelaj agadoj de la dati ili ne validas por resumniveloj, en preskaŭ ĉiu kazo. Alia struktura konsidero estas tiu de la subdivido de dati de DW.

Dispartigo povas esti farita sur du niveloj - je la nivelo de dbms kaj je la aplika nivelo. En la divido je la nivelo dbmsla dbms estas informita pri la sekcioj kaj kontrolas ilin laŭe. En la kazo de aplikaĵnivela divido, nur la programisto konscias pri la dividoj kaj la respondeco pri ilia administrado restas al li.

Sub nivelo dbms, multe da laboro estas farita aŭtomate. Estas multe da nefleksebleco asociita kun memadministrado de dividoj. En la kazo de la divizinivela aplikado de la dati de la datuma magazeno, multe da laboro falas sur la programisto, sed la fina rezulto estas fleksebleco en administrado de la dati nel datuma magazeno

ALIAJ ANOMALIOJ

Dum la komponantoj de la datuma magazeno laboro kiel priskribite por preskaŭ ĉiuj dati, estas kelkaj utilaj esceptoj, kiujn oni devas diskuti. Escepto estas tiu de dati publikaj resumoj (publikaj resumaj datumoj). Ĉi-tiuj estas dati resumoj kiuj estis kalkulitaj el la datuma magazeno sed ili estas uzataj de la socio. LA dati publikaj resumoj estas stokitaj kaj administritaj en la datuma magazeno, kvankam kiel menciite supre ili estas eltrovitaj. Librotenistoj laboras por produkti tiajn kvaronjare dati kiel enspezo, kvaronjaraj elspezoj, trimonata profito, ktp. La laboro farita de revizoroj estas ekstera al la datuma magazeno. Tamen, i dati estas uzataj "interne" ene de la kompanio - de marketing, vendoj, ktp. Alia anomalio, pri kiu oni ne diskutos, estas tiu de dati ekstera.

Alia elstara tipo de dati kiu troviĝas en a datuma magazeno estas tiu de konstantaj detalaj datumoj. Ĉi tiuj kaŭzas la bezonon konstante stoki la dati je detala nivelo pro etikaj aŭ juraj kialoj. Se kompanio eksponas siajn laboristojn al danĝeraj substancoj, necesas dati detala kaj konstanta. Se firmao produktas produkton kiu implikas publikan sekurecon, kiel ekzemple partoj por aviadilo, estas bezono dati konstantaj detaloj, same kiel se kompanio faras danĝerajn kontraktojn.

La firmao ne povas permesi preteratenti la detalojn ĉar dum la venontaj kelkaj jaroj, en kazo de proceso, revoko, pridisputata konstrudifekto, ktp. la eksponiĝo de la firmao povus esti granda. Kiel rezulto estas unika speco de dati konata kiel konstantaj detalaj datumoj.

RESUMO

Un datuma magazeno ĝi estas objektoorientita, integrita, streĉa varianto, kolekto de dati nevolatile por subteni la decidajn bezonojn de la administrado. Ĉiu el la elstaraj funkcioj de a datuma magazeno havas siajn implicojn. Krome estas kvar niveloj de dati de la datuma magazeno:

  • Malnovaj detaloj
  • Nuna detalo
  • dati iomete resumita
  • dati tre resumitaj Metadatumoj ankaŭ estas grava parto de la datuma magazeno. ABSTRAKTO La koncepto de stokado de dati ĝi lastatempe ricevis multe da atento kaj fariĝis tendenco de la 90-aj jaroj. Ĉi tio estas pro la kapablo de datuma magazeno venki la limojn de administradsubtensistemoj kiel ekzemple decidsubtensistemoj (DSS) kaj administraj informsistemoj (EIS). Kvankam la koncepto de la datuma magazeno aspektas promesplena, efektivigu i datuma magazeno povas esti problema pro grandskalaj stokprocezoj. Malgraŭ la komplekseco de stokaj projektoj de dati, multaj provizantoj kaj konsultistoj kiuj stokas dati argumenti ke la stokado de dati prezentas neniun problemon. Tamen, komence de ĉi tiu esplorprojekto, preskaŭ ne estis farita sendependa, rigora kaj sistema esplorado. Sekve estas malfacile diri, kio efektive okazas en la industrio kiam ili estas konstruitaj datuma magazeno. Ĉi tiu studo esploris la stokan praktikon de dati samtempuloj kiu celas evoluigi pli riĉan komprenon de aŭstralia praktiko. La literaturrecenzo disponigis la kuntekston kaj fundamenton por la empiria studo. Estas kelkaj rezultoj de ĉi tiu esplorado. Unue, ĉi tiu studo malkaŝis la agadojn kiuj okazis dum la disvolviĝo de la datuma magazeno. En multaj areoj, i dati kolektitaj konfirmis la praktikon raportitan en la literaturo. Due, la aferoj kaj problemoj kiuj povas influi la evoluon de la datuma magazeno estis identigitaj per ĉi tiu studo. Fine, profitoj akiritaj de aŭstraliaj organizoj asociitaj kun la uzo de datuma magazeno estis malkaŝitaj.

Ĉapitro 1

Serĉu kuntekston

La koncepto de datumstokado ricevis ĝeneraligitan malkovron kaj iĝis emerĝanta tendenco en la 90-aj jaroj (McFadden 1996, TDWI 1996, Shah and Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman and Oates 2000). Tio povas esti vidita de la kreskanta nombro da artikoloj pri datumstokado en komercaj publikaĵoj (Little kaj Gibson 1999). Multaj artikoloj (vidu, ekzemple, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett and King 1996, Graham et al. 1996, Sakaguchi and Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, Edward McCar 1997, 1997, T DWI 1998) raportis signifajn avantaĝojn al organizoj efektivigantaj i datuma magazeno. Ili subtenis sian teorion kun anekdotaj signoj de sukcesaj efektivigoj, alta rendimento de investo (ROI) ciferoj, kaj, ankaŭ, disponigante gvidliniojn aŭ metodarojn por disvolvi. datuma magazeno

(Shanks et al. 1997, Seddon kaj Benjamin 1998, Little kaj Gibson 1999). En ekstrema kazo, Graham et al. (1996) raportis mezan rendimenton de trijara investo de 401%.

Multo de la nuna literaturo, aliflanke, preteratentis la kompleksecojn implikitajn en entreprenado de tiaj projektoj. La projektoj de datuma magazeno ili estas kutime kompleksaj kaj grandskalaj kaj tial portas altan probablecon de fiasko se ne singarde kontrolitaj (Shah kaj Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs and Clymer 1998, Rao 1998). Ili postulas vastajn kvantojn de kaj homaj kaj financaj resursoj, tempon kaj penadon por konstrui ilin (Hill 1998, Crofts 1998). La tipa tempo kaj financaj rimedoj necesaj estas proksimume du jaroj kaj du ĝis tri milionoj da dolaroj, respektive (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Ĉi tiu tempo kaj financaj rimedoj estas postulataj por kontroli kaj plifirmigi multajn malsamajn aspektojn de datumstokado (Cafasso 1995, Hill 1998). Apud la aparataro kaj programaro konsideroj, aliaj funkcioj, kiuj varias de la eltiro de dati al la ŝarĝaj procezoj de dati, la memorkapablo por administri ĝisdatigojn kaj la meta dati por trejnado de uzantoj, devas esti konsiderata.

Tiutempe ĉi tiu esplorprojekto komenciĝis, ekzistis tre malmulte da akademia esplorado estanta farita en la kampo de datumstokado, precipe en Aŭstralio. Tio estis evidenta de la malabundeco de artikoloj publikigitaj pri datumstokado fare de ĵurnaloj aŭ aliaj akademiaj skribaĵoj de la tempo. Multaj el la disponeblaj akademiaj skribaĵoj priskribis la usonan sperton. La manko de akademia esplorado en la areo de datumstokado kaŭzis postulon je rigora esplorado kaj empiriaj studoj (McFadden 1996, Shanks et al. 1997, Little and Gibson 1999). Aparte, esplorstudoj pri la efektivigprocezo de datuma magazeno devas esti farita por etendi ĝeneralan scion pri la efektivigo de datuma magazeno kaj servos kiel bazo por estonta esplorstudo (Shanks et al. 1997, Little and Gibson 1999).

La celo de ĉi tiu studo, do, estas esplori kio efektive okazas kiam organizoj efektivigas kaj uzas i datuma magazeno en Aŭstralio. Specife, ĉi tiu studo implikos analizon de tuta procezo de evoluigado de a datuma magazeno, komencante kun inico kaj dezajno tra dezajno kaj efektivigo kaj posta uzo ene de aŭstraliaj organizoj. Krome, la studo ankaŭ kontribuos al nuna praktiko identigante areojn kie praktiko povas esti plu plibonigita kaj neefikecoj kaj riskoj povas esti minimumigitaj aŭ evititaj. Krome, ĝi servos kiel bazo por aliaj studoj pri datuma magazeno en Aŭstralio kaj plenigos la mankon kiu nuntempe ekzistas en la literaturo.

Esploraj demandoj

La celo de ĉi tiu esplorado estas studi la agadojn implikitajn en la efektivigo de datuma magazeno kaj ilia uzo de aŭstraliaj organizoj. Precipe oni studas elementojn pri projektplanado, evoluo, funkciado, uzo kaj la riskoj implikitaj. Do la demando de ĉi tiu esplorado estas:

“Kiel estas la nuna praktiko de la datuma magazeno en Aŭstralio?"

Por efike respondi ĉi tiun demandon, necesas kelkaj filaj esplordemandoj. Precipe, tri subdemandoj estis identigitaj el la literaturo, kiu estas prezentita en ĉapitro 2, por gvidi ĉi tiun esplorprojekton: Kiel estas la datuma magazeno de aŭstraliaj organizoj? Kiuj estas la problemoj renkontitaj?

Kiuj estas la profitoj spertaj?
Por respondi ĉi tiujn demandojn, esplora esplordezajno utiliganta enketon estis uzita. Kiel esplora studo, la respondoj al ĉi-supraj demandoj ne estas kompletaj (Shanks et al. 1993, Denscombe 1998). En ĉi tiu kazo, iu triangulado estas postulata por plibonigi la respondojn al ĉi tiuj demandoj. Tamen, la esploro provizos solidan bazon por estonta laboro ekzamenanta ĉi tiujn demandojn. Detala diskuto pri esplormetoda pravigo kaj dezajno estas prezentita en ĉapitro 3.

Strukturo de la esplorprojekto

Ĉi tiu esplorprojekto estas dividita en du partojn: la kunteksta studo de la datuma konserva koncepto kaj la empiria esplorado (vidu Figuro 1.1), ĉiu el kiuj estas diskutita malsupre.

Parto I: Kunteksta studo

La unua parto de la esplorado konsistis el revizio de la nuna literaturo pri diversaj specoj de datumstokado inkluzive de decidsubtenaj sistemoj (DSS), administraj informsistemoj (EIS), kazesploroj de datuma magazeno kaj la konceptoj de datuma magazeno. Ankaŭ, la rezultoj de la forumoj sur datuma magazeno kaj fakuloj kaj praktikistkunvengrupoj gviditaj fare de la Monash DSS esplorgrupo, kontribuis al tiu fazo de la studo kiu estis intencita akiri sciojn pri la praktiko de datuma magazeno kaj identigi la riskojn implikitajn en ilia adopto. Dum tiu periodo de konteksta studo, kompreno de la problemregiono estis establita por disponigi la sciobazon por postaj empiriaj enketoj. Tamen, ĉi tio estis daŭra procezo ĉar la esplorstudo estis farita.

Parto II: Empiria esplorado

La relative nova koncepto de datumstokado, precipe en Aŭstralio, kreis la bezonon de enketo por akiri larĝan bildon de la uzokutimo. Ĉi tiu parto estis farita post kiam la problema domajno estis establita per ampleksa literaturrecenzo. La datuma konserva koncepto formita dum la kunteksta studa fazo estis uzata kiel enigo por la komenca demandaro de ĉi tiu studo. Post tio, la demandaro estis reviziita. Ĉu vi estas spertulo pri datuma magazeno partoprenis en la testo. La celo de testado de la komenca demandaro estis kontroli la kompletecon kaj precizecon de la demandoj. Surbaze de la testrezultoj, la demandaro estis modifita kaj la modifita versio estis sendita al la enketpartoprenantoj. La resenditaj demandaroj tiam estis analizitaj por i dati en tabeloj, diagramoj kaj aliaj formatoj. LA

analizrezultoj de dati formi momentfoton de datumstokado praktiko en Aŭstralio.

SUPERVIZIO DE DATUMA STOKADO

La koncepto de datumstokado evoluis kun plibonigoj en komputila teknologio.
Ĝi celas venki la problemojn renkontitajn de aplikaj subtengrupoj kiel Decision Support System (DSS) kaj Executive Information System (EIS).

En la pasinteco la plej granda malhelpo de ĉi tiuj aplikoj estis la malkapablo de ĉi tiuj aplikoj provizi a Datumbazo necesa por la analizo.
Ĉi tio estas ĉefe kaŭzita de la naturo de la laboro de la administrado. La interesoj de administrado de firmao varias konstante depende de la areo kovrita. Tial i dati fundamenta por ĉi tiuj aplikoj devas povi ŝanĝi rapide depende de la parto por esti traktita.
Tio signifas ke i dati devas esti havebla en la taŭga formo por la postulataj analizoj. Fakte, aplikaĵsubtengrupoj trovis ĝin tre malfacile en la pasinteco kolekti kaj integri dati el kompleksaj kaj diversaj fontoj.

La resto de ĉi tiu sekcio prezentas superrigardon de la koncepto de datumstokado kaj diskutas kiel la datuma magazeno povas venki la problemojn de aplikaj subtengrupoj.
La esprimo "Datumstokejoestis popularigita de William Inmon en 1990. Lia ofte citita difino vidas la Datumstokejo kiel kolekto de dati subjekt-orientita, integra, ne-volatile, kaj varia dum tempo, en subteno de administraddecidoj.

Uzante ĉi tiun difinon Inmon atentigas, ke i dati loĝante en a datuma magazeno devas posedi la jenajn 4 karakterizaĵojn:

  • ▪ Subjekto orientita
  • ▪ Integrita
  • ▪ Ne volatila
  • ▪ Variebla laŭlonge de la tempo Per subjekt-orientita Inmon signifas ke i dati nel datuma magazeno en la plej grandaj organizaj areoj kiuj estis

difinita en la modelo dati. Ekzemple ĉiuj dati koncerne i klientoj estas enhavitaj en la temo klientoj. Simile ĉiuj dati rilataj al la produktoj estas enhavitaj en la temo PRODUTOJ.

Per Integrated Inmon signifas ke i dati de malsamaj platformoj, sistemoj kaj lokoj estas kombinitaj kaj stokitaj en unu loko. Konsekvence dati similaj devas esti transformitaj al konsekvencaj formatoj por esti facile aldonitaj kaj komparitaj.
Ekzemple, vira kaj ina sekso estas reprezentitaj per la literoj M kaj F en unu sistemo, kaj per 1 kaj 0 en alia. Por integri ilin ĝuste, unu aŭ ambaŭ formatoj devas esti transformitaj tiel ke la du formatoj estu egalaj. En ĉi tiu kazo ni povus ŝanĝi M al 1 kaj F al 0 aŭ inverse. Subjekt-orientita kaj Integrita indikas ke la datuma magazeno estas desegnita por disponigi funkcian kaj transversan vizion de dati de la kompanio.

Per Ne-volatile li signifas, ke i dati nel datuma magazeno resti konsekvenca kaj ĝisdatigo de dati ĝi ne estas necesa. Anstataŭe, ajna ŝanĝo en la dati originaloj estas aldonitaj al DataBase de la datuma magazeno. Tio signifas ke la historiisto de la dati estas enhavita en datuma magazeno.

Por Variabloj kun tempo Inmon indikas ke i dati nel datuma magazeno ĉiam enhavas la taktajn indikilojn ei dati ili normale transiras certan tempohorizonton. Ekzemple a
datuma magazeno povas enhavi 5 jarojn da historiaj valoroj de klientoj de 1993 ĝis 1997. La havebleco de la historia kaj de temposerio de la dati permesas analizi tendencojn.

Un datuma magazeno li povas kolekti sian propran dati de OLTP-sistemoj; de originoj dati ekstera al la organizo kaj/aŭ de aliaj specialaj kaptsistemaj projektoj dati.
I dati eltiraĵoj povas trapasi purigan procezon, ĉi-kaze i dati estas transformitaj kaj integritaj antaŭ esti stokitaj en la DataBase de la datuma magazeno. Tiam, i dati

loĝante ene de la DataBase de la datuma magazeno estas disponeblaj al finuzantaj ensalutoj kaj reakiro-iloj. Uzante ĉi tiujn ilojn la finuzanto povas aliri la integran vidon de la organizo de la dati.

I dati loĝante ene de la DataBase de la datuma magazeno ili estas konservitaj en kaj detala kaj resuma formato.
La nivelo de resumo povas dependi de la naturo de la dati. mi dati detala povas konsisti el dati aktuala kaj dati historiistoj
I dati realaj ne estas inkluzivitaj en la datuma magazeno ĝis mi dati nel datuma magazeno estas re-ĝisdatigitaj.
Krom konservi la dati sin, a datuma magazeno ĝi ankaŭ povas stoki malsaman specon de datumoj nomata METADATO priskribanta i dati loĝante en sia DataBase.
Estas du specoj de metadatenoj: evoluaj metadatenoj kaj analizaj metadatenoj.
Disvolvaj metadatenoj estas uzataj por administri kaj aŭtomatigi la procezojn de eltiro, purigado, mapado kaj alŝutado dati nel datuma magazeno.
La informoj enhavitaj en la evoluaj metadatenoj povas enhavi detalojn pri operaciumoj, detalojn pri la eltirotaj elementoj, la modelon. dati de la datuma magazeno kaj komercaj reguloj por konverti datumojn dati.

La dua speco de metadatenoj, konataj kiel analizaj metadatenoj ebligas al la finuzanto esplori la enhavon de la datuma magazeno trovi i dati disponeblaj kaj ilia signifo en klaraj, ne-teknikaj terminoj.

Tiel la analizaj metadatenoj funkcias kiel ponto inter la datuma magazeno kaj finuzantaj aplikoj. Ĉi tiuj metadatenoj povas enhavi la komercan modelon, priskribojn de dati responda al la komerca modelo, antaŭdifinitaj demandoj kaj raportoj, informoj por uzanta aliro kaj la indekso.

Analizaj kaj evoluaj metadatenoj devas esti kombinitaj en unu integran retenmetadatenojn por funkcii ĝuste.

Bedaŭrinde multaj el la ekzistantaj iloj havas siajn proprajn metadatenojn kaj nuntempe ne ekzistas ekzistantaj normoj

permesi al datumstokaj iloj integri ĉi tiujn metadatenojn. Por mildigi ĉi tiun situacion multaj vendistoj de gvidaj datumstokaj iloj formis la Meta Datumoj-Konsilion kiu poste iĝis la Meta Datumoj-Koalicio.

La celo de ĉi tiu koalicio estas konstrui norman metadatuman aron kiu permesas al malsamaj datumstokaj iloj konverti metadatenojn.
Iliaj klopodoj rezultigis la naskiĝon de la Meta Data Interchange Specification (MDIS) kiu permesos la interŝanĝon de informoj inter Microsoft-arkivoj kaj rilataj MDIS-dosieroj.

La ekzisto de dati kaj resumita/indeksita kaj detala, ĝi donas al la uzanto la eblecon fari DRILL DROWN (borado) de dati indeksitaj al detalaj kaj inverse. La ekzisto de dati detala historio permesas la kreadon de tendencaj analizoj laŭlonge de la tempo. Krome la analizaj metadatenoj povas esti uzataj kiel del-dosierujo DataBase de la datuma magazeno helpi finajn uzantojn trovi i dati necesa.

Kompare al OLTP-sistemoj, kun ilia kapablo subteni analizon de dati kaj raportado, la datuma magazeno ĝi estas vidita kiel pli taŭga sistemo por informprocezoj kiel fari kaj respondi demandojn kaj produkti raportojn. La sekva sekcio reliefigos la diferencojn de la du sistemoj detale.

DATUMOKONO KONTRAŬ OLTP-SISTEMOJ

Multaj el la informsistemoj ene de organizoj intencas subteni ĉiutagajn operaciojn. Ĉi tiuj sistemoj konataj kiel OLTP-SISTEMOJ kaptas ĉiutagajn transakciojn, kiuj estas kontinue ĝisdatigitaj.

I dati ene de tiuj sistemoj ili ofte estas modifitaj, aldonitaj aŭ forigitaj. Ekzemple, la adreso de kliento ŝanĝiĝas dum li moviĝas de loko al loko. En ĉi tiu kazo la nova adreso estos registrita modifante la adreskampon de DataBase. La ĉefa celo de ĉi tiuj sistemoj estas redukti transakciajn kostojn kaj samtempe redukti pretigtempojn. Ekzemploj de OLTP-Sistemoj inkludas kritikajn agojn kiel ekzemple mendo-ĵurnalo, salajro-etato, fakturoj, fabrikado, klientservo. klientoj.

Male al OLTP-sistemoj, kiuj estis kreitaj por transakciaj kaj okazaĵbazitaj procezoj, t.e datuma magazeno estis kreitaj por disponigi analiz-bazitan procezsubtenon dati kaj pri decidprocezoj.

Ĉi tio estas normale atingita per integrado de i dati el diversaj OLTP kaj eksteraj sistemoj en ununura "ujo" de dati, kiel diskutite en la antaŭa sekcio.

Monash Data Warehousing Process Model

La proceza modelo por datuma magazeno Monash estis evoluigita fare de esploristoj ĉe la Monash DSS Esplorgrupo kaj estas bazita sur la literaturo de datuma magazeno, sperto en disvolvaj helpsistemoj kampoj, diskutoj kun aplikaĵvendistoj por uzo sur datuma magazeno, pri grupo de spertuloj pri la uzo de datuma magazeno.

La fazoj estas: Iniciato, Planado, Evoluo, Operacioj kaj Klarigo. La diagramo klarigas la ripetan aŭ evoluan naturon de evoluigado de a datuma magazeno procezo uzante dudirektajn sagojn metitajn inter la malsamaj fazoj. En ĉi tiu kunteksto "ripetemaj" kaj "evoluaj" signifas ke, ĉe ĉiu paŝo de la procezo, efektivigaj agadoj ĉiam povas disvastigi malantaŭen al la antaŭa stadio. Ĉi tio estas pro la naturo de projekto datuma magazeno en kiu aldonaj petoj de la fina uzanto okazas iam ajn. Ekzemple, dum la evolufazo de procezo datuma magazenoSe nova temo aŭ areo estas petita de la finuzanto, kiu ne estis parto de la origina plano, ĝi devas esti aldonita al la sistemo. Ĉi tio kaŭzas ŝanĝon en la projekto. La rezulto estas, ke la dezajnteamo devas ŝanĝi la postulojn de la dokumentoj kreitaj ĝis nun dum la dezajna fazo. En multaj kazoj, la nuna stato de la projekto devas iri la tutan vojon reen al la dezajnofazo kie la nova postulo devas esti aldonita kaj dokumentita. La fina uzanto devas povi vidi la specifan dokumentaron reviziitan kaj la ŝanĝojn kiuj estis faritaj en la evolufazo. Fine de ĉi tiu disvolva ciklo, la projekto devas ricevi bonajn reagojn de kaj la evoluaj kaj uzantteamoj. Reago tiam estas recikligita por plibonigi estontan projekton.

Kapacitplanado
dw tendencas esti tre granda en grandeco kaj kreski tre rapide (Plej bone 1995, Rudin 1997a) pro la kvanto de dati historiaj, kiujn ili konservas de sia daŭro. Kresko ankaŭ povas esti kaŭzita de dati aldonaĵoj petitaj de uzantoj por pliigi la valoron de dati ke ili jam havas. Sekve, la stokado postuloj por dati povas esti signife plifortigita (Eckerson 1997). Tiel, estas esence certigi, farante kapacitplanadon, ke la konstruota sistemo povas kreski kiel bezonoj kreskas (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
En planado por datenmagazenoskaleblo, oni devas scii la atendatan kreskon en stokgrandeco, la specojn de demandoj verŝajne esti faritaj, kaj la nombron da finuzantoj apogitaj (Best 1995, Rudin 1997b, Foley 1997a). Konstrui skaleblajn aplikojn postulas kombinaĵon de skaleblaj servilaj teknologioj kaj skaleblaj aplikaj dezajnaj teknikoj (Plej bone 1995, Rudin 1997b. Ambaŭ estas necesaj en konstruado de tre skalebla aplikaĵo. Skaleblaj servilaj teknologioj povas faciligi kaj koste efika aldoni stokadon, memoron kaj CPU sen degradanta agado (Lang 1997, Telefonio 1997).

Ekzistas du ĉefaj skaleblaj servilteknologioj: simetria multobla pretigo (SMP) kaj masive paralela pretigo (MPP)) (IDC 1997, Humphries et al. 1999). SMP-servilo tipe havas multoblajn procesorojn kiuj dividas memoron, sistembusojn, kaj aliajn resursojn (IDC 1997, Humphries et al. 1999). Pliaj procesoroj povas esti aldonitaj por akceli ĝian potenco komputila. Alia metodo por pliigi la potenco komputado de la SMP-servilo, estas kombini multajn SMP-maŝinojn. Tiu ĉi tekniko estas konata kiel clustering (Humphries et al. 1999). MPP-servilo, aliflanke, havas multoblajn procesorojn ĉiu kun sia propra memoro, bussistemo, kaj aliaj rimedoj (IDC 1997, Humphries et al. 1999). Ĉiu procesoro estas nomita nodo. Pliiĝo en la potenco komputa povas esti akirita

aldonante pliajn nodojn al MPP-serviloj (Humphries et al. 1999).

Malforto de SMP-serviloj estas ke tro multaj enig-produktaĵoj (I/O) operacioj povas ŝtopi la bussistemon (IDC 1997). Ĉi tiu problemo ne okazas ene de MPP-serviloj ĉar ĉiu procesoro havas sian propran bussistemon. Tamen, la interligoj inter ĉiu nodo estas ĝenerale multe pli malrapidaj ol la SMP-bussistemo. Krome, MPP-serviloj povas aldoni kroman tavolon de komplekseco al aplikaĵprogramistoj (IDC 1997). Tiel, la elekto inter SMP kaj MPP-serviloj povas esti influita de multaj faktoroj, inkluzive de la komplekseco de la aplikoj, la prezo/efikecproporcio, la trafluo postulata, la dw-aplikoj malhelpitaj kaj la pliiĝo en grandeco de la. DataBase de dw kaj en la nombro de finaj uzantoj.

Kelkaj skaleblaj aplikaĵdezajnoteknikoj povas esti utiligitaj en kapacitplanado. Oni uzas diversajn raportperiodojn kiel tagojn, semajnojn, monatojn kaj jarojn. Havante diversajn sciigajn periodojn, la DataBase povas esti dividita en administreble grupigitaj pecoj (Inmon et al. 1997). Alia tekniko estas uzi resumajn tabelojn kiuj estas konstruitaj per resumado dati da dati detala. Tiel, i dati abstraktaĵoj estas pli kompaktaj ol detalaj, kio postulas malpli da memorspaco. Do la dati detaloj povas esti arkivitaj al malpli multekosta stokadunuo, kiu ŝparas eĉ pli da stokado. Dum uzado de resumaj tabeloj povas ŝpari stokan spacon, ili postulas multan penon por teni ilin aktualaj kaj konformaj al komercaj bezonoj. Tamen, tiu tekniko estas vaste uzita kaj ofte uzita lige kun la antaŭa tekniko (Best 1995, Inmon 1996a, Chauduri kaj Dayal
1997).

Difini Datumstokejo Teknikaj Arkitekturoj Difino de dw-arkitekturaj teknikoj

Fruaj adoptantoj de datumstokado ĉefe antaŭvidis alcentrigitan datumstokan efektivigon kie ĉiuj dati, inkluzive de i dati eksteraj, estis integritaj en unuopa,
fizika deponejo (Inmon 1996a, Bresnahan 1996, Peacock 1998).

La ĉefa avantaĝo de ĉi tiu aliro estas, ke finaj uzantoj povas aliri la tutentreprenan vidon de la dati organiza (Ovum 1998). Alia pluso estas, ke ĝi ofertas normigon de dati trans la organizo, kio signifas ke ekzistas nur unu versio aŭ difino por ĉiu terminologio uzata en la deponejo metadatenoj (Flanagan kaj Safdie 1997, Ovum 1998). La malavantaĝo de ĉi tiu aliro, aliflanke, estas ke ĝi estas multekosta kaj malfacile konstrui (Flanagan kaj Safdie 1997, Ovum 1998, Inmon et al. 1998). Ne longe post la stokado-arkitekturo dati centralizita iĝis populara, la koncepto de minado la plej malgrandaj subaroj de dioj evoluis dati subteni la bezonojn de specifaj aplikoj (Varney 1996, IDC 1997, Berson kaj Smith 1997, pavo 1998). Ĉi tiuj malgrandaj sistemoj estas derivitaj de la pli granda datuma magazeno centralizita. Ili estas nomitaj datuma magazeno dungitoj fakaj aŭ dungitaj datumaj vendejoj. La dependa datuma arkitekturo estas konata kiel tri-nivela arkitekturo kie la unua parto konsistas el la datuma magazeno centralizita, la dua konsistas el la kuŝejoj de dati departementa kaj la tria konsistas el aliro al dati kaj per analiziloj (Demarest 1994, Inmon et al. 1997).

Datumvendejoj estas normale konstruitaj post la datuma magazeno centralizita estis konstruita por renkonti la bezonojn de specifaj unuoj (Blanko 1995, Varney 1996).
Datumvendejo i dati rilata al apartaj unuoj (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

La avantaĝo de ĉi tiu metodo estas, ke ne estos datumoj ne integrita kaj ke i dati estos malpli redunda ene de datumaj martoj ekde ĉiuj dati venas el deponejo de dati integrita. Alia avantaĝo estas, ke estos malpli da ligoj inter ĉiu datumvendejo kaj ĝiaj fontoj dati ĉar ĉiu datumvendejo havas nur unu fonton de dati. Krome kun ĉi tiu arkitekturo en la loko, finaj uzantoj ankoraŭ povas aliri la dati

kompaniaj organizoj. Ĉi tiu metodo estas konata kiel la desupra metodo, kie datumvendejoj estas konstruitaj post la datuma magazeno (pavo 1998, Goff 1998).
Pliigante la bezonon montri rezultojn frue, kelkaj organizoj komencis konstrui sendependajn datumvendejojn (Flanagan kaj Safdie 1997, White 2000). En ĉi tiu kazo, la datumvendejoj ricevas sian dati rekte el la bazoj de dati OLTP kaj ne-OLTP de la centralizita kaj integra deponejo, tiel forigante la bezonon de la centra deponejo modloko.

Ĉiu datumvendejo postulas almenaŭ unu ligon al siaj fontoj dati. Unu malavantaĝo de havi multoblajn ligilojn al ĉiu datumvendejo estas ke, kompare kun la antaŭaj du arkitekturoj, la troabundo de dati signife pliiĝas.

Ĉiu datuma vendejo devas stoki ĉiujn dati postulata loke por havi neniun efikon al OLTP-sistemoj. Ĉi tio kaŭzas i dati ili estas stokitaj en malsamaj datumvendejoj (Inmon et al. 1997). Alia malavantaĝo de ĉi tiu arkitekturo estas ke ĝi kondukas al la kreado de kompleksaj interligoj inter datumvendejoj kaj iliaj datenfontoj. dati kiuj malfacilas efektivigi kaj kontroli (Inmon et al. 1997).

Alia malavantaĝo estas, ke finaj uzantoj eble ne povas aliri la kompanian informon superrigardon ĉar i dati de la malsamaj datumvendejoj ne estas integritaj (Ovum 1998).
Ankoraŭ alia malavantaĝo estas ke povas ekzisti pli ol unu difino por ĉiu terminologio uzita en datumvendejoj kiu generas datenfaktkonfliktojn. dati en organizo (Ovum 1998).
Malgraŭ la malavantaĝoj diskutitaj supre, memstaraj datumvendejoj daŭre altiras la intereson de multaj organizoj (IDC 1997). Unu faktoro kiu faras ilin allogaj estas ke ili estas pli rapide disvolvi kaj postulas malpli da tempo kaj rimedoj (Bresnahan 1996, Berson kaj Smith 1997, Ovum 1998). Sekve, ili funkcias ĉefe kiel testdezajnoj kiuj povas esti uzitaj por rapide identigi avantaĝojn kaj/aŭ mankojn en la dezajno (Parsaye 1995, Braly 1995, Newing 1996). En ĉi tiu kazo, la parto efektivigota en la pilota projekto devas esti malgranda sed grava por la organizo (Newing 1996, Mansell-Lewis 1996).

Ekzamenante la prototipon, finuzantoj kaj administrado povas decidi ĉu daŭrigi aŭ ĉesigi la projekton (Flanagan kaj Safdie 1997).
Se la decido estas daŭri, datumvendejoj por aliaj industrioj devus esti konstruitaj unuope. Ekzistas du opcioj por finuzantoj surbaze de iliaj bezonoj en konstruado de sendependaj datenmatroj: integra/federita kaj neintegra (Ovum 1998)

En la unua metodo, ĉiu nova datumvendejo devus esti konstruita surbaze de la nuna datumvendejo kaj modelo dati uzite fare de la firmao (Varney 1996, Berson kaj Smith 1997, Peacock 1998). La bezono uzi la modelon dati de la entrepreno signifas ke oni devas certigi ke ekzistas nur unu difino por ĉiu terminologio uzita trans datumvendejoj, ankaŭ por certigi ke malsamaj datumvendejoj povas esti kunfanditaj por doni superrigardon de entrepreninformoj (Bresnahan 1996). Tiu metodo estas nomita la desupra metodo kaj estas plej bone uzita kiam ekzistas limo sur financaj rimedoj kaj tempo (Flanagan kaj Safdie 1997, Ovum 1998, pavo 1998, Goff 1998). En la dua metodo, la konstruitaj datumvendejoj povas nur kontentigi la bezonojn de specifa unuo. Variaĵo de la federacia datuma vendejo estas la datuma magazeno distribuita en kiu la DataBase nabo-servila mezvaro estas uzata por kunfandi multajn datumvendejojn en ununuran deponejon dati distribuita (Blanko 1995). En ĉi tiu kazo, i dati komerco estas distribuitaj en pluraj datumvendejoj. Finuzantpetoj estas plusenditaj al DataBase nabo-servila mezvaro, kiu eltiras ĉion dati petitaj de datumvendejoj kaj redonu la rezultojn al finuzantaj aplikoj. Ĉi tiu metodo provizas komercajn informojn al finaj uzantoj. Tamen, la problemoj de sendependaj datumvendejoj ankoraŭ ne estas eliminitaj. Estas alia arkitekturo uzebla kiu nomiĝas la datuma magazeno virtuala (Blanko 1995). Tamen, ĉi tiu arkitekturo, kiu estas prezentita en Figuro 2.9, ne estas datumstoka arkitekturo dati reala ĉar ĝi ne movas la ŝarĝon de OLTP-sistemoj al datuma magazeno (Demarest 1994).

Fakte, petoj por dati de finuzantoj ili estas pludonitaj al OLTP-sistemoj kiuj resendas rezultojn post prilaborado de uzantpetoj. Dum ĉi tiu arkitekturo permesas al finaj uzantoj generi raportojn kaj fari petojn, ĝi ne povas provizi i

dati historio kaj superrigardo de kompaniaj informoj ekde i dati ĉar la malsamaj OLTP-sistemoj ne estas integritaj. Tial, ĉi tiu arkitekturo ne povas kontentigi la analizon de dati kiel antaŭdiroj.

Elekto de aliro kaj datumoj reakiro aplikoj dati

La celo konstrui a datuma magazeno estas transdoni informojn al finaj uzantoj (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); unu aŭ pluraj aliro kaj reakiro aplikoj dati devas esti provizita. Ĝis nun, ekzistas vasta gamo de tiaj aplikoj por la uzanto por elekti (Hammergren 1998, Humphries et al. 1999). La elektitaj aplikoj determinas la sukceson de la stokada penado dati en organizo ĉar la aplikoj estas la plej videbla parto de la datuma magazeno al la fina uzanto (Inmon et al. 1997, Poe 1996). Sukcesi a datuma magazeno, devas povi subteni datumajn analizajn agadojn dati de la finuzanto (Poe 1996, Seddon kaj Benjamin 1998, Eckerson 1999). Tiel la "nivelo" de tio, kion la finuzanto deziras, devas esti identigita (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

Ĝenerale, finaj uzantoj povas esti grupigitaj en tri kategoriojn: administraj uzantoj, komercaj analizistoj kaj potencaj uzantoj (Poe 1996, Humphries et al. 1999). Administraj uzantoj bezonas facilan aliron al antaŭdifinitaj aroj de raportoj (Humphries et al. 1999). Ĉi tiuj raportoj estas facile alireblaj per menua navigado (Poe 1996). Krome, raportoj devus prezenti informojn uzante grafikan reprezenton kiel ekzemple tabeloj kaj ŝablonoj por transdoni informojn rapide (Humphries et al. 1999). Komercaj analizistoj, kiuj eble ne havas la teknikajn kapablojn evoluigi raportojn de nulo memstare, devas povi modifi aktualajn raportojn por renkonti siajn specifajn bezonojn (Poe 1996, Humphries et al. 1999). Potencaj uzantoj, aliflanke, estas la speco de finuzanto kiu havas la kapablon generi kaj skribi petojn kaj raportojn de nulo (Poe 1996, Humphries et al. 1999). Ili estas tiuj, kiuj

ili konstruas rilatojn por aliaj specoj de uzantoj (Poe 1996, Humphries et al. 1999).

Post kiam finuzantpostuloj estas determinitaj, elekto de aliro kaj reakiro aplikoj devas esti farita dati inter ĉiuj disponeblaj (Poe 1996, Inmon et al. 1997).
Aliro al dati kaj retrovaj iloj povas esti klasifikitaj en 4 tipojn: OLAP-ilo, EIS/DSS-ilo, pridemandado kaj raporta ilo kaj datumminado.

OLAP-iloj permesas al uzantoj krei ad hoc demandojn same kiel tiujn faritajn sur la DataBase de la datuma magazeno. Aldone, ĉi tiuj produktoj permesas al uzantoj bori malsupren de dati ĝenerala al detala.

EIS/DSS-iloj disponigas administran raportadon kiel ekzemple "kio se" analizo kaj aliro al menu-movitaj raportoj. Raportoj devas esti antaŭdifinitaj kaj kunfanditaj kun menuoj por pli facila navigado.
Demandaj kaj raportaj iloj permesas al uzantoj produkti antaŭdifinitajn kaj specifajn raportojn.

Datumaj minindustriaj iloj estas uzataj por identigi rilatojn, kiuj povus verŝi novan lumon pri forgesitaj operacioj dati de la datumstokejo.

Krom optimumigi la postulojn de ĉiu tipo de uzanto, la iloj elektitaj devas esti intuiciaj, efikaj kaj facile uzeblaj. Ili ankaŭ devas esti kongruaj kun aliaj partoj de la arkitekturo kaj kapablaj labori kun ekzistantaj sistemoj. Estas ankaŭ sugestite elekti datumajn alirojn kaj rehavigajn ilojn kun akceptebla prezo kaj rendimento. Aliaj kriterioj por konsideri inkluzivas la engaĝiĝon de la vendisto de iloj subteni ilian produkton kaj la evoluojn kiujn ĝi havos en estontaj eldonoj. Por certigi uzantan engaĝiĝon en uzado de la datumstokejo, la disvolva teamo implikas uzantojn en la ila elektoprocezo. En ĉi tiu kazo, oni devas fari praktikan taksadon de la uzanto.

Por plibonigi la valoron de la datumstokejo la evoluigteamo ankaŭ povas disponigi retaliron al siaj datumstokejoj. Rete-ebligita datumstokejo permesas al uzantoj aliri la dati de malproksimaj lokoj aŭ dum vojaĝo. Ankaŭ la informoj povas

estu provizita je pli malalta kosto per malpliigo de trejnadokostoj.

2.4.3 Datumstokejo Operacia Fazo

Ĉi tiu fazo konsistas el tri agadoj: difino de datum-refreŝigaj strategioj, kontrolo de datum-magazenaj agadoj kaj administrado de datuma sekureco.

Difino de datum-refreŝigaj strategioj

Post komenca ŝarĝo, i dati nel DataBase de la datumstokejo devas esti refreŝigita periode por reprodukti la ŝanĝojn faritajn sur la dati originaloj. Do vi devas decidi kiam refreŝigi, kiom ofte la refreŝiĝo estu planita kaj kiel refreŝigi la dati. Oni sugestas refreŝigi la dati kiam la sistemo povas esti prenita eksterrete. La refreŝiga indico estas determinita de la disvolva teamo surbaze de uzantpostuloj. Estas du aliroj por refreŝigi la datumstokejon: plena refreŝiĝo kaj kontinua alŝuto de ŝanĝoj.

La unua aliro, plena refreŝiĝo, postulas reŝargi ĉion dati el nenio. Ĉi tio signifas, ke ĉiuj dati necesaj devas esti ĉerpitaj, purigitaj, transformitaj kaj integritaj en ĉiu refreŝiĝo. Ĉi tiu aliro devus esti evitita kiam ajn ebla ĉar ĝi estas tempopostula kaj resursokonsumanta.

Alternativa aliro estas kontinue alŝuti ŝanĝojn. Ĉi tio aldonas i dati kiuj ŝanĝiĝis ekde la lasta datum-magazeno refreŝiga ciklo. Identigi novajn aŭ ŝanĝitajn rekordojn signife reduktas la kvanton de dati kiu devas esti disvastigita al la datumstokejo en ĉiu ĝisdatigo kiel nur ĉi tiuj dati estos aldonita al DataBase de la datumstokejo.

Estas almenaŭ 5 aliroj uzeblaj por retiriĝi i dati novaj aŭ modifitaj. Por atingi efikan video-refreŝigan strategion dati miksaĵo de ĉi tiuj aliroj kiuj alportas ĉiujn ŝanĝojn en la sistemo povas esti utila.

La unua aliro, kiu uzas tempomarkojn, supozas ke ĉiu estas asignita dati redaktis kaj ĝisdatigis tempomarkon por ke vi povu facile identigi ĉiujn dati modifita kaj nova. Tamen, ĉi tiu aliro ne estis vaste uzita en la plej multaj operaciumoj hodiaŭ.
La dua aliro estas uzi aplikaĵ-generitan deltan dosieron, kiu enhavas nur la ŝanĝojn faritajn al la dati. Uzado de ĉi tiu dosiero ankaŭ plifortigas la ĝisdatigan ciklon. Tamen, eĉ ĉi tiu metodo ne estis uzata en multaj aplikoj.
La tria aliro estas skani protokoldosieron, kiu esence enhavas informojn similajn al la delta dosiero. La sola diferenco estas, ke protokolo-dosiero estas kreita por la reakiro kaj povas esti malfacile komprenebla.
La kvara aliro estas modifi la aplikan kodon. Tamen, plej multe de la aplika kodo estas malnova kaj fragila; tial ĉi tiu tekniko devus esti evitita.
La lasta aliro estas kompari i dati fontoj kun la ĉefa dosiero dei dati.

Monitorado de datenmagazenaj agadoj

Post kiam la datumstokejo estas liberigita al uzantoj, ĝi devas esti monitorita laŭlonge de la tempo. En ĉi tiu kazo, la administranto de la datuma stokejo povas uzi unu aŭ plurajn ilojn pri administrado kaj kontrolo por kontroli la uzon de la datuma stokejo. Precipe, informoj povas esti kolektitaj pri homoj kaj pri la tempo kiam ili aliras la datumstokejon. Venu dati kolektita, profilo de la laboro farita povas esti kreita kiu povas esti utiligita kiel enigaĵo en la kompensrefektivigon de la uzanto. Rekompenco permesas al uzantoj esti informitaj pri la kosto de prilaborado de datumservoj.

Krome, datenmagazenkontrolado ankaŭ povas esti uzata por identigi demandajn tipojn, ilian grandecon, nombron da demandoj tage, demandajn reagtempojn, sektorojn atingitajn kaj kvanton de dati prilaborita. Alia celo fari datumagazenan revizion estas identigi la dati kiuj ne estas uzataj. Ĉi tiuj dati ili povas esti forigitaj de la datumstokejo por plibonigi tempon

de demanda ekzekuto respondo kaj kontroli la kreskon de dati kiuj loĝas ene de la Datumbazo de la datumstokejo.

Administrado pri sekureco de datumoj-deponejo

Datumstokejo enhavas dati integra, kritika, sentema facile atingebla. Tial ĝi devus esti protektita kontraŭ neaŭtorizitaj uzantoj. Unu maniero efektivigi sekurecon estas uzi la funkcion del DBMS atribui malsamajn privilegiojn al malsamaj specoj de uzantoj. Tiamaniere, alirprofilo devas esti konservita por ĉiu speco de uzanto. Alia maniero sekurigi la datumstokejon estas ĉifri ĝin kiel skribite en la Datumbazo de la datumstokejo. Aliro al dati kaj la retrovigaj iloj devas deĉifri la dati antaŭ prezenti la rezultojn al uzantoj.

2.4.4 Datumstokejo Deploja Fazo

Ĝi estas la lasta etapo en la datum-magazena efektivigciklo. La agadoj farotaj en ĉi tiu fazo inkluzivas trejni uzantojn por uzi la datumstokejon kaj fari recenzojn pri la datumstokejo.

Trejnado de uzantoj

Uzanttrejnado devus esti farita antaŭ aliro dati de la datumstokejo kaj la uzo de retroviloj. Ĝenerale, sesioj devas komenciĝi per enkonduko al la koncepto de stokado dati, la enhavo de la datumstokejo, la meta dati kaj la bazaj trajtoj de la iloj. Tiam, pli progresintaj uzantoj ankaŭ povus studi la fizikajn tabelojn kaj funkciojn de uzantoj de datuma aliro kaj rehavigo iloj.

Estas multaj aliroj por fari uzanttrejnadon. Unu el ĉi tiuj implikas elekton de multaj uzantoj aŭ analizistoj elektitaj el aro de uzantoj, surbaze de iliaj gvidado kaj komunikadkapabloj. Ĉi tiuj estas persone trejnitaj pri ĉio, kion ili bezonas scii por konatiĝi kun la sistemo. Post trejnado, ili reiras al siaj laboroj kaj komencas instrui aliajn uzantojn kiel uzi la sistemon. Sur la

Surbaze de tio, kion ili lernis, aliaj uzantoj povas komenci esplori la datumstokejon.
Alia aliro estas trejni multajn uzantojn samtempe, kvazaŭ vi trejnus en klasĉambro. Ĉi tiu metodo taŭgas kiam estas multaj uzantoj, kiuj devas esti trejnitaj samtempe. Ankoraŭ alia metodo estas trejni ĉiun uzanton individue, unu post alia. Ĉi tiu metodo taŭgas kiam estas malmultaj uzantoj.

La celo de trejnado de uzantoj estas konatiĝi kun aliro dati kaj rehavigaj iloj same kiel datuma stokenhavo. Tamen, iuj uzantoj povas esti superfortitaj de la kvanto da informoj provizitaj dum la trejna sesio. Tiam kelkaj refreŝigaj sesioj devas esti faritaj por daŭra subteno kaj por respondi specifajn demandojn. En iuj kazoj, uzantgrupo estas formita por provizi ĉi tiun tipon de subteno.

Kolekto de sugestoj

Post kiam la datumstokejo estas lanĉita, uzantoj povas uzi i dati loĝante en la datumstokejo por diversaj celoj. Plejparte, analizistoj aŭ uzantoj uzas i dati en la datumstokejo por:

  1. 1 Identigu firmaajn tendencojn
  2. 2 Analizu la aĉetajn profilojn de klientoj
  3. 3 Split i klientoj kaj de
  4. 4 Provizu la plej bonajn servojn al klientoj - personecigi servojn
  5. 5 Formuli strategiojn marketing
  6. 6 Faru konkurencivajn citaĵojn por kostaj analizoj kaj helpu kontroli
  7. 7 Subtenu strategian decidon
  8. 8 Identigu ŝancojn por aperi
  9. 9 Plibonigu la kvaliton de nunaj komercaj procezoj
  10. 10 Kontrolu la profiton

Sekvante la evoluodirekton de la datumstokejo, serio da recenzoj de la sistemo povus esti kondukitaj por akiri retrosciigon

kaj de la evoluigteamo kaj de la finuzantkomunumo.
La rezultoj akiritaj povas esti konsiderataj por la sekva disvolva ciklo.

Ĉar la datumstokejo havas pliigan aliron, estas esence lerni de la sukcesoj kaj eraroj de antaŭaj evoluoj.

2.5 Resumo

En ĉi tiu ĉapitro la aliroj ĉeestantaj en la literaturo estis diskutitaj. En sekcio 1 la koncepto de datumstokejo kaj ĝia rolo en decida scienco estis diskutita. Sekcio 2 priskribis la ĉefajn diferencojn inter datumstokejoj kaj OLTP-sistemoj. Sekcio 3 diskutis la Monash datumstokmodelo kiu estis uzita en sekcio 4 por priskribi la agadojn implikitajn en la procezo de evoluigado de datumstokejo, tiuj asertoj ne estis bazitaj sur rigora esplorado. Kio okazas en la realo povas esti tre malsama ol tio, kion raportas la literaturo, tamen ĉi tiuj rezultoj povas esti uzataj por krei bazan bagaĝon, kiu substrekas la koncepton de datumstokejo por ĉi tiu esplorado.

Ĉapitro 3

Metodoj de esploro kaj dezajno

Ĉi tiu ĉapitro traktas la esplor- kaj projektajn metodojn por ĉi tiu studo. La unua parto montras ĝeneralan vidon de la esplormetodoj disponeblaj por informservado, krome la kriterioj por elekti la plej bonan metodon por aparta studo estas diskutitaj. En sekcio 2 du metodoj elektitaj kun la supraj kriterioj tiam estas diskutitaj; unu el tiuj estos elektita kaj adoptita pro la kialoj prezentitaj en sekcio 3 kie la kialoj de la ekskludo de la alia kriterio estas ankaŭ elmontritaj. Sekcio 4 prezentas la esplorprojekton kaj sekcio 5 la konkludojn.

3.1 Esploro en informsistemoj

Esplorsistemoj ne estas simple limigita al la teknologia sfero sed ankaŭ devas esti etendita por inkludi kondutismajn kaj organizajn celojn.
Ni ŝuldas tion al la tezoj de diversaj fakoj, kiuj iras de la sociaj sciencoj ĝis la naturaj; tio kondukas al la bezono de certa spektro de esplormetodoj implikantaj kvantajn kaj kvalitajn metodojn por esti uzitaj por informsistemoj.
Ĉiuj disponeblaj esplormetodoj estas gravaj, fakte pluraj esploristoj kiel Jenkins (1985), Nunamaker et al. (1991), kaj Galliers (1992) argumentas ke ekzistas neniu specifa universala metodo por fari esploradon en la diversaj kampoj de informsistemoj; fakte metodo povas esti taŭga por aparta esplorado sed ne por aliaj. Ĉi tio kondukas nin al la bezono elekti metodon, kiu taŭgas por nia aparta esplorprojekto: por ĉi tiu elekto Benbasat et al. (1987) deklaras ke la naturo kaj celo de la esplorado devus esti pripensitaj.

3.1.1 Naturo de la esplorado

La diversaj natur-bazitaj metodoj de esplorado povas esti klasifikitaj en tri vaste konatajn tradiciojn en informadiko: pozitivisma, interpretanta, kaj kritika esplorado.

3.1.1.1 Pozitivisma esplorado

Pozitivisma esplorado ankaŭ estas konata kiel scienca aŭ empiria studo. Ĝi serĉas: "klarigi kaj antaŭdiri kio okazos en la socia mondo rigardante la regulecojn kaj kaŭzo-efikaj rilatoj inter la elementoj kiuj konsistigas ĝin" (Shanks et al 1993).

Pozitivisma esplorado ankaŭ estas karakterizita per ripeteblo, simpligoj kaj refutoj. Krome, pozitivisma esplorado akceptas la ekziston de aprioraj rilatoj inter la studitaj fenomenoj.
Laŭ Galliers (1992) taksonomio estas esplormetodo inkluzivita en la pozitivisma paradigmo, kiu tamen ne estas limigita al tio, fakte ekzistas laboratoriaj eksperimentoj, kampaj eksperimentoj, kazesploroj, teoremaj pruvoj, antaŭdiroj kaj simulaĵoj. Uzante ĉi tiujn metodojn, esploristoj koncedas, ke la studataj fenomenoj povas esti observataj objektive kaj rigore.

3.1.1.2 Interpreta esplorado

Interpreta esplorado, kiu ofte estas nomita fenomenologio aŭ kontraŭpozitivismo, estas priskribita fare de Neuman (1994) kiel "la sistema analizo de la socia signifo de ago per la rekta kaj detala observado de homoj en naturaj situacioj, por alveni al kompreno kaj la interpreto de kiel homoj kreas kaj konservas sian socian mondon”. Interpretaj studoj malakceptas la supozon ke observitaj fenomenoj povas esti observitaj objektive. Fakte ili baziĝas sur subjektivaj interpretoj. Krome, interpretaj esploristoj ne trudas apriorajn signifojn al la fenomenoj, kiujn ili studas.

Ĉi tiu metodo inkluzivas subjektivajn/argumentajn studojn, agadesploradon, priskribajn/interpretajn studojn, estontan esploradon kaj rolludon. Aldone al tiuj enketoj kaj kazesploroj povas esti inkluditaj en tiu aliro ĉar ili koncernas studojn de individuoj aŭ organizoj ene de kompleksaj realmondaj situacioj.

3.1.1.3 Kritika esplorado

Kritika serĉo estas la malplej konata aliro en la sociosciencoj sed ĵus ricevis la atenton de esploristoj en la informsistemoj-areno. La filozofia supozo ke socia realeco estas historie produktita kaj reproduktita fare de homoj, same kiel sociaj sistemoj kun iliaj agoj kaj interagoj. Ilia kapablo tamen estas mediaciita de kelkaj sociaj, kulturaj kaj politikaj konsideroj.

Kiel interpretanta esplorado, kritika esplorado argumentas ke pozitivisma esplorado havas nenion farendaĵo kun la socia kunteksto kaj ignoras ĝian influon sur homaj agoj.
Kritika esplorado, aliflanke, kritikas interpretan esploradon por esti tro subjektiva kaj por ne komenci helpi homojn plibonigi siajn vivojn. La plej granda diferenco inter kritika esplorado kaj la aliaj du aliroj estas ĝia taksa dimensio. Dum la objektiveco de la pozitivismaj kaj interpretaj tradicioj devas antaŭdiri aŭ klarigi la status quo aŭ socian realecon, kritika esplorado planas kritike taksi kaj transformi la socian realecon studata.

Kritikaj esploristoj kutime kontraŭbatalas la status quo por forigi sociajn diferencojn kaj plibonigi sociajn kondiĉojn. Kritika esplorado havas engaĝiĝon al procezvido de la fenomenoj de intereso kaj, tial, estas normale longituda. Ekzemploj de esplormetodoj estas longdaŭraj historiaj studoj kaj etnografiaj studoj. Kritika serĉo, aliflanke, ne estis vaste uzita en informsistemesplorado

3.1.2 Celo de la esplorado

Kune kun la naturo de la esplorado, ĝia celo povas esti uzita por gvidi la esploriston en selektado de speciala esplormetodo. La amplekso de esplorprojekto estas proksime rilatita al la pozicio de la esplorado rilate al la esplorciklo kiu konsistas el tri fazoj: teoriokonstruado, teoriotestado kaj teoria rafinado. Tiel, surbaze de impeto kun respekto al la esplorciklo, esplorprojekto povas havi klarigan, priskriban, esploran, aŭ prognozan celon.

3.1.2.1 Esplora esplorado

Esplora esplorado celas esplori tute novan temon kaj formuli demandojn kaj hipotezojn por estonta esplorado. Ĉi tiu speco de esplorado estas uzata en teoriokonstruado por akiri komencajn referencojn en nova areo. Kutime estas uzataj kvalitaj esplormetodoj, kiel kazesploroj aŭ fenomenologiaj studoj.

Tamen, estas ankaŭ eble utiligi kvantajn teknikojn kiel ekzemple esploraj enketoj aŭ eksperimentoj.

3.1.3.3 Priskriba serĉo

Priskriba esplorado estas desegnita por analizi kaj priskribi tre detale apartan situacion aŭ organizan praktikon. Ĉi tio taŭgas por konstrui teoriojn kaj ankaŭ povas esti uzata por konfirmi aŭ defii hipotezojn. Priskriba esplorado kutime implikas la uzon de mezuradoj kaj provaĵoj. Taŭgaj esplormetodoj inkluzivas enketojn kaj fonajn analizojn.

3.1.2.3 Klariga esploro

Klariga esplorado provas klarigi kial aferoj okazas. Ĝi konstruas sur faktoj kiuj jam estis studitaj kaj provas trovi la kial de tiuj faktoj.
Tiel klariga esplorado estas kutime konstruita aldone al esplora aŭ priskriba esplorado kaj estas helpa al testado kaj rafinado de teorioj. Klariga esplorado tipe utiligas kazesplorojn aŭ enket-bazitajn esplormetodojn.

3.1.2.4 Antaŭzorga esplorado

Antaŭzorga esplorado celas antaŭdiri la observitajn eventojn kaj kondutojn kiuj estas studitaj (Marshall kaj Rossman 1995). Antaŭdiro estas la norma scienca testo de vero. Ĉi tiu speco de esplorado ĝenerale utiligas enketojn aŭ datuman analizon dati historiistoj. (Jin 1989)

La supra diskuto pruvas, ke ekzistas kelkaj eblaj esplormetodoj, kiuj povas esti uzataj en aparta studo. Tamen, devas ekzisti specifa metodo, kiu pli taŭgas ol la aliaj por aparta speco de esplorprojekto. (Galliers 1987, Yin 1989, De Vaus 1991). Tial ĉiu esploristo devas zorge taksi la fortojn kaj malfortojn de diversaj metodoj, por alpreni la plej taŭgan esplormetodon kongruan kun la esplorprojekto. (Jenkins 1985, Pervan kaj Klass 1992, Bonomia 1985, Yin 1989, Himilton kaj Ives 1992).

3.2. Eblaj serĉmetodoj

La celo de ĉi tiu projekto estis studi la sperton de aŭstraliaj organizoj kun i dati stokita kun evoluo de datuma magazeno. dato ke, nuntempe, mankas esplorado en la areo de datumstokado en Aŭstralio, ĉi tiu esplorprojekto ankoraŭ estas en la teoria fazo de la esplora ciklo kaj havas esploran celon. Esplori la sperton en aŭstraliaj organizoj adoptantaj datumstokadon postulas interpreti la realan socion. Sekve, la filozofia supozo subesta la esplorprojekto sekvas la tradician interpreton.

Post rigora ekzameno de disponeblaj metodoj, du eblaj esplormetodoj estis identigitaj: enketoj kaj kazesploroj, kiuj povas esti uzataj por esplora esploro (Shanks et al. 1993). Galliers (1992) argumentas la taŭgecon de tiuj du metodoj por tiu speciala studo en sia reviziita taksonomio dirante ke ili estas taŭgaj por teorikonstruo. La sekvaj du subfakoj diskutas ĉiun metodon detale.

3.2.1 Enketa esplormetodo

La enketa esplormetodo venas de la antikva censmetodo. Censo temas pri kolektado de informoj de tuta loĝantaro. Ĉi tiu metodo estas multekosta kaj nepraktika, precipe se la populacio estas granda. Tiel, kompare kun censo, enketo estas kutime temigis kolektado de informoj por malmulto, aŭ provaĵo, de la reprezentantoj de la populacio (Fowler 1988, Neuman 1994). Provaĵo reflektas la populacion de kiu ĝi estas tirita, kun ŝanĝiĝantaj gradoj da precizeco, depende de la provaĵstrukturo, grandeco, kaj selektmetodo uzita (Fowler 1988, Babbie 1982, Neuman 1994).

La enketmetodo estas difinita kiel "momentfotoj de praktikoj, situacioj aŭ vidoj en aparta momento en tempo, entreprenitaj uzante demandarojn aŭ intervjuojn, el kiuj povas esti konkludoj.
farita" (Galliers 1992:153) [momentfotofotado de praktikoj, situacioj aŭ vidoj en aparta momento en tempo, prenita per demandaroj aŭ intervjuoj, el kiuj povas esti faritaj inferencoj]. Enketoj temas pri kolektado de informoj pri certaj aspektoj de la studo de kelkaj partoprenantoj per demandado (Fowler 1988). Ĉi tiuj demandaroj kaj intervjuoj, kiuj inkluzivas vizaĝ-al-vizaĝajn telefonajn intervjuojn kaj strukturitajn intervjuojn, ankaŭ estas kolektoteknikoj. dati uzata en enketoj (Blalock 1970, Nachmias kaj Nachmias 1976, Fowler 1988), observoj kaj analizoj povas esti uzataj (Gable 1994). De ĉiuj ĉi metodoj kolekti diojn dati, la uzado de la demandaro estas la plej populara tekniko, ĉar ĝi certigas ke i dati

kolektitaj estas strukturitaj kaj formatitaj, kaj tiel faciligas la klasifikon de informoj (Hwang 1987, de Vaus 1991).

Analizante i dati, enketstrategio ofte utiligas kvantajn teknikojn, kiel ekzemple statistika analizo, sed kvalitaj teknikoj ankaŭ povas esti utiligitaj (Galliers 1992, Pervan).

kaj Klass 1992, Gable 1994). Normale, i dati kolektitaj estas uzataj por analizi distribuojn kaj ŝablonojn de asocioj (Fowler 1988).

Kvankam enketoj estas ĝenerale taŭgaj por serĉoj traktantaj la demandon 'kio?' (kio) aŭ derivante de ĝi, kiel 'quanto' (kiom) kaj 'quant'è' (kiom da), ili povas esti demanditaj per la demando 'kial' (Sonquist kaj Dunkelberg 1977, Yin 1989). Laŭ Sonquist kaj Dunkelberg (1977), esplorenketo celas malfacilajn hipotezojn, taksadprogramojn, priskribante la populacion kaj evoluigante modelojn de homa konduto. Krome, enketoj povas esti uzitaj por studi la opinion de certa populacio, kondiĉojn, kredojn, karakterizaĵojn, atendojn kaj eĉ pasintajn aŭ nunajn kondutojn (Neuman 1994).

Enketoj permesas al la esploristo malkovri populaciorilatojn kaj la rezultoj estas kutime pli ĝeneralaj ol aliaj metodoj (Sonquist kaj Dunkelberg 1977, Gable 1994). Enketoj permesas al esploristoj kovri pli larĝan geografian areon kaj atingi grandajn nombrojn da respondantoj (Blalock 1970, Sonquist kaj Dunkelberg 1977, Hwang kaj Lin 1987, Gable 1994, Neuman 1994). Finfine, enketoj povas disponigi informojn kiuj ne estas haveblaj aliloke aŭ en la formo postulata por analizoj (Fowler 1988).

Estas tamen iuj limigoj por fari enketon. Malavantaĝo estas, ke la esploristo ne povas akiri multajn informojn pri la studita objekto. Ĉi tio estas pro la fakto, ke la enketoj estas faritaj nur en aparta tempo kaj, tial, estas limigita nombro da variabloj kaj homoj, kiujn la esploristo povas.

studo (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Alia malavantaĝo estas ke fari enketon povas esti tre multekosta laŭ tempo kaj resursoj, precipe se ĝi implikas vizaĝ-al-vizaĝajn intervjuojn (Fowler 1988).

3.2.2. Enketa Esplora Metodo

La enketesplora metodo implikas la profundan studon de speciala situacio ene de ĝia fakta kunteksto dum difinita tempodaŭro, sen iu interveno flanke de la esploristo (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Ĉefe ĉi tiu metodo estas uzata por priskribi la rilatojn inter la variabloj kiuj estas studitaj en aparta situacio (Galliers 1992). La esploroj povas impliki unuopajn aŭ plurajn kazojn, depende de la fenomeno analizita (Franz kaj Robey 1987, Eisenhardt 1989, Yin 1989).

La enketesplora metodo estas difinita kiel "empiria enketo kiu esploras nuntempan fenomenon ene de sia fakta kunteksto, uzante multoblajn fontojn el unu aŭ pluraj unuoj kiel ekzemple homoj, grupoj, aŭ organizoj" (Yin 1989). Ekzistas neniu klara apartigo inter la fenomeno kaj ĝia kunteksto kaj ekzistas neniu kontrolo aŭ eksperimenta manipulado de la variabloj (Yin 1989, Benbasat et al. 1987).

Estas diversaj teknikoj por kolekti diojn dati tio povas esti utiligita en la enketmetodo, kiuj inkludas rektajn observaĵojn, arkivajn rekordrecenzojn, demandarojn, dokumentarevizion, kaj strukturitajn intervjuojn. Havante diversan gamon de rikoltaj teknikoj dati, enketoj permesas al esploristoj trakti ambaŭ dati kvalita kaj kvanta samtempe (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Kiel estas la kazo kun la enketmetodo, enketesploristo funkcias kiel observanto aŭ esploristo kaj ne kiel aktiva partoprenanto en la organizo pri studo.

Benbasat kaj aliaj (1987) asertas, ke la enketmetodo precipe taŭgas por esplorteorikonstruo, kiu komenciĝas per esplordemando kaj daŭras kun trejnado.

de teorio dum la procezo de kolektado dati. Estante ankaŭ taŭga por scenejo

de teorikonstruado, Franz kaj Robey (1987) sugestas ke la enketmetodo ankaŭ povas esti uzita por la kompleksa teorifazo. En ĉi tiu kazo, surbaze de la kolektita indico, antaŭfiksita teorio aŭ hipotezo estas kontrolita aŭ kontraŭpruvita. Krome, enketo ankaŭ taŭgas por esplorado traktanta demandojn pri "kiel" aŭ "kial" (Yin 1989).

Kompare kun aliaj metodoj, enketoj permesas al la esploristo kapti esencajn informojn pli detale (Galliers 1992, Shanks et al. 1993). Krome, esploroj permesas al la esploristo kompreni la naturon kaj kompleksecon de la procezoj studitaj (Benbasat et al. 1987).

Estas kvar ĉefaj malavantaĝoj asociitaj kun la enketmetodo. La unua estas la manko de kontrolitaj deprenoj. La subjektiveco de la esploristo povas ŝanĝi la rezultojn kaj konkludojn de la studo (Yin 1989). La dua malavantaĝo estas la manko de kontrolita observado. Male al eksperimentaj metodoj, la enketesploristo ne povas kontroli la fenomenojn studitajn ĉar ili estas ekzamenitaj en sia natura kunteksto (Gable 1994). La tria malavantaĝo estas la manko de reproduktebleco. Ĉi tio estas pro la fakto, ke la esploristo verŝajne ne observas la samajn eventojn, kaj ne povas kontroli la rezultojn de aparta studo (Lee 1989). Fine, kiel sekvo de la ne-reproduktebleco, estas malfacile ĝeneraligi la rezultojn akiritajn de unu aŭ pluraj enketoj (Galliers 1992, Shanks et al. 1993). Ĉiuj ĉi tiuj problemoj, tamen, ne estas nesupereblaj kaj povas, fakte, esti minimumigitaj de la esploristo aplikante taŭgajn agojn (Lee 1989).

3.3. Pravigu la esplormetodaron adoptita

El la du eblaj esplormetodoj por ĉi tiu studo, la enketmetodo estas konsiderita kiel la plej taŭga. La investigativo estis malakceptita sekvante atenta konsidero de la rilatigitaj

meritoj kaj malfortoj. La oportuno aŭ netaŭgeco de ĉiu metodo por ĉi tiu studo estas diskutita malsupre.

3.3.1. Nekonvena esplormetodo de enketo

La enketmetodo postulas la profundan studon de speciala situacio ene de unu aŭ pluraj organizoj dum tempodaŭro (Eisenhardt 1989). En ĉi tiu kazo, la periodo povas superi la tempokadron donitan por ĉi tiu studo. Alia kialo ne adopti la enketmetodon estas ke la rezultoj povas suferi pro manko de rigoro (Yin 1989). La subjektiveco de la esploristo povas influi la rezultojn kaj konkludojn. Alia kialo estas ke ĉi tiu metodo estas pli taŭga por esplordemandoj de la "kiel" aŭ "kial" tipo (Yin 1989), dum la esplordemando por ĉi tiu studo estas la "kio" tipo. Laste sed ne laste, estas malfacile ĝeneraligi rezultojn de nur unu aŭ kelkaj enketoj (Galliers 1992, Shanks et al. 1993). Surbaze de ĉi tiu raciaĵo, la enketesplora metodo ne estis elektita ĉar ĝi estis maltaŭga por ĉi tiu studo.

3.3.2. Komforto de la serĉmetodo de esploro

Kiam ĉi tiu esplorado estis farita, la praktiko de datumstokado ne estis vaste adoptita de aŭstraliaj organizoj. Tial, ekzistis ne multe da informoj koncerne ilian efektivigon ene de aŭstraliaj organizoj. La disponeblaj informoj venis de organizoj kiuj efektivigis aŭ uzis a datuma magazeno. En ĉi tiu kazo, la enketesplora metodo estas la plej taŭga ĉar ĝi permesas akiri informojn kiuj ne estas haveblaj aliloke aŭ en la formo necesa por analizo (Fowler 1988). Krome, la enketesplora metodo permesas al la esploristo akiri bonan komprenon pri praktikoj, situacioj aŭ vidoj en antaŭfiksita tempo (Galliers 1992, Denscombe 1998). Superrigardo estis petita por levi konscion pri la aŭstralia datuma stokado-sperto.

Krome, Sonquist kaj Dunkelberg (1977) deklaras ke enketaj esplorrezultoj estas pli ĝeneralaj ol aliaj metodoj.

3.4. Survey Research Design

La enketo pri datuma stokado estis farita en 1999. La celpopulacio konsistis el aŭstraliaj organizoj interesitaj pri datumservostudoj, ĉar ili verŝajne jam konsciis pri la dati kiujn ili konservas kaj, do, povus provizi la utilajn informojn por ĉi tiu studo. La celpopulacio estis identigita kun komenca enketo de ĉiuj aŭstraliaj membroj de "The Data Warehousing Institute" (Tdwi-aap). Ĉi tiu sekcio diskutas la dezajnon de la empiria esplorfazo de ĉi tiu studo.

3.4.1. Kolekta tekniko dati

El la tri teknikoj kutime uzataj en enketesplorado (t.e. poŝta demandaro, telefona intervjuo kaj persona intervjuo) (Nachmias 1976, Fowler 1988, de Vaus 1991), la poŝta demandaro estis adoptita por ĉi tiu studo. La unua kialo por adopti ĉi-lastan estas ke ĝi povas atingi geografie disigitan populacion (Blalock 1970, Nachmias kaj Nachmias 1976, Hwang kaj Lin 1987, de Vaus 1991, Gable 1994). Due, la poŝta demandaro taŭgas por tre edukitaj partoprenantoj (Fowler 1988). La poŝta demandaro por ĉi tiu studo estis adresita al la sponsoroj de la projekto pri konservado de datumoj, direktoroj kaj/aŭ projektestroj. Trie, poŝtaj demandaroj taŭgas kiam sekura listo de adresoj estas disponebla (Salant kaj Dilman 1994). TDWI, en ĉi tiu kazo, fidinda datumstoka asocio disponigis la dissendoliston de siaj aŭstraliaj membroj. Alia avantaĝo de la poŝta demandaro super telefonaj demandaroj aŭ personaj intervjuoj estas ke ĝi permesas respondantojn respondi pli precize, precipe kiam respondantoj bezonas konsulti rekordojn aŭ diskuti demandojn kun aliaj homoj (Fowler 1988).

Ebla malavantaĝo povas esti la tempo necesa por fari demandarojn per poŝto. Normale, poŝta enketilo estas farita en ĉi tiu sinsekvo: poŝtu leterojn, atendu respondojn, kaj sendu konfirmon (Fowler 1988, Bainbridge 1989). Tiel, la tuta tempo povas esti pli longa ol la tempo bezonata por vizaĝ-al-vizaĝaj intervjuoj aŭ telefonaj intervjuoj. Tamen, la tuta tempo povas esti konata anticipe (Fowler 1988, Denscombe 1998). La tempo pasigita farante la personajn intervjuojn ne povas esti konata anticipe ĉar ĝi varias de intervjuo al intervjuo (Fowler 1988). Telefonaj intervjuoj povas esti pli rapidaj ol poŝtenketiloj kaj personaj intervjuoj sed povas havi altan neresponditan indicon pro malhavebleco de kelkaj homoj (Fowler 1988). Plie, telefonaj intervjuoj estas ĝenerale limigitaj al relative mallongaj listoj de demandoj (Bainbridge 1989).

Alia malforto de sendita demandaro estas la alta ne-responda indico (Fowler 1988, Bainbridge 1989, Neuman 1994). Tamen, kontraŭiniciatoj estis prenitaj asociante ĉi tiun studon kun fidinda datumstoka institucio (t.e. TDWI) (Bainbridge 1989, Neuman 1994), kiu elsendas du memorigajn leterojn al nerespondantoj (Fowler 1988, Neuman 1994) kaj ankaŭ inkluzivas plian leteron klarigante. la celo de la studo (Neuman 1994).

3.4.2. Analiza unuo

La celo de ĉi tiu studo estas akiri informojn pri la efektivigo de datumstokado kaj ĝia uzo ene de aŭstraliaj organizoj. La celpopulacio estas ĉiuj aŭstraliaj organizoj kiuj efektivigis, aŭ efektivigas, t.e datuma magazeno. La individuaj organizoj tiam estas registritaj. La demandaro estis sendita al la organizoj interesitaj pri adopto datuma magazeno. Ĉi tiu metodo certigas, ke la informoj kolektitaj venas de la plej taŭgaj rimedoj de ĉiu partoprenanta organizo.

3.4.3. Enketo specimeno

La dissendolisto de enketpartoprenantoj estis akirita de TDWI. El tiu listo, 3000 aŭstraliaj organizoj estis selektitaj kiel la bazo por specimenigo. Sekva letero klariganta la projekton kaj la celon de la enketo, kune kun respondformularo kaj antaŭpagita koverto por resendi la kompletigitan demandaron estis sendita al la specimeno. El la 3000 organizoj, 198 konsentis partopreni en la studo. Oni atendis tiom malmulte da respondoj datumoj la granda nombro da aŭstraliaj organizoj kiuj tiam ampleksis aŭ ampleksis la datumstokan strategion ene de siaj organizoj. Tiel, la celpopulacio por ĉi tiu studo konsistas el nur 198 organizoj.

3.4.4. Enhavo de la demandaro

La demandardezajno baziĝis sur la modelo de konservado de datumoj Monash (pridiskutita pli frue en parto 2.3). La enhavo de la enketilo baziĝis sur la literaturrecenzo prezentita en ĉapitro 2. Kopio de la demandaro sendita al la enketpartoprenantoj troveblas en Apendico B. La demandaro estas kunmetita de ses sekcioj, kiuj sekvas la paŝojn de la modelo kovrita. La sekvaj ses alineoj mallonge resumas la enhavon de ĉiu sekcio.

Sekcio A: Bazaj informoj pri la organizo
Ĉi tiu sekcio enhavas demandojn rilate al la profilo de la partoprenantaj organizoj. Aldone, kelkaj el la demandoj rilatas al la statuso de la datuma stokprojekto de la partoprenanto. Konfidencaj informoj kiel ekzemple la nomo de la organizo ne estis malkaŝitaj en la enketanalizo.

Sekcio B: Komenco
La demandoj en ĉi tiu sekcio rilatas al komenci pri datuma stokado. Demandoj estis demanditaj koncerne la projektoiniciatintojn, sponsorojn, postulatajn kapablojn kaj scion, la celojn de datuma stokado-disvolviĝo kaj la atendojn de la finuzantoj.

Sekcio C: Dezajno
Ĉi tiu sekcio enhavas demandojn ligitajn al la planaj agadoj de la datuma magazeno. Precipe, la demandoj temis pri la amplekso de efektivigo, la daŭro de la projekto, la kosto de la projekto kaj la kosto/profita analizo.

Sekcio D: Evoluo
En la disvolva sekcio estas demandoj rilataj al la evoluaj agadoj de la datuma magazeno: kolekto de finuzantpostuloj, fontoj de dati, la logika modelo de dati, prototipoj, kapacitplanado, teknikaj arkitekturoj kaj elekto de datumstokaj evoluiloj.

Sekcio E: Operacio
Operaciaj demandoj rilataj al la funkciado kaj etendebleco de la datuma magazeno, ĉar ĝi evoluas en la sekva etapo de evoluo. Tie datuma kvalito, la refreŝigaj strategioj de la dati, la granulareco de dati, skaleblo de datuma magazeno kaj sekurecaj aferoj datuma magazeno estis inter la specoj de demandoj faritaj.

Sekcio F: Evoluo
Ĉi tiu sekcio enhavas demandojn rilate al uzado de la datuma magazeno de finaj uzantoj. La esploristo interesiĝis pri la celo kaj utileco de la datuma magazeno, la revizio kaj trejnadstrategioj adoptitaj kaj la kontrolstrategio de la datuma magazeno adoptita.

3.4.5. Responda indico

Kvankam poŝtenketoj estas kritikitaj pro havi malaltan respondprocenton, paŝoj estis faritaj por pliigi la indicon de reveno (kiel diskutite supre en sekcio 3.4.1). La esprimo "responda indico" rilatas al la procento de homoj en speciala enketprovaĵo kiuj respondas al la demandaro (Denscombe 1998). La sekva formulo estis uzata por kalkuli la respondan indicon por ĉi tiu studo:

Nombro de homoj kiuj respondis
Respondofteco = —————————————————————————– X 100 Tuta nombro de enketiloj senditaj

3.4.6. Testpiloto

Antaŭ ol la demandaro estis sendita al la specimeno, la demandoj estis testitaj farante pilotprovojn, kiel sugestite fare de Luck kaj Rubin (1987), Jackson (1988), kaj de Vaus (1991). La celo de pilotprovoj estas riveli iujn ajn mallertajn, ambiguajn esprimojn kaj malfacile interpreteblajn demandojn, klarigi iujn ajn difinojn kaj terminojn uzitajn, kaj identigi la proksimuman tempon necesan por kompletigi la demandaron (Warwick kaj Lininger 1975, Jackson 1988, Salant). kaj Dilman 1994). La pilotprovoj estis aranĝitaj elektante temojn kun karakterizaĵoj similaj al tiuj de la finaj temoj, kiel sugestite fare de Davis e Cosenza (1993). En ĉi tiu studo, ses datenstokprofesiuloj estis elektitaj kiel la pilotsubjektoj. Post ĉiu pilottesto, la necesaj korektoj estis faritaj. El la pilottestoj faritaj, la partoprenantoj kontribuis al restrukturado kaj restarigo de la fina versio de la demandaro.

3.4.7. Metodoj de Analizo De dati

I dati La enketaj datumoj kolektitaj de la fermitaj demandaroj estis analizitaj per statistika programaro nomata SPSS. Multaj el la respondoj estis analizitaj uzante priskribajn statistikojn. Kelkaj demandaroj revenis nekompletaj. Tiuj ĉi estis pli zorge traktitaj por certigi, ke i dati mankantaj ne estis sekvo de eraroj de enigo de datumoj, sed ĉar la demandoj ne estis taŭgaj por la aliĝinto, aŭ la aliĝinto decidis ne respondi unu aŭ plurajn specifajn demandojn. Ĉi tiuj mankantaj respondoj estis ignoritaj dum analizado de la datumoj dati kaj estis kodigitaj kiel "-9" por certigi ilian ekskludon de la analizprocezo.

En la preparado de la demandaro, la fermitaj demandoj estis antaŭkodigitaj per asignado de nombro al ĉiu opcio. La nombro tiam estis uzata por trejni i dati dum analizo (Denscombe 1998, Sapsford kaj Jupp 1996). Ekzemple, estis ses opcioj listigitaj en demando 1 de sekcio B: estraro de direktoroj, altranga oficulo, IT-sekcio, komerca unuo, konsultistoj kaj aliaj. En la dosiero de dati de SPSS, variablo estis generita por "projektiniciinto", kun ses valoretikedoj: "1" por "estraro de direktoroj", "2" por "senior executive" kaj tiel plu. La uzo de la Likertin-skalo en iuj el la fermitaj demandoj ankaŭ permesis senpenan identigon uzante la respondajn nombrajn valorojn enigitajn en SPSS. Por demandoj kun ne ĝisfundaj respondoj, kiuj ne estis reciproke ekskluzivaj, ĉiu opcio estis traktita kiel ununura variablo kun du valoretikedoj: '1 ' por 'kontrolita' kaj '2 ' por 'nemarkita'.

Malfermaj demandoj estis traktataj malsame ol fermitaj demandoj. La respondoj al ĉi tiuj demandoj ne estis enigitaj en SPSS. Anstataŭe, ili estis analizitaj mane. La uzo de ĉi tiu tipo de demando permesas akiri informojn pri libere esprimitaj ideoj kaj personaj spertoj ĉe la respondantoj (Bainbridge 1989, Denscombe 1998). Kie eble, kategoriigo de respondoj estis farita.

Por la analizo de datimetodoj de simpla statistika analizo estas uzataj, kiel la ofteco de respondoj, la meznombro, la norma devio kaj la mediano (Argyrous 1996, Denscombe 1998).
La Gama testo estis efika por akiri kvantajn mezurojn de la asocioj inter dati ordoj (Norusis 1983, Argyrous 1996). Tiuj ĉi testoj estis taŭgaj ĉar la ordaj skaloj uzitaj ne havis multajn kategoriojn kaj povus esti montritaj en tabelo (Norusis 1983).

3.5 Resumo

En ĉi tiu ĉapitro, la esplora metodiko kaj dezajno adoptita por ĉi tiu studo estis diskutitaj.

Elekti la plej taŭgan esplormetodon por aparta studo prenas
konsidero de kelkaj reguloj, inkluzive de la naturo kaj speco de esplorado, same kiel la merits kaj malfortoj de ĉiu ebla metodo (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, yin 1989, Hamilton and ives 1992, Galliers). 1992, neuman 1994). Konsiderante la mankon de ekzistanta scio kaj teorio pri la adopto de datumstokado en Aŭstralio, ĉi tiu esplorstudo postulas interpretan esplormetodon kun esplora kapablo esplori la spertojn de aŭstraliaj organizoj. La elektita esplormetodo estis elektita por kolekti informojn pri la adopto de la datuma stokkoncepto de aŭstraliaj organizoj. Poŝta demandaro estis elektita kiel la kolekta tekniko dati. La pravigoj por la esplormetodo kaj kolekta tekniko dati elektoj estos provizitaj en ĉi tiu ĉapitro. Krome, oni prezentis diskuton pri la analizunuo, la specimeno uzata, la procentoj de respondoj, la enhavo de la demandaro, la antaŭtesto de la demandaro kaj la metodo de analizo de la dati.

Projektado de Datumstokejo:

Kombinante Entajn Rilatojn kaj Dimensian Modeladon

Senstare
Stoku i dati estas grava aktuala afero por multaj organizoj. Ŝlosila problemo en la disvolviĝo de stokado dati ĝi estas lia desegno.
La desegnaĵo devas subteni la detekton de konceptoj en la datuma magazeno al hereda sistemo kaj aliaj fontoj de dati kaj ankaŭ facila kompreno kaj efikeco en la efektivigo de datuma magazeno.
Granda parto de la magazena literaturo dati rekomendas la uzon de enta rilatmodeligado aŭ dimensia modeligado por reprezenti la dezajnon de datuma magazeno.
En ĉi tiu artikolo ni montras kiel ambaŭ reprezentadoj povas esti kombinitaj en aliro al la dezajno de datuma magazeno. La aliro uzata estas sisteme

ekzamenita en kazesploro kaj estas identigita en kelkaj gravaj implicoj kun profesiuloj.

STOKADO DE DATUMOJ

Un datuma magazeno ĝi estas kutime difinita kiel "subjekt-orientita, integra, temp-varia, kaj nevolatila kolekto de datenoj en subteno de la decidoj de administrado" (Inmon kaj Hackathorn, 1994). Subjekt-orientita kaj integrita indikas ke la datuma magazeno estas dizajnita por transiri la funkciajn limojn de heredaĵsistemoj por oferti integran perspektivon de dati.
Tempo-variaĵo temas pri la historia aŭ temposerionaturo de vidbendo dati en datuma magazeno, kiu ebligas analizi tendencojn. Ne-volatile indikas ke la datuma magazeno ĝi ne estas kontinue ĝisdatigita kiel a DataBase de OLTP. Prefere ĝi estas ĝisdatigita periode, kun dati de internaj kaj eksteraj fontoj. La datuma magazeno ĝi estas specife desegnita por esplorado prefere ol ĝisdatigi integrecon kaj operacian efikecon.
La ideo konservi i dati ne estas nova, ĝi estis unu el la celoj de administrado dati ekde la sesdekaj jaroj (Il Martin, 1982).
I datuma magazeno ili proponas la infrastrukturon dati por administradsubtenaj sistemoj. Administradsubtensistemoj inkludas decidhelpsistemojn (DSS) kaj administrajn informsistemojn (EIS). DSS estas komputila informsistemo kiu estas dizajnita por plibonigi procezon kaj sekve homan decidiĝon. EIS estas tipe liversistemo dati kiu ebligas komercajn oficulojn facile aliri la vidon de dati.
La ĝenerala arkitekturo de a datuma magazeno reliefigas la rolon de datuma magazeno en administrado-subteno. Krom proponi la infrastrukturon dati por EIS kaj DSS, al datuma magazeno ĝi povas aliri rekte per demandoj. LA dati inkluzivita en a datuma magazeno estas bazitaj sur analizo de administradinformpostuloj kaj estas akiritaj de tri fontoj: internaj heredaĵsistemoj, specialcelaj datenkaptsistemoj kaj eksteraj datenfontoj. LA dati en internaj heredaĵsistemoj estas ofte redundaj, malkonsekvencaj, de malalta kvalito, kaj stokitaj en malsamaj formatoj do ili devas esti akordigeblaj kaj purigitaj antaŭ ol ili povas esti ŝarĝitaj en la

datuma magazeno (Inmon, 1992; McFadden, 1996). LA dati de stokaj sistemoj dati ad hoc kaj el fontoj dati eksteraj estas ofte uzataj por pligrandigi (ĝisdatigi, anstataŭigi) i dati de heredaj sistemoj.

Estas multaj konvinkaj kialoj por disvolvi a datuma magazeno, kiuj inkludas plibonigitan decidiĝon per la efika uzo de pli da informoj (Ives 1995), subtenon por fokuso sur tutaj aferoj (Graham 1996), kaj redukton en decidaj kostoj. dati por EIS kaj DSS (Graham 1996, McFadden 1996).

Lastatempa empiria studo trovis, averaĝe, profiton de investo por i datuma magazeno je 401% post tri jaroj (Graham, 1996). Tamen, la aliaj empiriaj studoj de datuma magazeno trovis signifajn problemojn inkluzive de malfacileco en mezurado kaj asignado de avantaĝoj, manko de klara celo, subtaksado de la amplekso kaj komplekseco de la procezo de stokado. dati, precipe koncerne la fontojn kaj la purecon de la dati. Konservu i dati povas esti konsiderata kiel solvo al la administradproblemo dati inter organizoj. La manipulado de dati kiel socia rimedo ĝi restis unu el la ŝlosilaj problemoj en administrado de informsistemoj tutmonde dum multaj jaroj (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Populara aliro al aktivadministrado dati en la okdekaj estis la evoluo de modelo dati sociaj. Modelo dati socia estis dizajnita por oferti stabilan bazon por la evoluo de novaj aplikaĵsistemoj ekz DataBase kaj la rekonstruo kaj integriĝo de heredaĵsistemoj (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kim kaj Everest 1994). Tamen, ekzistas pluraj problemoj kun tiu aliro, aparte, la komplekseco kaj kosto de ĉiu tasko, kaj la longa tempo postulata por atingi palpeblajn rezultojn (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997). ).

Il datuma magazeno ĝi estas aparta datumbazo kiu kunekzistas kun la heredaj datumbazoj prefere ol anstataŭigi ilin. Ĝi do permesas vin direkti la administradon de dati kaj eviti multekostan rekonstruadon de heredaj sistemoj.

EKZISTANTA ALIROJ AL DATUMA DEZajno

VERKO

La procezo konstrui kaj perfektigi a datuma magazeno devus esti komprenita pli kiel evolua procezo prefere ol tradicia sistema evolua vivociklo (Deziro, 1995, Shanks, O'Donnell kaj Arnott 1997a). Estas multaj procezoj implikitaj en projekto datuma magazeno kiel komencado, planado; informoj akiritaj de la postuloj petitaj de kompaniaj administrantoj; fontoj, transformoj, purigado de dati kaj sinkronigi de heredaj sistemoj kaj aliaj fontoj dati; liversistemoj evoluantaj; monitorado de datuma magazeno; kaj sensenceco de la evolua procezo kaj de konstruado a datuma magazeno (Stinchi, O'Donnell kaj Arnott 1997b). En ĉi tiu ĵurnalo, ni koncentriĝas pri kiel desegni i dati stokita en la kunteksto de tiuj aliaj procezoj. Ekzistas kelkaj proponitaj aliroj al videoarkitekturo datuma magazeno en la literaturo (Inmon 1994, Ives 1995, Kimball 1994, McFadden 1996). Ĉiu el ĉi tiuj metodaroj havas mallongan revizion kun analizo de iliaj fortoj kaj malfortoj.

La Aliro de Inmon (1994) por Datumstokejo dezajno

Inmon (1994) proponis kvar ripetantajn paŝojn por dizajni a datuma magazeno (vidu figuron 2). La unua paŝo estas desegni ŝablonon dati socia kompreni kiel i dati povas esti integrita trans funkciaj areoj ene de organizo subdividante i dati stoki en areoj. Modelo dati ĝi estas farita por stokado dati rilata al decidofarado, inkluzive dati historia, kaj inkluzivita dati deduktita kaj kunigita. La dua paŝo estas identigi temojn por efektivigo. Ĉi tiuj baziĝas sur prioritatoj determinitaj de aparta organizo. La tria paŝo implikas desegni a DataBase por la temo, aparte atentu inkluzivi taŭgajn nivelojn de granulareco. Inmon rekomendas uzi la modelon de ento kaj rilato. La kvara paŝo estas identigi fontsistemojn dati postulis kaj evoluigi transformajn procezojn por kapti, purigi kaj formatigi i dati.

La fortoj de la aliro de Inmon estas ke la modelo dati socia proponas la bazon por la integriĝo de dati ene de la organizado kaj planado subtenoj por la ripeta evoluo de datuma magazeno. Ĝiaj malavantaĝoj estas la malfacileco kaj kosto de desegnado de la modelo dati socia, la malfacileco por kompreni modelojn de estaĵoj kaj rilatoj uzataj en ambaŭ modeloj, tio dati socia kaj tiu de dati stokita per temo, kaj la taŭgeco de la dati de la desegno de datuma magazeno por la farado de DataBase rilata sed ne por DataBase plurdimensia.

Ives' (1995) Alproksimiĝo al Datumstokejo dezajno

Ives (1995) proponas kvar-ŝtupan aliron al dizajnado de informsistemo kiun li kredas estas uzebla al la dezajno de datuma magazeno (vidu figuron 3). La aliro estas tre bazita sur Informa Inĝenierado por la evoluo de informsistemoj (Martin 1990). La unua paŝo estas determini viajn celojn, sukceson kaj kritikajn faktorojn, kaj ŝlosilajn rendimentajn indikilojn. Ŝlosilaj komercaj procezoj kaj la necesaj informoj estas modeligitaj por konduki nin al modelo dati sociaj. La dua paŝo implikas evoluigi difinan arkitekturon dati stokita laŭ areo, DataBase di datuma magazeno, la teknologiokomponentoj kiuj estas postulataj, la aro de organiza subteno postulata por efektivigi kaj funkcii kun datuma magazeno. La tria paŝo inkluzivas la elekton de postulataj programarpakaĵoj kaj iloj. La kvara paŝo estas la detala dezajno kaj konstruado de la datuma magazeno. Ives notas tiun vendejon dati ĝi estas limigita ripeta procezo.

La fortoj de la Ives-aliro estas la uzo de teknikaj specifoj por determini informpostulojn, la uzo de strukturita procezo por subteni la integriĝon de datuma magazeno, la taŭga aparataro kaj softvarelekto, kaj la uzo de multoblaj reprezentaj teknikoj por la datuma magazeno. Ĝiaj difektoj estas enecaj en komplekseco. Aliaj inkluzivas malfacilecon disvolvi multajn nivelojn de DataBase ene de la datuma magazeno en racia tempo kaj kosto.

La alproksimiĝo de Kimball (1994) al Datumstokejo dezajno

Kimball (1994) proponis kvin ripetantajn ŝtupojn por dizajnado de a datuma magazeno (vidu Figurojn 4). Lia aliro estas precipe dediĉita al la desegnaĵo de soloo datuma magazeno kaj sur la uzo de dimensiaj modeloj en prefero al unuo kaj rilatmodeloj. Kimball analizas tiujn dimensiajn modelojn ĉar estas pli facile por komercgvidantoj kompreni komercon, ĝi estas pli efika kiam traktas kompleksajn konsultojn, kaj la dezajnon de DataBase fizika estas pli efika (Kimball 1994). Kimball agnoskas ke disvolvi a datuma magazeno estas ripeta, kaj tio datuma magazeno disigitaj povas esti integritaj per la divido en tabelojn de komunaj dimensioj.

La unua paŝo estas identigi la specialan temon por perfektigi. La dua kaj tria paŝoj implikas dimensian formadon. En la dua paŝo la mezuroj identigas aferojn de intereso en la temo kaj grupigas ilin en faktabelon. Ekzemple, en venda temo la mezuroj de intereso povus inkluzivi la kvanton de eroj venditaj kaj la dolaro kiel venda valuto. La tria paŝo implikas identigi dimensiojn kiuj estas la manieroj en kiuj faktoj povas esti grupigitaj. En venda temo, koncernaj dimensioj povus inkluzivi objekton, lokon kaj tempoperiodon. La faktotabelo havas plurpartan ŝlosilon por ligi ĝin al ĉiu el la dimensiotabeloj kaj tipe enhavas tre grandan nombron da faktoj. En kontrasto, dimensiotabeloj enhavas priskribajn informojn pri dimensioj kaj aliaj atributoj kiuj povas esti uzitaj por grupigi faktojn. La proponita rilata fakto kaj dimensiotabelo formas tion, kio estas nomita stelskemo pro sia formo. La kvara paŝo implikas konstrui a DataBase plurdimensia por perfektigi la ŝablonon de la stelo. La fina paŝo estas identigi fontsistemojn dati postulis kaj evoluigi transformajn procezojn por kapti, purigi kaj formatigi i dati.

Fortoj de la aliro de Kimball inkludas la uzon de dimensiaj modeloj por reprezenti i dati stokita kio faciligas kompreni kaj kondukas al efika fizika dezajno. Dimensia modelo kiu ankaŭ facile uzas ambaŭ sistemojn DataBase rilataj povas esti perfektigitaj aŭ sistemoj DataBase plurdimensia. Ĝiaj difektoj inkluzivas la mankon de iuj teknikoj por faciligi la planadon aŭ integriĝon de multaj stelskemoj ene de a datuma magazeno kaj la malfacileco de desegnado de la ekstrema denormaligita strukturo en dimensia modelo a dati en heredaj sistemoj.

La Aliro al Datenoj de McFadden (1996). Dezajno de Stokejo

McFadden (1996) proponas kvin-ŝtupan aliron al desegnado a datuma magazeno (vidu figuron 5).
Lia aliro estas bazita sur sintezo de ideoj de la literaturo kaj estas temigis la dezajnon de unuopaĵo datuma magazeno. La unua paŝo implikas analizon de postuloj. Dum teknikaj specifoj ne estas preskribitaj, la notoj de McFadden identigas unuojn dati specifoj kaj iliaj atributoj, kaj plusendas legantojn Watson kaj Frolick (1993) por kaptado de la postuloj.
En la dua paŝo, modelo de enta rilato estas desegnita datuma magazeno kaj poste validigita de kompaniaj oficuloj. La tria paŝo implikas determini la mapadon de heredaj sistemoj kaj eksteraj fontoj de datuma magazeno. La kvara paŝo implikas procezojn en evoluigado, deplojado kaj sinkronigado dati nel datuma magazeno. En la fina paŝo, la livero de la sistemo estas disvolvita kun emfazo de uzantinterfaco. McFadden notas ke la desegna procezo estas ĝenerale ripeta.

La fortoj de la aliro de McFadden estas la implikiĝo de komercgvidantoj en determinado de postuloj same kiel la graveco de resursoj. datiilia purigado kaj kolekto. Ĝiaj difektoj estas la manko de procezo por dividi grandan projekton datuma magazeno en multaj integraj stadioj, kaj tie

malfacileco kompreni la enton kaj rilatmodelojn uzitajn en la dezajno de datuma magazeno.

Ne nur tiuj, kiuj estas proksime al ni, elektas nin.

    0/5 (0 Recenzoj)
    0/5 (0 Recenzoj)
    0/5 (0 Recenzoj)

    Eksciu pli de Interreta Reta Agentejo

    Abonu por ricevi la plej novajn artikolojn retpoŝte.

    aŭtoro avataro
    administristo CEO
    👍Enreta Reta Agentejo | Reta Agentejo spertulo pri Cifereca Merkatado kaj SEO. Reta Agentejo Online estas Reta Agentejo. Por Agenzia Web Online sukceso en cifereca transformo baziĝas sur la fundamentoj de Iron SEO-versio 3. Specialaĵoj: Sistemintegriĝo, Enterprise Aplika Integriĝo, Servo-Orientita Arkitekturo, Nuba Komputado, Datuma stokejo, komerca inteligenteco, Granda Datumo, portaloj, intraretoj, TTT-apliko Dezajno kaj administrado de rilataj kaj plurdimensiaj datumbazoj Projektado de interfacoj por ciferecaj amaskomunikiloj: uzebleco kaj Grafiko. Interreta Reta Agentejo proponas al kompanioj la jenajn servojn: -SEO en Google, Amazon, Bing, Yandex; -Reta Analitiko: Google Analytics, Google Tag Manager, Yandex Metrica; -Konvertoj de uzantoj: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM en Google, Bing, Amazon Ads; -Merkatado pri Socia Amaskomunikilaro (Facebook, Linkedin, Youtube, Instagram).
    Mia Lerta Privateco
    Ĉi tiu retejo uzas teknikajn kaj profilajn kuketojn. Alklakante akcepti vi rajtigas ĉiujn profilajn kuketojn. Alklakante malakcepton aŭ la X, ĉiuj profilaj kuketoj estas malakceptitaj. Alklakante personecigi eblas elekti kiajn profilajn kuketojn aktivigi.
    Ĉi tiu retejo konformas al la Leĝo pri Protekto de Datumoj (LPD), la Svisa Federacia Leĝo de la 25-a de septembro 2020 kaj la GDPR, EU-Regulamento 2016/679, rilate al la protekto de personaj datumoj kaj al la libera movado de tiaj datumoj.