fbpx

Emmagatzematge de dades i planificació de recursos empresarials | DWH i ERP

ARXIU DADES CENTRAL : HISTÒRIA ED EVOLUCIÓ

Els dos temes dominants de la tecnologia corporativa a la dècada de 90 eren i magatzem de dades i l'ERP. Durant molt de temps, aquests dos poderosos fluxos han estat part de la TI corporativa sense haver-hi mai una intersecció. Era gairebé com si fossin matèria i antimatèria. Però el creixement d'ambdós fenòmens ha portat inevitablement a la seva intersecció. Avui les empreses s'enfronten al problema de què fer amb ERP i magatzem de dades. En aquest article s'explicarà quins són els problemes i com els aborden les empreses.

AL COMENÇAMENT…

Al principi hi havia el magatzem de dades. Magatzem de dades va néixer per contrarestar el sistema d'aplicacions de processament de transaccions. En els primers temps la memorització de Dati havia de ser només un contrapunt a les aplicacions de processament de transaccions. Però avui dia hi ha visions molt més sofisticades del que a magatzem de dades. En el món actual el magatzem de dades s'insereix dins d'una estructura que es pot anomenar Fàbrica d'Informació Corporativa.

LA FÀBRICA DE LA INFORMACIÓ CORPORATIVA (CIF)

La fàbrica d'informació corporativa té components arquitectònics estàndard: una capa d'integració i transformació de codi que integra i Dati mentre jo Dati passen de l'entorn de l'aplicació a l'entorn del magatzem de dades de l'empresa; a magatzem de dades de l'empresa on el Dati historiadors detallats i integrats. El magatzem de dades de l'empresa serveix com a base sobre la qual es poden construir totes les altres parts del medi ambient magatzem de dades; un magatzem de dades operacionals (ODS). Una ODS és una estructura híbrida que conté algun aspecte del magatzem de dades i altres aspectes d'un entorn OLTP; data marts, on diferents departaments poden tenir la seva pròpia versió del magatzem de dades; 1 magatzem de dades exploració on els pensadors de l'empresa poden enviar les seves consultes de 72 hores sense cap efecte perjudicial per al magatzem de dades; i una memòria propera, en la qual Dati vell i Dati Els detalls a granel es poden emmagatzemar a baix cost.

ON ES COMBINA L'ERP AMB EL FÀBRICA D'INFORMACIÓ CORPORATIVA

L'ERP es fusiona amb la Fàbrica d'Informació Corporativa en dos llocs. Principalment com a aplicació de referència que proporciona i Dati de l'aplicació a magatzem de dades. En aquest cas i Dati, generats com a subproducte d'un procés de transacció, s'integren i es carreguen al magatzem de dades de l'empresa. El segon enllaç entre ERP i CIF és l'ODS. De fet, en molts entorns l'ERP s'utilitza com a ODS clàssic.

En cas que l'ERP s'utilitzi com a aplicació bàsica, el mateix ERP també es pot utilitzar al CIF com a ODS. En qualsevol cas, si s'ha d'utilitzar l'ERP en ambdues funcions, cal que hi hagi una clara distinció entre les dues entitats. En altres paraules, quan l'ERP té el paper d'aplicació base i ODS, cal distingir les dues entitats arquitectòniques. Si una sola implementació d'un ERP intenta complir ambdues funcions simultàniament, inevitablement hi haurà problemes en el disseny i la implementació d'aquesta estructura.

SEPARA ODS I APLICACIONS BÀSIQUES

Hi ha moltes raons que porten a la divisió dels components arquitectònics. Potser el punt més revelador a l'hora de separar els diferents components d'una arquitectura és que cada component de l'arquitectura té la seva pròpia visió. L'aplicació de referència té un propòsit diferent de l'ODS. Proveu de superposar-vos

una visió de referència de l'aplicació sobre el món d'un ODS o viceversa no és una manera justa de treballar.

En conseqüència, el primer problema d'un ERP al CIF és verificar si hi ha una distinció entre les aplicacions de referència i les ODS.

MODELS DE DADES A LA CORPORATIVA FÀBRICA DE LA INFORMACIÓ

Per aconseguir la cohesió entre els diferents components de l'arquitectura CIF, cal que hi hagi un model de Dati. Els models de Dati serveixen d'enllaç entre els diferents components de l'arquitectura, com ara les aplicacions de base i l'ODS. Els models de Dati es converteixen en el “mapa de ruta intel·lectual” per obtenir el significat adequat dels diferents components arquitectònics del CIF.

Anant de la mà d'aquesta noció, la idea és que hi hauria d'haver un patró gran i únic Dati. Òbviament hi ha d'haver un patró Dati per a cadascun dels components i, a més, hi ha d'haver un camí sensible que connecti els diferents models. Cada component de l'arquitectura: ODS, aplicacions de referència, magatzem de dades de l'empresa, etc. – necessita un model propi de Dati. I, per tant, ha d'haver una definició precisa de com funcionen aquests models Dati interaccionen entre si.

MOVE I DADES DE L'ERP A LES DADES EL magatzem

Si l'origen del Dati és una aplicació de referència i/o una ODS, quan l'ERP insereix i Dati en magatzem de dades, aquesta inserció s'ha de fer al nivell més baix de "granularitat". Simplement recapituleu o sumeu i Dati ja que surten de l'aplicació ERP baseline o ERP ODS no és el correcte. EL Dati es necessiten detalls al magatzem de dades per constituir la base del procés DSS. Tal Dati seran remodelats de moltes maneres mitjançant els data mart i l'exploració magatzem de dades.

El trasllat de Dati des de l'entorn d'aplicació de referència ERP fins a magatzem de dades de l'empresa es fa d'una manera raonablement relaxada. Aquest moviment es produeix aproximadament 24 hores després de l'actualització o creació a l'ERP. El fet de tenir un moviment "mandrós" del Dati en magatzem de dades de l'empresa permet el Dati procedent de l'ERP per "assentar". Una vegada i Dati s'emmagatzemen a l'aplicació de línia de base, llavors podeu moure el fitxer amb seguretat Dati de l'ERP a l'empresa. Un altre objectiu que es pot aconseguir gràcies al moviment "mandrós" de la Dati és la clara delimitació entre processos operatius i DSS. Amb un moviment "ràpid" del Dati la línia entre el DSS i l'operativa segueix sent vaga.

El moviment de Dati des de l'ODS de l'ERP a magatzem de dades de l'empresa es fa periòdicament, normalment setmanalment o mensualment. En aquest cas el moviment de Dati es basa en la necessitat de “netejar” els antics Dati historiadors. Naturalment, l'ODS conté i Dati que són molt més noves que les Dati historiadors trobats al magatzem de dades.

El trasllat de Dati en magatzem de dades gairebé mai es fa "a l'engròs" (de manera majorista). Copieu una taula de l'entorn ERP a magatzem de dades no té sentit. Un enfocament molt més realista és moure unitats seleccionades de Dati. Només el Dati que han canviat des de l'última actualització del magatzem de dades són els que s'han de traslladar al magatzem de dades. Una manera de saber quins Dati han canviat des de l'última actualització és mirar les marques de temps de Dati que es troben a l'entorn ERP. El dissenyador selecciona tots els canvis que s'han produït des de l'última actualització. Un altre enfocament és utilitzar tècniques de captura de canvis Dati. Amb aquestes tècniques s'analitzen registres i cintes de diari per tal de determinar quins Dati s'ha de traslladar de l'entorn ERP al de magatzem de dades. Aquestes tècniques són les millors, ja que els registres i les cintes de diari es poden llegir des dels fitxers ERP sense més efectes sobre altres recursos ERP.

ALTRES COMPLICACIONS

Un dels problemes d'ERP al CIF és el que passa amb altres fonts d'aplicació o ai Dati de les SAO a les quals han de contribuir magatzem de dades però no formen part de l'entorn ERP. Donada la naturalesa tancada de l'ERP, especialment SAP, s'intenta integrar claus de fonts externes de Dati amb i Dati que provenen de l'ERP en el moment del trasllat i Dati en magatzem de dades, és un gran repte. I quines són exactament les probabilitats que i Dati d'aplicacions o ODS fora de l'entorn ERP s'integraran al magatzem de dades? En realitat, les probabilitats són molt altes.

TROBAR DADES HISTÒRIC DES D'ERP

Un altre problema amb i Dati d'ERP és el que es deriva de la necessitat de tenir Dati historiadors dins del magatzem de dades. Normalment el magatzem de dades necessitats Dati historiadors. I la tecnologia ERP normalment no els emmagatzema Dati històrica, almenys no en la mesura que sigui necessari en el magatzem de dades. Quan una gran quantitat de Dati Els registres comencen a acumular-se a l'entorn ERP, aquest entorn s'ha de netejar. Per exemple, suposem a magatzem de dades s'hauria de carregar amb cinc anys de Dati històric mentre que l'ERP en conserva un màxim de sis mesos Dati. Sempre que l'empresa estigui satisfeta de recollir un nombre de Dati històric a mesura que passa el temps, llavors no hi ha cap problema per utilitzar l'ERP com a font magatzem de dades. Però quan el magatzem de dades cal tornar enrere en el temps i agafar déus Dati historial que l'ERP no ha recopilat i desat prèviament, llavors l'entorn ERP es torna ineficient.

ERP I METADADES

Una altra consideració a fer sobre l'ERP e magatzem de dades és el de les metadades existents a l'entorn ERP. De la mateixa manera que les metadades es mouen de l'entorn ERP al magatzem de dades, les metadades s'han de moure de la mateixa manera. A més, les metadades s'han de transformar en el format i l'estructura requerits per la infraestructura magatzem de dades. Hi ha una gran diferència entre les metadades operatives i les metadades DSS. Les metadades operatives són principalment per al desenvolupador i per a

programador. Les metadades DSS són principalment per a l'usuari final. Les metadades existents en aplicacions ERP o ODS s'han de convertir i aquesta conversió no sempre és fàcil i senzilla.

OBTENCIÓ DE DADES DE L'ERP

Si l'ERP s'utilitza com a proveïdor de Dati per al magatzem de dades hi ha d'haver una interfície sòlida que mogui i Dati de l'entorn ERP a l'entorn magatzem de dades. La interfície ha de:

  • ▪ sigui fàcil d'utilitzar
  • ▪ permetre l'accés a Dati de l'ERP
  • ▪ recollir el significat de Dati als quals s'estan traslladant magatzem de dades
  • ▪ conèixer les limitacions de l'ERP que podrien sorgir en accedir al Dati de l'ERP:
  • ▪ integritat referencial
  • ▪ relacions jeràrquiques
  • ▪ relacions lògiques implícites
  • ▪ conveni d'aplicació
  • ▪ totes les estructures de Dati suportat per l'ERP, etc.
  • ▪ ser eficient en l'accés Dati, proveïnt:
  • ▪ moviment directe de Dati
  • ▪ adquisició del canvi Dati
  • ▪ donar suport a l'accés puntual a Dati
  • ▪ comprendre el format del Dati, etcètera… INTERFÀCIES AMB SAP La interfície pot ser de dos tipus, pròpia o comercial. Algunes de les principals interfícies comercials inclouen:
  • ▪ SAS
  • ▪ Solucions Prime
  • ▪ D2k, i així successivament... MÚLTIPLES TECNOLOGIES ERP Tractar l'entorn ERP com si fos una sola tecnologia és un gran error. Hi ha moltes tecnologies ERP, cadascuna amb els seus punts forts. Els venedors més coneguts del mercat són:
  • ▪ SAP
  • ▪ Oracle Financials
  • ▪ PeopleSoft
  • JD Edwards
  • ▪ Baans SAP SAP és el programari ERP més gran i complet. Les aplicacions SAP inclouen molts tipus d'aplicacions en moltes àrees. SAP té fama de ser:
  • ▪ molt gran
  • ▪ molt difícil i costós d'implementar
  • ▪ necessita molta gent i consultors per implementar
  • ▪ necessita persones especialitzades per a la implementació
  • ▪ necessita molt de temps per implementar. També SAP té fama de memoritzar-ne Dati de prop, cosa que dificulta l'accés a ells fora de l'àrea SAP. La força de SAP és que és capaç de capturar i emmagatzemar una gran quantitat de Dati. SAP va anunciar recentment la seva intenció d'estendre les seves aplicacions a magatzem de dades. Hi ha molts avantatges i contres per utilitzar SAP com a venedor magatzem de dades. Un avantatge és que SAP ja està instal·lat i la majoria dels consultors ja estan familiaritzats amb SAP.
    Els inconvenients de tenir SAP com a proveïdor de magatzem de dades són molts: SAP no té experiència en el món de magatzem de dades Si SAP és el proveïdor de magatzem de dades, cal “treure” i Dati de SAP a magatzem de dades. Dada un historial de SAP de sistema tancat, és poc probable que sigui fàcil obtenir-me de SAP en ell (???). Hi ha molts entorns heretats que alimenten SAP, com ara IMS, VSAM, ADABAS, ORACLE, DB2, etc. SAP insisteix en un enfocament "no inventat aquí". SAP no vol associar-se amb altres proveïdors per utilitzar o crear el magatzem de dades. SAP insisteix a generar tot el seu propi programari.

Tot i que SAP és una empresa gran i potent, el fet d'intentar reescriure la tecnologia d'ELT, OLAP, administració de sistemes i fins i tot el codi base de la dbms és simplement una bogeria. En lloc d'adoptar una actitud de cooperació amb els proveïdors magatzem de dades Des de fa temps, SAP ha seguit l'enfocament que "coneixen millor". Aquesta actitud frena l'èxit que podria tenir SAP en l'àmbit magatzem de dades.
La negativa de SAP a permetre als venedors externs accedir ràpidament i amb gràcia als seus Dati. L'essència mateixa d'utilitzar a magatzem de dades és de fàcil accés Dati. Tota la història de SAP es basa en dificultar l'accés Dati.
La manca d'experiència de SAP en el tractament de grans volums de Dati; en el camp de magatzem de dades hi ha volums de Dati mai vist des de SAP i per gestionar aquestes grans quantitats Dati cal tenir la tecnologia adequada. SAP aparentment no és conscient d'aquesta barrera tecnològica que hi ha per entrar al camp magatzem de dades.
Cultura corporativa de SAP: SAP ha construït un negoci per aconseguir i Dati del sistema. Però per fer-ho cal tenir una mentalitat diferent. Tradicionalment, les empreses de programari que eren bones a l'hora d'introduir dades en un entorn no han estat bones per aconseguir que les dades anessin cap a un altre camí. Si SAP aconsegueix fer aquest tipus de canvi, serà la primera empresa que ho farà.

En resum, és qüestionable si una empresa hauria de seleccionar SAP com a proveïdor magatzem de dades. Hi ha riscos molt greus d'una banda i molt poques recompenses per l'altra. Però hi ha un altre motiu que descoratja triar SAP com a proveïdor magatzem de dades. Perquè totes les empreses haurien de tenir el mateix magatzem de dades de totes les altres empreses? El magatzem de dades és el cor de l'avantatge competitiu. Si totes les empreses adoptessin el mateix magatzem de dades seria difícil, encara que no impossible, aconseguir un avantatge competitiu. SAP sembla pensar que a magatzem de dades es pot veure com una galeta i aquest és un signe més de la seva mentalitat d'"introduir les dades a" les aplicacions.

Cap altre proveïdor d'ERP és tan dominant com SAP. Sens dubte, hi haurà empreses que aniran pel seu camí SAP magatzem de dades però presumiblement aquests magatzem de dades Els SAP seran grans, costosos i requereixen molt de temps.

Aquests entorns inclouen activitats com ara el processament de caixers bancaris, processos de reserves de companyies aèries, processos de reclamacions d'assegurances, etc. Com millor funcionava el sistema de transaccions, més evident era la necessitat de separar el procés operatiu i el DSS (Decision Support System). Tanmateix, amb els sistemes de recursos humans i de personal, mai no us enfronteu a grans volums de transaccions. I, per descomptat, quan una persona és contractada o deixa l'empresa, aquest és el registre d'una transacció. Però en relació amb altres sistemes, els sistemes de recursos humans i de personal simplement no tenen moltes transaccions. Per tant, en els sistemes de recursos humans i de personal no és del tot obvi que hi hagi una necessitat d'un DataWarehouse. En molts aspectes, aquests sistemes són fusions de sistemes DSS.

Però hi ha un altre factor que cal tenir en compte quan es tracta de datawarehouse i PeopleSoft. En molts cercles, i Dati Els recursos humans i personals són secundaris al negoci principal de l'empresa. La majoria de les empreses fabriquen, venen, ofereixen serveis, etc. Els sistemes de recursos humans i de personal solen ser secundaris (o donen suport) a la línia de negoci principal de l'empresa. Per tant, és equívoc i inconvenient a magatzem de dades separat per al suport de recursos humans i personal.

PeopleSoft és molt diferent de SAP en aquest sentit. Amb SAP, és obligatori que hi hagi un magatzem de dades. Amb PeopleSoft, no està tan clar. Un magatzem de dades és opcional amb PeopleSoft.

El millor que es pot dir del Dati PeopleSoft és que el magatzem de dades es pot utilitzar per arxivar i Dati relacionats amb antics recursos humans i personals. Una segona raó per la qual una empresa voldria utilitzar a magatzem de dades a

L'inconvenient de l'entorn PeopleSoft és permetre l'accés i accés gratuït a les eines d'anàlisi, ai Dati per PeopleSoft. Però més enllà d'aquests motius, pot haver-hi casos en què és preferible no disposar d'un magatzem de dades Dati PeopleSoft.

En resum

Hi ha moltes idees relacionades amb la construcció d'a magatzem de dades dins d'un programari ERP.
Alguns d'aquests són:

  • ▪ Té sentit tenir un magatzem de dades qui s'assembla a qualsevol altre del sector?
  • ▪ Què tan flexible és un ERP magatzem de dades programari?
  • ▪ Un ERP magatzem de dades el programari pot gestionar un volum de Dati que es troba en amagatzem de dades arena"?
  • ▪ Quin és el registre de traça que fa el venedor d'ERP davant d'una intel·ligència fàcil i barata, que requereix temps Dati? (Quin és el historial dels proveïdors d'ERP en el lliurament de dades de baix cost, a temps i de fàcil accés?)
  • ▪ Quina és la comprensió del proveïdor ERP de l'arquitectura DSS i la fàbrica d'informació corporativa?
  • ▪ Els venedors d'ERP entenen com aconseguir-ho Dati dins del medi ambient, però també entenem com exportar-los?
  • ▪ Quina obertura té el proveïdor d'ERP a les eines d'emmagatzematge de dades?
    Totes aquestes consideracions s'han de tenir en compte a l'hora de determinar on posar el magatzem de dades que acollirà i Dati de l'ERP i altres Dati. En general, tret que hi hagi una raó convincent per fer el contrari, es recomana construir magatzem de dades fora de l'entorn del proveïdor ERP. CAPÍTOL 1 Visió general de l'organització de BI Punts clau:
    Els dipòsits d'informació funcionen de manera oposada a l'arquitectura d'intel·ligència empresarial (BI):
    La cultura corporativa i les TI poden limitar l'èxit de la creació d'organitzacions de BI.

La tecnologia ja no és el factor limitant per a les organitzacions de BI. El problema per als arquitectes i els planificadors de projectes no és si la tecnologia existeix, sinó si poden implementar efectivament la tecnologia disponible.

Per a moltes empreses a magatzem de dades és poc més que un dipòsit passiu que distribueix i Dati als usuaris que ho necessitin. EL Dati s'extreuen dels sistemes font i s'omplen en estructures de destinació per magatzem de dades. Jo Dati també es poden netejar amb sort. No obstant això, no s'afegeix ni recull cap valor addicional Dati durant aquest procés.

Essencialment, dw passiu, en el millor dels casos, només proporciona i Dati net i operatiu per a les associacions d'usuaris. La creació d'informació i la comprensió analítica depenen completament dels usuaris. Avaluar si el DW (Magatzem de dades) si un èxit és subjectiu. Si jutgem l'èxit per la capacitat de recollir, integrar i netejar de manera eficient i Dati corporativa de manera previsible, llavors sí, el DW és un èxit. D'altra banda, si mirem la recollida, consolidació i explotació de la informació de l'organització en el seu conjunt, aleshores el DW és un fracàs. Un DW proporciona poc o cap valor d'informació. Com a resultat, els usuaris es veuen obligats a conformar-se, creant així sitges d'informació. Aquest capítol presenta una visió integral per resumir l'arquitectura de BI (Business Intelligence) empresarial. Comencem amb una descripció de la BI i després passem a les discussions sobre el disseny i desenvolupament d'informació, en lloc de simplement proporcionar Dati als usuaris. A continuació, les discussions se centren a calcular el valor dels vostres esforços de BI. Acabem definint com IBM aborda els requisits arquitectònics de BI de la vostra organització.

Descripció de l'arquitectura Organització de BI

Els potents sistemes d'informació orientats a les transaccions estan ara a l'ordre del dia a totes les grans empreses, la qual cosa permet igualar de manera efectiva el terreny de joc per a les corporacions d'arreu del món.

Per continuar sent competitiu, però, ara requereix sistemes orientats a l'anàlisi que puguin revolucionar la capacitat d'una empresa de redescobrir i utilitzar la informació que ja té. Aquests sistemes analítics es deriven de la comprensió de la riquesa de Dati disponible. La BI pot millorar el rendiment de tota la informació de l'empresa. Les empreses poden millorar les relacions client-proveïdor, millorar la rendibilitat dels productes i serveis, generar ofertes noves i millors, controlar el risc i, entre molts altres guanys, reduir les despeses dràsticament. Amb la BI, finalment la teva empresa comença a utilitzar la informació del client com a actiu competitiu gràcies a aplicacions que tenen objectius de mercat.

Tenir els mitjans de negoci adequats significa tenir respostes definitives a preguntes clau com ara:

  • ▪ Quin dels nostres clients Ens fan guanyar més, o ens fan perdre diners?
  • ▪ On viuen els nostres millors clients en relació a botiga/ magatzem que freqüenten?
  • ▪ Quins dels nostres productes i serveis es poden vendre de manera més eficaç i a qui?
  • ▪ Quins productes es poden vendre amb més eficàcia i a qui?
  • ▪ Quina campanya de vendes té més èxit i per què?
  • ▪ Quins canals de venda són més efectius per a quins productes?
  • ▪ Com podem millorar les relacions amb els nostres millors clients? La majoria de les empreses ho tenen Dati difícil de respondre aquestes preguntes.
    Els sistemes operatius generen grans quantitats de producte, client i cost Dati des dels punts de venda, reserves, atenció al client i sistemes de suport tècnic. El repte és extreure i explotar aquesta informació. Moltes empreses es beneficien només de petites fraccions de les seves Dati per a anàlisis estratègiques.
    I Dati restant, sovint combinat amb i Dati Les fonts externes derivades, com ara informes governamentals i altres informacions comprades, són una mina d'or a l'espera de ser explorada i Dati només cal perfeccionar-los en el context informatiu de la vostra organització.

Aquest coneixement es pot aplicar de diverses maneres, que van des del disseny d'una estratègia corporativa global fins a la comunicació personal amb els proveïdors, passant per centres de trucades, facturació, Internet i altres punts. L'entorn empresarial actual imposa que DW i les solucions de BI relacionades evolucionin més enllà de l'execució d'estructures empresarials tradicionals. Dati com jo Dati normalitzat a nivell atòmic i "granges estrella/cub".

El que cal per seguir sent competitiu és una fusió de tecnologies tradicionals i avançades en un esforç per donar suport a un panorama analític ampli.
Finalment, l'entorn general ha de millorar el coneixement del conjunt de l'empresa, procurant que les actuacions realitzades com a resultat de les anàlisis realitzades siguin útils perquè tothom se'n beneficiï.

Per exemple, suposem que classifiqueu el vostre clients en categories de risc alt o baix.
Tant si aquesta informació és generada per un model de mineria com per altres mitjans, s'ha de posar al DW i fer-la accessible per a qualsevol, mitjançant qualsevol eina d'accés, com ara informes estàtics, fulls de càlcul, taules o processament analític en línia (OLAP).

Tanmateix, actualment, gran part d'aquest tipus d'informació roman en sitges Dati dels individus o departaments que generen l'anàlisi. L'organització en el seu conjunt té poca o cap visibilitat per a la comprensió. Només combinant aquest tipus de contingut d'informació a la vostra empresa DW podeu eliminar les sitges d'informació i millorar el vostre entorn DW.
Hi ha dos obstacles principals per desenvolupar una organització de BI.
En primer lloc, tenim el problema de la pròpia organització i la seva disciplina.
Tot i que no podem ajudar amb els canvis de política de l'organització, podem ajudar a entendre els components de la BI d'una organització, la seva arquitectura i com la tecnologia d'IBM facilita el seu desenvolupament.
La segona barrera a superar és la manca de tecnologia integrada i el coneixement d'un mètode que crida a tot l'espai de BI en lloc de només un petit component.

IBM està responent als canvis en la integració de la tecnologia. És la vostra responsabilitat proporcionar un disseny conscient. Aquesta arquitectura s'ha de desenvolupar amb tecnologia escollida per a una integració sense restriccions, o com a mínim, amb tecnologia que s'adhereixi als estàndards oberts. Així mateix, la direcció de la vostra empresa ha d'assegurar-se que l'empresa Bi es duu a terme en els terminis previstos i no la de permetre el desenvolupament de sitges d'informació que sorgeixen d'agendas o objectius d'autoservei.
Això no vol dir que l'entorn de BI no sigui sensible a reaccionar a les diferents necessitats i requeriments dels diferents usuaris; en canvi, vol dir que la implementació d'aquestes necessitats i requisits individuals es fa en benefici de tota l'organització de BI.
A la figura 9 es pot trobar una descripció de l'arquitectura de l'organització de BI a la pàgina 1.1. L'arquitectura demostra una combinació rica de tecnologies i tècniques.
Des de la visió tradicional, l'arquitectura inclou els següents components del magatzem

Capa atòmica (capa atòmica).

Aquest és el fonament, el cor de tot el Dw i, per tant, de l'informe estratègic.
I Dati emmagatzemats aquí conservaran la integritat històrica, els informes de Dati i inclouen mètriques derivades, a més de netejar, integrar i emmagatzemar mitjançant models de mineria.
Tot l'ús posterior d'aquests Dati i la informació relacionada es deriva d'aquesta estructura. Aquesta és una excel·lent font per a la mineria Dati i per als informes amb consultes SQL estructurades

Magatzem operatiu de Dati o base d'informe de Dati(Magatzem de dades operacionals (ODS) o informes database.)

Aquesta és una estructura de Dati dissenyat específicament per a informes tècnics.

I Dati emmagatzemats i informats per sobre d'aquestes estructures poden eventualment propagar-se al magatzem a través de la zona d'escenificació, on es podria utilitzar per a la senyalització estratègica.

Zona d'escenificació.

La primera parada per a la majoria Dati destinada a l'entorn del magatzem és la zona d'organització.
Aquí jo Dati s'integren, netegen i es transformen Dati beneficis que poblaran l'estructura del magatzem

Data marts.

Aquesta part de l'arquitectura representa l'estructura de Dati utilitzat específicament per a OLAP. La presència de datamarts, si i Dati s'emmagatzemen en els esquemes d'estrelles que superposen Dati multidimensional en un entorn relacional, o en els fitxers de Dati La propietat utilitzada per tecnologia OLAP específica, com ara DB2 OLAP Server, no és rellevant.

L'única limitació és que l'arquitectura facilita l'ús de Dati multidimensional.
L'arquitectura també inclou tecnologies i tècniques Bi crítiques que es distingeixen com:

Anàlisi espacial

L'espai és un benefici d'informació per a l'analista i és fonamental per a una resolució completa. L'espai pot representar informació sobre les persones que viuen en un lloc determinat, així com informació sobre on es troba físicament aquesta ubicació en relació amb la resta del món.

Per realitzar aquesta anàlisi, heu de començar lligant la vostra informació a les coordenades de latitud i longitud. Això s'anomena "geocodificació" i ha de formar part del procés d'extracció, transformació i càrrega (ETL) a nivell atòmic del vostre magatzem.

Mineria de dades.

L'extracció de Dati permet a les nostres empreses créixer el nombre de clients, per predir les tendències de vendes i permetre la gestió de les relacions amb i clients (CRM), entre altres iniciatives de BI.

L'extracció de Dati per tant, s'ha d'integrar amb les estructures de Dati magatzem i amb el suport de processos de magatzem per comprovar l'ús eficaç i eficient de la tecnologia i les tècniques relacionades.

Tal com s'indica a l'arquitectura de BI, el nivell atòmic Dwhouse, així com els datamarts, són una excel·lent font de Dati per a l'extracció. Aquestes mateixes propietats també han de ser receptores dels resultats d'extracció per garantir la disponibilitat per al públic més ampli.

Agents.

Hi ha diversos "agents" per examinar el client per qualsevol punt, com ara els sistemes operatius de l'empresa i el propi dw. Aquests agents poden ser xarxes neuronals avançades entrenades per conèixer les tendències en cada punt, com ara la demanda futura de productes basada en promocions de vendes, motors basats en regles per reaccionar a un dates conjunt de circumstàncies, o fins i tot simples agents que informen d'excepcions als alts executius. Aquests processos generalment es produeixen en temps real i, per tant, han d'estar estretament relacionats amb el moviment dels processos Dati. Totes aquestes estructures de Dati, tecnologies i tècniques garanteixen que no passareu la nit generant una organització de la vostra BI.

Aquesta activitat es desenvoluparà en passos incrementals, per punts petits.
Cada pas és un esforç de projecte independent i es coneix com una iteració en el vostre dw o iniciativa de BI. Les iteracions poden incloure la implementació de noves tecnologies, començant per noves tècniques i afegint nous marcs Dati , carregant i Dati addicional, o amb l'ampliació d'anàlisi del vostre entorn. Aquest paràgraf es tracta amb més detall al capítol 3.

A més dels marcs DW tradicionals i les eines de BI, hi ha altres aspectes de la vostra organització de BI per als quals heu de dissenyar, com ara:

Punts de contacte del client (toc del client punts).

Com amb qualsevol organització moderna, hi ha una sèrie de punts de contacte amb els clients que indiquen com tenir una experiència positiva per a la vostra clients. Hi ha canals tradicionals com comerciants, centralistes, correu directe, publicitat multimèdia i impresa, així com canals més actuals com el correu electrònic i la web, Dati Els productes amb algun punt de contacte s'han d'adquirir, transportar, netejar, processar i després poblar-se a les instal·lacions Dati de la BI.

Bases de Dati associacions operatives i d'usuaris (Operational

bases de dades i comunitats d'usuaris).
Al final dels punts de contacte de la clients es troben els fonaments Dati de les comunitats d'aplicacions i usuaris de l'empresa. EL Dati existents són Dati tradicional que s'ha d'ajuntar i fusionar amb el Dati que flueix des dels punts de contacte per trobar la informació necessària.

Analistes. (Analistes)

El principal beneficiari de l'entorn de BI és l'analista. És ell qui es beneficia de l'extracció actual de Dati operatiu, integrat amb diferents fonts de Dati , augmentat amb funcions com l'anàlisi geogràfica (geocodificació) i presentat en tecnologies de BI que permeten mineria, OLAP, informes SQL avançats i anàlisi geogràfica. La interfície principal de l'analista a l'entorn d'informes és el portal de BI.

Tanmateix, l'analista no és l'únic que es beneficia de l'arquitectura de BI.
Directius, grans associacions d'usuaris, i fins i tot socis, proveïdors i i clients hauria de trobar beneficis a la BI empresarial.

Bucle d'alimentació posterior.

L'arquitectura de BI és un entorn d'aprenentatge. Un principi característic del desenvolupament és permetre estructures persistents de Dati per ser actualitzat per la tecnologia de BI utilitzada i per les accions realitzades per l'usuari. Un exemple és la puntuació dels clients.

Si el departament de vendes fa un model de mineria de puntuacions dels clients, com ara l'ús d'un servei nou, aleshores el departament de vendes no hauria de ser l'únic grup que es beneficiï del servei.

En canvi, la mineria de models s'ha de realitzar com una part natural del flux de dades dins de l'empresa i les puntuacions dels clients s'han de convertir en una part integrada del context d'informació del magatzem, visible per a tots els usuaris. IBM Suite centrat en Bi-bI que inclou DB2 UDB, DB2 OLAP Server inclou els components tecnològics més importants, definits a la figura 1.1.

Utilitzem l'arquitectura tal com apareix en aquesta figura del llibre per donar-nos un nivell de continuïtat i demostrar com cadascun dels productes d'IBM s'adapta a l'esquema global de BI.

Proporcionar contingut informatiu (proporcionar contingut informatiu)

Dissenyar, desenvolupar i implementar el vostre entorn de BI és una tasca descoratjadora. El disseny ha d'abraçar els requisits empresarials actuals i futurs. El dibuix d'arquitectura ha de ser complet per incloure totes les conclusions trobades durant la fase de disseny. L'execució ha de mantenir-se compromesa amb un únic propòsit: desenvolupar l'arquitectura de BI tal com es presenta formalment en el disseny i fonamentada en els requisits empresarials.

És especialment difícil argumentar que la disciplina garantirà un èxit relatiu.
Això és senzill perquè no desenvolupeu un entorn de BI alhora, sinó en petits passos al llarg del temps.

Tanmateix, identificar els components de BI de la vostra arquitectura és important per dos motius: impulsareu totes les decisions d'arquitectura tècnica posteriors.
Podreu planificar conscientment un ús particular de la tecnologia tot i que potser no us torneu a necessitar la tecnologia durant diversos mesos.

Entendre prou els requisits del vostre negoci influirà en el tipus de productes que adquireixis per a la teva arquitectura.
El disseny i desenvolupament de la teva arquitectura garanteix que el teu magatzem sigui

no és un esdeveniment aleatori, sinó un anunci ben pensat i construït amb cura òpera de l'art com a mosaic de tecnologia mixta.

Dissenyar contingut informatiu

Tot el disseny inicial ha de centrar-se i identificar els components principals de BI que necessitarà l'entorn global ara i en el futur.
Conèixer els requisits del negoci és important.

Fins i tot abans de començar qualsevol planificació formal, el planificador del projecte sovint pot identificar un o dos components immediatament.
Tanmateix, no es pot trobar fàcilment l'equilibri de components que poden ser necessaris per a la vostra arquitectura. Durant la fase de disseny, la part principal de l'arquitectura vincula la sessió de desenvolupament d'aplicacions (JAD) a una investigació per identificar els requisits empresarials.

De vegades, aquests requisits es poden confiar a eines de consultes i informes.
Per exemple, els usuaris afirmen que si volen automatitzar un informe actual s'han de generar manualment integrant dos informes actuals i afegint els càlculs derivats de la combinació dels Dati.
Tot i que aquest requisit és senzill, defineix una funcionalitat determinada que heu d'incloure quan compreu eines d'informes per a la vostra organització.

El dissenyador també ha de complir requisits addicionals per obtenir una imatge completa. Els usuaris volen subscriure's a aquest informe?
Es generen subconjunts d'informes i s'envien per correu electrònic a diversos usuaris? Vols veure aquest informe al portal de l'empresa? Tots aquests requisits formen part de la simple necessitat de substituir un informe manual tal com ho requereixen els usuaris. L'avantatge d'aquest tipus de requisits és que tothom, usuaris i dissenyadors, està familiaritzat amb el concepte d'informes.

Hi ha altres tipus d'empreses, però, que hem de planificar. Quan els requisits empresarials s'especifiquen en forma de preguntes estratègiques de negoci, és fàcil per al planificador experimentat discernir els requisits dimensionals i mesurar/de fet.

Si els usuaris de JAD no saben com indicar els seus requisits en forma d'un problema empresarial, el dissenyador sovint proporcionarà exemples per ometre-iniciar la sessió de recollida de requisits.
El planificador expert pot ajudar els usuaris a entendre no només el negoci estratègic, sinó també com donar-li forma.
L'enfocament de recollida de requisits es tracta al capítol 3; de moment només volem assenyalar la necessitat de dissenyar per a tot tipus de requisits de BI.

Un problema de negoci estratègic no és només un requisit empresarial, sinó també una indicació de disseny. Si has de respondre una pregunta multidimensional, llavors has de memoritzar, presentar-lo Dati dimensional, i si necessiteu memoritzar el Dati multidimensional, heu de decidir quin tipus de tecnologia o tècnica utilitzareu.

Implementeu un esquema d'estrella de cub reservat, o tots dos? Com podeu veure, fins i tot un simple problema comercial pot influir molt en el disseny. Però aquest tipus de requisits empresarials són habituals i, per descomptat, almenys per planificadors i dissenyadors de projectes experimentats.

Hi ha hagut prou debat sobre les tecnologies i el suport OLAP, i hi ha una gran varietat de solucions disponibles. Fins ara hem parlat de la necessitat d'ajuntar informes simples amb requisits empresarials dimensionals, i com aquests requisits influeixen en les decisions d'arquitectura tècnica.

Però, quins són els requisits que els usuaris o l'equip de Dw no entenen fàcilment? Alguna vegada necessitareu anàlisi espacial (anàlisi espacial)?
Els models de mineria de Dati Seran una part necessària del teu futur? Qui sap?

És important tenir en compte que aquest tipus de tecnologies no són ben conegudes per les comunitats d'usuaris generals i els membres de l'equip de DW, en part, això podria ser perquè normalment són gestionades per alguns experts tècnics interns o de tercers. És un cas avantguardista dels problemes que generen aquest tipus de tecnologies. Si els usuaris no poden descriure els requisits empresarials o emmarcar-los per oferir orientació als dissenyadors, poden passar desapercebuts o, pitjor, simplement ignorar-los.

Es torna més problemàtic quan el dissenyador i el desenvolupador no poden reconèixer l'aplicació d'una d'aquestes tecnologies avançades però crítiques.
Com hem escoltat sovint els dissenyadors dir: "bé, per què no ho guardem fins que aconseguim aquesta altra cosa? “Estan realment interessats en les prioritats, o simplement eviten requisits que no entenen? El més probable és que aquesta última hipòtesi. Suposem que el vostre equip de vendes ha comunicat un requisit comercial, tal com s'indica a la figura 1.3, com podeu veure, el requisit s'emmarca en forma d'un problema empresarial. La diferència entre aquest problema i el problema dimensional típic és la distància. En aquest cas, l'equip comercial vol conèixer, mensualment, les vendes totals de productes, magatzems i clients que viuen a 5 milles del magatzem on compren.

Malauradament, els dissenyadors o arquitectes poden simplement ignorar el component espacial dient: "Tenim el client, el producte i el Dati del dipòsit. Mantenim la distància fins a una altra iteració.

"Resposta incorrecta. Aquest tipus de problema empresarial es refereix a la BI. Representa una comprensió més profunda del nostre negoci i un espai analític sòlid per als nostres analistes. La BI va més enllà de la simple consulta o informes estàndard, o fins i tot OLAP. Això no vol dir que aquestes tecnologies no siguin importants per a la vostra BI, però per si soles no representen l'entorn de BI.

Disseny per al context de la informació (Disseny per a contingut informatiu)

Ara que hem identificat els requisits empresarials que distingeixen diversos components bàsics, s'han d'incloure en un dibuix arquitectònic general. Alguns dels components de BI formen part dels nostres esforços inicials, mentre que alguns no s'implementaran durant diversos mesos.

No obstant això, tots els requisits coneguts es reflecteixen en el disseny de manera que quan necessitem implementar una tecnologia determinada, estem preparats per fer-ho. Alguna cosa del projecte reflectirà el pensament tradicional.

Aquest conjunt de Dati s'utilitza per donar suport a usos posteriors de Dati dimensional impulsat pels problemes empresarials que hem identificat. A mesura que es generen documents addicionals, com ara el desenvolupament del projecte del Dati, començarem per formalitzar com i Dati s'estenen al medi. Hem constatat la necessitat de representar i Dati de manera dimensional, dividint-los (segons necessitats específiques específiques) en data marts.

La següent pregunta a respondre és: Com es construiran aquests data marts?
Construïu les estrelles per suportar els cubs, o només cubs, o només les estrelles? (o cubs dretes, o estrelles dretes). Genereu l'arquitectura per a centres de dades dependents que requereixin una capa atòmica per a tots Dati adquireixes? Permet que els mercats de dades independents adquireixin i Dati directament des dels sistemes operatius?

Quina tecnologia Cube intentaràs estandarditzar?

Tens grans quantitats de déus Dati necessari per a l'anàlisi dimensional o necessiteu cubs de la vostra força de vendes nacional setmanalment o tots dos? Creeu un objecte potent com el servidor DB2 OLAP per a finances o els cubs Cognos PowerPlay per a la vostra organització de vendes o tots dos? Aquestes són les grans decisions de disseny arquitectònic que afectaran el vostre entorn de BI en el futur. Sí, heu identificat una necessitat d'OLAP. Ara com vas a dur a terme aquest tipus de tècnica i tecnologia?

Com afecten algunes de les tecnologies més avançades als vostres dissenys? Suposem que heu identificat una necessitat espacial a la vostra organització. Ara heu de recordar les edicions del dibuix arquitectònic encara que no tingueu previst fer components espacials durant diversos mesos. L'arquitecte ha de dissenyar avui en funció del que calgui. Anticipar la necessitat d'una anàlisi espacial que generi, emmagatzemi, mantingui i proporcioni accés Dati espacial. Això al seu torn hauria de servir com a limitació pel que fa al tipus de tecnologia de programari i les especificacions de la plataforma que podeu considerar actualment. Per exemple, el sistema d'administració de base de dades relacional (RDBMS) que manteniu per a la vostra capa atòmica ha de tenir una extensió espacial robusta disponible. Això garantiria el màxim rendiment quan utilitzeu geometria i objectes espacials a les vostres aplicacions analítiques. Si el vostre RDBMS no pot gestionar Dati (espacial-cèntric) internament, de manera que hauràs d'establir a base de dades (cèntric espacial) extern. Això complica la gestió de problemes i compromet el vostre rendiment general, per no parlar dels problemes addicionals que crea per als vostres DBA, ja que probablement tenen una comprensió mínima dels conceptes bàsics de Dati espacial també. D'altra banda, si el vostre motor RDMBS gestiona tots els components espacials i el seu optimitzador és conscient de les necessitats especials (per exemple, la indexació) dels objectes espacials, els vostres DBA poden gestionar fàcilment els problemes de gestió i podeu maximitzar el rendiment.

A més, cal ajustar l'àrea d'escenificació i la capa d'entorn atòmic per incloure la neteja d'adreces (a

element clau per a l'anàlisi espacial), així com el posterior estalvi d'objectes espacials. La successió d'edicions de disseny continua ara que hem introduït la noció de neteja d'adreces. D'una banda, aquesta aplicació dictarà el tipus de programari que necessiteu per al vostre esforç ETL.

Necessiteu productes com Trillium per proporcionar-vos una adreça neta o un proveïdor d'ETL que trieu per oferir aquesta funcionalitat?
De moment, és important que aprecieu el nivell de disseny que cal completar abans de començar a mantenir el vostre magatzem. Els exemples anteriors haurien de demostrar la multitud de decisions de disseny que han de seguir la identificació de qualsevol requisit empresarial particular. Quan es prenen correctament, aquestes decisions de disseny promouen la interdependència entre les estructures físiques del vostre entorn, la selecció de la tecnologia utilitzada i el flux de propagació del contingut d'informació. Sense aquesta arquitectura de BI convencional, la vostra organització estarà sotmesa a una barreja caòtica de tecnologies existents, en el millor dels casos unides entre si per proporcionar una estabilitat aparent.

Mantenir el contingut informatiu

Aportar el valor de la informació a la vostra organització és una tasca molt difícil. Sense la suficient comprensió i experiència, o sense una enginyeria i disseny adequats, fins i tot els millors equips fracassarien. D'altra banda, si teniu una gran intuïció i un disseny detallat, però no teniu disciplina per executar, només heu perdut els vostres diners i temps perquè el vostre esforç està condemnat al fracàs. El missatge ha de ser clar: si us falten una o més d'aquestes habilitats, comprensió/experiència o disciplina de planificació/disseny o implementació, això comportarà paralitzar o destruir la construcció de l'organització de BI.

El teu equip està prou preparat? Algú del vostre equip de BI entén el vast panorama analític disponible als entorns de BI i les tècniques i tecnologies necessàries per mantenir aquest panorama? Hi ha algú del vostre equip que pugui notar la diferència a l'hora d'aplicar l'avanç

informes estàtics i OLAP, o les diferències entre ROLAP i OLAP? Un dels membres del vostre equip reconeix clarament la forma de la mineria i com pot afectar el magatzem o com el magatzem pot donar suport al rendiment de la mineria? Un membre de l'equip entén el valor de Dati tecnologia basada en l'espai o en agents? Tens algú que aprecia l'aplicació d'eines úniques de la tecnologia ETL vs Message Broker? Si no el tens, fes-ne un. BI és molt més gran que una capa atòmica normalitzada, OLAP, esquemes d'estrelles i un ODS.

Tenir la comprensió i l'experiència per reconèixer els requisits de BI i les seves solucions és essencial per a la vostra capacitat per formalitzar adequadament les necessitats dels usuaris i per dissenyar i implementar les seves solucions. Si la vostra comunitat d'usuaris té dificultats per descriure els requisits, depèn de l'equip del magatzem proporcionar aquesta comprensió. Però si l'equip de magatzem

no reconeix l'aplicació específica de la BI (per exemple, la mineria de dades), llavors no és millor que els entorns de BI es limitin sovint a ser repositoris passius. Tanmateix, ignorar aquestes tecnologies no disminueix la seva importància i l'efecte que tenen sobre l'aparició de les capacitats d'intel·ligència empresarial de la vostra organització, així com l'actiu d'informació que teniu previst promocionar.

El disseny ha d'incloure la noció de dibuix, i tots dos requereixen una persona competent. A més, la planificació requereix una filosofia de casa d'equip i el compliment dels estàndards. Per exemple, si la vostra empresa ha establert un estàndard de plataforma o ha identificat un RDBMS concret que vol estandarditzar a tota la plataforma, és imprescindible que tots els membres de l'equip compleixin aquests estàndards. Generalment, un equip expressa la necessitat d'estandardització (a les comunitats d'usuaris), però el propi equip no està disposat a adherir-se als estàndards establerts en altres àrees de l'empresa o potser fins i tot en empreses similars. Això no només és hipòcrita, sinó que estableix que l'empresa no és capaç d'explotar els recursos i inversions existents. No vol dir que no hi hagi situacions que justifiquin una plataforma o tecnologia no estandarditzada; tanmateix, els esforços del magatzem

haurien de vigilar gelosament els estàndards de l'empresa fins que els requisits empresarials dictin el contrari.

El tercer component clau necessari per construir una organització de BI és la disciplina.
Depèn en total, igualment dels individus i de l'entorn. Els planificadors de projectes, patrocinadors, arquitectes i usuaris han d'apreciar la disciplina necessària per construir els actius d'informació de l'empresa. Els dissenyadors han de dirigir els seus esforços de disseny per complementar altres esforços necessaris a la societat.

Per exemple, suposem que la vostra empresa crea una aplicació ERP que té un component de magatzem.
Així doncs, és responsabilitat dels dissenyadors de l'ERP col·laborar amb l'equip d'entorn del magatzem per no competir ni duplicar el treball ja iniciat.

La disciplina també és un tema que ha de ser abordat per tota l'organització i normalment s'estableix i s'imposa a un nivell executiu.
Els executius estan disposats a adherir-se a un enfocament dissenyat? Un enfocament que promet crear contingut d'informació que en última instància aportarà valor a totes les àrees de l'empresa, però potser comprometre les agendes individuals o departamentals? Recordeu la dita "Pensar en tot és més important que pensar en una cosa". Aquesta dita és certa per a les organitzacions de BI.

Malauradament, molts magatzems centren els seus esforços a intentar orientar i oferir valor a un departament o usuaris concrets, sense tenir en compte l'organització en general. Suposem que el gerent demana ajuda a l'equip de la casa d'habitacions. L'equip respon amb un esforç de 90 dies que inclou no només lliurar els requisits de notificació definits per l'executiu, sinó assegurar-se que tots els Dati base es barregen al nivell atòmic abans d'introduir-se en la tecnologia del cub proposada.
Aquesta addició d'enginyeria garanteix que l'empresa de la casa d'habitacions es beneficiarà del Dati necessàries pel gestor.
No obstant això, l'executiu va parlar amb empreses consultores externes que van proposar una aplicació similar amb lliurament en menys de 4 setmanes.

Suposant que l'equip intern de la cambra és competent, l'executiu té una opció. Qui pot donar suport a la disciplina d'enginyeria addicional necessària per fer créixer l'actiu d'informació empresarial o pot optar per crear la seva pròpia solució ràpidament. Aquest últim sembla que s'escull massa sovint i només serveix per crear contenidors d'informació que beneficien uns quants o l'individu.

Objectius a curt i llarg termini

Els arquitectes i els planificadors de projectes han de formalitzar una visió a llarg termini de l'arquitectura general i els plans per fer créixer una organització de BI. Aquesta combinació de guanys a curt termini i planificació a llarg termini són les dues cares dels esforços de BI. Els ingressos a curt termini són la faceta de la BI que s'associa amb les iteracions del vostre magatzem.

Aquí és on els planificadors, arquitectes i patrocinadors se centren en complir els requisits empresarials específics. És en aquest nivell on es construeixen estructures físiques, es compra tecnologia i s'implanten tècniques. De cap manera estan fets per abordar requisits específics tal com els defineixen comunitats d'usuaris concretes. Tot es fa amb l'objectiu d'atendre requisits específics definits per una comunitat en particular.
La planificació a llarg termini, però, és l'altra faceta de la BI. Aquí és on els plànols i dissenys asseguraven que es construïa qualsevol estructura física, les tecnologies seleccionades i les tècniques realitzades es fessin amb una mirada cap a l'empresa. És la planificació a llarg termini la que proporciona la cohesió necessària per garantir que els guanys de l'empresa es derivin dels guanys a curt termini trobats.

Justifiqueu el vostre esforç de BI

Un magatzem de dades per si mateix no té cap valor inherent. En altres paraules, no hi ha cap valor inherent entre les tecnologies de magatzem i les tècniques d'implementació.

El valor de qualsevol esforç del magatzem es troba en les accions realitzades com a conseqüència de l'entorn del magatzem i dels continguts informatius conreats al llarg del temps. Aquest és un punt crític que cal entendre abans d'intentar estimar el valor de qualsevol iniciativa de Wherehouse.

Massa sovint, els arquitectes i els planificadors intenten aplicar valor als components físics i tècnics del magatzem quan, de fet, el valor es basa en els processos empresarials que es veuen afectats positivament pel magatzem i la informació ben capturada.

Aquí rau el repte per fundar BI: com justifiqueu la inversió? Si el mateix wherehouse no té valor intrínsec, els planificadors del projecte han d'investigar, definir i formalitzar els beneficis per a aquells individus que utilitzaran el magatzem per millorar processos de negoci específics o el valor de la informació protegida, o ambdós.

Per complicar les coses, qualsevol procés empresarial afectat pels esforços del magatzem podria proporcionar avantatges "substancials" o "lleus". Els beneficis significatius proporcionen una mètrica tangible per mesurar el retorn de la inversió (ROI), per exemple, revertir l'inventari un temps addicional durant un període específic o per reduir el cost de transport per enviament. És més difícil definir beneficis subtils, com ara un millor accés a la informació, en termes de valor tangible.

Connecteu el vostre projecte per conèixer el peticions comercials

Massa sovint, els planificadors de projectes intenten vincular el valor del magatzem amb objectius empresarials amorfs. En declarar que "el valor d'un magatzem es basa en la nostra capacitat de satisfer peticions estratègiques" obrim la discussió d'una manera agradable. Però això per si sol no és suficient per determinar si té sentit invertir en el magatzem. El millor és connectar els representants del magatzem amb consultes i notes comercials específiques.

Mesura el ROI

Calcular el ROI en un magatzem pot ser especialment difícil. És especialment difícil si el plom

d'una repetició determinada és quelcom intangible o fàcil de mesurar. Un estudi va trobar que els usuaris perceben els dos avantatges principals de les iniciatives de BI:

  • ▪ Crear la capacitat de prendre decisions
  • ▪ Crear accés a la informació
    Aquests beneficis són beneficis suaus (o lleus). És fàcil veure com podem calcular un retorn de la inversió en funció d'un benefici dur (o més gran), com ara un cost de transport reduït, però com mesurem la capacitat de prendre millors decisions?
    Definitivament, aquest és un repte per als planificadors de projectes quan intenten que l'empresa inverteixi en un esforç de magatzem concret. L'augment de les vendes o la disminució dels costos ja no són els temes centrals que impulsen l'entorn de BI.
    En lloc d'això, busqueu sol·licituds empresarials per a un millor accés a la informació perquè un departament concret pugui prendre decisions més ràpidament. Aquests són factors estratègics que són igualment importants per a l'empresa, però són més ambigus i més difícils de caracteritzar en una mètrica tangible. En aquest cas, calcular el ROI pot ser enganyós, si no irrellevant.
    Els dissenyadors de projectes han de ser capaços de demostrar un valor tangible perquè els executius decideixin si la inversió en una iteració concreta val la pena. Tanmateix, no proposarem un nou mètode per calcular el ROI, ni presentarem cap argument a favor o en contra.
    Hi ha molts articles i llibres disponibles que tracten els fonaments del càlcul del ROI. Hi ha propostes de valor especials com el valor de la inversió (VOI), que ofereixen grups com Gartner, que podeu investigar. En lloc d'això, ens centrarem en els aspectes bàsics de qualsevol ROI o altres propostes de valor que hàgiu de tenir en compte. Aplicant el ROI Més enllà de l'argument sobre els beneficis "durs" versus "tous" associats als esforços de BI, hi ha altres qüestions a tenir en compte a l'hora d'aplicar el ROI. Per exemple:

Atribuir massa estalvis als esforços de DW que vindrien de totes maneres
Suposem que la vostra empresa va passar d'una arquitectura mainframe a un entorn UNIX distribuït. Per tant, els estalvis que es puguin (o no) es realitzin amb aquest esforç no s'haurien d'atribuir únicament, si no (?), al magatzem.

No tenir en compte tot és car. I hi ha moltes coses a tenir en compte. Considereu la llista següent:

  • ▪ Cost de posada en marxa, inclosa la viabilitat.
  • ▪ Cost del maquinari dedicat amb emmagatzematge i comunicacions associats
  • ▪ Cost del programari, inclosa la gestió Dati i extensions client/servidor, programari ETL, tecnologies DSS, eines de visualització, aplicacions de planificació i flux de treball i programari de monitorització, .
  • ▪ Cost del disseny de l'estructura Dati, amb la creació i optimització de
  • ▪ Cost de desenvolupament de programari directament associat a l'esforç de BI
  • ▪ Cost de l'assistència domiciliària, inclosa l'optimització del rendiment, inclòs el control de versions del programari i les operacions d'ajuda Apliqueu el ROI "Big-Bang". Construir el magatzem com un únic i gegantí esforç està condemnat al fracàs, així que també calculeu el ROI d'una gran iniciativa empresarial L'oferta és sorprenent i els planificadors continuen fent intents febles d'estimar el valor de tot l'esforç. Per què els planificadors intenten donar un valor monetari a la iniciativa empresarial si és àmpliament conegut i acceptat que estimar iteracions específiques és difícil? Com és possible? No és possible amb poques excepcions. No ho facis. Ara que hem establert què no cal fer a l'hora de calcular el ROI, aquí teniu alguns punts que us ajudaran a establir un procés fiable per estimar el valor dels vostres esforços de BI.

Obtenció del consentiment del ROI. Independentment de la tècnica que trieu per estimar el valor dels vostres esforços de BI, totes les parts l'han d'acordar, inclosos els planificadors de projectes, els patrocinadors i els executius corporatius.

Dividiu el ROI en parts identificables. Un pas necessari cap a un càlcul de ROI raonable és centrar aquest càlcul en un projecte específic. Aleshores, us permet estimar un valor en funció dels requisits empresarials específics que es compleixin

Definir els costos. Com s'ha dit, cal tenir en compte nombrosos costos. A més, els costos han d'incloure no només els associats a la iteració individual, sinó també els costos associats a garantir el compliment dels estàndards empresarials.

Definir beneficis. En vincular clarament el ROI a requisits empresarials específics, hauríem de ser capaços d'identificar els beneficis que permetran complir els requisits.

Reduir costos i beneficis en guanys imminents. És la millor manera de basar les vostres valoracions en el valor actual net (VAN) en lloc d'intentar predir el valor futur dels guanys futurs.

Mantingueu el temps per dividir el vostre ROI al mínim. Està ben documentat a llarg termini, s'ha utilitzat al vostre ROI.

Utilitzeu més d'una fórmula de ROI. Hi ha nombrosos mètodes per predir el ROI, i hauríeu de planificar utilitzar-ne un o més, com ara el valor actual net, la taxa interna de retorn (IRR) i la recuperació.

Definir un procés repetible. Això és crucial per calcular qualsevol valor a llarg termini. S'ha de documentar un únic procés repetible per a totes les subseqüències posteriors del projecte.

Els problemes enumerats són els més comuns definits per experts en medi ambient de casals. La insistència de la direcció a oferir un ROI "Big-Bang" és molt confusa. Si comenceu tots els vostres càlculs de ROI dividint-los en parts identificables i tangibles, teniu moltes possibilitats d'estimar una estimació precisa de ROI.

Preguntes sobre els avantatges del ROI

Siguin quins siguin els vostres beneficis, suaus o durs, podeu fer servir algunes preguntes bàsiques per determinar-ne el valor. Per exemple, utilitzant un sistema d'escala senzill, de l'1 al 10, podeu mesurar l'impacte de qualsevol esforç mitjançant les preguntes següents:

  • Com valoraries la comprensió Dati seguint aquest projecte de la teva empresa?
  • Com valoraries les millores de processos com a resultat d'aquest projecte?
  • Com mesuraríeu l'impacte dels nous coneixements i inferències que ara estan disponibles per aquesta iteració
  • Quin va ser l'impacte dels nous i millors entorns informàtics com a resultat del que es va aprendre? Si les respostes a aquestes preguntes són poques, és possible que l'empresa no valgui la inversió realitzada. Les preguntes amb puntuació alta apunten a guanys de valor significatius i haurien de servir com a guies per a una investigació posterior. Per exemple, una puntuació alta per a les millores de processos hauria de portar els dissenyadors a examinar com s'han millorat els processos. És possible que trobeu que alguns o tots els guanys obtinguts són tangibles i, per tant, es pot aplicar fàcilment un valor monetari. Aconseguint el màxim profit de la primera iteració del magatzem El benefici més gran de l'esforç de la vostra empresa es troba sovint en les primeres iteracions. Aquests primers esforços tradicionalment estableixen el contingut d'informació més útil per al públic i ajuden a establir la base tecnològica per a aplicacions de BI posteriors. En general, cada subseqüència posterior de Dati dels projectes de magatzem aporten cada cop menys valor addicional a l'empresa en conjunt. Això és especialment cert si la iteració no afegeix nous temes ni satisfà les necessitats d'una nova comunitat d'usuaris.

Aquesta funció d'emmagatzematge també s'aplica a les piles en creixement de Dati historiadors. Com que els esforços posteriors requereixen més Dati i com més Dati s'aboquen al magatzem amb el pas del temps, la majoria dels Dati es torna menys rellevant per a l'anàlisi utilitzada. Aquests Dati sovint s'anomenen Dati latent i sempre és car mantenir-los perquè gairebé mai s'utilitzen.

Què significa això per als patrocinadors del projecte? Bàsicament, els primers patrocinadors comparteixen més que els costos d'inversió. Això és fonamental perquè són l'impuls per fundar l'àmplia capa d'entorn tecnològic i de recursos del magatzem, inclosa la orgànica.

Però aquests primers passos porten el major valor i, per tant, els planificadors de projectes sovint han de justificar la inversió.
Els projectes realitzats després de la vostra iniciativa de BI poden tenir costos directes i inferiors (en comparació amb el primer), però aporten menys valor a l'empresa.

I els propietaris de les organitzacions han de començar a plantejar-se llançar l'acumulació Dati i tecnologies menys rellevants.

Data Mining: Extracció dades

Molts components arquitectònics requereixen variacions de les tecnologies i tècniques de mineria de dades:
per exemple, els diferents "agents" per examinar els punts d'interès de la clients, els sistemes operatius de l'empresa i per al mateix dw. Aquests agents poden ser xarxes neuronals avançades entrenades sobre tendències de l'olla, com ara la demanda futura de productes basada en promocions de vendes; motors basats en regles per reaccionar davant un conjunt dates de circumstàncies, per exemple, diagnòstic mèdic i recomanacions de tractament; o fins i tot simples agents amb la funció d'informar les excepcions als alts directius. Generalment aquests processos d'extracció Dati si

verificar en temps real; per tant, s'han d'unir completament amb el moviment de la Dati ells mateixos.

Processament analític en línia

Analítica en línia

La capacitat de tallar, tallar daus, tirar, profunditzar i realitzar anàlisis
Què passa si, està dins de l'abast, l'abast de la suite tecnològica d'IBM. Per exemple, existeixen funcions de processament analític en línia (OLAP) per a DB2 que introdueixen l'anàlisi dimensional al motor del database mateix .

Les funcions afegeixen una utilitat dimensional a SQL alhora que obtenen tots els beneficis de ser una part natural de DB2. Un altre exemple d'integració OLAP és l'eina d'extracció, DB2 OLAP Analyzer Server. Aquesta tecnologia permet escanejar de forma ràpida i automàtica els cubs del servidor DB2 OLAP per localitzar i informar sobre els valors de Dati inusual o inesperat per a qualsevol cub per a l'analista comercial. I, finalment, les funcions del DW Center ofereixen un mitjà perquè els arquitectes comprovin, entre altres coses, el perfil d'un servidor de cub DB2 OLAP com a part natural dels processos ETL.

Anàlisi espacial Anàlisi espacial

L'espai representa la meitat de les ancoratges analítiques (conduccions) necessàries per a una panoràmica
analític ampli (el temps representa l'altra meitat). El nivell atòmic del magatzem, representat a la figura 1.1, inclou els fonaments tant del temps com de l'espai. Els segells de temps s'ancoren anàlisis per temps i les anàlisis d'àncora d'informació d'adreça per espai. Els segells de temps realitzen l'anàlisi per temps, i la informació d'adreça realitza l'anàlisi per espai. El diagrama mostra la geocodificació, el procés de conversió d'adreces en punts d'un mapa o punts de l'espai perquè es puguin utilitzar conceptes com la distància i l'interior/exterior en l'anàlisi, realitzat a nivell atòmic i l'anàlisi espacial es posa a disposició de l'analista. IBM proporciona extensions espacials, desenvolupades amb l'Environmental System Research Institute (ESRI), al database DB2 perquè els objectes espacials es puguin mantenir com a part normal del fitxer database relacional. db2

Els extensors espacials, també proporcionen totes les extensions SQL per aprofitar l'anàlisi espacial. Per exemple, les extensions SQL per consultar
la distància entre adreces o si un punt està dins o fora d'una àrea poligonal definida, són un estàndard analític amb l'Extensor espacial. Vegeu el capítol 16 per obtenir més informació.

Base de dades- Eines per a residents Eines Base de dades-Resident

DB2 té moltes característiques residents d'SQL BI que ajuden a l'acció d'anàlisi. Això inclou:

  • Funcions de recursivitat per realitzar anàlisis, com ara "trobar totes les rutes de vol possibles des de Sant Francesc a nova York".
  • Les funcions analítiques per a les funcions de classificació, acumulació, cub i acumulació per facilitar tasques que normalment només es produeixen amb la tecnologia OLAP, són ara una part natural del motor del database
  • La capacitat de crear taules que continguin resultats
    Els venedors de database els líders barregen més de les funcions de BI al database mateix.
    Els principals proveïdors de base de dades estan barrejant més funcions de BI al database mateix.
    Això proporciona un millor rendiment i més opcions d'execució per a les solucions de BI.
    Les característiques i funcions de DB2 V8 es comenten amb detall als capítols següents:
    Arquitectura tècnica i fonaments de gestió de dades (Capítol 5)
  • Fonaments de DB2 BI (Capítol 6)
  • Taules de consultes materialitzades de DB2 (Capítol 7)
  • Funcions DB2 OLAP (Capítol 13)
  • Característiques i funcions de BI millorades de DB2 (Capítol 15) Sistema simplificat de lliurament de dades Sistema de lliurament de Dati simplificat

L'arquitectura representada a la figura 1.1 inclou nombroses estructures Dati físic. Un és el magatzem de Dati en funcionament. En general, un ODS està orientat a objectes, integrat i actual. Crearíeu un ODS per donar suport, per exemple, a l'oficina de vendes. Les vendes d'ODS es complementarien Dati de molts sistemes diferents, però només conservaria, per exemple, les transaccions actuals. L'ODS també es pot actualitzar moltes vegades al dia. Simultàniament, els processos empenyen i Dati integrat en altres aplicacions. Aquesta estructura està dissenyada específicament per integrar-se Dati actual i dinàmic i seria un candidat probable per donar suport a l'anàlisi en temps real, com ara proporcionar agents de servei clients la informació actual de vendes d'un client mitjançant l'extracció de la informació de tendències de vendes del propi inventari. Una altra estructura que es mostra a la figura 1.1 és un estat formal per al dw. No només és aquest el lloc per a l'execució de la integració necessària, de la qualitat de Dati, i de la transformació de Dati de magatzem d'entrada, però també és una àrea d'emmagatzematge fiable i temporal per Dati rèpliques que es podrien utilitzar en anàlisis en temps real. Si decidiu fer servir una ODS o una àrea d'escenificació, una de les millors eines per poblar aquestes estructures Dati utilitzar diferents fonts operacionals és la consulta distribuïda heterogènia de DB2. Aquesta capacitat s'ofereix mitjançant la funció opcional de DB2 anomenada DB2 Relational Connect (només consultes) i mitjançant DB2 DataJoiner (un producte independent que ofereix capacitat de consulta, inserció, actualització i supressió a RDBMS distribuïts heterogenis).

Aquesta tecnologia permet als arquitectes Dati per lligar Dati de producció amb processos analítics. La tecnologia no només es pot adaptar a pràcticament qualsevol de les demandes de replicació que puguin sorgir amb l'anàlisi en temps real, sinó que també es pot connectar a una gran varietat de Dati més populars, inclosos DB2, Oracle, Sybase, SQL Server, Informix i altres. El DB2 DataJoiner es pot utilitzar per emplenar una estructura Dati formal com una ODS o fins i tot una taula permanent representada al magatzem dissenyada per a la recuperació ràpida d'actualitzacions instantànies o per a la venda. Per descomptat, aquestes estructures en si Dati es pot omplir utilitzant

una altra tecnologia important dissenyada per a la replicació Dati, IBM DataPropagator Relational. (DataPropagator és un producte independent per a sistemes centrals. DB2 UNIX, Linux, Windows i OS/2 inclouen serveis de replicació de Dati com a característica estàndard).
Un altre mètode per moure's Dati que opera al voltant de l'empresa és un integrador d'aplicacions empresarials també conegut com a intermediari de missatges. Aquesta tecnologia única permet un control inigualable per a l'orientació i el moviment. Dati al voltant de l'empresa. IBM té l'agent de missatges més utilitzat, MQSeries, o una variació del producte que inclou els requisits per comerç electrònic, IBM WebSphere MQ.
Per obtenir més discussió sobre com aprofitar MQ per donar suport a un entorn de magatzem i BI, visiteu lloc web del llibre. De moment, n'hi ha prou amb dir que aquesta tecnologia és un excel·lent mitjà per capturar i transformar (amb MQSeries Integrator) Dati agents objectiu contractats per a solucions de BI. La tecnologia MQ s'ha integrat i empaquetat a UDB V8, la qual cosa significa que ara les cues de missatges es poden gestionar com si fossin taules DB2. El concepte de missatges de cua de soldadura i l'univers de database relacional es dirigeix ​​cap a un entorn potent de lliurament de Dati.

Latència zero Latència zero

L'objectiu estratègic final d'IBM és l'anàlisi de latència zero. Tal com defineix
Gartner, un sistema de BI ha de ser capaç d'inferir, ingerir i proporcionar informació als analistes sota demanda. El repte, per descomptat, és com barrejar Dati actual i en temps real amb la informació històrica necessària, com ara i Dati tendència/patró relacionat o informació extreta, com ara l'elaboració de perfils de clients.

Aquesta informació inclou, per exemple, la identificació de clients risc alt o baix o quins productes i clients El més probable és que compraran si ja tenen formatge al carro de la compra.

Aconseguir una latència zero depèn en realitat de dos mecanismes fonamentals:

  • Unió completa de Dati que s'analitzen amb les tècniques establertes i amb les eines creades per la BI
  • Un sistema de lliurament de Dati eficient per garantir que les analítiques en temps real estiguin realment disponibles. Aquests requisits previs per a una latència zero no són diferents dels dos objectius establerts per IBM i descrits anteriorment. L'acoblament estret del Dati forma part del programa d'integració perfecta d'IBM. I crear un sistema de lliurament de Dati eficient depèn completament de la tecnologia disponible que simplifica el procés de lliurament Dati. En conseqüència, dos dels tres objectius d'IBM són fonamentals per assolir el tercer. IBM està desenvolupant conscientment la seva tecnologia per garantir que la latència zero sigui una realitat per als esforços del magatzem. Resum / Síntesi La vostra organització de BI proporciona un full de ruta per crear el vostre entorn
    iterativament. S'ha d'ajustar per reflectir les necessitats del vostre negoci, tant actuals com futures. Sense una visió arquitectònica àmplia, les iteracions del magatzem són poc més que implementacions casuals del magatzem central que fan poc per crear una empresa gran i informativa. El primer obstacle per als líders del projecte és com justificar la inversió necessària per fer créixer l'organització de BI. Tot i que els càlculs de ROI s'han mantingut com un pilar dels assoliments d'inventari, cada cop és més difícil predir amb exactitud. Això ha donat lloc a altres mètodes per determinar si obteniu el valor dels vostres diners. El valor de la inversió2 (VOI), per exemple, s'obté com a solució. Correspon als arquitectes de Dati i sobre els planificadors de projectes generen i proporcionen informació deliberadament a les associacions d'usuaris i no simplement donen un servei Dati. Hi ha una gran diferència entre els dos. La informació és quelcom que marca la diferència en la presa de decisions i l'eficàcia; relativament, i Dati són elements bàsics per obtenir aquesta informació.

Encara que sigui crític amb la font Dati per fer front a les demandes empresarials, l'entorn de BI hauria de tenir un paper més important en la creació de contingut d'informació. Hem de prendre els passos addicionals per netejar, integrar, transformar o crear d'una altra manera contingut d'informació sobre el qual els usuaris puguin actuar, i després hem d'assegurar-nos que aquestes accions i decisions, quan siguin raonables, es reflecteixin a l'entorn de BI. Si releguem el magatzem a servir només en Dati, tingueu la seguretat que les associacions d'usuaris crearan el contingut informatiu necessari per prendre mesures. Això garanteix que la seva comunitat pugui prendre millors decisions, però l'empresa pateix la manca de coneixement que han utilitzat. Dada que els arquitectes i els planificadors de projectes iniciïn projectes específics en l'entorn de BI, segueixen sent responsables davant l'empresa en el seu conjunt. Un exemple senzill d'aquesta característica a dues cares de les iteracions de BI es troba a la font Dati. Tot el Dati rebudes per a sol·licituds comercials específiques s'han d'omplir a la primera capa atòmica. Això garanteix el desenvolupament de l'actiu d'informació empresarial, així com gestionar, atendre les sol·licituds específiques dels usuaris definides a la iteració.

Què és un magatzem de dades?

Magatzem de dades ha estat el cor de l'arquitectura de sistemes d'informació des de 1990 i dóna suport als processos d'informació oferint una sòlida plataforma integrada de Dati la història presa com a base per a les anàlisis posteriors. EL magatzem de dades ofereixen facilitat d'integració en un món de sistemes d'aplicacions incompatibles. Magatzem de dades ha evolucionat fins a convertir-se en una moda. Magatzem de dades organitzar i memoritzar i Dati necessaris per als processos informatius i analítics a partir d'una llarga perspectiva històrica temporal. Tot això implica un esforç considerable i constant en la construcció i manteniment de la magatzem de dades.

Què és doncs a magatzem de dades? un magatzem de dades és:

  • ▪ orientat a la matèria
  • ▪ sistema integrat
  • ▪ variació temporal
  • ▪ no volàtil (no cancel·la)

una col·lecció de Dati s'utilitza per donar suport a les decisions de gestió en la implementació dels processos.
I Dati inserit a magatzem de dades deriven en la majoria dels casos d'entorns operatius. El magatzem de dades està fet d'una unitat d'emmagatzematge, físicament separada de la resta del sistema, que conté Dati transformat prèviament per aplicacions que operen amb informació derivada de l'entorn operatiu.

La definició literal de a magatzem de dades mereix una explicació exhaustiva ja que hi ha motivacions importants i significats subjacents que descriuen les característiques d'un magatzem.

ORIENTACIÓ ASSIGNATURA ORIENTACIÓ TEMÀTICA

La primera característica d'a magatzem de dades és que s'orienta cap als grans temes d'una empresa. La guia dels processos a través del Dati contrasta amb el mètode més clàssic que preveu l'orientació de les aplicacions cap a processos i funcions, mètode compartit majoritàriament per la majoria dels sistemes de gestió menys recents.

El món operatiu està dissenyat al voltant d'aplicacions i funcions com ara préstecs, estalvis, targetes bancàries i confiança per a una entitat financera. El món del dw s'organitza al voltant de temes principals com el client, el venedor, el producte i l'activitat. L'alineació al voltant dels temes afecta el disseny i la implementació de Dati trobat al dw. El més important és que el tema principal afecta la part més important de l'estructura clau.

El món de les aplicacions està influenciat tant pel disseny de bases de dades com pel disseny de processos. El món de dw se centra únicament en el modelatge de vídeo Dati i sobre el disseny de la database. El disseny de processos (en la seva forma clàssica) no forma part de l'entorn dw.

Les diferències entre l'elecció de l'aplicació del procés/funció i l'elecció del tema també es revelen com a diferències en el contingut del Dati a nivell detallat. EL Dati del dw no inclouen i Dati que no s'utilitzarà per processar DSS durant les sol·licituds

orientat a les operacions Dati conté i Dati per satisfer immediatament els requisits funcionals/de processament que poden o no tenir cap ús per a l'analista DSS.
Una altra manera important per a les aplicacions orientades a les operacions Dati diferenciar-se de Dati de dw està als informes de Dati. Jo Dati els operaris mantenen una relació contínua entre dues o més taules en funció d'una regla de negoci activa. EL Dati de dw abasten un espectre de temps i els informes que es troben al dw són molts. Moltes regles comercials (i, en conseqüència, molts informes de Dati ) estan representats a l'estoc de Dati entre dues o més taules.

(Per a una explicació detallada de com les relacions entre el Dati es gestionen al DW, consulteu el tema tecnològic sobre aquest tema.)
Des de cap altra perspectiva que la de la diferència fonamental entre l'elecció d'una aplicació funcional/de procés i una elecció de matèria, hi ha una diferència important entre els sistemes operatius i Dati i el DW.

INTEGRACIÓ INTEGRACIÓ

L'aspecte més important de l'entorn dw és que i Dati que es troben dins del dw s'integren fàcilment. SEMPRE. SENSE EXCEPCIONS. L'essència mateixa de l'entorn dw és que i Dati s'integren dins dels límits del magatzem.

La integració es revela de moltes maneres diferents: en convencions identificades coherents, en mesuraments coherents de variables, en estructures codificades coherents, en atributs físics de Dati consistent, etc.

Al llarg dels anys, els dissenyadors de diferents aplicacions han pres moltes decisions sobre com s'ha de desenvolupar una aplicació. L'estil i les decisions individualitzades de disseny de les aplicacions dels dissenyadors es revelen de cent maneres: en diferències de codificació, estructura de claus, característiques físiques, convencions d'identificació, etc. La capacitat col·lectiva de molts dissenyadors d'aplicacions per crear aplicacions inconsistents és llegendària. La figura 3 exposa algunes de les diferències més importants en com es dissenyen les aplicacions.

Codificació: Codificació:

Els dissenyadors d'aplicacions han escollit la codificació de camp (gènere) de diverses maneres. Un dissenyador representa el gènere com una "m" i una "f". Un altre dissenyador representa el gènere com un "1" i un "0". Un altre dissenyador representa el gènere com una "x" i una "y". Un altre dissenyador representa el gènere com "mascle" i "dona". Realment no importa com entra el sexe al DW. La "M" i la "F" són probablement tan bones com qualsevol representació.

El que importa és que sigui quina sigui la font d'on provingui el camp sexual, aquest camp arriba al DW en un estat integrat consistent. En conseqüència, quan el camp es carrega al DW des d'una aplicació on s'ha representat fora en el format "M" i "F", el Dati s'ha de convertir al format DW.

Mesura d'Atributs: Mesurament de Atributs:

Els dissenyadors d'aplicacions han optat per mesurar el pipeline de diverses maneres al llarg dels anys. Un dissenyador emmagatzema i Dati de la canonada en centímetres. Un altre dissenyador d'aplicacions emmagatzema el Dati de la canonada en polzades. Un altre dissenyador d'aplicacions emmagatzema el Dati de la canonada en milions de peus cúbics per segon. I un altre dissenyador emmagatzema informació de canonades en termes de iardes. Sigui quina sigui la font, quan la informació de la canalització arriba al DW, s'ha de mesurar de la mateixa manera.

Com es mostra a la figura 3, els problemes d'integració afecten gairebé tots els aspectes del projecte: les característiques físiques del projecte Dati, el dilema de tenir més d'una font de Dati, el problema de les mostres identificades inconsistents, formats de Dati inconsistents, etc.

Sigui quin sigui l'argument del disseny, el resultat és el mateix: és a dir Dati s'ha d'emmagatzemar al DW d'una manera única i globalment acceptable, fins i tot quan els sistemes operatius subjacents emmagatzemen i Dati.

Quan l'analista DSS mira el DW, el focus de l'analista hauria de ser l'explotació Dati que es troben al magatzem,

en lloc de preguntar-se sobre la credibilitat o la coherència de la Dati.

VARIANT TEMPORAL

Tot jo Dati en el DW són precisos en algun moment en el temps. Aquesta característica bàsica del Dati en DW és molt diferent de Dati que es troben a l'entorn operatiu. EL Dati de l'entorn operatiu són tan precises com en el moment de l'accés. En altres paraules, en l'entorn operatiu quan s'accedeix a una unitat Dati, s'espera que reflecteixi valors tan precisos com en el moment de l'accés. Perquè jo Dati al DW són exactes ja que en algun moment del temps (és a dir, no "ara mateix"), jo Dati que es troben al DW són "variància temporal".
La variació temporal de Dati per DW es fa referència de moltes maneres.
La manera més senzilla és que i Dati d'una representació DW Dati en un horitzó temporal llarg: de cinc a deu anys. L'horitzó temporal representat per a l'entorn operatiu és molt més curt que els valors actuals en un màxim de seixanta noranta
Les aplicacions que han de funcionar bé i han d'estar disponibles per al processament de transaccions han de portar la quantitat mínima de Dati si permeten algun grau de flexibilitat. Així, les aplicacions operatives tenen un horitzó temporal curt, com ara un tema de disseny d'aplicacions d'àudio.
La segona manera en què apareix la "variància temporal" al DW és a l'estructura clau. Cada estructura clau del DW conté, implícita o explícitament, un element temporal, com ara el dia, la setmana, el mes, etc. L'element de temps es troba gairebé sempre a la part inferior de la clau concatenada que es troba al DW. En aquestes ocasions, l'element temps existirà implícitament, com per exemple en el cas que es dupliqui un fitxer sencer a finals de mes o trimestre.
La tercera manera en què es mostra la variació temporal és que i Dati del DW, només registrat correctament, no es pot actualitzar. EL Dati de la DW són, a tots els efectes pràctics, una llarga sèrie d'instantànies. Per descomptat, si la instantània s'ha fet incorrectament, les instantànies es poden modificar. Però suposant que les instantànies es prenen correctament, no es canvien tan bon punt es facin. En alguns

En casos, pot ser poc ètic o fins i tot no vàlid que es modifiquin les instantànies del DW. EL Dati operativa, essent tan precisa com en el moment de l'accés, es pot actualitzar a mesura que es presenti la necessitat.

NO VOLATIL

La quarta característica important de DW és que no és volàtil.
Les actualitzacions, insercions, supressions i canvis es realitzen periòdicament als entorns operatius, registre per registre. Però la manipulació bàsica de la Dati necessari al DW és molt més fàcil. Només hi ha dos tipus d'operacions que es produeixen al DW: la càrrega inicial del Dati i accés a Dati. No hi ha cap actualització de Dati (en el sentit general d'actualització) al DW com a operació de processament normal. Hi ha algunes conseqüències molt poderoses d'aquesta diferència bàsica entre el processament operatiu i el processament DW. A nivell de disseny, la necessitat de ser prudent amb l'actualització d'error no és un factor en el DW, ja que l'actualització de Dati no es realitza. Això vol dir que, a nivell físic de disseny, es poden prendre llibertats per optimitzar l'accés Dati, especialment en tractar els temes de normalització i desnormalització física. Una altra conseqüència de la simplicitat d'operació de DW és la tecnologia subjacent utilitzada per executar l'entorn DW. Haver de suportar actualitzacions en línia registre per registre (com sol passar amb el processament operatiu) requereix que la tecnologia tingui una base molt complexa sota una aparent simplicitat.
La tecnologia que admet la còpia de seguretat i la recuperació, les transaccions i la integritat dels fitxers Dati i la detecció i el remei de bloqueig és força complex i innecessari per al processament de DW. Les característiques d'un DW, orientació al disseny, integració de Dati dins del DW, la variació temporal i la facilitat de gestió de Dati, tot condueix a un entorn molt, molt diferent de l'entorn operatiu clàssic. La font de gairebé tots Dati de DW són l'entorn operatiu. És temptador pensar que hi ha una redundància massiva de Dati entre els dos ambients.
De fet, la primera impressió que tenen molta gent és la d'una gran redundància Dati entre l'entorn operatiu i l'entorn de

Extensió DW. Aquesta interpretació és superficial i demostra una manca de comprensió del que està passant al DW.
De fet, hi ha un mínim de redundància Dati entre l'entorn operatiu i i Dati del DW. Considereu el següent: I Dati es filtren dates que canvieu de l'entorn operatiu a l'entorn DW. Molts Dati mai surten de l'entorn operatiu. Només que jo Dati que són necessaris per al processament DSS troben la seva direcció a l'entorn

▪ l'horitzó temporal de Dati és molt diferent d'un entorn a un altre. EL Dati en l'entorn operatiu són molt frescos. EL Dati al DW són molt més grans. Només des d'una perspectiva d'horitzó temporal, hi ha molt poca superposició entre l'entorn operatiu i el DW.

▪ El DW conté Dati resum que mai estan a l'entorn

▪ I Dati experimenten una transformació fonamental a mesura que passen a la Figura 3 il·lustra que la majoria dels Dati es modifiquen significativament sempre que se seleccionen i es mouen al DW. Dit d'una altra manera, la majoria Dati es canvia físicament i radicalment a mesura que es trasllada al DW. Des del punt de vista de la integració no són el mateix Dati residint en l'entorn operatiu. Tenint en compte aquests factors, la redundància de Dati entre els dos entorns és un esdeveniment rar, que condueix a una redundància inferior a l'1% entre els dos entorns. L'ESTRUCTURA DEL MAGATZEM Els DW tenen una estructura diferent. Hi ha diversos nivells de resum i detall que delimiten els DW.
Els diferents components d'un DW són:

De lluny, la principal preocupació és per i Dati detalls actuals. És la principal preocupació perquè:

  • I Dati Els detalls actuals reflecteixen els esdeveniments més recents, que sempre són de gran interès i
  • i Dati les dades de detall actuals són voluminoses perquè s'emmagatzemen al nivell més baix de granularitat i
  • i Dati dels detalls actuals gairebé sempre s'emmagatzemen a la memòria del disc, que és ràpid d'accedir, però costosa i complexa des d'I Dati de detall són més antigues Dati que s'emmagatzemen en alguna memòria de massa. S'hi accedeix esporàdicament i s'emmagatzema amb un nivell de detall compatible Dati detalls actuals. Tot i que no és obligatori emmagatzemar en un mitjà d'emmagatzematge alternatiu, a causa del gran volum de Dati unit amb l'accés esporàdic de la Dati, el mitjà d'emmagatzematge per Dati Els detalls més antics no solen emmagatzemar-se al disc. EL Dati es resumeixen lleugerament Dati que es destil·len des del nivell de detall baix trobat fins al nivell de detall actual. Aquest nivell de DW gairebé sempre s'emmagatzema a la memòria del disc. Els problemes de disseny que es presenten a l'arquitecte del Dati en la construcció d'aquest nivell del DW són:
  • Quina unitat de temps és el resum fet anteriorment
  • Quin contingut, els atributs resumiran lleugerament el contingut del Dati El següent nivell de Dati que es troba al DW és el de Dati molt resumida. EL Dati molt resumits són compactes i de fàcil accés. EL Dati de vegades es troben molt resumits en l'entorn DW i altres casos i Dati altament abstractes es troben fora de les parets immediates de la tecnologia que allotja el DW. (en tot cas, i Dati molt resumits formen part del DW independentment d'on i Dati estan allotjats físicament). El component final del DW és el component de metadades. En molts aspectes, les metadades es troben en una dimensió diferent de la d'altres Dati del DW, perquè les metadades no en contenen cap dates extret directament de l'entorn operatiu. Les metadades tenen un paper especial i molt important en DW. Les metadades s'utilitzen com a:
  • un directori per ajudar l'analista DSS a localitzar el contingut del DW,
  • una guia de cartografia Dati de com jo Dati s'han transformat de l'entorn operatiu a l'entorn DW,
  • una guia dels algorismes utilitzats per resumir entre i Dati detalls actuals ei Dati lleugerament resumida, i Dati En resum, les metadades tenen un paper molt més important en l'entorn DW que mai en l'entorn operatiu. ANTIGU DETALLS MEDI D'emmagatzematge La cinta magnètica es pot utilitzar per emmagatzemar aquest tipus Dati. De fet, hi ha una gran varietat de suports d'emmagatzematge que s'han de tenir en compte per emmagatzemar els antics Dati de detall. En funció del volum de Dati, freqüència d'accés, cost de les eines i tipus d'accés, és totalment probable que altres eines necessitin l'antic nivell de detall del DW. FLUX DE DADES Hi ha un flux normal i previsible del Dati dins del DW.
    I Dati entren al DW des de l'entorn operatiu. (NOTA: hi ha algunes excepcions molt interessants a aquesta regla. Tanmateix, gairebé totes Dati introduïu el DW des de l'entorn operatiu). Dada que jo Dati entren al DW des de l'entorn operatiu, es transforma tal com es descriu anteriorment. Sempre que introduïu el DW, és a dir Dati introduïu el nivell de detall actual, tal com es mostra. Hi resideix i s'utilitza fins que es produeix un dels tres esdeveniments:
  • es purifica,
  • es resumeix, i/o ▪és El procés obsolet dins d'un DW es mou i Dati detalls actuals a Dati de detall antic, segons l'edat de Dati. El procés de

el resum utilitza el detall de Dati per calcular el Dati nivells lleugerament resumits i molt resumits de la Dati. Hi ha algunes excepcions al flux mostrat (que es comentarà més endavant). No obstant això, normalment, per a la gran majoria de Dati es troba dins d'un DW, el flux de Dati és tal com es representa.

ÚS DEL DATAWAREHOUSE

No sorprèn els diferents nivells de Dati dins del DW no reben diferents nivells d'ús. Per regla general, com més alt sigui el nivell de resum, més i Dati s'utilitzen.
Molts usos es donen al Dati molt resumida, mentre que l'antiga Dati de detall gairebé mai s'utilitzen. Hi ha bones raons per canviar l'organització al paradigma d'utilització de recursos. Més resumit i Dati, més ràpid i eficient és arribar-hi Dati. Si a botiga descobreix que fa molt de processament a nivell de detall del DW, llavors es consumeix una quantitat corresponent de recursos de màquina. És en el millor interès de tots processar un nivell tan alt de resum tan aviat com sigui possible.

Per a moltes botigues, l'analista DSS en un entorn pre-DW ha utilitzat Dati a nivell de detall. En molts aspectes l'arribada a Dati detallat sembla una manta de seguretat, fins i tot quan hi ha disponibles altres nivells de resum. Una de les activitats de l'arquitecte de Dati és desllevar l'usuari de DSS de l'ús constant de Dati al nivell més baix de detall. Hi ha dues motivacions a l'abast de l'arquitecte Dati:

  • instal·lar un sistema de devolució de càrrecs, on l'usuari final paga pels recursos consumits e
  • que indiquen que es pot obtenir molt bon temps de resposta quan el comportament amb i Dati es troba a un alt nivell de resum, mentre que el mal temps de resposta prové del comportament de la Dati a un nivell baix de ALTRES CONSIDERACIONS Hi ha algunes altres consideracions de construcció i gestió de DW.
    La primera consideració és la dels índexs. EL Dati en nivells superiors de resum es poden indexar lliurement, mentre que i Dati

a nivells de detall més baixos són tan voluminosos que es poden indexar amb moderació. De la mateixa manera, i Dati amb alts nivells de detall es pot reestructurar amb relativa facilitat, mentre que el volum de Dati als nivells inferiors és tan gran que i Dati no es poden renovar fàcilment. En conseqüència, el model de la Dati i el treball formal realitzat pel disseny posa les bases per a DW aplicat gairebé exclusivament al nivell de detall actual. En altres paraules, les activitats de modelatge del Dati no s'apliquen als nivells de resum, en gairebé tots els casos. Una altra consideració estructural és la de la subdivisió de Dati per DW.

La partició es pot fer a dos nivells: al nivell de dbms i a nivell d'aplicació. A la divisió a nivell dbms, La dbms s'informa de les divisions i les controla en conseqüència. En el cas d'una divisió a nivell d'aplicació, només el programador és conscient de les divisions i la responsabilitat de la seva administració es deixa a ell.

Per sota del nivell dbms, molta feina es fa automàticament. Hi ha molta inflexibilitat associada a l'autoadministració de les divisions. En el cas de l'aplicació a nivell divisió de la Dati del magatzem de dades, gran part de la feina recau en el programador, però el resultat final és flexibilitat en l'administració del Dati en magatzem de dades

ALTRES ANOMALIES

Mentre que els components del magatzem de dades treball tal com es descriu per a gairebé tots Dati, hi ha algunes excepcions útils que cal discutir. Una excepció és la de Dati resums públics (dades de resum públic). Aquests són Dati resums que s'han calculat a partir del magatzem de dades però són utilitzats per la societat. EL Dati els resums públics s'emmagatzemen i gestionen al magatzem de dades, encara que com s'ha esmentat anteriorment estan esbrinats. Els comptables treballen per produir aquest trimestre Dati com ara ingressos, despeses trimestrals, beneficis trimestrals, etc. El treball realitzat pels comptables és extern al magatzem de dades. Tanmateix, i Dati s'utilitzen "internament" dins de l'empresa - des mercadeig, vendes, etc. Una altra anomalia, que no es parlarà, és la de Dati extern.

Un altre tipus destacat de Dati que es pot trobar en a magatzem de dades és el de les dades de detall permanent. Aquests provoquen la necessitat d'emmagatzemar permanentment el Dati a nivell detallat per raons ètiques o legals. Si una empresa està exposant els seus treballadors a substàncies perilloses, és necessari Dati detallat i permanent. Si una empresa fabrica un producte que implica seguretat pública, com ara peces per a un avió, cal Dati dades permanents, així com si una empresa celebra contractes perillosos.

L'empresa no es pot permetre el luxe de passar per alt els detalls perquè durant els propers anys, en cas de demanda, retirada, defecte de construcció impugnat, etc. l'exposició de l'empresa podria ser gran. Com a resultat, hi ha un tipus únic de Dati conegudes com a dades de detall permanent.

RESUM

Un magatzem de dades és una variant orientada a objectes, integrada, tensa, una col·lecció de Dati no volàtil en suport de les necessitats de presa de decisions de l'administració. Cadascuna de les funcions destacades d'a magatzem de dades té les seves implicacions. A més hi ha quatre nivells de Dati del magatzem de dades:

  • Detalls antics
  • Detall actual
  • dades lleugerament resumida
  • dades Les metadades molt resumides també són una part important del magatzem de dades. RESUM El concepte d'emmagatzematge de Dati recentment ha rebut molta atenció i s'ha convertit en una tendència dels anys 90. Això es deu a la capacitat d'un magatzem de dades per superar les limitacions dels sistemes de suport a la gestió com els sistemes de suport a la decisió (DSS) i els sistemes d'informació executiva (EIS). Tot i que el concepte de la magatzem de dades sembla prometedor, implementar i magatzem de dades pot ser problemàtic a causa dels processos d'emmagatzematge a gran escala. Tot i la complexitat dels projectes d'emmagatzematge de Dati, molts proveïdors i consultors que fan estoc Dati argumentar que l'emmagatzematge de Dati no presenten cap problema. Tanmateix, a l'inici d'aquest projecte de recerca, gairebé no s'havia fet cap recerca independent, rigorosa i sistemàtica. En conseqüència, és difícil dir què passa realment a la indústria quan es construeixen magatzem de dades. Aquest estudi va explorar la pràctica d'emmagatzematge de Dati contemporanis que té com a objectiu desenvolupar una comprensió més rica de la pràctica australiana. La revisió de la literatura va proporcionar el context i la base per a l'estudi empíric. Hi ha una sèrie de resultats d'aquesta investigació. En primer lloc, aquest estudi va revelar les activitats que es van produir durant el desenvolupament del magatzem de dades. En molts àmbits, i Dati recollit va confirmar la pràctica descrita a la literatura. En segon lloc, els problemes i problemes que poden afectar el desenvolupament de la magatzem de dades van ser identificats per aquest estudi. Finalment, els beneficis obtinguts per les organitzacions australianes associats amb l'ús de magatzem de dades han estat revelats.

Capítol 1

Context de cerca

El concepte d'emmagatzematge de dades va rebre una exposició generalitzada i es va convertir en una tendència emergent a la dècada de 90 (McFadden 1996, TDWI 1996, Shah i Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman i Oates 2000). Això es pot comprovar a partir del nombre creixent d'articles sobre emmagatzematge de dades en publicacions comercials (Little i Gibson 1999). Molts articles (vegeu, per exemple, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett i King 1996, Graham et al. 1996, Sakaguchi i Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, McCar O'Donnell, 1997 Edwards 1997, TDWI 1998) han informat de beneficis significatius per a les organitzacions que implementen magatzem de dades. Van recolzar la seva teoria amb proves anecdòtiques d'implementacions reeixides, xifres d'alt retorn de la inversió (ROI) i, també, proporcionant pautes o metodologies per desenvolupar magatzem de dades

(Shanks et al. 1997, Seddon i Benjamin 1998, Little i Gibson 1999). En un cas extrem, Graham et al. (1996) van reportar un rendiment mitjà d'una inversió de tres anys del 401%.

Gran part de la literatura actual, però, ha passat per alt les complexitats que comporta la realització d'aquests projectes. Els projectes de magatzem de dades solen ser complexes i a gran escala i, per tant, comporten una alta probabilitat de fracàs si no es controlen acuradament (Shah i Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs i Clymer 1998, Rao 1998). Requereixen grans quantitats de recursos humans i financers, temps i esforç per construir-los (Hill 1998, Crofts 1998). El temps i els mitjans financers típics necessaris són d'uns dos anys i de dos a tres milions de dòlars, respectivament (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Aquest temps i mitjans econòmics són necessaris per controlar i consolidar molts aspectes diferents de l'emmagatzematge de dades (Cafasso 1995, Hill 1998). A més de les consideracions de maquinari i programari, altres funcions, que varien des de l'extracció de Dati als processos de càrrega de Dati, la capacitat de memòria per gestionar les actualitzacions i el meta Dati per a la formació dels usuaris, s'ha de tenir en compte.

En el moment en què va començar aquest projecte de recerca, hi havia molt poca investigació acadèmica que s'estava realitzant en el camp de l'emmagatzematge de dades, especialment a Austràlia. Això era evident per la escassetat d'articles publicats sobre l'emmagatzematge de dades per revistes o altres escrits acadèmics de l'època. Molts dels escrits acadèmics disponibles descriuen l'experiència dels EUA. La manca d'investigació acadèmica en l'àrea de l'emmagatzematge de dades ha provocat una demanda d'investigació rigorosa i estudis empírics (McFadden 1996, Shanks et al. 1997, Little i Gibson 1999). En particular, estudis de recerca sobre el procés d'implementació de magatzem de dades cal fer per ampliar el coneixement general sobre la implementació de magatzem de dades i servirà de base per a un futur estudi de recerca (Shanks et al. 1997, Little i Gibson 1999).

L'objectiu d'aquest estudi, per tant, és investigar què passa realment quan les organitzacions implementen i utilitzen i magatzem de dades a Austràlia. En concret, aquest estudi implicarà l'anàlisi de tot un procés de desenvolupament d'a magatzem de dades, començant amb la iniciació i el disseny passant pel disseny i la implementació i l'ús posterior a les organitzacions australianes. A més, l'estudi també contribuirà a la pràctica actual identificant àrees on la pràctica es pot millorar encara més i les ineficiències i els riscos es poden minimitzar o evitar. A més, servirà de base per a altres estudis sobre magatzem de dades a Austràlia i omplirà el buit que hi ha actualment a la literatura.

Preguntes de recerca

L'objectiu d'aquesta recerca és estudiar les activitats implicades en la implementació de magatzem de dades i el seu ús per les organitzacions australianes. En particular, s'estudien els elements relatius a la planificació, desenvolupament, funcionament, ús i riscos del projecte. Per tant, la pregunta d'aquesta investigació és:

“Com és la pràctica actual de la magatzem de dades a Austràlia?"

Per respondre eficaçment aquesta pregunta, calen una sèrie de preguntes de recerca subsidiàries. En particular, s'han identificat tres subqüestions de la literatura, que es presenta al capítol 2, per guiar aquest projecte de recerca: Com són els magatzem de dades per organitzacions australianes? Quins són els problemes trobats?

Quins són els beneficis experimentats?
Per respondre aquestes preguntes, es va utilitzar un disseny d'investigació exploratòria que emprava una enquesta. Com a estudi exploratori, les respostes a les preguntes anteriors no estan completes (Shanks et al. 1993, Denscombe 1998). En aquest cas, cal fer alguna triangulació per millorar les respostes a aquestes preguntes. Tanmateix, la investigació proporcionarà una base sòlida per al treball futur que examini aquestes qüestions. Al capítol 3 es presenta una discussió detallada de la justificació i el disseny del mètode d'investigació.

Estructura del projecte de recerca

Aquest projecte de recerca es divideix en dues parts: l'estudi contextual del concepte d'emmagatzematge de dades i la investigació empírica (vegeu la figura 1.1), cadascuna de les quals es comenta a continuació.

Part I: Estudi contextual

La primera part de la investigació va consistir en una revisió de la literatura actual sobre diversos tipus d'emmagatzematge de dades, incloent sistemes de suport a la decisió (DSS), sistemes d'informació executiva (EIS), estudis de cas de magatzem de dades i els conceptes de magatzem de dades. També, els resultats dels fòrums en magatzem de dades i els grups de reunions d'experts i professionals liderats pel grup de recerca Monash DSS, van contribuir en aquesta fase de l'estudi que tenia com a objectiu obtenir una visió de la pràctica de magatzem de dades i identificar els riscos que comporta la seva adopció. Durant aquest període d'estudi contextual, es va establir una comprensió de l'àrea problemàtica per proporcionar la base de coneixement per a investigacions empíriques posteriors. No obstant això, aquest era un procés continu a mesura que es va dur a terme l'estudi de recerca.

Part II: Recerca empírica

El concepte relativament nou d'emmagatzematge de dades, especialment a Austràlia, ha creat la necessitat d'una enquesta per obtenir una imatge àmplia de l'experiència d'ús. Aquesta part es va realitzar un cop s'havia establert el domini del problema mitjançant una extensa revisió de la literatura. El concepte d'emmagatzematge de dades format durant la fase d'estudi contextual es va utilitzar com a entrada per al qüestionari inicial d'aquest estudi. Després d'això, es va revisar el qüestionari. Ets un expert en magatzem de dades va participar a la prova. L'objectiu de la prova del qüestionari inicial era comprovar la integritat i l'exactitud de les preguntes. A partir dels resultats de la prova, es va modificar el qüestionari i es va enviar la versió modificada als participants de l'enquesta. Després es van analitzar els qüestionaris retornats per a i Dati en taules, diagrames i altres formats. EL

resultats de l'anàlisi Dati formen una instantània de la pràctica d'emmagatzematge de dades a Austràlia.

VISIÓ GENERAL DEL MAGATZEMATGE DE DADES

El concepte d'emmagatzematge de dades ha evolucionat amb les millores en la tecnologia informàtica.
Està dirigit a superar els problemes que troben els grups de suport d'aplicacions com el Sistema de Suport a la Decisió (DSS) i el Sistema d'Informació Executiva (EIS).

En el passat, el major obstacle d'aquestes aplicacions ha estat la incapacitat d'aquestes aplicacions per proporcionar a base de dades necessaris per a l'anàlisi.
Això es deu principalment a la naturalesa del treball de la direcció. Els interessos de la direcció d'una empresa varien constantment segons l'àmbit que s'hi abasta. Per tant i Dati fonamentals per a aquestes aplicacions han de poder canviar ràpidament en funció de la peça a tractar.
Això vol dir que i Dati ha d'estar disponible en la forma adequada per a les anàlisis requerides. De fet, els grups de suport d'aplicacions tenien molt difícil en el passat recopilar i integrar Dati de fonts complexes i diverses.

La resta d'aquesta secció presenta una visió general del concepte d'emmagatzematge de dades i s'explica com magatzem de dades pot superar els problemes dels grups de suport d'aplicacions.
El terme "Magatzem de dadesva ser popularitzat per William Inmon el 1990. La seva definició sovint citada veu el Magatzem de dades com a col·lecció de Dati orientat a temes, integrat, no volàtil i variable en el temps, en suport de les decisions de gestió.

Utilitzant aquesta definició, Inmon assenyala que i Dati residint en a magatzem de dades ha de tenir les 4 característiques següents:

  • ▪ Orientat a la matèria
  • ▪ Integrat
  • ▪ No volàtil
  • ▪ Variable en el temps Per Inmon orientat a la matèria significa que i Dati en magatzem de dades en les àrees organitzatives més grans que hi ha hagut

definida en el model Dati. Per exemple tots Dati pel que fa al clients es troben a l'àrea temàtica CLIENTS. Igualment tots Dati relacionades amb els productes es troben a l'àrea temàtica PRODUCTES.

Per Integrated Inmon vol dir que i Dati de diferents plataformes, sistemes i ubicacions es combinen i s'emmagatzemen en un sol lloc. En conseqüència Dati els de similars s'han de transformar en formats coherents per afegir i comparar fàcilment.
Per exemple, el gènere masculí i femení es representen amb les lletres M i F en un sistema, i amb 1 i 0 en un altre. Per integrar-los correctament, cal transformar un o ambdós formats de manera que els dos formats siguin iguals. En aquest cas podríem canviar M a 1 i F a 0 o viceversa. Orientat a la matèria i Integrat indiquen que el magatzem de dades està dissenyat per oferir una visió funcional i transversal de Dati per part de l'empresa.

Per No volàtil vol dir que i Dati en magatzem de dades mantenir-se coherent i actualitzar Dati no és necessari. En canvi, qualsevol canvi en el Dati s'afegeixen originals database del magatzem de dades. Això vol dir que l'historiador de la Dati està continguda a magatzem de dades.

Per a les variables amb el temps, Inmon indica que i Dati en magatzem de dades sempre conté els indicadors de tempo ei Dati normalment creuen un horitzó temporal determinat. Per exemple a
magatzem de dades pot contenir 5 anys de valors històrics de clients de 1993 a 1997. La disponibilitat de la sèrie històrica i d'una sèrie temporal de la Dati permet analitzar tendències.

Un magatzem de dades pot recollir el seu Dati dels sistemes OLTP; dels orígens Dati extern a l'organització i/o d'altres projectes especials de sistemes de captura Dati.
I Dati els extractes poden passar per un procés de neteja, en aquest cas i Dati es transformen i s'integren abans d'emmagatzemar-se al database del magatzem de dades. Llavors jo Dati

residint dins del database del magatzem de dades estan disponibles per als inicis de sessió dels usuaris finals i les eines de recuperació. Mitjançant aquestes eines l'usuari final pot accedir a la vista integrada de l'organització del Dati.

I Dati residint dins del database del magatzem de dades s'emmagatzemen tant en format detallat com en format resum.
El nivell de resum pot dependre de la naturalesa del Dati. Jo Dati detallat pot consistir en Dati actual i Dati historiadors
I Dati reals no estan inclosos en el magatzem de dades fins i Dati en magatzem de dades es tornen a actualitzar.
A més d'emmagatzemar el Dati ells mateixos, a magatzem de dades també pot emmagatzemar un tipus diferent de dates anomenades METADADES que descriuen i Dati residint a la seva database.
Hi ha dos tipus de metadades: metadades de desenvolupament i metadades d'anàlisi.
Les metadades de desenvolupament s'utilitzen per gestionar i automatitzar els processos d'extracció, neteja, mapeig i càrrega Dati en magatzem de dades.
La informació continguda a les metadades de desenvolupament pot contenir detalls dels sistemes operatius, detalls dels elements a extreure, el model Dati del magatzem de dades i regles empresarials per a la conversió de dades Dati.

El segon tipus de metadades, conegut com a metadades analítiques, permet a l'usuari final explorar el contingut magatzem de dades per trobar el Dati disponibles i el seu significat en termes clars i no tècnics.

Així, les metadades analítiques funcionen com un pont entre el magatzem de dades i aplicacions d'usuari final. Aquestes metadades poden contenir el model de negoci, les descripcions Dati corresponent al model de negoci, consultes i informes predefinits, informació per a l'accés dels usuaris i l'índex.

Les metadades d'anàlisi i desenvolupament s'han de combinar en una metadades de contenció integrades per funcionar correctament.

Malauradament, moltes de les eines existents tenen les seves pròpies metadades i actualment no hi ha estàndards existents

permetre que les eines d'emmagatzematge de dades integrin aquestes metadades. Per solucionar aquesta situació, molts venedors d'eines d'emmagatzematge de dades líders van formar el Meta Data Council que més tard es va convertir en la Meta Data Coalition.

L'objectiu d'aquesta coalició és crear un conjunt de metadades estàndard que permeti a diferents eines d'emmagatzematge de dades convertir metadades.
Els seus esforços van donar lloc al naixement de l'Especificació d'intercanvi de dades de meta (MDIS) que permetrà l'intercanvi d'informació entre els arxius de Microsoft i els fitxers MDIS relacionats.

L'existència de Dati tant resumit/indexat com detallat, dóna a l'usuari la possibilitat de realitzar un DILL DOWN (foradatge) des de Dati indexats a detallats i viceversa. L'existència de Dati l'historial detallat permet la creació d'anàlisis de tendències al llarg del temps. A més, les metadades d'anàlisi es poden utilitzar com a directori del database del magatzem de dades per ajudar els usuaris finals a localitzar i Dati necessaris.

En comparació amb els sistemes OLTP, amb la seva capacitat per donar suport a l'anàlisi de Dati i informar, el magatzem de dades es veu com un sistema més adequat per a processos d'informació com la realització i resposta de consultes i l'elaboració d'informes. La següent secció destacarà detalladament les diferències dels dos sistemes.

MAGATZEM DE DADES CONTRA ELS SISTEMES OLTP

Molts dels sistemes d'informació de les organitzacions estan pensats per donar suport a les operacions del dia a dia. Aquests sistemes coneguts com a SISTEMES OLTP, capturen transaccions diàries que s'actualitzen contínuament.

I Dati dins d'aquests sistemes sovint es modifiquen, afegeixen o suprimeixen. Per exemple, l'adreça d'un client canvia a mesura que es mou d'un lloc a un altre. En aquest cas, la nova adreça es registrarà modificant el camp d'adreça de database. L'objectiu principal d'aquests sistemes és reduir els costos de transacció i al mateix temps reduir els temps de processament. Alguns exemples de sistemes OLTP inclouen accions crítiques com ara registre de comandes, nòmines, factures, fabricació, servei al client clients.

A diferència dels sistemes OLTP, que es van crear per a processos basats en transaccions i esdeveniments, i magatzem de dades es van crear per proporcionar suport de processos basat en l'anàlisi Dati i sobre els processos de presa de decisions.

Això s'aconsegueix normalment integrant i Dati de diversos OLTP i sistemes externs en un únic "contenidor" de Dati, tal com s'ha comentat a l'apartat anterior.

Model de procés d'emmagatzematge de dades Monash

El model de procés per magatzem de dades Monash va ser desenvolupat per investigadors del Monash DSS Research Group i es basa en la literatura de magatzem de dades, experiència en camps de sistemes de suport al desenvolupament, converses amb venedors d'aplicacions per utilitzar-les magatzem de dades, sobre un grup d'experts en l'ús de magatzem de dades.

Les fases són: Iniciació, Planificació, Desenvolupament, Operacions i Explicació. El diagrama explica la naturalesa iterativa o evolutiva del desenvolupament a magatzem de dades procés mitjançant fletxes de doble sentit col·locades entre les diferents etapes. En aquest context, “iterativa” i “evolutiva” vol dir que, a cada pas del procés, les activitats d'implementació sempre es poden propagar cap enrere a l'etapa anterior. Això es deu a la naturalesa d'un projecte magatzem de dades en què es produeixen peticions addicionals per part de l'usuari final en qualsevol moment. Per exemple, durant la fase de desenvolupament d'un procés magatzem de dadesSi l'usuari final sol·licita una nova mida o àrea del tema, que no formava part del pla original, s'ha d'afegir al sistema. Això provoca un canvi en el projecte. El resultat és que l'equip de disseny ha de canviar els requisits dels documents creats fins ara durant la fase de disseny. En molts casos, l'estat actual del projecte ha de remuntar-se fins a la fase de disseny on s'ha d'afegir i documentar el nou requisit. L'usuari final ha de poder veure la documentació concreta revisada i els canvis que s'han fet en la fase de desenvolupament. Al final d'aquest cicle de desenvolupament, el projecte ha de rebre una bona retroalimentació tant dels equips de desenvolupament com dels usuaris. Aleshores, els comentaris es reutilitzen per millorar un projecte futur.

Planificació de la capacitat
dw tendeix a ser de mida molt gran i créixer molt ràpidament (Best 1995, Rudin 1997a) a causa de la quantitat de Dati històrics que conserven de la seva durada. El creixement també pot ser causat per Dati complements sol·licitats pels usuaris per augmentar el valor de Dati que ja tenen. En conseqüència, els requisits d'emmagatzematge per Dati es pot millorar significativament (Eckerson 1997). Per tant, és essencial assegurar, mitjançant la planificació de la capacitat, que el sistema a construir pugui créixer a mesura que creixen les necessitats (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
En la planificació de l'escalabilitat del magatzem de dades, cal conèixer el creixement esperat de la mida del magatzem, els tipus de preguntes que es poden fer i el nombre d'usuaris finals admesos (Best 1995, Rudin 1997b, Foley 1997a). La creació d'aplicacions escalables requereix una combinació de tecnologies de servidor escalables i tècniques de disseny d'aplicacions escalables (Best 1995, Rudin 1997b. Totes dues són necessàries per crear una aplicació altament escalable. Les tecnologies de servidor escalables poden fer que sigui fàcil i rendible afegir emmagatzematge, memòria i CPU sense rendiment degradant (Lang 1997, Telephony 1997).

Hi ha dues tecnologies principals de servidor escalables: processament múltiple simètric (SMP) i processament massivament paral·lel (MPP) (IDC 1997, Humphries et al. 1999). Un servidor SMP normalment té diversos processadors que comparteixen memòria, busos del sistema i altres recursos (IDC 1997, Humphries et al. 1999). Es poden afegir processadors addicionals per augmentar-lo poder computacional. Un altre mètode per augmentar el poder càlcul del servidor SMP, és combinar nombroses màquines SMP. Aquesta tècnica es coneix com clustering (Humphries et al. 1999). Un servidor MPP, en canvi, té diversos processadors cadascun amb la seva pròpia memòria, sistema de bus i altres recursos (IDC 1997, Humphries et al. 1999). Cada processador s'anomena node. Un augment de la poder es pot obtenir computacional

afegir nodes addicionals als servidors MPP (Humphries et al. 1999).

Una debilitat dels servidors SMP és que massa operacions d'entrada-sortida (I/O) poden congestionar el sistema de bus (IDC 1997). Aquest problema no es produeix als servidors MPP, ja que cada processador té el seu propi sistema de bus. Tanmateix, les interconnexions entre cada node són generalment molt més lentes que el sistema de bus SMP. A més, els servidors MPP poden afegir una capa addicional de complexitat als desenvolupadors d'aplicacions (IDC 1997). Així, l'elecció entre servidors SMP i MPP pot estar influenciada per molts factors, com ara la complexitat de les aplicacions, la relació preu/rendiment, el rendiment requerit, les aplicacions dw impedides i l'augment de mida del database de dw i en el nombre d'usuaris finals.

Es poden utilitzar diverses tècniques de disseny d'aplicacions escalables en la planificació de la capacitat. S'utilitza diversos períodes d'informe, com ara dies, setmanes, mesos i anys. Tenint diversos períodes de notificació, el database es pot dividir en peces agrupades de manera manejable (Inmon et al. 1997). Una altra tècnica és utilitzar taules de resum que es construeixen per resum Dati da Dati detallat. Així, i Dati els resums són més compactes que els detallats, cosa que requereix menys espai de memòria. Doncs el Dati els detalls es poden arxivar en una unitat d'emmagatzematge menys costosa, la qual cosa estalvia encara més emmagatzematge. Tot i que l'ús de taules de resum pot estalviar espai d'emmagatzematge, requereixen molt d'esforç per mantenir-les actuals i en línia amb les necessitats empresarials. Tanmateix, aquesta tècnica s'utilitza àmpliament i sovint s'utilitza conjuntament amb la tècnica anterior (Best 1995, Inmon 1996a, Chauduri i Dayal).
1997).

definint Magatzem de dades Arquitectures Tècniques Definició de tècniques d'arquitectura dw

Els primers usuaris de l'emmagatzematge de dades van imaginar principalment una implementació centralitzada d'emmagatzematge de dades on tots Dati, inclòs i Dati externs, s'integraven en un únic,
dipòsit físic (Inmon 1996a, Bresnahan 1996, Peacock 1998).

El principal avantatge d'aquest enfocament és que els usuaris finals poden accedir a la visió de l'empresa Dati organitzatiu (Ovum 1998). Un altre avantatge és que ofereix estandardització de Dati a tota l'organització, el que significa que només hi ha una versió o definició per a cada terminologia utilitzada a les metadades del dipòsit (Flanagan i Safdie 1997, Ovum 1998). El desavantatge d'aquest enfocament, d'altra banda, és que és car i difícil de construir (Flanagan i Safdie 1997, Ovum 1998, Inmon et al. 1998). No gaire després de l'arquitectura d'emmagatzematge Dati centralitzat es va popularitzar, va evolucionar el concepte d'extracció dels més petits subconjunts de déus Dati per donar suport a les necessitats d'aplicacions específiques (Varney 1996, IDC 1997, Berson i Smith 1997, peacock 1998). Aquests sistemes petits es deriven del més gran magatzem de dades centralitzat. S'anomenen magatzem de dades departaments d'empleats o mercats de dades d'empleats. L'arquitectura de data mart dependent es coneix com a arquitectura de tres nivells, on el primer nivell consta de magatzem de dades centralitzat, el segon està format pels dipòsits de Dati departamental i la tercera consisteix en l'accés a Dati i mitjançant eines d'anàlisi (Demarest 1994, Inmon et al. 1997).

Els data marts normalment es construeixen després de magatzem de dades centralitzat es va construir per satisfer les necessitats d'unitats específiques (White 1995, Varney 1996).
Magatzem de data marts i Dati rellevant per a unitats particulars (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

L'avantatge d'aquest mètode és que no hi haurà dates no integrat i que i Dati serà menys redundant dins dels mercats de dades ja que tots els Dati provenen d'un dipòsit de Dati integrat. Un altre avantatge és que hi haurà menys enllaços entre cada data mart i les seves fonts Dati perquè cada data mart només té una font Dati. A més, amb aquesta arquitectura establerta, els usuaris finals encara poden accedir a Dati

organitzacions corporatives. Aquest mètode es coneix com el mètode de dalt a baix, on els data marts es construeixen després del magatzem de dades (paó 1998, Goff 1998).
En augmentar la necessitat de mostrar resultats aviat, algunes organitzacions han començat a construir centres de dades independents (Flanagan i Safdie 1997, White 2000). En aquest cas, els centres de dades obtenen els seus Dati directament des dels fonaments de Dati OLTP i no OLTP del repositori centralitzat i integrat, eliminant així la necessitat de disposar del repositori central.

Cada data mart requereix almenys un enllaç a les seves fonts Dati. Un desavantatge de tenir múltiples enllaços a cada data mart és que, en comparació amb les dues arquitectures anteriors, la sobreabundància de Dati augmenta significativament.

Cada data mart ha d'emmagatzemar tots els Dati localment per no tenir cap impacte en els sistemes OLTP. Això fa que i Dati s'emmagatzemen en diferents data marts (Inmon et al. 1997). Un altre desavantatge d'aquesta arquitectura és que condueix a la creació d'interconnexions complexes entre els data mart i les seves fonts de dades. Dati que són difícils d'implementar i controlar (Inmon et al. 1997).

Un altre desavantatge és que és possible que els usuaris finals no puguin accedir a la informació general de l'empresa perquè i Dati dels diferents datamarts no estan integrats (Ovum 1998).
Un altre desavantatge és que pot haver-hi més d'una definició per a cada terminologia que s'utilitza en els mercats de dades que genera incoherències en les dades. Dati en organització (Ovum 1998).
Malgrat els desavantatges comentats anteriorment, els data marts autònoms encara atrauen l'interès de moltes organitzacions (IDC 1997). Un factor que els fa atractius és que es desenvolupen més ràpidament i requereixen menys temps i recursos (Bresnahan 1996, Berson i Smith 1997, Ovum 1998). En conseqüència, serveixen principalment com a dissenys de prova que es poden utilitzar per identificar ràpidament els beneficis i/o les mancances del disseny (Parsaye 1995, Braly 1995, Newing 1996). En aquest cas, la part a implementar en el projecte pilot ha de ser petita però important per a l'organització (Newing 1996, Mansell-Lewis 1996).

En examinar el prototip, els usuaris finals i la direcció poden decidir si continuar o aturar el projecte (Flanagan i Safdie 1997).
Si la decisió ha de continuar, s'haurien de construir els mercats de dades per a altres indústries d'un en un. Hi ha dues opcions per als usuaris finals en funció de les seves necessitats en la construcció de matrius de dades independents: integrades/federades i no integrades (Ovum 1998)

En el primer mètode, cada nou data mart s'ha de construir basant-se en els data mart i el model actuals Dati utilitzat per l'empresa (Varney 1996, Berson i Smith 1997, Peacock 1998). La necessitat d'utilitzar el model Dati de l'empresa significa que s'ha d'assegurar que només hi ha una definició per a cada terminologia utilitzada a través de data marts, també per assegurar-se que es poden fusionar diferents data marts per donar una visió general de la informació de l'empresa (Bresnahan 1996). Aquest mètode s'anomena mètode de baix a dalt i s'utilitza millor quan hi ha una limitació de mitjans financers i de temps (Flanagan i Safdie 1997, Ovum 1998, peacock 1998, Goff 1998). En el segon mètode, els datamarts construïts només poden satisfer les necessitats d'una unitat específica. Una variant del data mart federat és el magatzem de dades distribuïts en què el database El programari intermediari del servidor concentrador s'utilitza per combinar molts centres de dades en un únic dipòsit Dati distribuït (White 1995). En aquest cas, i Dati les empreses es distribueixen en diversos data mart. Les sol·licituds dels usuaris finals es reenvien a database programari intermediari del servidor concentrador, que ho extreu tot Dati sol·licitat pels centres de dades i retornar els resultats a les aplicacions d'usuari final. Aquest mètode proporciona informació empresarial als usuaris finals. No obstant això, els problemes dels data marts independents encara no s'han eliminat. Hi ha una altra arquitectura que es pot utilitzar que es diu la magatzem de dades virtual (White 1995). Tanmateix, aquesta arquitectura, que es mostra a la figura 2.9, no és una arquitectura d'emmagatzematge de dades Dati real ja que no mou la càrrega dels sistemes OLTP a magatzem de dades (Demarest 1994).

De fet, les peticions de Dati Els usuaris finals els transmeten als sistemes OLTP que retornen resultats després de processar les sol·licituds dels usuaris. Tot i que aquesta arquitectura permet als usuaris finals generar informes i fer sol·licituds, no pot proporcionar i

Dati historial i visió general de la informació de l'empresa des de i Dati ja que els diferents sistemes OLTP no estan integrats. Per tant, aquesta arquitectura no pot satisfer l'anàlisi de Dati com les prediccions.

Selecció d'aplicacions d'accés i recuperació de dades Dati

La finalitat de la construcció a magatzem de dades és transmetre informació als usuaris finals (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); una o més aplicacions d'accés i recuperació Dati s'han de proporcionar. Fins ara, hi ha una gran varietat d'aplicacions d'aquest tipus perquè l'usuari pugui triar (Hammergren 1998, Humphries et al. 1999). Les aplicacions seleccionades determinen l'èxit de l'esforç d'emmagatzematge Dati en una organització perquè les aplicacions són la part més visible del magatzem de dades a l'usuari final (Inmon et al. 1997, Poe 1996). Per tenir èxit a magatzem de dades, ha de ser capaç de donar suport a les activitats d'anàlisi de dades Dati de l'usuari final (Poe 1996, Seddon i Benjamin 1998, Eckerson 1999). Així, cal identificar el "nivell" del que vol l'usuari final (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

En general, els usuaris finals es poden agrupar en tres categories: usuaris executius, analistes empresarials i usuaris potents (Poe 1996, Humphries et al. 1999). Els usuaris executius necessiten un accés fàcil a conjunts predefinits d'informes (Humphries et al. 1999). Es pot accedir fàcilment a aquests informes amb la navegació del menú (Poe 1996). A més, els informes haurien de presentar informació utilitzant representacions gràfices com ara taules i plantilles per transmetre la informació ràpidament (Humphries et al. 1999). Els analistes empresarials, que potser no tenen les capacitats tècniques per desenvolupar informes des de zero per si mateixos, han de ser capaços de modificar els informes actuals per satisfer les seves necessitats específiques (Poe 1996, Humphries et al. 1999). Els usuaris potents, en canvi, són el tipus d'usuari final que té la capacitat de generar i escriure peticions i informes des de zero (Poe 1996, Humphries et al. 1999). Ells són els que

construeixen relacions per a altres tipus d'usuaris (Poe 1996, Humphries et al. 1999).

Un cop determinats els requisits de l'usuari final, s'ha de fer una selecció d'aplicacions d'accés i recuperació Dati entre tots els disponibles (Poe 1996, Inmon et al. 1997).
L'accés a Dati i les eines de recuperació es poden classificar en 4 tipus: eina OLAP, eina EIS/DSS, eina de consultes i informes i eina de mineria de dades.

Les eines OLAP permeten als usuaris crear consultes ad hoc, així com les realitzades al database del magatzem de dades. A més, aquests productes permeten als usuaris profunditzar des de Dati general a detallat.

Les eines EIS/DSS proporcionen informes executius com ara l'anàlisi del "què passa si" i accés a informes basats en menús. Els informes s'han de predefinir i combinar amb menús per facilitar la navegació.
Les eines de consultes i informes permeten als usuaris elaborar informes predefinits i específics.

Les eines de mineria de dades s'utilitzen per identificar relacions que podrien aportar una nova llum sobre les operacions oblidades Dati del magatzem de dades.

A més d'optimitzar els requisits de cada tipus d'usuari, les eines seleccionades han de ser intuïtives, eficients i fàcils d'utilitzar. També han de ser compatibles amb altres parts de l'arquitectura i poder treballar amb sistemes existents. També es recomana triar eines d'accés i recuperació de dades amb un preu i un rendiment raonables. Altres criteris a considerar inclouen el compromís del venedor de l'eina de donar suport al seu producte i els desenvolupaments que tindrà en futures versions. Per garantir la participació dels usuaris en l'ús del magatzem de dades, l'equip de desenvolupament implica els usuaris en el procés de selecció de l'eina. En aquest cas, s'ha de fer una avaluació pràctica de l'usuari.

Per millorar el valor del magatzem de dades, l'equip de desenvolupament també pot proporcionar accés web als seus magatzems de dades. Un magatzem de dades habilitat per a la web permet als usuaris accedir a Dati des de llocs remots o durant el viatge. També la informació pot

oferir-se a un cost més baix mitjançant una disminució dels costos de formació.

2.4.3 Magatzem de dades Fase d'operació

Aquesta fase consta de tres activitats: definició d'estratègies d'actualització de dades, control de les activitats del magatzem de dades i gestió de la seguretat del magatzem de dades.

Definició d'estratègies d'actualització de dades

Després de la càrrega inicial, i Dati en database del magatzem de dades s'ha d'actualitzar periòdicament per reproduir els canvis realitzats al Dati originals. Per tant, heu de decidir quan actualitzar, amb quina freqüència s'ha de programar l'actualització i com actualitzar Dati. Es recomana actualitzar el Dati quan el sistema es pot desconnectar. La freqüència d'actualització la determina l'equip de desenvolupament en funció dels requisits de l'usuari. Hi ha dos enfocaments per actualitzar el magatzem de dades: l'actualització completa i la càrrega contínua de canvis.

El primer enfocament, l'actualització total, requereix tornar a carregar-ho tot Dati des de zero. Això vol dir que tots els Dati s'han d'extreure, netejar, transformar i integrar en cada actualització. Aquest enfocament s'ha d'evitar sempre que sigui possible, ja que requereix temps i recursos.

Un enfocament alternatiu és carregar canvis contínuament. Això afegeix i Dati que han canviat des de l'últim cicle d'actualització del magatzem de dades. La identificació de registres nous o modificats redueix significativament la quantitat de Dati que s'han de propagar al magatzem de dades en cada actualització com només aquestes Dati s'afegirà a database del magatzem de dades.

Hi ha almenys 5 enfocaments que es poden utilitzar per retirar i Dati nous o modificats. Per aconseguir una estratègia eficient d'actualització de vídeo Dati pot ser útil una combinació d'aquests enfocaments que recullin tots els canvis del sistema.

El primer enfocament, que utilitza marques de temps, suposa que tothom està assignat Dati editat i actualitzat una marca de temps perquè pugueu identificar-les fàcilment Dati modificat i nou. Tanmateix, aquest enfocament no s'ha utilitzat àmpliament en la majoria dels sistemes operatius actuals.
El segon enfocament és utilitzar un fitxer delta generat per l'aplicació que conté només els canvis fets al fitxer Dati. L'ús d'aquest fitxer també amplifica el cicle d'actualització. Tanmateix, fins i tot aquest mètode no s'ha utilitzat en moltes aplicacions.
El tercer enfocament és escanejar un fitxer de registre, que bàsicament conté informació similar al fitxer delta. L'única diferència és que es crea un fitxer de registre per al procés de recuperació i pot ser difícil d'entendre.
El quart enfocament és modificar el codi de l'aplicació. Tanmateix, la majoria del codi de l'aplicació és antic i trencadís; per tant, s'ha d'evitar aquesta tècnica.
L'últim enfocament és comparar i Dati fonts amb el fitxer principal dei Dati.

Seguiment de les activitats del magatzem de dades

Un cop el magatzem de dades s'ha alliberat als usuaris, s'ha de controlar al llarg del temps. En aquest cas, l'administrador del magatzem de dades pot utilitzar una o més eines de gestió i control per supervisar l'ús del magatzem de dades. En particular, es pot recollir informació sobre les persones i sobre el moment en què accedeixen al magatzem de dades. Vinga Dati recopilat, es pot crear un perfil del treball realitzat que es pot utilitzar com a entrada en la implementació de la devolució de càrrec de l'usuari. La devolució de càrrec permet als usuaris estar informats del cost del processament del magatzem de dades.

A més, l'auditoria del magatzem de dades també es pot utilitzar per identificar els tipus de consultes, la seva mida, el nombre de consultes al dia, els temps de reacció de les consultes, els sectors assolits i la quantitat de Dati processats. Un altre propòsit de fer l'auditoria del magatzem de dades és identificar el Dati que no estan en ús. Aquests Dati es poden eliminar del magatzem de dades per millorar el temps

de la resposta d'execució de la consulta i controlar el creixement de Dati que resideixen dins del base de dades del magatzem de dades.

Gestió de la seguretat del magatzem de dades

Un magatzem de dades conté Dati integrat, crític, sensible al qual es pot arribar fàcilment. Per aquest motiu s'ha de protegir dels usuaris no autoritzats. Una manera d'implementar la seguretat és utilitzar la funció del DBMS per assignar diferents privilegis a diferents tipus d'usuaris. D'aquesta manera, s'ha de mantenir un perfil d'accés per a cada tipus d'usuari. Una altra manera de protegir el magatzem de dades és xifrar-lo tal com està escrit a base de dades del magatzem de dades. L'accés a Dati i les eines de recuperació han de desxifrar el Dati abans de presentar els resultats als usuaris.

2.4.4 Magatzem de dades Fase de desplegament

És l'última etapa del cicle d'implementació del magatzem de dades. Les activitats que es realitzaran en aquesta fase inclouen la formació dels usuaris per utilitzar el data warehouse i la realització de revisions del data warehouse.

Formació d'usuaris

La formació dels usuaris s'ha de fer abans d'accedir Dati del magatzem de dades i l'ús d'eines de recuperació. En general, les sessions haurien de començar amb una introducció al concepte d'emmagatzematge Dati, el contingut del magatzem de dades, el meta Dati i les característiques bàsiques de les eines. Aleshores, els usuaris més avançats també podrien estudiar les taules físiques i les característiques dels usuaris de les eines d'accés i recuperació de dades.

Hi ha molts enfocaments per fer la formació dels usuaris. Un d'ells implica una selecció de molts usuaris o analistes escollits entre un grup d'usuaris, en funció de les seves habilitats de lideratge i comunicació. Aquests estan entrenats personalment en tot el que necessiten saber per familiaritzar-se amb el sistema. Després de la formació, tornen a la seva feina i comencen a ensenyar a altres usuaris com utilitzar el sistema. A la

D'acord amb el que han après, altres usuaris poden començar a explorar el magatzem de dades.
Un altre enfocament és formar molts usuaris alhora, com si estiguéssiu entrenant en una aula. Aquest mètode és adequat quan hi ha molts usuaris que necessiten ser entrenats al mateix temps. Un altre mètode és entrenar cada usuari individualment, un per un. Aquest mètode és adequat quan hi ha pocs usuaris.

L'objectiu de la formació d'usuaris és familiaritzar-se amb l'accés Dati i eines de recuperació, així com continguts del magatzem de dades. Tanmateix, alguns usuaris poden quedar aclaparats per la quantitat d'informació proporcionada durant la sessió de formació. A continuació, s'han de fer diverses sessions d'actualització per obtenir suport continu i respondre preguntes específiques. En alguns casos, es forma un grup d'usuaris per oferir aquest tipus de suport.

Recollida de comentaris

Un cop s'hagi desplegat el magatzem de dades, els usuaris poden utilitzar i Dati residint al magatzem de dades per a diferents finalitats. Majoritàriament, els analistes o usuaris utilitzen i Dati al magatzem de dades per a:

  1. 1 Identificar tendències de l'empresa
  2. 2 Analitzar els perfils de compra de clients
  3. 3 Dividir i clients i i
  4. 4 Proporcioneu els millors serveis a clients - personalitzar els serveis
  5. 5 Formular estratègies mercadeig
  6. 6 Feu pressupostos competitius per a anàlisis de costos i ajudeu al control
  7. 7 Donar suport a la presa de decisions estratègiques
  8. 8 Identificar les oportunitats que sorgeixen
  9. 9 Millorar la qualitat dels processos empresarials actuals
  10. 10 Comproveu el benefici

Seguint la direcció de desenvolupament del magatzem de dades, es podrien realitzar una sèrie de revisions del sistema per obtenir retroalimentació

tant per l'equip de desenvolupament com per la comunitat d'usuaris finals.
Els resultats obtinguts es poden tenir en compte per al proper cicle de desenvolupament.

Com que el magatzem de dades té un enfocament incremental, és essencial aprendre dels èxits i errors de desenvolupaments anteriors.

2.5 Resum

En aquest capítol s'han comentat els enfocaments presents a la literatura. A la secció 1 es va tractar el concepte de magatzem de dades i el seu paper en la ciència de decisions. A la secció 2 es descriuen les principals diferències entre els magatzems de dades i els sistemes OLTP. A la secció 3 es va analitzar el model de magatzem de dades de Monash que es va utilitzar a la secció 4 per descriure les activitats implicades en el procés de desenvolupament d'un magatzem de dades, aquestes afirmacions no es basaven en una investigació rigorosa. El que passa en realitat pot ser molt diferent del que informa la literatura, però aquests resultats es poden utilitzar per crear un equipatge bàsic que subratlla el concepte de data warehouse per a aquesta investigació.

Capítol 3

Mètodes de recerca i disseny

Aquest capítol tracta dels mètodes de recerca i disseny d'aquest estudi. La primera part mostra una visió genèrica dels mètodes de recerca disponibles per a la recuperació d'informació, a més a més es discuteixen els criteris per seleccionar el millor mètode per a un estudi concret. A la secció 2 es discuteixen dos mètodes seleccionats amb els criteris anteriors; un d'aquests s'escollirà i s'adoptarà pels motius previstos a l'apartat 3 on també s'exposin els motius de l'exclusió de l'altre criteri. La secció 4 presenta el projecte de recerca i la secció 5 les conclusions.

3.1 Recerca en sistemes d'informació

La recerca de sistemes d'informació no es limita només a l'àmbit tecnològic, sinó que també s'ha d'estendre per incloure objectius de comportament i organitzatius.
Això ho devem a les tesis de diverses disciplines que van des de les ciències socials fins a les naturals; això comporta la necessitat d'un determinat espectre de mètodes d'investigació que impliquin mètodes quantitatius i qualitatius que s'utilitzen per als sistemes d'informació.
Tots els mètodes de recerca disponibles són importants, de fet diversos investigadors com Jenkins (1985), Nunamaker et al. (1991) i Galliers (1992) argumenten que no hi ha un mètode universal específic per dur a terme investigacions en els diferents camps dels sistemes d'informació; de fet, un mètode pot ser adequat per a una investigació concreta però no per a altres. Això ens porta a la necessitat de seleccionar un mètode adequat per al nostre projecte de recerca particular: per a aquesta elecció Benbasat et al. (1987) afirmen que s'ha de tenir en compte la naturalesa i el propòsit de la recerca.

3.1.1 Naturalesa de la recerca

Els diversos mètodes d'investigació basats en la naturalesa es poden classificar en tres tradicions àmpliament conegudes en ciències de la informació: investigació positivista, interpretativa i crítica.

3.1.1.1 Recerca positivista

La investigació positivista també es coneix com a estudi científic o empíric. Pretén: "explicar i predir què passarà al món social mirant les regularitats i les relacions causa-efecte entre els elements que el constitueixen" (Shanks et al 1993).

La recerca positivista també es caracteritza per la repetibilitat, simplificacions i refutacions. A més, la investigació positivista admet l'existència de relacions a priori entre els fenòmens estudiats.
Segons Galliers (1992) la taxonomia és un mètode d'investigació inclòs en el paradigma positivista, que però no es limita a això, de fet hi ha experiments de laboratori, experiments de camp, estudis de casos, demostracions de teoremes, prediccions i simulacions. Mitjançant aquests mètodes, els investigadors admeten que els fenòmens estudiats es poden observar de manera objectiva i rigorosa.

3.1.1.2 Recerca interpretativa

La investigació interpretativa, que sovint s'anomena fenomenologia o antipositivisme, és descrita per Neuman (1994) com “l'anàlisi sistemàtica del significat social de l'acció mitjançant l'observació directa i detallada de les persones en situacions naturals, per tal d'arribar a una comprensió i la interpretació de com les persones creen i mantenen el seu món social”. Els estudis interpretatius rebutgen la suposició que els fenòmens observats es poden observar objectivament. De fet es basen en interpretacions subjectives. A més, els investigadors interpretatius no imposen significats a priori als fenòmens que estudien.

Aquest mètode inclou estudis subjectius/argumentatius, investigació-acció, estudis descriptius/interpretatius, investigacions futures i jocs de rol. A més d'aquestes enquestes i estudis de cas es poden incloure en aquest enfocament, ja que es refereixen a estudis d'individus o organitzacions dins de situacions complexes del món real.

3.1.1.3 Recerca crítica

La cerca crítica és l'enfocament menys conegut en les ciències socials, però recentment ha rebut l'atenció d'investigadors en l'àmbit dels sistemes d'informació. El supòsit filosòfic que la realitat social és històricament produïda i reproduïda per les persones, així com pels sistemes socials amb les seves accions i interaccions. La seva capacitat, però, està mediada per una sèrie de consideracions socials, culturals i polítiques.

Igual que la investigació interpretativa, la investigació crítica argumenta que la investigació positivista no té res a veure amb el context social i ignora la seva influència en les accions humanes.
La investigació crítica, en canvi, critica la investigació interpretativa per ser massa subjectiva i per no proposar-se ajudar les persones a millorar les seves vides. La diferència més gran entre la investigació crítica i els altres dos enfocaments és la seva dimensió valorativa. Mentre que l'objectivitat de les tradicions positivistes i interpretatives és predir o explicar l'statu quo o la realitat social, la investigació crítica pretén avaluar i transformar críticament la realitat social que s'estudia.

Els investigadors crítics solen oposar-se a l'statu quo per eliminar les diferències socials i millorar les condicions socials. La recerca crítica té un compromís amb una visió de procés dels fenòmens d'interès i, per tant, normalment és longitudinal. Exemples de mètodes de recerca són els estudis històrics a llarg termini i els estudis etnogràfics. La cerca crítica, però, no s'ha utilitzat àmpliament en la investigació de sistemes d'informació

3.1.2 Finalitat de la recerca

Juntament amb la naturalesa de la recerca, el seu propòsit es pot utilitzar per guiar l'investigador en la selecció d'un mètode de recerca particular. L'abast d'un projecte de recerca està estretament relacionat amb la posició de la recerca en relació al cicle de recerca que consta de tres fases: construcció de la teoria, prova de teoria i perfeccionament de la teoria. Així, en funció de l'impuls respecte al cicle de recerca, un projecte de recerca pot tenir una finalitat explicativa, descriptiva, exploratòria o predictiva.

3.1.2.1 Recerca exploratòria

La recerca exploratòria té com a objectiu investigar un tema totalment nou i formular preguntes i hipòtesis per a futures investigacions. Aquest tipus d'investigació s'utilitza en la construcció de teoria per obtenir referències inicials en una nova àrea. Normalment s'utilitzen mètodes d'investigació qualitativa, com ara estudis de cas o estudis fenomenològics.

Tanmateix, també és possible emprar tècniques quantitatives com ara enquestes exploratòries o experiments.

3.1.3.3 Cerca descriptiva

La investigació descriptiva està dissenyada per analitzar i descriure amb gran detall una situació particular o pràctica organitzativa. Això és adequat per construir teories i també es pot utilitzar per confirmar o desafiar hipòtesis. La investigació descriptiva sol implicar l'ús de mesures i mostres. Els mètodes de recerca adequats inclouen enquestes i anàlisis de fons.

3.1.2.3 Recerca explicativa

La investigació explicativa intenta explicar per què passen les coses. Es basa en fets que ja han estat estudiats i intenta trobar el perquè d'aquests fets.
Per tant, la investigació explicativa es construeix normalment sobre la investigació exploratòria o descriptiva i és complementària a la prova i perfeccionament de les teories. La investigació explicativa normalment utilitza estudis de casos o mètodes de recerca basats en enquestes.

3.1.2.4 Recerca preventiva

La investigació preventiva té com a objectiu predir els esdeveniments i comportaments observats que s'estan estudiant (Marshall i Rossman 1995). La predicció és la prova científica estàndard de la veritat. Aquest tipus d'investigació generalment utilitza enquestes o anàlisi de dades Dati historiadors. (Yin 1989)

La discussió anterior demostra que hi ha una sèrie de mètodes de recerca possibles que es poden utilitzar en un estudi concret. Tanmateix, hi ha d'haver un mètode específic que sigui més adequat que els altres per a un determinat tipus de projecte de recerca. (Galliers 1987, Yin 1989, De Vaus 1991). Per tant, cada investigador ha d'avaluar acuradament els punts forts i febles dels diferents mètodes, per tal d'adoptar el mètode de recerca més adequat i compatible amb el projecte de recerca. (Jenkins 1985, Pervan i Klass 1992, Bonomia 1985, Yin 1989, Himilton i Ives 1992).

3.2. Mètodes de cerca possibles

L'objectiu d'aquest projecte era estudiar l'experiència de les organitzacions australianes amb i Dati emmagatzemat amb un desenvolupament de magatzem de dades. Dada que, actualment, hi ha una manca de recerca en l'àmbit de l'emmagatzematge de dades a Austràlia, aquest projecte de recerca encara es troba en la fase teòrica del cicle de recerca i té una finalitat exploratòria. Explorar l'experiència de les organitzacions australianes que adopten l'emmagatzematge de dades requereix interpretar la societat real. En conseqüència, el supòsit filosòfic subjacent al projecte de recerca segueix la interpretació tradicional.

Després d'un examen rigorós dels mètodes disponibles, s'han identificat dos possibles mètodes d'investigació: enquestes i estudis de cas, que es poden utilitzar per a investigacions exploratòries (Shanks et al. 1993). Galliers (1992) argumenta la idoneïtat d'aquests dos mètodes per a aquest estudi en particular en la seva taxonomia revisada dient que són adequats per a la construcció teòrica. Les dues subseccions següents tracten cada mètode amb detall.

3.2.1 Mètode d'investigació de l'enquesta

El mètode de recerca de l'enquesta prové de l'antic mètode del cens. Un cens consisteix a recollir informació de tota una població. Aquest mètode és car i poc pràctic, sobretot si la població és gran. Així, en comparació amb un cens, una enquesta normalment se centra a recollir informació per a un petit nombre, o mostra, dels representants de la població (Fowler 1988, Neuman 1994). Una mostra reflecteix la població de la qual s'ha extret, amb diferents graus de precisió, depenent de l'estructura de la mostra, la mida i el mètode de selecció utilitzats (Fowler 1988, Babbie 1982, Neuman 1994).

El mètode de l'enquesta es defineix com "instantànies de pràctiques, situacions o punts de vista en un moment determinat del temps, realitzades mitjançant qüestionaris o entrevistes, a partir de les quals es poden extreure inferències.
made” (Galliers 1992:153) [fotografia instantània de pràctiques, situacions o punts de vista en un moment determinat, feta mitjançant qüestionaris o entrevistes, a partir dels quals es poden fer inferències]. Les enquestes s'ocupen de reunir informació sobre certs aspectes de l'estudi d'un nombre de participants fent preguntes (Fowler 1988). Aquests qüestionaris i entrevistes, que inclouen entrevistes telefòniques presencials i entrevistes estructurades, també són tècniques de recollida. Dati utilitzat en enquestes (Blalock 1970, Nachmias i Nachmias 1976, Fowler 1988), es poden utilitzar observacions i anàlisis (Gable 1994). De tots aquests mètodes de recollida de déus Dati, l'ús del qüestionari és la tècnica més popular, ja que assegura que i Dati

recollits s'estructuren i formen, i així faciliten la classificació de la informació (Hwang 1987, de Vaus 1991).

En analitzar i Dati, una estratègia d'enquesta sovint empra tècniques quantitatives, com ara l'anàlisi estadística, però també es poden emprar tècniques qualitatives (Galliers 1992, Pervan).

i Klass 1992, Gable 1994). Normalment, i Dati recollits s'utilitzen per analitzar distribucions i patrons d'associacions (Fowler 1988).

Tot i que les enquestes són generalment adequades per a cerques que tracten la pregunta "què?" (què) o derivant-ne, com ara 'quanto' (quant) i 'quant'è' (quants), es poden fer a través de la pregunta 'per què' (Sonquist i Dunkelberg 1977, Yin 1989). Segons Sonquist i Dunkelberg (1977), la investigació té com a objectiu hipòtesis dures, programes d'avaluació, descriure la població i desenvolupar models de comportament humà. A més, les enquestes es poden utilitzar per estudiar l'opinió, condicions, creences, característiques, expectatives i fins i tot comportaments passats o presents d'una determinada població (Neuman 1994).

Les enquestes permeten a l'investigador descobrir les relacions poblacionals i els resultats solen ser més generals que altres mètodes (Sonquist i Dunkelberg 1977, Gable 1994). Les enquestes permeten als investigadors cobrir una àrea geogràfica més àmplia i arribar a un gran nombre d'enquestats (Blalock 1970, Sonquist i Dunkelberg 1977, Hwang i Lin 1987, Gable 1994, Neuman 1994). Finalment, les enquestes poden proporcionar informació que no està disponible en cap altre lloc o en la forma necessària per a les anàlisis (Fowler 1988).

Tanmateix, hi ha algunes limitacions per dur a terme una enquesta. Un desavantatge és que l'investigador no pot obtenir molta informació sobre l'objecte estudiat. Això es deu al fet que les enquestes es realitzen només en un moment determinat i, per tant, hi ha un nombre limitat de variables i persones que l'investigador pot

estudi (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Un altre inconvenient és que la realització d'una enquesta pot ser molt costosa en termes de temps i recursos, sobretot si implica entrevistes cara a cara (Fowler 1988).

3.2.2. Mètode d'investigació d'investigació

El mètode d'investigació d'investigació implica l'estudi en profunditat d'una situació particular dins del seu context real durant un període de temps definit, sense cap intervenció per part de l'investigador (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Aquest mètode s'utilitza principalment per descriure les relacions entre les variables que s'estan estudiant en una situació particular (Galliers 1992). Les investigacions poden implicar casos únics o múltiples, segons el fenomen analitzat (Franz i Robey 1987, Eisenhardt 1989, Yin 1989).

El mètode d'investigació d'investigació es defineix com "una investigació empírica que investiga un fenomen contemporani dins del seu context real, utilitzant múltiples fonts seleccionades d'una o més entitats com persones, grups o organitzacions" (Yin 1989). No hi ha una separació clara entre el fenomen i el seu context i no hi ha control ni manipulació experimental de les variables (Yin 1989, Benbasat et al. 1987).

Hi ha una varietat de tècniques per col·leccionar déus Dati que es poden utilitzar en el mètode d'investigació, que inclou observacions directes, revisions de registres d'arxiu, qüestionaris, revisió de documentació i entrevistes estructurades. Tenir una àmplia gamma de tècniques de collita Dati, les enquestes permeten als investigadors tractar ambdues coses Dati qualitativa i quantitativa alhora (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Com passa amb el mètode d'enquesta, un investigador de l'enquesta serveix com a observador o investigador i no com a participant actiu de l'organització objecte d'estudi.

Benbasat i altres (1987) afirmen que el mètode d'investigació és especialment adequat per a la construcció de la teoria de la investigació, que comença amb una pregunta de recerca i continua amb la formació.

d'una teoria durant el procés de recollida Dati. Sent apte també per a l'escenari

de construcció de teoria, Franz i Robey (1987) suggereixen que el mètode d'investigació també es pot utilitzar per a la fase de teoria complexa. En aquest cas, a partir de l'evidència recollida, es verifica o es refusa una teoria o hipòtesi determinada. A més, la investigació també és adequada per a investigacions que tracten preguntes sobre el "com" o el "per què" (Yin, 1989).

En comparació amb altres mètodes, les enquestes permeten a l'investigador captar informació essencial amb més detall (Galliers 1992, Shanks et al. 1993). A més, les investigacions permeten a l'investigador comprendre la naturalesa i la complexitat dels processos estudiats (Benbasat et al. 1987).

Hi ha quatre desavantatges principals associats al mètode d'investigació. El primer és la manca de deduccions controlades. La subjectivitat de l'investigador pot alterar els resultats i les conclusions de l'estudi (Yin 1989). El segon desavantatge és la manca d'observació controlada. A diferència dels mètodes experimentals, l'investigador no pot controlar els fenòmens estudiats ja que s'examinen en el seu context natural (Gable 1994). El tercer desavantatge és la manca de replicabilitat. Això es deu al fet que és poc probable que l'investigador observe els mateixos esdeveniments i no pot verificar els resultats d'un estudi en particular (Lee 1989). Finalment, com a conseqüència de la no replicabilitat, és difícil generalitzar els resultats obtinguts d'una o més enquestes (Galliers 1992, Shanks et al. 1993). Tots aquests problemes, però, no són insuperables i, de fet, poden ser minimitzats per l'investigador aplicant les accions adequades (Lee 1989).

3.3. Justificar la metodologia de recerca adoptat

Dels dos mètodes de recerca possibles per a aquest estudi, el mètode d'enquesta es considera el més adequat. La investigació va ser rebutjada després d'una acurada consideració del relacionat

mèrits i debilitats. A continuació es discuteix la conveniència o inadequació de cada mètode per a aquest estudi.

3.3.1. Mètode d'investigació inadequat d'investigació

El mètode d'investigació requereix l'estudi en profunditat d'una situació particular dins d'una o més organitzacions durant un període de temps (Eisenhardt 1989). En aquest cas, el termini pot excedir el termini establert per a aquest estudi. Un altre motiu per no adoptar el mètode d'investigació és que els resultats poden patir una falta de rigor (Yin 1989). La subjectivitat de l'investigador pot influir en els resultats i les conclusions. Una altra raó és que aquest mètode és més adequat per a preguntes de recerca del tipus "com" o "per què" (Yin 1989), mentre que la pregunta d'investigació per a aquest estudi és el tipus "què". Finalment, però no menys important, és difícil generalitzar els resultats d'una o poques enquestes (Galliers 1992, Shanks et al. 1993). Tenint en compte aquesta raó, no es va escollir el mètode de recerca de l'enquesta perquè no era adequat per a aquest estudi.

3.3.2. Conveniència del mètode de cerca de estudi

Quan es va dur a terme aquesta investigació, la pràctica de l'emmagatzematge de dades no havia estat àmpliament adoptada per les organitzacions australianes. Per tant, no hi havia molta informació sobre la seva implementació a les organitzacions australianes. La informació disponible prové d'organitzacions que havien implementat o utilitzat a magatzem de dades. En aquest cas, el mètode d'investigació d'enquesta és el més adequat, ja que permet obtenir informació que no està disponible en cap altre lloc o en la forma necessària per a l'anàlisi (Fowler 1988). A més, el mètode d'investigació d'investigació permet a l'investigador obtenir una bona visió de les pràctiques, situacions o punts de vista en un moment determinat (Galliers 1992, Denscombe 1998). Es va demanar una visió general per donar a conèixer l'experiència australiana d'emmagatzematge de dades.

A més, Sonquist i Dunkelberg (1977) afirmen que els resultats de les enquestes són més generals que altres mètodes.

3.4. Disseny d'investigació d'enquesta

L'enquesta de pràctiques d'emmagatzematge de dades es va dur a terme l'any 1999. La població objectiu consistia en organitzacions australianes interessades en estudis d'emmagatzematge de dades, ja que probablement ja coneixien la Dati que emmagatzemen i, per tant, podrien proporcionar la informació útil per a aquest estudi. La població objectiu es va identificar amb una enquesta inicial a tots els membres australians de "The Data Warehousing Institute" (Tdwi-aap). En aquesta secció es discuteix el disseny de la fase de recerca empírica d'aquest estudi.

3.4.1. Tècnica de recollida Dati

A partir de les tres tècniques que s'utilitzen habitualment en la investigació d'enquestes (és a dir, qüestionari per correu, entrevista telefònica i entrevista personal) (Nachmias 1976, Fowler 1988, de Vaus 1991), es va adoptar el qüestionari per correu per a aquest estudi. El primer motiu per adoptar aquest últim és que pot arribar a una població dispersa geogràficament (Blalock 1970, Nachmias i Nachmias 1976, Hwang i Lin 1987, de Vaus 1991, Gable 1994). En segon lloc, el qüestionari per correu és adequat per a participants altament educats (Fowler 1988). El qüestionari per correu per a aquest estudi es va adreçar als patrocinadors del projecte d'emmagatzematge de dades, directors i/o gestors de projectes. En tercer lloc, els qüestionaris postals són adequats quan es disposa d'una llista segura d'adreces (Salant i Dilman 1994). TDWI, en aquest cas, una associació d'emmagatzematge de dades de confiança va proporcionar la llista de correu dels seus membres australians. Un altre avantatge del qüestionari per correu sobre els qüestionaris telefònics o les entrevistes personals és que permet als enquestats respondre amb més precisió, especialment quan els enquestats necessiten consultar els registres o discutir preguntes amb altres persones (Fowler 1988).

Un desavantatge potencial pot ser el temps necessari per realitzar qüestionaris per correu. Normalment, un qüestionari per correu es realitza en aquesta seqüència: envieu cartes, espereu les respostes i envieu la confirmació (Fowler 1988, Bainbridge 1989). Així, el temps total pot ser superior al temps necessari per a les entrevistes presencials o telefòniques. Tanmateix, el temps total es pot conèixer per endavant (Fowler 1988, Denscombe 1998). El temps dedicat a realitzar les entrevistes personals no es pot conèixer per endavant, ja que varia d'entrevista a entrevista (Fowler 1988). Les entrevistes telefòniques poden ser més ràpides que els qüestionaris per correu i les entrevistes personals, però poden tenir un alt percentatge de no contestades a causa de la indisponibilitat d'algunes persones (Fowler 1988). A més, les entrevistes telefòniques es limiten generalment a llistes de preguntes relativament curtes (Bainbridge 1989).

Un altre punt feble d'un qüestionari enviat per correu és l'alta taxa de no resposta (Fowler 1988, Bainbridge 1989, Neuman 1994). No obstant això, es van prendre contramesures associant aquest estudi amb una institució d'emmagatzematge de dades de confiança (és a dir, TDWI) (Bainbridge 1989, Neuman 1994), que emet dues cartes de recordatori als no responent (Fowler 1988, Neuman 1994) i també inclou una carta addicional que explica l'objectiu de l'estudi (Neuman 1994).

3.4.2. Unitat d'anàlisi

L'objectiu d'aquest estudi és obtenir informació sobre la implementació de l'emmagatzematge de dades i el seu ús a les organitzacions australianes. La població objectiu són totes les organitzacions australianes que han implementat, o estan implementant, i magatzem de dades. Aleshores es registren les organitzacions individuals. El qüestionari es va enviar per correu electrònic a les organitzacions interessades a adoptar magatzem de dades. Aquest mètode garanteix que la informació recollida prové dels recursos més adequats de cada organització participant.

3.4.3. Mostra de l'enquesta

La llista de correu dels participants de l'enquesta es va obtenir de TDWI. D'aquesta llista, es van seleccionar 3000 organitzacions australianes com a base per al mostreig. Es va enviar a la mostra una carta de seguiment explicant el projecte i la finalitat de l'enquesta, juntament amb un formulari de resposta i un sobre prepagat per retornar el qüestionari emplenat. De les 3000 organitzacions, 198 van acceptar participar en l'estudi. S'esperava un nombre tan petit de respostes dates el gran nombre d'organitzacions australianes que llavors havien adoptat o estaven adoptant l'estratègia d'emmagatzematge de dades dins de les seves organitzacions. Així, la població objectiu d'aquest estudi consta només de 198 organitzacions.

3.4.4. Contingut del qüestionari

El disseny del qüestionari es va basar en el model d'emmagatzematge de dades Monash (que es va comentar anteriorment a la part 2.3). El contingut del qüestionari es va basar en la revisió bibliogràfica presentada al capítol 2. Una còpia del qüestionari enviat per correu als participants de l'enquesta es pot trobar a l'Annex B. El qüestionari es compon de sis apartats, que segueixen els passos del model tractat. Els sis paràgrafs següents resumeixen breument el contingut de cada apartat.

Secció A: Informació bàsica sobre l'organització
Aquesta secció conté preguntes relacionades amb el perfil de les organitzacions participants. A més, algunes de les preguntes es refereixen a l'estat del projecte d'emmagatzematge de dades del participant. La informació confidencial, com ara el nom de l'organització, no es va revelar a l'anàlisi de l'enquesta.

Secció B: Inici
Les preguntes d'aquesta secció estan relacionades amb l'inici de l'emmagatzematge de dades. Es van fer preguntes sobre els iniciadors del projecte, els patrocinadors, les habilitats i coneixements requerits, els objectius del desenvolupament de l'emmagatzematge de dades i les expectatives dels usuaris finals.

Apartat C: Disseny
Aquesta secció conté preguntes relacionades amb les activitats de planificació del magatzem de dades. En particular, les preguntes eren sobre l'abast d'execució, la durada del projecte, el cost del projecte i l'anàlisi cost/benefici.

Apartat D: Desenvolupament
A la secció de desenvolupament hi ha preguntes relacionades amb les activitats de desenvolupament del magatzem de dades: recopilació de requisits dels usuaris finals, fonts de Dati, el model lògic de Dati, prototips, planificació de capacitat, arquitectures tècniques i selecció d'eines de desenvolupament d'emmagatzematge de dades.

Secció E: Funcionament
Qüestions operatives relacionades amb el funcionament i extensibilitat del magatzem de dades, a mesura que evoluciona en la següent etapa de desenvolupament. Allà qualitat de les dades, les estratègies de refresc del Dati, la granularitat de Dati, escalabilitat de magatzem de dades i problemes de seguretat magatzem de dades eren entre els tipus de preguntes formulades.

Apartat F: Desenvolupament
Aquesta secció conté preguntes relacionades amb l'ús de magatzem de dades pels usuaris finals. L'investigador estava interessat en el propòsit i la utilitat del magatzem de dades, les estratègies de revisió i formació adoptades i l'estratègia de control de la magatzem de dades adoptat.

3.4.5. Taxa de resposta

Tot i que les enquestes per correu són criticades per tenir una baixa taxa de resposta, s'han pres mesures per augmentar la taxa de rendiment (com s'ha comentat anteriorment a la secció 3.4.1). El terme "taxa de resposta" es refereix al percentatge de persones d'una mostra concreta d'enquesta que responen al qüestionari (Denscombe 1998). Per calcular la taxa de resposta d'aquest estudi es va utilitzar la fórmula següent:

Nombre de persones que han respost
Taxa de resposta = —————————————————————————– X 100 Nombre total de qüestionaris enviats

3.4.6. Pilot de prova

Abans d'enviar el qüestionari a la mostra, les preguntes es van provar mitjançant la realització d'assajos pilot, tal com suggereixen Luck i Rubin (1987), Jackson (1988) i de Vaus (1991). L'objectiu de les proves pilot és revelar qualsevol expressió incòmode i ambigua i preguntes difícils d'interpretar, aclarir qualsevol definició i termes utilitzats, i identificar el temps aproximat necessari per completar el qüestionari (Warwick i Lininger 1975, Jackson 1988, Salant). i Dilman 1994). Els assaigs pilot es van dur a terme seleccionant subjectes amb característiques similars a les dels subjectes finals, tal com suggereix Davis e Cosenza (1993). En aquest estudi, es van seleccionar sis professionals de l'emmagatzematge de dades com a temes pilot. Després de cada prova pilot, es van fer les correccions necessàries. A partir de les proves pilot realitzades, els participants van contribuir a remodelar i restablir la versió final del qüestionari.

3.4.7. Mètodes d'anàlisi de dades

I Dati Les dades de l'enquesta recollides dels qüestionaris tancats es van analitzar mitjançant un paquet de programari estadístic anomenat SPSS. Moltes de les respostes es van analitzar mitjançant estadístiques descriptives. Diversos qüestionaris van tornar incomplets. S'han tractat amb més cura per assegurar-se que i Dati Les faltes no van ser conseqüència d'errors d'introducció de dades, sinó perquè les preguntes no eren adequades per al registrant o el registrant va decidir no respondre una o més preguntes específiques. Aquestes respostes que falten es van ignorar en analitzar les dades Dati i es van codificar com a '-9' per garantir la seva exclusió del procés d'anàlisi.

En preparar el qüestionari, les preguntes tancades es van codificar prèviament assignant un número a cada opció. El número es va utilitzar llavors per entrenar i Dati durant l'anàlisi (Denscombe 1998, Sapsford i Jupp 1996). Per exemple, hi havia sis opcions enumerades a la pregunta 1 de la secció B: consell d'administració, alt executiu, departament informàtic, unitat de negoci, consultors i altres. A l'expedient de Dati de SPSS, es va generar una variable per a "iniciador del projecte", amb sis etiquetes de valor: "1" per a "junta", "2" per a "alt executiu", etc. L'ús de l'escala Likertin en algunes de les preguntes tancades també va permetre una identificació sense esforç mitjançant l'ús dels valors numèrics corresponents introduïts a SPSS. Per a les preguntes amb respostes no exhaustives, que no s'exclouen mútuament, cada opció es va tractar com una única variable amb dues etiquetes de valor: "1" per "marcat" i "2" per "no marcat".

Les preguntes obertes es van tractar de manera diferent a les preguntes tancades. Les respostes a aquestes preguntes no s'han introduït a SPSS. En canvi, es van analitzar a mà. L'ús d'aquest tipus de preguntes permet adquirir informació sobre idees i experiències personals expressades lliurement en els enquestats (Bainbridge 1989, Denscombe 1998). Quan va ser possible, es va fer una categorització de les respostes.

Per a l'anàlisi de Datis'utilitzen mètodes d'anàlisi estadística simple, com ara la freqüència de respostes, la mitjana, la desviació estàndard i la mediana (Argyrous 1996, Denscombe 1998).
La prova Gamma va ser eficient per obtenir mesures quantitatives de les associacions entre Dati ordinals (Norusis 1983, Argyrous 1996). Aquestes proves eren adequades perquè les escales ordinals utilitzades no tenien moltes categories i es podien mostrar en una taula (Norusis 1983).

3.5 Resum

En aquest capítol s'ha comentat la metodologia i el disseny de recerca adoptats per a aquest estudi.

Es necessita seleccionar el mètode de recerca més adequat per a un estudi concret
consideració d'una sèrie de regles, inclosa la naturalesa i el tipus de recerca, així com els mèrits i les debilitats de cada mètode possible (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, yin 1989, Hamilton and ives 1992, Galliers). 1992, neuman 1994). Donada la manca de coneixement i teoria existents sobre l'adopció de l'emmagatzematge de dades a Austràlia, aquest estudi de recerca demana un mètode d'investigació interpretatiu amb una capacitat exploratòria per explorar les experiències de les organitzacions australianes. El mètode de recerca escollit es va seleccionar per recollir informació sobre l'adopció del concepte d'emmagatzematge de dades per part de les organitzacions australianes. Es va triar un qüestionari postal com a tècnica de recollida Dati. Les justificacions del mètode de recerca i la tècnica de recollida Dati les seleccions es proporcionaran en aquest capítol. A més, es va presentar una discussió sobre la unitat d'anàlisi, la mostra utilitzada, els percentatges de respostes, el contingut del qüestionari, la prova prèvia del qüestionari i el mètode d'anàlisi del qüestionari. Dati.

Dissenyar a Magatzem de dades:

Combinant relacions d'entitats i modelització dimensional

RESUM
Botiga i Dati és un tema actual important per a moltes organitzacions. Un problema clau en el desenvolupament de l'emmagatzematge Dati és el seu disseny.
El dibuix ha de donar suport a la detecció de conceptes en el magatzem de dades al sistema heretat i altres fonts de Dati i també una fàcil comprensió i eficiència en la implementació de magatzem de dades.
Gran part de la literatura sobre magatzems Dati recomana l'ús de modelatge de relacions d'entitats o modelatge dimensional per representar el disseny de magatzem de dades.
En aquest article mostrem com es poden combinar ambdues representacions en una aproximació al disseny de magatzem de dades. L'enfocament utilitzat és sistemàtic

examinat en un estudi de cas i s'identifica en una sèrie d'implicacions importants amb els professionals.

emmagatzematge de dades

Un magatzem de dades generalment es defineix com una “col·lecció de dades orientada a temes, integrada, variable en el temps i no volàtil en suport de les decisions de la direcció” (Inmon i Hackathorn, 1994). Orientat al tema i integrat indica que el magatzem de dades està dissenyat per traspassar els límits funcionals dels sistemes heretats per oferir una perspectiva integrada Dati.
La variant temporal es refereix a la naturalesa històrica o de sèrie temporal de la Dati en a magatzem de dades, que permet analitzar tendències. No volàtil indica que el magatzem de dades no s'actualitza contínuament com un database d'OLTP. Més aviat s'actualitza periòdicament, amb Dati de fonts internes i externes. El magatzem de dades està dissenyat específicament per a la investigació en lloc d'actualitzar la integritat i el rendiment operatiu.
La idea d'emmagatzemar i Dati no és nou, era una de les finalitats de la gestió Dati des dels anys seixanta (Il Martin, 1982).
I magatzem de dades ofereixen la infraestructura Dati per als sistemes de suport a la gestió. Els sistemes de suport a la gestió inclouen els sistemes de suport a la decisió (DSS) i els sistemes d'informació executiva (EIS). Un DSS és un sistema d'informació basat en ordinador dissenyat per millorar el procés i, en conseqüència, la presa de decisions humanes. Un EIS és normalment un sistema de lliurament Dati que permet als executius empresarials accedir fàcilment a la vista de Dati.
L'arquitectura general d'a magatzem de dades destaca el paper de magatzem de dades en el suport a la gestió. A més d'oferir la infraestructura Dati per a EIS i DSS, al magatzem de dades s'hi pot accedir directament mitjançant consultes. EL Dati inclòs en a magatzem de dades es basen en l'anàlisi dels requisits d'informació de gestió i s'obtenen de tres fonts: sistemes heretats interns, sistemes de captura de dades amb finalitats especials i fonts de dades externes. EL Dati en els sistemes heretats interns sovint són redundants, inconsistents, de baixa qualitat i s'emmagatzemen en diferents formats, de manera que s'han de reconciliar i netejar abans de poder carregar-los al

magatzem de dades (Inmon, 1992; McFadden, 1996). EL Dati dels sistemes d'emmagatzematge Dati ad hoc i de fonts Dati extern s'utilitzen sovint per augmentar (actualitzar, substituir) i Dati de sistemes heretats.

Hi ha moltes raons convincents per desenvolupar a magatzem de dades, que inclouen la millora de la presa de decisions mitjançant l'ús efectiu de més informació (Ives 1995), el suport per centrar-se en assumptes sencers (Graham 1996) i la reducció dels costos de presa de decisions. Dati per a EIS i DSS (Graham 1996, McFadden 1996).

Un estudi empíric recent va trobar, de mitjana, un retorn de la inversió per a i magatzem de dades en un 401% després de tres anys (Graham, 1996). Tanmateix, els altres estudis empírics de magatzem de dades va trobar problemes importants, com ara dificultat per mesurar i assignar beneficis, manca d'un propòsit clar, subestimació de l'abast i la complexitat del procés d'emmagatzematge. Dati, especialment pel que fa a les fonts i la neteja de la Dati. Botiga i Dati es pot considerar una solució al problema de gestió Dati entre organitzacions. La manipulació de Dati com a recurs social ha continuat sent un dels problemes clau en la gestió dels sistemes d'informació a nivell mundial durant molts anys (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Un enfocament popular de la gestió d'actius Dati als anys vuitanta va ser el desenvolupament d'un model Dati socials. Model Dati social va ser dissenyat per oferir una base estable per al desenvolupament de nous sistemes d'aplicacions e database i la reconstrucció i integració de sistemes heretats (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kim i Everest 1994). Tanmateix, hi ha diversos problemes amb aquest enfocament, en particular, la complexitat i el cost de cada tasca, i el llarg temps necessari per aconseguir resultats tangibles (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997). ).

Il magatzem de dades és una base de dades separada que coexisteix amb les bases de dades heretades en lloc de substituir-les. Per tant, permet dirigir la gestió de Dati i evitar la reconstrucció costosa de sistemes heretats.

ENFOCAMENTS EXISTENTS DEL DISSENY DE DADES

EL magatzem

El procés de construcció i perfeccionament a magatzem de dades s'hauria d'entendre més com un procés evolutiu que com un cicle de vida de desenvolupament de sistemes tradicionals (Desig, 1995, Shanks, O'Donnell i Arnott 1997a). Hi ha molts processos implicats en un projecte magatzem de dades com ara la inicialització, la programació; informació adquirida a partir dels requisits sol·licitats als responsables de l'empresa; fonts, transformacions, neteja de Dati i sincronitzar des de sistemes heretats i altres fonts Dati; sistemes de lliurament en desenvolupament; seguiment de magatzem de dades; i sense sentit del procés evolutiu i de la construcció a magatzem de dades (Stinchi, O'Donnell i Arnott 1997b). En aquest diari, ens centrem en com dibuixar i Dati emmagatzemats en el context d'aquests altres processos. Hi ha una sèrie d'enfocaments proposats per a l'arquitectura de vídeo magatzem de dades a la literatura (Inmon 1994, Ives 1995, Kimball 1994, McFadden 1996). Cadascuna d'aquestes metodologies té una breu revisió amb una anàlisi dels seus punts forts i febles.

Inmon's (1994) Enfocament per Magatzem de dades disseny

Inmon (1994) va proposar quatre passos iteratius per dissenyar a magatzem de dades (vegeu la figura 2). El primer pas és dissenyar una plantilla Dati social per entendre com i Dati es pot integrar en àrees funcionals dins d'una organització subdividint i Dati emmagatzemar a les zones. Model Dati està fet per a l'emmagatzematge Dati relatius a la presa de decisions, inclòs Dati històric, i inclòs Dati deduït i agregat. El segon pas és identificar les àrees temàtiques a implementar. Es basen en prioritats determinades per una organització concreta. El tercer pas consisteix a dibuixar a database per a l'àrea temàtica, presteu especial atenció a la inclusió dels nivells adequats de granularitat. Inmon recomana utilitzar el model d'entitat i relació. El quart pas és identificar els sistemes font Dati requereix i desenvolupar processos de transformació per capturar, netejar i formatar i Dati.

Els punts forts de l'enfocament d'Inmon són que el model Dati social ofereix la base per a la integració de Dati dins de l'organització i planificació suports per al desenvolupament iteratiu de magatzem de dades. Els seus inconvenients són la dificultat i el cost de dissenyar el model Dati social, la dificultat per entendre els models d'entitats i relacions utilitzats en ambdós models, que Dati social i el de Dati emmagatzemats per àrea temàtica i l'adequació del Dati del dibuix de magatzem de dades per a la realització de database relacional però no per database multidimensional.

Ives' (1995) Enfocament a Magatzem de dades disseny

Ives (1995) proposa un enfocament de quatre passos per dissenyar un sistema d'informació que creu que és aplicable al disseny d'un sistema d'informació. magatzem de dades (vegeu la figura 3). L'enfocament es basa molt en l'enginyeria de la informació per al desenvolupament de sistemes d'informació (Martin 1990). El primer pas és determinar els vostres objectius, èxit i factors crítics, i indicadors clau de rendiment. Els processos de negoci clau i la informació necessària es modelen per portar-nos a un model Dati socials. El segon pas consisteix a desenvolupar una arquitectura definidora Dati emmagatzemat per àrea, database di magatzem de dades, els components tecnològics que es requereixen, el conjunt de suports organitzatius necessaris per implementar i operar magatzem de dades. El tercer pas inclou la selecció dels paquets de programari i eines necessaris. El quart pas és el disseny i la construcció detallats del magatzem de dades. Ives assenyala aquesta botiga Dati és un procés iteratiu restringit.

Els punts forts de l'enfocament d'Ives són l'ús d'especificacions tècniques per determinar els requisits d'informació, l'ús d'un procés estructurat per donar suport a la integració de magatzem de dades, la selecció de maquinari i programari adequada, i l'ús de tècniques de representació múltiples per al magatzem de dades. Els seus defectes són inherents a la complexitat. Altres inclouen dificultats per desenvolupar molts nivells de database dins de magatzem de dades en un temps i un cost raonables.

L'enfocament de Kimball (1994). Magatzem de dades disseny

Kimball (1994) va proposar cinc passos iteratius per dissenyar a magatzem de dades (vegeu figures 4). El seu enfocament està especialment dedicat al dibuix d'un solo magatzem de dades i sobre l'ús de models dimensionals amb preferència als models d'entitats i relacions. Kimball analitza aquests models dimensionals perquè és més fàcil per als líders empresarials entendre els negocis, és més eficient quan es tracta de consultes complexes i el disseny de database físic és més eficient (Kimball 1994). Kimball reconeix que desenvolupar a magatzem de dades és iteratiu, i això magatzem de dades separats es poden integrar mitjançant la divisió en taules de dimensions comunes.

El primer pas és identificar l'àrea temàtica concreta a perfeccionar. El segon i tercer pas impliquen la conformació dimensional. En el segon pas, les mesures identifiquen coses d'interès en l'àrea temàtica i les agrupen en una taula de fets. Per exemple, en una àrea temàtica de vendes, les mesures d'interès poden incloure la quantitat d'articles venuts i el dòlar com a moneda de vendes. El tercer pas consisteix a identificar les dimensions que són les maneres en què es poden agrupar els fets. En una àrea temàtica de vendes, les dimensions rellevants poden incloure l'article, la ubicació i el període de temps. La taula de fets té una clau de diverses parts per enllaçar-la a cadascuna de les taules de dimensions i normalment conté un nombre molt gran de fets. En canvi, les taules de dimensions contenen informació descriptiva sobre dimensions i altres atributs que es poden utilitzar per agrupar fets. La taula de fets i dimensions associada proposada forma el que s'anomena esquema estel·lar a causa de la seva forma. El quart pas consisteix a construir a database multidimensional per perfeccionar el patró de l'estrella. El pas final és identificar els sistemes font Dati requereix i desenvolupar processos de transformació per capturar, netejar i formatar i Dati.

Els punts forts de l'enfocament de Kimball inclouen l'ús de models dimensionals per representar i Dati emmagatzemat, cosa que fa que sigui fàcil d'entendre i condueix a un disseny físic eficient. Un model dimensional que també utilitza fàcilment ambdós sistemes database relacional poden ser perfeccionats o sistemes database multidimensional. Els seus defectes inclouen la manca d'algunes tècniques per facilitar la planificació o la integració de molts esquemes estrella dins d'a magatzem de dades i la dificultat de dissenyar des de l'estructura desnormalitzada extrema en un model dimensional a Dati en sistemes heretats.

Aproximació a les dades de McFadden (1996). Disseny de magatzem

McFadden (1996) proposa un enfocament de cinc passos per dibuixar a magatzem de dades (vegeu la figura 5).
El seu enfocament es basa en una síntesi d'idees de la literatura i se centra en el disseny d'un sol magatzem de dades. El primer pas implica una anàlisi de requisits. Tot i que les especificacions tècniques no estan prescrites, les notes de McFadden identifiquen entitats Dati especificacions i els seus atributs, i remet als lectors Watson i Frolick (1993) per captar els requisits.
En el segon pas, es dibuixa un model de relació d'entitats magatzem de dades i després validat pels directius de l'empresa. El tercer pas consisteix a determinar el mapeig a partir de sistemes heretats i fonts externes de magatzem de dades. El quart pas implica processos de desenvolupament, desplegament i sincronització Dati en magatzem de dades. En el pas final, el lliurament del sistema es desenvolupa amb èmfasi en una interfície d'usuari. McFadden assenyala que el procés de dibuix és generalment iteratiu.

Els punts forts de l'enfocament de McFadden són la participació dels líders empresarials en la determinació dels requisits, així com la importància dels recursos. Datila seva neteja i recollida. Els seus defectes són la manca d'un procés per dividir un gran projecte magatzem de dades en moltes etapes integrades, i allà

dificultat per comprendre els models d'entitat i relació utilitzats en el disseny de magatzem de dades.

No només els que ens són propers ens trien.

    0/5 (0 comentaris)
    0/5 (0 comentaris)
    0/5 (0 comentaris)

    Més informació a Online Web Agency

    Subscriu-te per rebre els últims articles per correu electrònic.

    avatar de l'autor
    admin CEO
    👍Agència web en línia | Agència web experta en màrqueting digital i SEO. Web Agency Online és una agència web. Per a Agenzia Web Online l'èxit en la transformació digital es basa en els fonaments d'Iron SEO versió 3. Especialitats: Integració de sistemes, Integració d'aplicacions empresarials, Arquitectura Orientada a Serveis, Cloud Computing, Data warehouse, Business Intelligence, Big Data, portals, intranets, Aplicació web Disseny i gestió de bases de dades relacionals i multidimensionals Disseny d'interfícies per a mitjans digitals: usabilitat i gràfics. Online Web Agency ofereix a les empreses els següents serveis: -SEO a Google, Amazon, Bing, Yandex; -Analítica web: Google Analytics, Google Tag Manager, Yandex Metrica; -Conversions d'usuari: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM a Google, Bing, Amazon Ads; -Màrqueting en xarxes socials (Facebook, Linkedin, Youtube, Instagram).
    La meva privadesa àgil
    Aquest lloc utilitza cookies tècniques i de perfil. En fer clic a acceptar autoritzes totes les cookies de perfil. En fer clic a rebutjar o a la X, es rebutgen totes les galetes de perfil. Fent clic a personalitzar és possible seleccionar quines galetes de perfil activar.
    Aquest lloc compleix la Llei de Protecció de Dades (LPD), la Llei Federal Suïssa del 25 de setembre de 2020 i el GDPR, Reglament UE 2016/679, relatiu a la protecció de dades personals, així com a la lliure circulació d'aquestes dades.