fbpx

Entrepôt de données et ERP | ARCHIVE CENTRALE DE DONNÉES: HISTORIQUE ET ÉVOLUTIONS

ARCHIVER DONNÉES CENTRALE : HISTOIRE ET ÉVOLUTIONS


Les deux thèmes dominants de la technologie d'entreprise dans les années 90 sont
déclare que je entrepôt de données et l'ERP. Pendant longtemps ces deux puissants
courants ont fait partie de l'informatique d'entreprise sans jamais avoir
intersections. C'était presque comme s'il s'agissait de matière et d'anti-matière. Mais
la croissance des deux phénomènes conduit inévitablement à un
leur intersection. Les entreprises sont aujourd'hui confrontées au problème de
que faire avec ERP e entrepôt de données. Cet article illustrera
quels sont les problèmes et comment ils sont traités par les entreprises.
AU DÉBUT…
Au début, il y avait le entrepôt de données. Entrepôt de données est né pour
contrer le système d'application de traitement des transactions.
Dans les premiers temps, la mémorisation du donner c'était le destin
juste un contrepoint aux applications de traitement de
transactions. Mais de nos jours, il y a des visions beaucoup plus sophistiquées
que ce qu'un entrepôt de données. Dans le monde d'aujourd'hui, le
entrepôt de données il s'insère dans une structure qui peut être
appelé Corporate Information Factory.
L'USINE D'INFORMATION D'ENTREPRISE
(CAF)
La Corporate Information Factory a des composants architecturaux
standard: un niveau de transformation et d'intégration de code
qui intègre i donner alors que je donner ils quittent l'environnement de
application à l'environnement entrepôt de données de la compagnie; une
entrepôt de données de l'entreprise où je donner
des histoires détaillées et intégrées. le entrepôt de données de l'entreprise sert de
fondation sur laquelle toutes les autres pièces peuvent être construites
de l'environnement de entrepôt de données; un magasin de données opérationnelles (ODS).
Un ODS est une structure hybride qui contient certains aspects des données
entrepôt et autres aspects d'un environnement OLTP; data marts, dans lesquels je
différents départements peuvent avoir leur propre version des données
entrepôt; une entrepôt de données d'exploration dans laquelle je
Les "penseurs" de l'entreprise peuvent présenter leurs questions
72 heures sans effet nocif sur entrepôt de données; et un souvenir
près de la ligne, où donner vieux et donner les détails en gros peuvent être
stocké à bas prix.
OÙ L'ERP SE COMBINE AVEC LE
USINE D'INFORMATIONS D'ENTREPRISE
L'ERP fusionne avec la Corporate Information Factory à deux endroits.
Tout d'abord en tant qu'application de base (ligne de base) qui fournit le
donner de la demande à entrepôt de données. Dans ce cas je donner,
généré comme sous-produit d'un processus de transaction,
sont intégrés et chargés dans le entrepôt de données de la compagnie. le
deuxième point d'union entre l'ERP et le CIF et l'ODS. En effet, de nombreux
Dans ces environnements, l'ERP est utilisé comme un ODS classique.
Dans le cas où l'ERP est utilisé comme application de base, il
même ERP peut également être utilisé dans CIF comme ODS. Dans
cependant, si l'ERP doit être utilisé dans les deux rôles, il
il doit y avoir une distinction claire entre les deux entités. En d'autres termes,
lorsque l'ERP joue le rôle de l'application principale et de l'ODS, le
deux entités architecturales doivent être distinctes. Si un seul
la mise en œuvre d'un ERP tente de jouer les deux rôles
en même temps, il y aura inévitablement des problèmes dans le
conception et mise en œuvre de cette structure.
SAO SÉPARÉES ET APPLICATIONS DE BASE
De nombreuses raisons conduisent à la division des composants
architectural. Peut-être la question la plus révélatrice pour séparer
différents composants d'une architecture est que chaque composant
de l'architecture a sa propre vision. L'application de base est nécessaire
dans un but différent de celui de l’ODS. Essayez de se chevaucher
une vue d'application de base sur le monde d'un ODS ou vice versa
ce n'est pas une bonne façon de travailler.
Par conséquent, le premier problème d'un ERP dans le CIF est celui de
vérifier s'il y a une distinction entre les applications de base et le
ODS.
MODÈLES DE DONNÉES DANS L'ENTREPRISE
USINE D'INFORMATION
Pour réaliser la cohésion entre les différents composants
de l'architecture du CIF, il doit y avoir un modèle de donner. Les
modèles de donner servir de lien entre les différents composants
architecture telle que les applications de base et ODS. LE
modèles de donner devenir la «feuille de route intellectuelle» pour
juste sens par les différentes composantes architecturales du CIF.
Parallèlement à cette notion, l'idée est qu'il devrait y avoir
être un modèle formidable et unique de donner. Bien sûr, il doit
être un modèle de donner pour chacun des composants et en plus là
ce doit être une voie sensée reliant les différents modèles.
Chaque composant de l'architecture - ODS, applications de base,
entrepôt de données entreprise, et ainsi de suite .. - a besoin de son propre
modèle de donner. Et donc il doit y avoir une définition précise de
comme ces modèles de donner ils s'interfacent les uns avec les autres.
MOVE I DONNÉES DE LA DATE ERP
ENTREPÔT
Si l'origine du donner est une application de base et / ou un ODS, lorsque
Inserts ERP i donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données, cette insertion doit
se produisent au plus bas niveau de «granularité». Récapitulatif ou
agréger simplement i donner comme ils sortent
de l'application de base de l'ERP ou de l'ODS de l'ERP n'est pas le
bonne chose à faire. LE donner des détails sont nécessaires dans la date
entrepôt pour former la base du processus DSS. Tel donner
ils seront remodelés de plusieurs manières par des data marts et des explorations
de la entrepôt de données.
Le déplacement de donner à partir de l'environnement d'application de base
de l'ERP à l'environnement du entrepôt de données de l'entreprise est réalisée dans un
raisonnablement détendu. Ce changement se produit après ça
environ 24 heures à compter de la mise à jour ou de la création dans l'ERP. Le fait de
avoir un mouvement « paresseux » du donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données
de l'entreprise permet donner venant de l'ERP pour "s'installer".
Une fois que je donner sont déposés dans l'application de base,
alors vous pouvez bouger en toute sécurité i donner de l'ERP
dans la société. Un autre objectif réalisable grâce au mouvement
Dieux "paresseux" donner est la délimitation claire entre les processus opérationnels et
DSS. Avec un mouvement « rapide » du donner la ligne de démarcation
entre DSS et opérationnel reste vague.
Le mouvement de donner de l'ODS de l'ERP à entrepôt de données
de l'entreprise se fait périodiquement, généralement
hebdomadaire ou mensuelle. Dans ce cas, le mouvement de
donner il est basé sur la nécessité de « nettoyer » les anciens donner les historiens.
Naturellement, l'ODS contient je donner qui sont beaucoup plus récents
par rapport à donner historiens trouvés dans le entrepôt de données.
Le déplacement de donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données ce n'est presque jamais fait
"Vente en gros" (à la manière d'un grossiste). Copier un tableau
de l'environnement ERP à entrepôt de données cela n'a aucun sens. Une approche
beaucoup plus réaliste est le déplacement des unités sélectionnées du donner.
Seulement je donner qui ont changé depuis la dernière mise à jour de la date
l'entrepôt sont ceux qui doivent être déplacés dans les données
entrepôt. Une façon de savoir lesquels donner ils ont été modifiés
puisque la dernière mise à jour consiste à regarder les horodatages des donner
trouvé dans l'environnement ERP. Le concepteur sélectionne toutes les modifications
qui se sont produits depuis la dernière mise à jour. Une autre approche
consiste à utiliser des techniques d'acquisition de changement donner. avec
ces techniques sont analysées sur des bandes de journal et de journal afin de
déterminer lesquels donner doit être déplacé de l'environnement ERP vers
Celui du entrepôt de données. Ces techniques sont les meilleures pour
combien de journaux et de bandes de journal peuvent être lus à partir des fichiers ERP
sans autre effet sur les autres ressources de l'ERP.
AUTRES COMPLICATIONS
L'un des problèmes avec l'ERP dans CIF est ce qui arrive aux autres
sources d'application ou IA donner de l'ODS auquel ils doivent contribuer
entrepôt de données mais ils ne font pas partie de l'environnement ERP. Compte tenu du
nature fermée de l'ERP, en particulier SAP, la tentative d'intégration
clés provenant de sources externes de donner avec donner qui viennent de l'ERP au
il est temps de déménager donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données, c'est un grand défi.
Et combien sont exactement les probabilités que je donner d'applications ou
Les ODS en dehors de l'environnement ERP seront intégrés dans les données
dépot? Les chances sont en fait très élevées.
TROUVE DONNÉES HISTORIQUES DE L'ERP
Un autre problème avec le donner de l'ERP est le résultat
du besoin d'avoir donner historiens au sein du entrepôt de données.
Généralement le entrepôt de données il a besoin donner les historiens. EST
généralement, la technologie ERP ne stocke pas ces donner
historique, du moins pas au point où il est nécessaire à la date
entrepôt. Quand une grande quantité de donner les historiens commencent l'annonce
être ajouté à l'environnement ERP, un tel environnement doit être
nettoyé. Par exemple, supposons qu'un entrepôt de données devrait
être chargé de cinq ans de donner historique alors que l’ERP tient bon
maximum six mois de ces donner. Tant que l'entreprise est satisfaite de
rassembler une série de donner historique au fil du temps,
alors il n'y a aucun problème à utiliser l'ERP comme source pour le
entrepôt de données. Mais quand le entrepôt de données deve andare
remonter le temps et prendre les dieux donner des historiens qui n'ont pas été
préalablement collectés et sauvegardés par l'ERP, puis l'environnement ERP
devient inefficace.
ERP ET METADATA
Une autre considération à faire sur l'ERP et entrepôt de données c'est ça
sur les métadonnées existantes dans l'environnement ERP. Ainsi que les métadonnées
ils passent de l'environnement ERP au del entrepôt de donnéesle
les métadonnées doivent être déplacées de la même manière. En outre, je
les métadonnées doivent être transformées en format et en structure
requis par l'infrastructure de entrepôt de données. il y en a un gros
différence entre les métadonnées opérationnelles et les métadonnées DSS. Les métadonnées
opérationnels sont principalement pour le développeur et pour le
programmeur. Les métadonnées DSS sont principalement destinées à l'utilisateur
le final. Métadonnées existantes dans les applications ERP ou les ODS
ils doivent être convertis et cette conversion n'est pas toujours facile
et direct.
SOURCE DES DONNÉES ERP
Si l'ERP est utilisé comme fournisseur de donner le entrepôt de données ci
ce doit être une interface solide qui bouge i donner de l'environnement
ERP à l'environnement entrepôt de données. L'interface doit :
▪ être facile à utiliser
▪ permettre l'accès à donner de l'ERP
▪ prendre le sens de donner qui sont sur le point d'être déplacés
Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données
▪ connaître les limites de l'ERP qui pourraient survenir
heure à laquelle vous vous connectez à donner de l'ERP:
▪ intégrité référentielle
▪ relations hiérarchiques
▪ relations logiques implicites
▪ convention d'application
▪ toutes les structures de donner pris en charge par l'ERP, et ainsi de suite ...
▪ être efficace dans l'accès donner, en fournissant:
▪ mouvement direct de donner
▪ acquisition du changement donner
▪ soutenir l'accès en temps opportun à donner
▪ comprendre le format du donner, etc…
INTERFACE AVEC SAP
L'interface peut être de deux types, locale ou commerciale.
Certaines des principales interfaces commerciales comprennent:
▪ SAS
▪ Solutions Prims
▪ D2k, et ainsi de suite…
PLUSIEURS TECHNOLOGIES ERP
Traiter l'environnement ERP comme s'il s'agissait d'une seule technologie est un
grosse erreur. Il existe de nombreuses technologies ERP, chacune avec ses propres
forces. Les vendeurs les plus connus du marché sont :
▪ SAP
▪ Oracle Finance
▪ PeopleSoft
JD Edwards
▪ Baans
SAP
SAP est le logiciel ERP le plus grand et le plus complet. Applications
de SAP englobe de nombreux types d'applications dans de nombreux domaines. SAP a
la réputation d'être:
▪ très grand
▪ très difficile et coûteux à mettre en œuvre
▪ a besoin de beaucoup de personnes et de consultants pour être
mis en œuvre
▪ a besoin de personnes spécialisées pour la mise en œuvre
▪ prend beaucoup de temps à mettre en œuvre
De plus, SAP a la réputation de mémoriser ses propres donner très
soigneusement, ce qui rend difficile leur accès
personne en dehors de la zone SAP. La force de SAP est d'être
capable de capturer et de stocker une grande quantité de donner.
SAP a récemment annoncé son intention d'étendre la
ses applications ai entrepôt de données. Il y a beaucoup d'avantages et d'inconvénients
en utilisant SAP en tant que fournisseur de entrepôt de données.
L'un des avantages est que SAP est déjà installé et que la plupart des
les consultants connaissent déjà SAP.
Les inconvénients d'avoir SAP comme fournisseur de entrepôt de données sont
nombreux : SAP n'a aucune expérience dans le monde entrepôt de données
Si SAP est le fournisseur de entrepôt de données, il faut "sortir"
i donner de SAP al entrepôt de données. Date l'expérience d'un SAP en matière de
système fermé, il est peu probable qu'il soit facile de passer de SAP à
il (???). Il existe de nombreux environnements hérités qui alimentent SAP,
tels que IMS, VSAM, ADABAS, ORACLE, DB2, etc.
SAP insiste sur une approche «non inventée ici». SAP ne veut pas
collaborer avec d'autres fournisseurs pour utiliser ou créer le entrepôt de données.
SAP insiste pour générer lui-même l'ensemble de ses logiciels.
Bien que SAP soit une grande et puissante entreprise, le fait de
tentative de réécriture de la technologie d'ELT, OLAP, administration de la
système et même le code de base du dbm c'est juste fou.
Au lieu d'adopter une attitude coopérative avec les fournisseurs
di entrepôt de données de longue date, SAP a suivi l'approche qui
ils "en savent plus". Cette attitude freine le succès que
SAP peut avoir dans le domaine de entrepôt de données.
Refus de SAP d'autoriser l'accès des fournisseurs externes
promptement et gracieusement pour eux donner. L’essence même de l’utilisation
un entrepôt de données est un accès facile à donner. Toute l'histoire de SAP est
basé sur le fait qu'il est difficile d'accéder donner.
Le manque d'expérience de SAP dans le traitement de gros volumes de donner;
dans le domaine de entrepôt de données il y a des volumes de donner jamais vu depuis
SAP et pour gérer ces grandes quantités de donner tu dois en avoir un
technologie appropriée. SAP n'est apparemment pas au courant de cela
barrière technologique qui existe pour entrer dans le champ de données
entrepôt.
La culture d'entreprise de SAP: SAP a créé une entreprise
en obtenant je donner du système. Mais pour ce faire, vous devez avoir
une mentalité différente. Traditionnellement, les éditeurs de logiciels
bons pour obtenir des données dans un environnement n'ont pas été bons pour
obtenir des données pour aller dans l'autre sens. Si SAP peut faire ce genre de
switch sera la première entreprise à le faire.
En bref, on peut se demander si une entreprise doit sélectionner
SAP en tant que fournisseur de entrepôt de données. Il y a des risques très sérieux
d'une part et très peu de récompenses d'autre part. Mais il y en a un autre
raison qui décourage le choix de SAP comme fournisseur de dates
dépot. Parce que chaque entreprise doit avoir la même date
entrepôt de toutes les autres entreprises ? le entrepôt de données c'est le coeur
avantage compétitif. Si chaque entreprise adoptait la même
entrepôt de données ce serait difficile, mais pas impossible,
obtenir un avantage concurrentiel. SAP semble penser qu'un
entrepôt de données il peut être considéré comme un cookie et c'est un
signe supplémentaire de leur «obtenir les données
dans".
Aucun autre fournisseur ERP n'est aussi dominant que SAP.
Il y aura sans aucun doute des entreprises qui suivront la voie SAP
pour les leurs entrepôt de données mais probablement cette date
Les entrepôts SAP seront grands, chers et très exigeants
le temps de leur création.
Ces environnements incluent des activités telles que le "traitement des guichets bancaires",
processus de réservation des compagnies aériennes, processus de réclamation
assurance, et ainsi de suite. Le système de transaction était plus performant,
le besoin de séparation entre les opérations et les processus était plus évident.
DSS (système d'aide à la décision). Cependant, avec les systèmes de ressources
humain et personnel, vous n'êtes jamais confronté à de gros volumes de
transactions. Et, bien sûr, quand une personne est embauchée
ou quitter l'entreprise c'est un enregistrement d'une transaction.
Mais par rapport à d'autres systèmes, les systèmes de ressources humaines et
personnel n'a tout simplement pas beaucoup de transactions. Par conséquent, dans le
systèmes de ressources humaines et personnelles, il n'est pas tout à fait évident qu'il existe
besoin d'un DataWarehouse. À bien des égards, ces systèmes
représentent la fusion des systèmes DSS.
Mais il y a un autre facteur qui doit être pris en compte si on doit le faire
faire avec datawarehouse et PeopleSoft. Dans de nombreux environnements, je donner
des ressources humaines et personnelles sont secondaires à l'entreprise
société primaire. La plupart des entreprises effectuent
fabrication, vente, prestation de services, etc. LE
les systèmes de ressources humaines et personnelles sont généralement secondaires (ou di
support) au cœur de métier de l'entreprise. Il est donc
équivoque et incommode entrepôt de données séparé pour le
soutien aux ressources humaines et personnelles.
PeopleSoft est très différent de SAP à cet égard. Avec SAP, c'est
obligatoire qu'il y ait un entrepôt de données. Avec PeopleSoft, ce n'est pas
alors si clair. Un entrepôt de données est facultatif avec PeopleSoft.
La meilleure chose que l'on puisse dire pour le donner PeopleSoft, ce sont ces données
l'entrepôt peut être utilisé pour stocker i donner lié à
anciennes ressources humaines et personnelles. Une deuxième raison pour la
laquelle une entreprise souhaite utiliser un entrepôt de données a
au détriment de l'environnement PeopleSoft est de permettre l'accès et
accès gratuit aux outils d'analyse, ai donner par PeopleSoft. Mais
en plus de ces raisons, il peut y avoir des cas où il est préférable de ne pas
disposer d'un entrepôt de données pour donner PeopleSoft.
En bref
Il existe de nombreux aperçus sur la construction d'une date
entrepôt au sein d’un logiciel ERP.
Certains d'entre eux sont:
▪ Il est logique d'avoir un entrepôt de données qui ressemble à n'importe quel
ailleurs dans l'industrie ?
▪ Quelle est la flexibilité d'un ERP entrepôt de données logiciel?
▪ Un ERP entrepôt de données le logiciel peut gérer un volume de
donner qui est situé dans un "entrepôt de données arène"?
▪ Quel est le bilan du fournisseur ERP
face facile et peu coûteux, en termes de temps, ai donner? (quelle
est le bilan des fournisseurs ERP en matière de livraison de produits bon marché, sur
temps, accès facile aux données ?)
▪ Quelle est la compréhension de l'architecture DSS et du
«Usine d'informations d'entreprise» par le fournisseur ERP?
▪ Les fournisseurs ERP comprennent comment obtenir donner dans
de l'environnement, mais aussi comprendre comment les exporter ?
▪ Dans quelle mesure le fournisseur de l'ERP est-il ouvert aux outils de données
l'entreposage?
Toutes ces considérations doivent être prises en compte pour déterminer
où mettre le entrepôt de données qui va héberger je donner ERP et autres
donner. En général, à moins qu'il n'y ait une raison impérieuse à cela
pour faire autrement, il est recommandé de construire entrepôt de données dehors
de l'environnement du fournisseur ERP.
CHAPITRE 1
Présentation de l'organisation BI
Points clés:
Les référentiels d'informations fonctionnent en sens inverse
à l'architecture de Business Intelligence (BI):
La culture d'entreprise et l'informatique peuvent limiter le succès
construire des organisations BI.
La technologie n'est plus le facteur limitant pour les organisations de BI. Le
Le problème pour les architectes et les planificateurs de projets n'est pas
la technologie existe, mais s'ils peuvent mettre en œuvre efficacement
technologie disponible.
Pour de nombreuses entreprises, un entrepôt de données c'est un peu plus qu'un dépôt
distribution passive i donner aux utilisateurs qui en ont besoin. LE donner
ils sont extraits des systèmes source et sont peuplés dans les structures cibles
di entrepôt de données. Les donner ils peuvent également être nettoyés avec l'ensemble
la chance. Cependant, aucune valeur supplémentaire n'est ajoutée non plus
collecté par donner au cours de ce processus.
Essentiellement, DW passif, au mieux, offre
seulement moi donner propre et opérationnel aux associations d’usagers. Là
la création d'informations et la compréhension analytique dépendent
entièrement par les utilisateurs. Jugez si le DW (Entrepôt de données) soit
le succès est subjectif. Si l'on juge le succès sur
capacité à collecter, intégrer et nettoyer efficacement i donner
entreprise sur une base prévisible, alors oui, le DW est un succès.
D'un autre côté, si on regarde la collection, la consolidation et elle
l'exploitation des informations de l'organisation dans son ensemble, puis
le DW est un échec. Un DW fournit peu ou pas de valeur
informations. En conséquence, les utilisateurs sont obligés de se débrouiller,
créant ainsi des silos d'information. Ce chapitre présente
une vision complète pour résumer l'architecture de la BI (Business
Intelligence) des entreprises. Commençons par une description de la BI et
puis nous passerons aux discussions sur la conception et
développement de l'information, au lieu de simplement fournir i donner
aux utilisateurs. Les discussions sont ensuite axées sur le calcul de
valeur de vos efforts BI. Nous concluons en définissant comment IBM
répond aux exigences de BI architecturales de votre organisation.
Description architecturale de
organisation de la BI
De puissants systèmes d'information orientés transactions sont désormais
à l'ordre du jour dans toutes les grandes entreprises, au fur et à mesure qu'ils
effectivement le terrain de jeu des entreprises du monde entier.
Rester compétitif, cependant, nécessite désormais des systèmes analytiques
orienté vers cela peut révolutionner la capacité de l'entreprise en redécouvrant et en
en utilisant les informations dont ils disposent déjà. Ces systèmes
l'analyse découle de la compréhension de la richesse des donner
disponible. La BI peut améliorer les performances dans toutes les informations
de la compagnie. Les entreprises peuvent améliorer les relations clients et
fournisseurs, améliorer le profit des produits et services, générer
nouvelles et meilleures offres, contrôle des risques et entre autres
les revenus réduisent considérablement les dépenses. Avec BI vôtre
l'entreprise commence enfin à utiliser les informations client
comme un atout concurrentiel grâce à des applications qui ont des objectifs de
marché.
Avoir le bon business signifie avoir des réponses définitives aux
des questions clés telles que :
▪ Lequel des nôtres clientèle ils nous font gagner plus, ou là
envoient-ils à perte?
▪ Où vivent nos meilleurs clientèle par rapport à boutique/
entrepôt qu’ils fréquentent ?
▪ Lequel de nos produits et services peut être le plus vendu
efficacement et à qui?
▪ Quels produits peuvent être vendus le plus efficacement et à qui?
▪ Quelle campagne de vente a été la plus réussie et pourquoi?
▪ Quels canaux de vente sont les plus efficaces pour quels produits?
▪ Comment nous pouvons améliorer les relations avec nos meilleurs clientèle?
La plupart des entreprises ont donner difficile de répondre
ces questions.
Les systèmes opérationnels génèrent de grandes quantités de produit, de
client et donner marché des points de vente, réservations,
du service client et des systèmes de support technique. Le défi est
extraire et exploiter ces informations.
De nombreuses entreprises ne profitent que de petites fractions de leurs propres donner
pour les analyses stratégiques.
I donner restant, souvent rejoint avec moi donner résultant de sources externes telles que i
Les "rapports gouvernementaux" et les autres informations achetées en sont un
mine d'or qui ne demande qu'à être explorée, ei donner doivent
être affiné uniquement dans le contexte informatif du vôtre
organisation.
Ces connaissances peuvent être appliquées de différentes manières, variations
de la conception d'une stratégie d'entreprise générale à
communication personnelle avec les fournisseurs, via les centres d'appels,
facturation, Internet et d'autres points. L'environnement des affaires d'aujourd'hui dicte
que DW et les solutions BI associées évoluent davantage
l'exécution de structures traditionnelles de donner que je donner normalisé à
niveau atomique et "fermes d'étoiles / cubes".
Ce qu'il faut pour rester compétitif, c'est une fusion de
technologies traditionnelles et avancées dans un effort pour soutenir une
vaste paysage analytique.
Enfin, l'environnement général doit améliorer les connaissances
de l'entreprise dans son ensemble, en veillant à ce que les actions entreprises
à la suite des analyses effectuées, elles sont utiles pour que chacun fasse
avantage.
Par exemple, disons que vous classez le vôtre clientèle dans les catégories
risque élevé ou faible.
Si ces informations sont générées par un modèle d'extraction ou
d'autres moyens, il doit être mis dans DW et rendu accessible à
n'importe qui, au moyen de n'importe quel outil d'accès, tel que i
rapports statiques, feuilles de calcul, tableaux ou traitement analytique dans
ligne (OLAP).
Cependant, actuellement, une grande partie de ce type d'informations
ils restent dans les silos de donner des individus ou des services qu'ils génèrent
l'analyse. L'organisation dans son ensemble a peu ou pas de visibilité
pour la compréhension. Simplement en mélangeant ce type de contenu
informations dans votre entreprise DW vous pouvez éliminer les silos de la
informations et élevez votre environnement Dw.
Il y a deux obstacles majeurs au développement d'une organisation
de BI.
Premièrement, nous avons le problème de l'organisation elle-même
de la discipline concernée.
Bien que nous ne puissions pas vous aider avec les changements de politique
organisation, nous pouvons vous aider à comprendre les composants de
une organisation BI, son architecture et comment le
La technologie IBM facilite son développement.
Le deuxième obstacle à surmonter est le manque de technologie
intégré et la connaissance d'une méthode qui rappelle tout l'espace
de BI par opposition à seulement un petit composant.
IBM répond aux évolutions technologiques
d'intégration. Il est de votre responsabilité de fournir un design
conscient de soi. Cette architecture doit être développée avec
technologie choisie pour une intégration sans contraintes, ou du moins avec
technologie qui adhère à des normes ouvertes. Aussi, le vôtre
La direction de l'entreprise doit s'assurer que l'entreprise Bi est
effectuée selon le calendrier et de ne pas le permettre
développement de silos d'informations dérivant de
agendas ou objectifs.
Cela ne veut pas dire que l'environnement BI n'est pas sensible à
réagir aux différents besoins et exigences des différents utilisateurs; au lieu de cela, cela signifie
que la mise en œuvre de ces besoins et exigences individuels est
fait pour le bénéfice de l'ensemble de l'organisation BI.
Une description de l'architecture de l'organisation BI peut
se trouve à la page 9 de la figure 1.1. L'architecture montre
un riche mélange de technologies et de techniques.
Du point de vue traditionnel, l'architecture comprend les composants suivants
d'entrepôt
Couche atomique.
C'est le fondement, le cœur de tout le DW et donc de la
reporting stratégique.
I donner stocké ici conservera l’intégrité historique, les relations de
donner et inclure la métrique dérivée, en plus d'être propre,
intégré et stocké à l'aide des modèles d'extraction.
Toute utilisation ultérieure de ceux-ci donner et les informations associées sont
dérivé de cette structure. C'est une excellente source pour
extraction de donner et pour les rapports avec des requêtes SQL structurées
Entrepôt opérationnel de donner ou rapporter la base de
donner(Magasin de données opérationnelles (ODS) ou reporting
base de données.)
Il s'agit d'une structure de donner spécialement conçu pour
rapports techniques.
I donner stockées et transportées sur ces structures peuvent enfin
propager dans l'entrepôt à travers la zone d'organisation (transfert
zone), où il pourrait être utilisé pour la signalisation stratégique.
Zone de transit.
Le premier arrêt pour la plupart donner destiné à l'environnement
l'entrepôt est la zone d'organisation.
Ici je donner ils sont intégrés, nettoyés et transformés en donner utile que
ils peupleront la structure de l'entrepôt
Date marts.
Cette partie de l'architecture représente la structure de donner utilisé
spécifiquement pour OLAP. La présence des datamarts, si je donner sont
stockés dans le schéma en étoile qui se chevauchent donner
multidimensionnel dans un environnement relationnel, ou dans des classeurs
di donner propriétaire utilisé par une technologie OLAP spécifique, telle que
Serveur DB2 OLAP, ce n'est pas pertinent.
La seule contrainte est que l'architecture facilite l'utilisation de donner
multidimensionnel.
L'architecture englobe également les technologies et techniques critiques de Bi
qui se distinguent par:
Analyse spatiale
L'espace est un atout d'information inattendu pour l'analyste et
c’est essentiel pour une résolution complète. L'espace peut
représentent les informations des personnes vivant dans un certain
emplacement, ainsi que des informations sur l'emplacement de cet emplacement
physiquement par rapport au reste du monde.
Pour effectuer cette analyse, vous devez commencer par lier la vôtre
informations aux coordonnées de latitude et de longitude. C'est-à-dire
dénommé "géocodage" et doit faire partie de l'extraction,
transformation, et le processus de chargement (ETL) au niveau
de votre entrepôt.
Exploration de données.
L'extraction de donner permet à nos entreprises de développer
nombre de clientèle, pour prédire les tendances des ventes et permettre
gestion des relations avec clientèle (CRM), entre autres initiatives du
BI.
L'extraction de donner il doit donc être intégré aux structures de
donner de DWHouse et pris en charge par les processus d'entrepôt pour
s'assurer de l'utilisation efficace et efficiente de la technologie et
techniques connexes.
Comme indiqué dans l'architecture BI, le niveau atomique du
Dwhouse, comme les datamarts, est une excellente source de donner
pour l'extraction. Ces mêmes structures doivent également être
destinataires des résultats d'extraction pour vérifier la disponibilité
public le plus large (public le plus large).
Agents.
Il existe différents agents pour examiner le client pour chaque point tels que, i
systèmes d'exploitation de l'entreprise et le même dw. Ces agents peuvent
être des réseaux de neurones avancés formés pour en savoir plus
les tendances de chaque point, telles que la demande future du produit en fonction
sur les promotions des ventes, les moteurs basés sur des règles pour réagir
un date ensemble de circonstances, ou même de simples agents qui
ils signalent les exceptions aux «cadres supérieurs». Ces processus font
généralement présent en temps réel et doit donc
être étroitement lié au mouvement du même donner.
Toutes ces structures de donner, technologies et techniques garantissent
que vous ne passerez pas la nuit à générer une organisation du
votre BI.
Cette activité sera développée par étapes incrémentielles, pour les petits
les points.
Chaque étape est un effort de projet indépendant et fait l'objet d'un rapport
comme une itération dans votre initiative dw ou BI. Les itérations
peut inclure la mise en œuvre de nouvelles technologies, pour
commencer avec de nouvelles techniques en ajoutant de nouvelles structures donner ,
chargement i donner supplémentaire, ou avec l'expansion de l'analyse de la
votre environnement. Ce paragraphe est discuté plus
en détail au chapitre 3.
En plus des structures traditionnelles de Dw et des outils de Bi il y en a d'autres
fonctions de votre organisation BI auxquelles vous devez
conception, tels que:
Points de contact client (contact client
points).
Comme pour toute organisation moderne, il existe un certain nombre de
points de contact client qui indiquent comment vivre une expérience
positif pour le vôtre clientèle. Il existe des canaux traditionnels tels que je
commerçants, standardistes, publipostage, multimédia et imprimerie
la publicité, ainsi que les canaux les plus courants tels que le courrier électronique et le Web, i donner
les produits avec un point de contact doivent être achetés,
transportés, nettoyés, traités puis peuplés vers les installations donner de
BI.
Bases de donner associations opérationnelles et d'utilisateurs (Opérationnel
bases de données et communautés d’utilisateurs).
A la fin des points de contact du clientèle les fondations sont trouvées donner
application de l'entreprise et des communautés d'utilisateurs. LES donner existant
sont donner traditionnel qui doit être réuni et fusionné avec le donner que
flux des points de contact pour répondre aux
informations.
Analystes. (Analystes)
Le principal bénéficiaire de l'environnement BI est l'analyste. C'est lui qui
bénéficie de l’extraction actuelle de donner opérationnel, intégré à
différentes sources de donner , augmenté de fonctionnalités telles que l'analyse
géographique (géocodage) et présenté dans les technologies BI qui
vous permettent d'extraire, OLAP, des rapports et des analyses SQL avancés
géographique. L'interface principale de l'analyste avec l'environnement de
reporting est le portail BI.
Cependant, l'analyste n'est pas le seul à bénéficier de l'architecture du
BI.
Dirigeants, grandes associations d'utilisateurs et même partenaires, fournisseurs et i
clientèle ils devraient trouver des avantages dans la BI d'entreprise.
Boucle de retour.
L'architecture BI est un environnement d'apprentissage. Un principe
caractéristique du développement est de permettre des structures persistantes de donner
être mis à jour grâce à la technologie BI utilisée et par des actions
compréhensions de l'utilisateur. Un exemple est l'évaluation de la
client(notation client).
Si le service commercial fait un modèle d'exploration de données
des scores du client quant à l'utilisation d'un nouveau service, puis le
le service commercial ne devrait pas être le seul groupe bénéficiaire
de service.
Au lieu de cela, le modèle minier doit être fait en tant que partie
flux de données naturel au sein de l'entreprise et scores du client
devrait devenir une partie intégrante du contexte informationnel de
entrepôt, visible par tous les utilisateurs. La suite IBM bi-bi-centrique
y compris DB2 UDB, DB2 OLAP Server comprend la plupart
partie des composants importants de la technologie, définis dans la figure
1.1.
Nous utilisons l'architecture telle qu'elle apparaît dans cette figure de livre pour
donnez-nous un niveau de continuité et démontrez comment chaque produit
d'IBM s'inscrit dans le cadre général de la BI.
Fournir le contenu de l'information (fournir
contenu de l'information)
Concevoir, développer et mettre en œuvre votre environnement BI est
une opération ardue. Le design doit tellement embrasser
besoins commerciaux actuels et futurs. La conception de l'architecture
il doit être complet pour inclure toutes les conclusions trouvées
pendant la phase de conception. L'exécution doit rester
engagé dans un seul but: développer l'architecture de la BI
tel que présenté formellement dans le dessin et basé sur les exigences de
Entreprise.
Il est particulièrement difficile de soutenir que la discipline garantira la
succès relatif.
C'est simple car vous ne développez pas un environnement BI complet
tout d'un coup, mais cela se fait par petites étapes au fil du temps.
Cependant, identifier les composants BI de votre architecture est
important pour deux raisons: vous guiderez toutes les décisions ultérieures
techniques architecturales.
Vous serez en mesure de concevoir consciemment une utilisation particulière de la technologie
bien que vous n'obtiendrez peut-être pas un représentant qui a besoin du
technologie depuis plusieurs mois.
Comprendre suffisamment les exigences de votre entreprise affectera le type
de produits que vous acquerrez pour votre architecture.
La conception et le développement de votre architecture garantissent
que votre entrepôt est
pas un événement aléatoire, mais plutôt un "bien pensé",
annonce soigneusement construite opera d'art comme une mosaïque de
technologie mixte.
Concevoir le contenu des informations
Toute planification initiale doit se concentrer et identifier
composants majeurs de la BI qui seront nécessaires à l'environnement
général dans le présent et dans le futur.
Il est important de connaître les exigences commerciales.
Avant même que toute la planification conventionnelle ne commence, le
le planificateur de projet peut souvent identifier un ou deux
composant immédiatement.
L'équilibre des composants qui peuvent être nécessaires pour la
votre architecture, cependant, n’est pas facile à trouver.
Pendant la phase de conception, l'essentiel de l'architecture
lie la session de développement d'application (JAD) à une recherche
pour identifier les besoins commerciaux.
Parfois, ces exigences peuvent être confiées à des outils de
requêtes et rapports.
Par exemple, les utilisateurs déclarent que s'ils souhaitent automatiser
actuellement un rapport doit générer manuellement en intégrant
deux ratios de courant et en ajoutant les calculs dérivés de
combinaison de donner.
Bien que cette exigence soit simple, elle en définit une certaine
fonctionnalité de la fonction que vous devez inclure lorsque
acheter des outils de reporting pour votre organisation.
Le concepteur doit également satisfaire aux exigences supplémentaires pour
obtenez une image complète. Les utilisateurs souhaitent s'abonner à
ce rapport?
Les sous-ensembles du rapport sont générés et envoyés par e-mail aux différents
utilisateurs? Vous souhaitez voir ce rapport sur le portail de l'entreprise ?
Toutes ces exigences font partie du simple besoin de
remplacer un rapport manuel à la demande des utilisateurs. Le bénéfice
de ces types d'exigences est que tout le monde, utilisateurs et concepteurs,
une compréhension du concept de rapports.
Il existe cependant d'autres types d'entreprises que nous devons planifier.
Lorsque les exigences commerciales sont énoncées sous la forme de
Questions stratégiques d'affaires, c'est facile pour le designer chevronné
discerner la mesure / le fait et les exigences dimensionnelles.
La figure 1.2 illustre les composantes de mesure et dimensionnelles d'un
Problème commercial.
Si les utilisateurs JAD ne savent pas comment déclarer leurs besoins
sous la forme d'un problème commercial, le concepteur fournira souvent
exemples pour sauter-démarrer la session de collecte
exigences.
Le concepteur expert peut aider les utilisateurs à comprendre non seulement
commerce stratégique, mais aussi comment le former.
L'approche de collecte des exigences est abordée au chapitre 3; pour
maintenant nous souhaitons seulement indiquer la nécessité de concevoir pour tout le monde
les types d’exigences BI
Un problème commercial stratégique n'est pas seulement une exigence
Des affaires, mais aussi un indice de conception. Si vous devez répondre
à une question multidimensionnelle, alors il faut mémoriser,
soumettre je donner dimensions, et si vous avez besoin de mémoriser les
donner multidimensionnelle, vous devez décider quel type de technologie ou
technique que vous allez utiliser.
Implémentez-vous un schéma d'étoiles cubiques réservé, ou les deux?
Comme vous pouvez le voir, même un simple problème commercial
cela peut avoir une influence considérable sur la conception. Toutefois
ces types d'exigences commerciales sont ordinaires et bien sûr, au moins
par des planificateurs et concepteurs de projets expérimentés.
Il y a eu suffisamment de débats sur les technologies et le soutien des
OLAP et une large gamme de solutions sont disponibles. Jusqu'à maintenant
nous avons mentionné la nécessité de rassembler des rapports simples avec i
exigences en matière de taille d'entreprise et comment ces exigences
influencer les décisions architecturales techniques.
Mais quelles sont les exigences qui ne sont pas facilement comprises
par les utilisateurs ou par l'équipe DW? Vous n'aurez jamais besoin de l'analyse
spatiale(analyse spatiale) ?
Les modèles miniers de donner ils seront une partie nécessaire de la vôtre
futur? Qui sait?
Il est important de noter que ces types de technologies ne sont pas nombreux
connu des communautés d'utilisateurs générales et des membres de l'équipe de
Dw, en partie, cela pourrait arriver parce qu'ils
ils sont traités par des experts techniques internes ou tiers. C'est un
cas extrême des problèmes que génèrent ces types de technologies. Soi
les utilisateurs ne peuvent pas décrire les besoins de l'entreprise ni les encadrer
afin de fournir des lignes directrices aux concepteurs, ils peuvent
passer inaperçu ou, pire, simplement ignoré.
Plus problématique cela devient lorsque le concepteur et le développeur échouent
ils peuvent reconnaître l'application de l'un de ces
technologies critiques.
Comme nous l’avons souvent entendu dire par les concepteurs, «eh bien, pourquoi
Ne le mettons-nous pas de côté jusqu'à ce que nous ayons cette autre chose?
«Sont-ils vraiment intéressés par les priorités ou évitent-ils simplement de
exigences qu'ils ne comprennent pas? C'est probablement la dernière hypothèse.
Disons que votre équipe de vente a communiqué une exigence
des entreprises, comme indiqué dans la figure 1.3, comme vous pouvez le voir, le
l'exigence est formulée sous la forme d'un problème commercial. Là
la différence entre ce problème et le problème dimensionnel typique est
la distance. Dans ce cas, le groupe de vente souhaite savoir,
sur une base mensuelle, les ventes totales des produits, entrepôts et
clientèle qui vivent à moins de 5 miles de l'entrepôt où ils se trouvent
ils achètent.
Malheureusement, les concepteurs ou les architectes peuvent tout simplement
ignorer la composante spatiale en disant: «nous avons le client, le
produit et je donner du dépôt. Nous gardons la distance jusqu'à
une autre itération.
"Mauvaise réponse. Ce type de problème commercial concerne
entièrement BI. Il représente une compréhension plus profonde de la
notre activité et un espace analytique robuste pour nos analystes.
La BI va au-delà d'une simple requête ou d'un rapport standard, ou
même OLAP. Cela ne veut pas dire que ces technologies ne
sont importants pour votre BI, mais à eux seuls, ils ne représentent pas
l'environnement BI.
Conception pour le contexte d'information
(Conception pour le contenu d'information)
Maintenant que nous avons identifié les exigences commerciales qui les distinguent
divers composants fondamentaux, doivent être inclus dans une conception
architecture générale. Certains des composants de la BI font partie de
de nos efforts initiaux, tandis que certains ne seront pas mis en
plusieurs mois.
Cependant, toutes les exigences connues sont reflétées dans la conception de sorte que
lorsque nous devons mettre en œuvre une technologie particulière, nous sommes
préparez-vous à le faire. Quelque chose dans le projet reflétera la réflexion
Traditionnel.
Par exemple, la figure 1.1, au début du chapitre, montre une date
mart qui garde le donner dimensionnelle.
Cet ensemble de donner est utilisé pour prendre en charge les utilisations ultérieures de
donner dimensionnellement motivé par les problèmes commerciaux qui
nous avons identifié. Comme les documents supplémentaires sont
générés, tels que le développement de la conception du donner, nous
nous commencerons à formaliser comment je donner ils se propagent dans l'environnement.
Nous avons constaté la nécessité de représenter le donner si
dimensionnelle, en les divisant (selon les besoins spécifiques
déterminé) sur des data marts.
La prochaine question à laquelle il faut répondre est: comment seront-ils construits
ces data marts?
Construisez-vous les étoiles pour soutenir les cubes, ou simplement les cubes, ou simplement les étoiles?
(ou cubes droits, ou étoiles droites). Générer l'architecture des données
marts dépendants qui nécessitent une couche atomique pour tous donner
acquis? Autoriser l'acquisition de data marts indépendants donner
directement à partir des systèmes d'exploitation?
Quelle technologie de cube allez-vous essayer de standardiser?
Vous avez d'énormes quantités de dieux donner requis pour l'analyse dimensionnelle
ou vous avez besoin de vos cubes de force de vente nationaux sur un
sur une base hebdomadaire ou sur les deux? Construisez un objet puissant
tels que DB2 OLAP Server for Finance ou les cubes Cognos
PowerPlay pour votre organisation commerciale ou les deux?
Ce sont les grandes décisions de conception architecturale qui
affectera votre environnement BI à partir de maintenant. Oui,
vous avez identifié un besoin pour OLAP. Maintenant, comment allez-vous faire ça
type de technique et de technologie ?
Comment certaines des technologies les plus avancées affectent la vôtre
dessins? Nous supposons que vous avez constaté un besoin
espace dans votre organisation. Vous devez maintenant appeler le
éditions de dessins architecturaux bien que non planifiées
pour réaliser des composantes spatiales pendant plusieurs mois. L'architecte doit
concevoir aujourd'hui en fonction de ce qui est nécessaire. Prédire le besoin de
l'analyse spatiale qu'elle génère, stocke, réalise et fournit
accès à donner espace. Cela devrait à son tour servir de
contrainte concernant le type de technologie et les spécifications
plate-forme logicielle que vous pouvez actuellement envisager. Pour
exemple, le système d'administration de base de données relationnel
(SGBDR) que vous effectuez pour votre couche atomique doit avoir
une extension spatiale robuste disponible. Cela garantirait le
performances maximales lors de l'utilisation de la géométrie et des objets
espace dans vos applications analytiques. Si votre SGBDR ne fonctionne pas
peut gérer je donner (spatial-centric) en interne, vous devrez donc
una stable base de données (centrée sur l'espace) externe. Cela complique le
gérer les éditions et compromettre vos performances globales,
sans parler des problèmes supplémentaires créés pour le vôtre
DBA, car ils ont probablement un peu de compréhension
des bases de donner l'espace aussi. D'un autre côté, si votre
RDMBS gère tous les composants spatiaux et connexes
l'optimiseur est conscient des besoins spéciaux (par exemple,
indexation) des objets spatiaux, alors vos administrateurs de base de données peuvent gérer
gérez rapidement les éditions et vous pouvez augmenter le
la performance.
En outre, vous devez ajuster la zone de transit et le calque
environnement atomique pour inclure le nettoyage des adresses (un
élément clé de l'analyse spatiale), ainsi que les éléments suivants
économiser des objets spatiaux. La succession des éditions de
le design continue maintenant que nous avons introduit la notion de nettoyage
adresse. D'une part, cette application dictera le type de
logiciel dont vous avez besoin pour vos efforts ETL.
Vous avez besoin de produits comme Trillium pour vous fournir une adresse
clean, ou un fournisseur ETL que vous avez choisi de fournir
Fonctionnalité?
Pour l'instant, il est important que vous appréciiez le niveau de conception que vous êtes
il doit être complété avant de commencer à créer le vôtre
environnement (entrepôt). Les exemples ci-dessus devraient
démontrer la multitude de décisions de conception qui doivent suivre
l'identification de toute exigence commerciale particulière. Si c'est fait
correctement, ces décisions de conception favorisent
l'interdépendance entre les structures physiques de votre environnement, le
sélection de la technologie utilisée et du flux de propagation du
contenu de l'information. Sans cette architecture conventionnelle
de BI, votre organisation sera soumise à un mélange
chaotique des technologies existantes, au mieux, unies d'une manière
pas précis pour fournir une stabilité apparente.
Maintenir le contenu des informations
Apporter la valeur de l'information à votre organisation est
une opération très difficile. Sans une compréhension suffisante
et l'expérience, ou une planification et un dessin appropriés, même le
de meilleures équipes échoueraient. Par contre, si vous en avez un grand
intuition et une conception détaillée mais pas de discipline pour cela
exécution, vous venez de gaspiller votre argent et votre temps
parce que votre effort est voué à l'échec. Le message doit
soyez clair: si vous manquez un ou plusieurs de ces
compétences, compréhension / expérience ou planification / dessin o
la discipline de mise en œuvre, cela conduira à paralyser ou
détruire la construction de l'organisation BI.
Votre équipe est-elle suffisamment préparée ? Il y a quelqu'un sur le vôtre
Équipe BI qui comprend le vaste paysage analytique disponible
dans les environnements BI, dans les techniques et technologies nécessaires
pour affecter ce paysage ? Il y a quelqu'un dans votre équipe
qui peut reconnaître la différence d'application entre avancé
reporting statique et OLAP, ou les différences entre ROLAP et OLAP ? L'un des
les membres de votre équipe reconnaissent clairement le chemin
extrait et comment cela pourrait affecter l'entrepôt ou comment
l'entrepôt peut-il soutenir les performances minières? Un membre
de l'équipe comprend la valeur de donner espace ou technologie
basé sur un agent? Avez-vous quelqu'un qui apprécie l'application unique
des outils ETL par rapport à la technologie des courtiers
un message? Si vous ne l'avez pas, procurez-vous-en un. La BI, c'est bien plus
grand d'une couche atomique normalisée, d'OLAP, des schémas a
étoile et une ODS.
Avoir la compréhension et l'expérience nécessaires pour reconnaître les exigences
de la BI et de leurs solutions est essentielle à votre capacité à
formaliser correctement les besoins et la conception des utilisateurs
et mettre en œuvre leurs solutions. Si votre communauté d'utilisateurs a
difficulté à décrire les exigences, c'est le travail de l'équipe
l'entrepôt fournit cet aperçu. Mais si l'équipe de
entrepôt
ne reconnaît pas l'application spécifique de la BI - par exemple, étant donné
l'exploitation minière - alors ce n'est pas la meilleure chose que font les environnements BI
souvent limités à des dépôts passifs. Cependant, ignorez ces
les technologies ne diminuent pas leur importance et l'effet qu'elles ont
sur l'émergence de vos possibilités de business intelligence
l'organisation, ainsi que la structure d'information que vous concevez
promouvoir.
Le design doit inclure la notion de design, ed
les deux nécessitent une personne compétente. De plus, la conception
cela nécessite une philosophie et une observation de la maison en équipe
normes. Par exemple, si votre entreprise en a créé un
plate-forme standard ou a identifié un SGBDR particulier que vous
veulent normaliser sur toute la plate-forme, il se profile que
tout le monde dans l'équipe adhère à ces normes. Généralement un
l'équipe expose le besoin de normalisation (pour l'utilisateur
communautés), mais l’équipe elle-même ne souhaite pas rejoindre le
normes également établies dans d'autres domaines de l'entreprise ou peut-être même dans le
entreprises similaires. Non seulement cela est hyporcritique, mais cela garantit que l'entreprise ne
est capable d'exploiter les ressources et les investissements existants. Ça ne veut pas dire
qu'il n'y a pas de situations qui garantissent une plate-forme ou une
technologie non standard; cependant, les efforts de l'entrepôt
ils doivent jalousement protéger les normes de l'entreprise jusqu'à
que les exigences commerciales ne dictent pas le contraire.
Le troisième élément clé nécessaire pour construire une BI
l'organisation est la discipline.
Cela dépend au total, également des individus et de l'environnement.
Les planificateurs de projets, les sponsors, les architectes et les utilisateurs doivent apprécier
discipline nécessaire pour construire la structure informationnelle de l'entreprise.
Les concepteurs doivent diriger leurs efforts de projet de manière à
compléter les autres efforts nécessaires dans la société.
Par exemple, supposons que votre entreprise crée un
Application ERP qui a un composant d'entrepôt.
Il est donc de la responsabilité des concepteurs ERP de collaborer avec le
équipe environnement de l'entrepôt pour ne pas concurrencer non plus
dupliquer le travail déjà commencé.
La discipline est aussi un sujet qui doit être occupé
par l'ensemble de l'organisation et est généralement établi et confié à un
niveau exécutif.
Les dirigeants sont-ils prêts à adhérer à une approche conçue? UNE
approche qui promet de créer un contenu d'information qui
fin apportera de la valeur à tous les domaines de l'entreprise, mais peut-être
cela compromet-il les individus ou les programmes ministériels? Rappelez-vous le dicton
«Penser à tout est plus important que penser à une chose».
Ce dicton est vrai pour les organisations de BI.
Malheureusement, de nombreux entrepôts concentrent leurs efforts
essayer d'adresser et d'apporter de la valeur à un département particulier ou à
utilisateurs spécifiques, avec un peu de respect pour l'organisation en
général. Supposons que l'exécutif demande l'assistance du
washouse. L'équipe répond avec un travail de 90 jours qui
comprend non seulement la livraison des exigences de notification définies par le
gestionnaire mais veille à ce que tous donner la base est mélangée au niveau
atomique avant d'être introduit dans la technologie du cube
proposition.
Cet ajout d'ingénierie garantit que l'entreprise
l'entrepôt bénéficiera de donner nécessaire au gestionnaire.
Cependant, l'exécutif s'est entretenu avec des cabinets de conseil externes qui
ont proposé une application similaire avec livraison en moins de 4
semaines.
En supposant que l'équipe interne de la maison est compétente, le
l'exécutif a le choix. Qui peut soutenir la discipline de
ingénierie supplémentaire nécessaire pour cultiver le bien
entreprise informative ou peuvent choisir de réaliser leur propre
solution rapidement. Ce dernier semble vraiment choisi
trop souvent et ne sert qu'à créer des conteneurs d'informations de
qui ne profitent qu'à quelques-uns ou à l'individu.
Objectifs à court et à long terme
Les architectes et les planificateurs de projets doivent en formaliser un
une vision à long terme de l'architecture générale et des plans
devenir une organisation BI. Cette combinaison de
revenus à court terme et planification à long terme
représentent les deux visages des efforts de BI. Le gain à court terme
l'expiration est la facette de la BI associée aux itérations du
votre entrepôt.
C'est là que les planificateurs, les architectes et les sponsors se concentrent sur
répondre à des exigences commerciales spécifiques. C'est à ce niveau que le
les structures physiques sont construites, la technologie est achetée et le
des techniques sont mises en œuvre. Ils ne sont en aucun cas faits pour traiter
exigences spécifiques telles que définies par des communautés d'utilisateurs particulières.
Tout est fait pour répondre aux besoins spécifiques définis
d'une communauté particulière.
La planification à long terme, cependant, est l'autre facette
de BI. C'est là que les plans et les projets ont assuré qu'il était
construit toute structure physique, les technologies sélectionnées et le
techniques faites avec un œil sur l'entreprise. Et le
une planification à long terme qui assure la cohésion
nécessaire pour garantir que les avantages commerciaux découlent de tous
les gains à court terme constatés.
Justifiez votre effort BI
Un entrepôt de données en soi, il n'a pas de valeur intrinsèque. En d'autre
mots, il n'y a pas de valeur intrinsèque parmi les technologies de
techniques d'entreposage et de mise en œuvre.
La valeur de tout effort d'entrepôt se trouve dans les actions
réalisé en raison de l'environnement et du contenu de l'entrepôt
informatif grandi au fil du temps. C'est un point critique à comprendre
avant d'essayer d'estimer la valeur d'une initiative
où.
Trop souvent, les architectes et les designers essaient de valoriser
composants physiques et techniques de l'entrepôt alors qu'en fait la valeur est
fondée avec les processus commerciaux qui sont positivement impactés par
entrepôt et informations bien acquises.
C'est là que réside le défi de fonder la BI: comment justifiez-vous l'investissement?
Si le wherehouse lui-même n'a pas de valeur intrinsèque, les concepteurs de
le projet doit étudier, définir et formaliser les bénéfices
réalisé par les personnes qui utiliseront l'entrepôt pour
améliorer des processus métier spécifiques ou la valeur
informations protégées ou les deux.
Pour compliquer les choses, tout processus commercial
affectées par les efforts d'entreposage pourraient offrir des avantages
«Considérable» ou «doux». Des avantages considérables en fournissent un
métrique tangible pour mesurer le retour sur investissement (ROI) - annonce
par exemple, remettez l'inventaire une fois de plus au cours d'une période
spécifique ou pour un coût de transport moindre par envoi. C'est plus
Il est difficile de définir les légers avantages, comme un meilleur accès aux
l'information, en termes de valeur tangible.
Liez votre projet pour en savoir plus sur
Demandes commerciales
Trop souvent, les concepteurs de projets essaient de lier la valeur
de l'entrepôt avec des objectifs amorphes de l'entreprise. En déclarant que
«La valeur d'un entrepôt repose sur notre capacité à
satisfaire les demandes stratégiques »nous ouvrons de manière agréable le
discours. Mais à lui seul, il ne suffit pas de déterminer si
investir dans l'inventaire est logique. Il vaut mieux connecter les représentants
entrepôt avec des demandes commerciales spécifiques et connues.
Mesurer le ROI
Le calcul du retour sur investissement dans une configuration d'entrepôt peut être
particulièrement difficile. C'est particulièrement difficile si l'avantage
le principal d'une répétition particulière est quelque chose d'intangible ou
facile à mesurer. Une étude a révélé que les utilisateurs perçoivent
les deux principaux avantages des initiatives BI:
▪ Créer la capacité de prendre des décisions
▪ Créer un accès à l'information
Ces avantages sont des avantages doux (ou doux). C'est facile à voir
comment pouvons-nous calculer un retour sur investissement basé sur un lead dur (ou
plus grande) comme la réduction du coût du transport, mais comment
mesurons-nous la capacité de prendre de meilleures décisions?
C'est définitivement un défi pour les concepteurs de projets lorsque
ils essaient d'amener l'entreprise à investir dans une entreprise en particulier
effort d'entrepôt. Augmentation des ventes ou diminution des coûts
ce ne sont plus les thèmes centraux qui animent l'environnement BI.
Au lieu de cela, vous recherchez un accès dans les demandes de renseignements commerciaux
mieux à l'information afin qu'un service particulier puisse
prendre des décisions plus rapidement. Ce sont des moteurs stratégiques pour
ce qui se trouve être tout aussi important pour l'entreprise, mais ils sont
plus ambiguë et plus difficile à caractériser dans une métrique tangible.
Dans ce cas, le calcul du ROI peut être trompeur, voire non pertinent.
Les concepteurs de projets doivent pouvoir démontrer leur valeur
tangible pour les dirigeants de décider d'investir dans
une répétition particulière tient. Cependant, nous n'en proposerons pas de nouveau
méthode de calcul du ROI, nous ne ferons pas non plus de pro ou d'arguments
encontre.
Il existe de nombreux articles et livres disponibles qui traitent des principes fondamentaux de
calculer le retour sur investissement. Il existe des propositions de valeur spéciales telles que la valeur
sur l'investissement (VOUS), proposé par des groupes comme Gartner, que vous pouvez
rechercher. Au lieu de cela, nous nous concentrerons sur les aspects fondamentaux de tout
ROI ou autres propositions de valeur dont vous devez tenir compte.
Appliquer le ROI
En plus de l'argument concernant les avantages «concrets» par rapport aux avantages «légers»
associé aux efforts de BI, il y a d'autres problèmes à prendre en compte
lorsque nous appliquons le ROI. Par exemple:
Attribuer trop d'économies aux efforts du DW qui viendraient
cependant
Disons que votre entreprise est passée d'une architecture de
mainframe vers un environnement UNIX distribué. Donc tout
économies qui peuvent (ou non) être réalisées grâce à cet effort
ne doit pas être attribué exclusivement, si à tous (?), au
entrepôt.
Ne pas tenir compte de tous les coûts. Et il y a beaucoup de choses de
prendre en compte. Considérez la liste suivante:
▪ Coût de démarrage, y compris la faisabilité.
▪ Coût du matériel dédié avec stockage associé e
la communication
▪ Coût du logiciel, y compris la gestion des donner et extensions
client / serveur, logiciel ETL, technologies DSS,
applications de visualisation, de programmation et de flux
logiciel de travail et de suivi, .
▪ Coût de conception de la structure donner, avec la réalisation, et
l'optimisation de
▪ Coût de développement logiciel directement associé à l'effort
BI
▪ Coût de l'assistance à domicile, y compris l'optimisation de
performances, y compris le contrôle de la version du logiciel e
opérations d'aide
Appliquez un retour sur investissement «Big-Bang».
La construction de l'entrepôt comme un effort unique et gigantesque
il est voué à l'échec, il calcule donc également le retour sur investissement d'une initiative
de grande entreprise L'offre est surprenante, et que les concepteurs
continuer à faire de faibles tentatives pour estimer la valeur de l'ensemble
effort.
Parce que les designers essaient de donner une valeur monétaire
à l'initiative des entreprises s'il est largement connu et accepté
Est-il difficile d'estimer des répétitions spécifiques? Comment est-ce possible? Ce n'est pas
possible à quelques exceptions près. Ne fais pas ça.
Maintenant que nous avons établi ce qu'il ne faut pas faire lorsque nous calculons
ROI, voici quelques points qui nous aideront dans la définition de
un processus fiable pour estimer la valeur de vos efforts BI.
Obtention du consentement ROI. Indépendamment de la vôtre
choix de la technique pour estimer la valeur de vos efforts BI, doit
être accepté par toutes les parties, y compris les planificateurs de projet,
sponsors et dirigeants d’entreprises.
Réduisez le retour sur investissement des pièces identifiables. Une étape nécessaire vers
un calcul de retour sur investissement raisonnable consiste à concentrer ce calcul sur un
projet spécifique. Cela vous permet ensuite d'estimer une valeur
en fonction des exigences commerciales spécifiques satisfaites
Définissez les coûts. Comme mentionné, de nombreux coûts doivent être
pris en considération. De plus, les coûts doivent inclure non seulement les coûts associés
à l'itération unique mais aussi aux coûts associés
à l'assurance du respect des normes de l'entreprise.
Définissez les avantages. Lier clairement le retour sur investissement aux exigences
commercial, nous devrions être en mesure d'identifier les
des avantages qui permettront de répondre aux exigences.
Réduisez les coûts et les avantages des revenus à venir. C'est le chemin
meilleure façon de baser vos évaluations sur la valeur actuelle nette
(VAN) contrairement à essayer de prédire la valeur future
revenus futurs.
Réduisez au minimum votre temps de retour sur investissement. EST'
bien documenté sur le long terme, il a été utilisé dans le vôtre
ROI
Utilisez plusieurs formules de retour sur investissement. Il existe de nombreuses méthodes pour
Les prévisions de retour sur investissement et vous devez prévoir d’en utiliser un ou
plus, y compris la valeur actuelle nette, la vitesse interne du retour
(IRR) et récupération.
Définissez le processus répétable. Ceci est crucial pour calculer
toute valeur à long terme. Il devrait être documenté un
processus unique et répétable pour toutes les séquences de projet a
poursuivre.
Les problèmes répertoriés sont les plus courants définis par les experts
de l'environnement de la maison. L'insistance de la part de la direction de
avoir un ROI «Big-Bang» livré est très déroutant. Si vous démarrez tous les
vos calculs de ROI en les réduisant à des parties identifiables et tangibles, vous avez
une bonne chance d'estimer une évaluation précise du retour sur investissement.
Questions sur les avantages du retour sur investissement
Quels que soient vos avantages, doux ou durs, vous pouvez utiliser
quelques questions fondamentales pour déterminer leur valeur. À
exemple utilisant un système d'échelle simple, de 1 à 10, vous
vous pouvez détecter l'impact de tout effort en utilisant les éléments suivants
des questions:
▪ Comment évalueriez-vous la compréhension de donner suivant ceci
projet de votre entreprise ?
▪ Comment estimeriez-vous les améliorations de processus résultant de
ce projet?
▪ Comment mesureriez-vous l'impact de nouvelles idées et inférences maintenant
rendu disponible par cette itération
▪ Quel a été l'impact des nouveaux environnements informatiques e
performant à la suite de ce qui avait été appris?
Si les réponses à ces questions sont peu nombreuses, il est possible que
l'entreprise ne vaut pas l'investissement réalisé. Questions avec un high
marquer des points à des gains de valeur significatifs et devrait
servir de guides pour une enquête plus approfondie.
Par exemple, un score élevé pour l'amélioration des processus
il doit amener les concepteurs à examiner comment les processus sont
été amélioré. Vous constaterez peut-être que certains ou tous les gains sont réalisés
ils sont tangibles et, par conséquent, une valeur monétaire peut être facilement
appliqué.
Tirer le meilleur parti de la première itération du
entrepôt
Le plus grand résultat de vos efforts commerciaux est souvent
quelques premières itérations. Ces premiers efforts traditionnellement
établir le contenu d'information le plus utile pour le public e
établit une aide à la base technologique pour les suivantes
Applications BI.
Habituellement, chaque sous-séquence suivante de donner de projet de
les entrepôts apportent de moins en moins de valeur ajoutée à l'entreprise en
général. Cela est particulièrement vrai si l'itération ne le fait pas
ajoute de nouveaux sujets ou ne répond pas aux besoins d'un nouveau
communauté d'utilisateurs.
Cette fonction de stockage s'applique également aux batteries
augmentation de donner les historiens. Comme les efforts ultérieurs nécessitent plus
donner et comment plus donner sont versés dans l'entrepôt au fil du temps, la plupart des
donner cela devient moins pertinent pour l'analyse utilisée. Celles-ci donner sont
souvent appelé donner somnoler et ça coûte toujours cher de les garder car
ils ne sont presque jamais utilisés.
Qu'est-ce que cela signifie pour les porteurs de projets? Essentiellement, je
les premiers sponsors partagent plus que les coûts d'investissement.
Ceci est primaire car ils sont l'impulsion pour fonder la couche
grand environnement technologique et ressources d'entrepôt,
y compris bio.
Mais ces premiers pas apportent la plus grande valeur et donc les designers
doivent souvent justifier l’investissement.
Les projets réalisés après votre initiative BI peuvent avoir des coûts
inférieur (par rapport au premier) et direct, mais ayant moins de valeur
à l'entreprise.
Et les propriétaires d'organisation doivent commencer à envisager
jeter l'accumulation de donner et des technologies moins pertinentes.
Exploration de données: exploitation minière Donner
De nombreux composants architecturaux nécessitent des variations de
technologies et techniques d'exploration de données -
par exemple, les différents «agents» pour l'examen des points d'intérêt de la
clientèle, les systèmes d'exploitation de l'entreprise et pour le même dw. Celles-ci
les agents peuvent être des réseaux de neurones avancés formés sur
les tendances du pot, telles que la demande future de produits basée sur
promotions des ventes; moteurs basés sur des règles pour
réagir à un tout date de circonstances, par exemple, un diagnostic
recommandations médicales et de traitement; ou même de simples agents
avec le rôle de signaler les exceptions aux cadres supérieurs (haut
cadres). Généralement ces procédés d'extraction donner si
vérifier en temps réel; par conséquent, ils doivent être unis
complètement avec le mouvement de donner eux-mêmes.
Traitement du traitement analytique en ligne
Analyse en ligne
La capacité de trancher, hacher, rouler, percer
et effectuer l'analyse
what-if, est dans le champ d'application de l'objectif de la suite
Technologie IBM. Par exemple, les fonctions de traitement analytique
en ligne (OLAP) existe pour DB2, ce qui introduit l'analyse dimensionnelle dans le
moteur de base de données même.
Les fonctions ajoutent un utilitaire dimensionnel à SQL tandis que
profitez de tous les avantages de faire partie intégrante de DB2. Une autre
exemple d'intégration OLAP est l'outil d'extraction, DB2
Analyseur de serveur OLAP. Cette technologie permet aux cubes du
Serveur DB2 OLAP pour être rapidement et automatiquement
analysé pour identifier et rendre compte des valeurs de donner inhabituel ou inattendu
tout au long du cube à l'analyste commercial. Et enfin, les fonctions du
DW Center fournit aux architectes les moyens de contrôler, parmi les
autres choses, le profil d'un cube serveur DB2 OLAP en tant que partie
nature des processus ETL.
Analyse spatiale Analyse spatiale
L'espace représente la moitié des ancres analytiques (conduction)
nécessaire pour un panorama
large analytique (le temps représente l'autre moitié). Le niveau atomique
(niveau atomique) de l'entrepôt, représenté sur la figure 1.1,
il comprend les principes fondamentaux du temps et de l'espace. Les enregistrements
de l'analyse de l'ancrage temporel pour les informations d'heure et d'adresse
analyse de l'espace d'ancrage. Horodatage (horodatage)
ils effectuent l'analyse à temps, et les informations d'adresse conduisent
l'analyse par l'espace. Le diagramme montre le géocodage - processus de
conversion d'adresses en points dans une carte ou en points dans l'espace
afin que des concepts tels que la distance et l'interne / l'externe puissent être
utilisé dans l'analyse - menée au niveau atomique et l'analyse spatiale
qui est mis à la disposition de l'analyste. IBM fournit des extensions
espace, développé avec l'Institut de recherche sur les systèmes environnementaux (ESRI),
al base de données DB2 afin que les objets spatiaux puissent être
stocké comme partie normale de base de données relationnel. DB2
Spatial Extenders, ils fournissent également toutes les extensions SQL pour
tirer parti de l'analyse spatiale. Par exemple, les extensions SQL de
question sur
distance entre les adresses ou si un point est à l'intérieur ou à l'extérieur d'une zone
polygonales définies, sont une norme analytique avec le Spatial
Extenseur. Voir le chapitre 16 pour plus d'informations.
Base de données-Outils outils résidents Base de données-
résident
DB2 possède de nombreuses fonctionnalités SQL résidant en BI qui aident
dans l'action d'analyse. Ceux-ci inclus:
▪ Fonctions de récursivité pour effectuer des analyses, telles que «trouver
toutes les trajectoires de vol possibles de San Francisco a New York ».
▪ Les fonctions analytiques de classement, fonctions cumulatives, cube
et des cumuls pour faciliter les tâches qui se produisent normalement
uniquement avec la technologie OLAP, ils font désormais partie intégrante de la
moteur de base de données
▪ La possibilité de créer des tableaux contenant des résultats
Vendeurs de base de données les dirigeants combinent davantage de capacités de BI
Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. base de données même.
Les principaux fournisseurs de base de données ils mélangent plus de
fonctionnalité de BI dans base de données même.
Cela fournit les meilleures performances et plus d'options d'exécution pour le
Solutions BI.
Les caractéristiques et fonctions de DB2 V8 sont présentées
en détail dans les chapitres suivants :
Fondements de l'architecture technique et de la gestion des données
(Chapitre 5)
▪ Principes de base de DB2 BI (chapitre 6)
▪ Tables de requêtes matérialisées DB2 (Requête matérialisée
Tableaux) (Chapitre 7)
▪ Fonctions DB2 OLAP (Chapitre 13)
▪ DB2 Enhanced BI
Caractéristiques et fonctions) (Chapitre 15)
Système de livraison de données simplifié
Système de livraison de donner simplifié
L'architecture représentée sur la figure 1.1 comprend plusieurs
structures donner physique. L'un est l'entrepôt de donner opérationnel.
Généralement, un ODS est un sujet orienté,
intégré et actuel. Souhaitez-vous créer un ODS pour prendre en charge, annonce
exemple, le bureau des ventes. Les ventes de SAO intégreraient donner
provenant de nombreux systèmes différents mais ne garderait que,
exemple, les transactions d'aujourd'hui. L'ODS peut être mis à jour
même plusieurs fois par jour. En même temps, les processus
pousser je donner intégré dans d'autres applications. Cette structure est
spécialement conçu pour intégrer donner e actuelle et dynamique
serait un candidat susceptible de subir des analyses en temps réel,
comment fournir des agents de service clientèle informations de vente
courants d'un client en extrayant des informations sur les tendances des ventes
de l'entrepôt lui-même. Une autre structure illustrée à la figure 1.1 est
un statut formel pour le dw. Non seulement c'est l'endroit pour
l'exécution de l'intégration nécessaire, de la qualité de donneret
de la transformation de donner de stock sur le chemin, mais c'est aussi
une zone de stockage fiable et temporaire pour donner a répondu que
pourrait être utilisé dans des analyses en temps réel. Si vous décidez de
utiliser un ODS ou une zone de rassemblement, un
des meilleurs outils pour peupler ces structures donner aide
différentes sources d'exploitation est la requête distribuée hétérogène de DB2.
Cette fonctionnalité est fournie par la fonction DB2 en option
appelé DB2 Relational Connect (requête uniquement) et via DB2
DataJoiner (un produit distinct qui fournit l'application,
l'insertion, la mise à jour et la possibilité d'annulation d'un
SGBDR distribués de manière hétérogène).
Cette technologie permet aux architectes de donner di legare donner di
production avec des processus analytiques. Non seulement la technologie peut
s'adapter à pratiquement toutes les demandes de réplication qui
ils peuvent apparaître avec des analyses en temps réel, mais
ils peuvent également se connecter à une grande variété de bases de donner plus
populaires, notamment DB2, Oracle, Sybase, SQL Server,
Informix et autres. DB2 DataJoiner peut être utilisé pour renseigner
une structure donner formel comme un ODS ou même une table
permanent représenté dans l'entrepôt conçu pour la restauration
rapide des mises à jour instantanées ou à vendre. Bien sûr,
ces mêmes structures donner peut être rempli en utilisant
une autre technologie importante conçue pour la réplication de donner, IBM
DataPropagator Relational. (DataPropagator est un produit distinct
pour les systèmes centraux. DB2 UNIX, Linux, Windows et OS / 2 incluent
services de réplication de donner en standard).
Une autre méthode pour déménager donner opérant autour
à l'entreprise est un intégrateur d'applications d'entreprise autrement
connu sous le nom de courtier de messages
une technologie unique permet un contrôle inégalé au centre
(ciblage) et déplacer donner autour de l'entreprise. IBM a le courtier
du message le plus largement utilisé, MQSeries ou une variante
du produit qui comprend les exigences de e-commerce, IBM
WebSphere MQ.
Pour plus d'informations sur la façon de tirer parti de MQ pour prendre en charge un
magazzino e un ambiente BI, visitare site web del libro. Per ora, è
il suffit de dire que cette technologie est un excellent médium pour
capture et transformation (à l'aide de MQSeries Integrator) donner
des opérateurs ciblés recrutés pour des solutions BI. Là
La technologie MQ a été intégrée et intégrée dans UDB V8, qui
cela signifie que les files d'attente de messages peuvent maintenant être gérées
comme s'il s'agissait de tables DB2. Le concept de soudage du
messages en file d'attente et messages d'univers base de données têtes relationnelles
vers un environnement de livraison puissant donner.
Zéro latence Zéro latence
L'objectif stratégique ultime d'IBM est l'analyse de latence zéro (zéro latence).
Tel que défini par
Gartner, un système BI doit pouvoir déduire, assimiler
et fournir des informations aux analystes sur demande. Le défi,
bien sûr, cela réside dans la façon de mélanger donner actuel et en temps réel
avec les informations historiques nécessaires, telles que i donner modèle / de
tendance, ou compréhension extraite, comme une délimitation de la
client.
Ces informations comprennent, par exemple, l'identification des clientèle ad
risque élevé ou faible ou quels produits i clientèle ils achèteront beaucoup
probablement s'ils ont déjà du fromage dans leur panier
achats.
Obtenir une latence nulle dépend en fait de deux
mécanismes fondamentaux :
▪ Union complète de donner qui sont analysés avec le
techniques établies et avec les outils développés par BI
▪ Un système de livraison de donner efficace pour garantir que
l'analyse en temps réel est vraiment disponible
Ces conditions préalables à latence nulle ne sont pas différentes des deux
objectifs fixés par IBM et décrits ci-dessus.
Le couplage étroit du donner fait partie de la
intégration transparente organisée par IBM. Et créer un système
livraison de donner l'efficacité dépend entièrement de
technologie disponible qui simplifie le processus de livraison de
donner. Par conséquent, deux des trois objectifs d'IBM sont critiques
pour réaliser le troisième. IBM développe consciemment son propre
technologie pour garantir que la latence zéro est une réalité pour
efforts d'entrepôt.
Résumé / Synthèse
L'organisation BI fournit une feuille de route pour
créez votre environnement
itérativement. Il doit être ajusté pour refléter les besoins des
votre entreprise, actuelle et future. Sans vision architecturale
large, les répétitions de stock ne sont guère plus que
implémentations aléatoires d'entrepôt central qui font peu pour
créer une grande entreprise informative.
Le premier obstacle pour les chefs de projet est de savoir comment justifier
investissements nécessaires au développement de l'organisation BI.
Bien que le calcul du ROI soit resté un atout majeur pour
réalisations de l'entrepôt, il devient de plus en plus difficile de
prédire exactement. Cela a conduit à d'autres méthodes pour
déterminer si vous en avez pour votre argent. le
la valeur de l'investissement2 (VOUS), par exemple, est obtenue
comme solution.
Il incombe aux architectes de donner et sur les planificateurs de projets
générer et fournir délibérément des informations aux associations de
utilisateurs et pas simplement donner un service sur donner. Il y a un
énorme différence entre les deux. L'information est quelque chose qui fait
différence dans la prise de décision et l'efficacité; relativement, je
donner ce sont des éléments de base pour obtenir ces informations.
Même si je critique la source donner répondre aux demandes
l'environnement commercial et BI devrait jouer un rôle plus important
dans la création de contenu d'information. Nous devons prendre
des mesures supplémentaires pour nettoyer, intégrer, transformer ou
sinon créer un contenu d'information selon lequel le
les utilisateurs peuvent agir, et nous devons donc nous assurer que ces
les actions et ces décisions, lorsqu'elles sont raisonnables, sont reflétées
dans l'environnement BI. Si nous reléguons l'entrepôt pour servir uniquement sur donner,
il est garanti que les associations d'utilisateurs créeront le contenu
les informations nécessaires pour agir. Cela garantit que leur
la communauté sera en mesure de prendre de meilleures décisions, mais l'entreprise
il souffre du manque de connaissances qu'ils ont utilisé.
Date que les architectes et les planificateurs de projets lancent des projets
spécifiques à l'environnement BI, ils restent responsables devant l'entreprise
dans l'ensemble. Un exemple simple de cette fonctionnalité bidirectionnelle
faces des itérations de BI se trouve dans la source donner. tous
donner reçus pour des demandes commerciales spécifiques doivent être
peuplé dans la première couche atomique. Cela garantit le développement de la
l’information de l’entreprise, ainsi que la gestion, adressent les
demandes spécifiques de l'utilisateur définies dans l'itération.

Qu'est-ce qu'un entrepôt de données ?
Entrepôt de données c'est le cœur de l'architecture des systèmes d'information
depuis 1990 et accompagne les processus d'information en offrant une solide
plateforme intégrée de donner historiens pris comme base pour plus tard
Analyse. LES entrepôt de données offrent une facilité d'intégration dans un
monde des systèmes d'application qui ne sont pas compatibles les uns avec les autres. Date
l'entrepôt a évolué pour devenir une tendance. Entrepôt de données
organise et stocke i donner nécessaire aux processus d'information e
analytique sur la base d'une longue perspective de temps historique. Tout
cela implique un engagement considérable et constant dans la construction e
dans le maintien de la entrepôt de données.
Alors qu'est-ce qu'un entrepôt de données? A entrepôt de données est:
▪ orienté sujet
▪ système intégré
▪ temps de variante
▪ non volatile (ne s'annule pas)
une collection de donner utilisé pour soutenir les décisions managériales dans
mise en œuvre de processus.
I donner inséré dans entrepôt de données surgissent dans la plupart des
cas des environnements opérationnels. le entrepôt de données est faite par un
unité de stockage, physiquement séparée du reste du
système, qui contient donner préalablement traité par
applications qui fonctionnent sur des informations provenant de l'environnement
opérationnel.
La définition littérale d'un entrepôt de données mérite une étude approfondie
explication car il y a des motivations et des significations importantes
fonds décrivant les caractéristiques d'un entrepôt.
ORIENTATION DU SUJET ORIENTATION
THÉMATIQUE
La première caractéristique d'un entrepôt de données c'est qu'il est orienté vers
acteurs majeurs d'une entreprise. Le jugement des épreuves par i
donner c'est en contraste avec la méthode plus classique qui fournit
l'orientation des applications vers les processus et les fonctions,
méthode pour la plupart partagée par la plupart des
anciens systèmes directionnels.
Le monde opérationnel est conçu autour d'applications et de fonctions
comme les prêts, l'épargne, les cartes bancaires et la fiducie pour une institution
financier. Le monde de dw s'organise autour de sujets
tels que le client, le vendeur, le produit et l'entreprise.
L'alignement autour des sujets affecte la conception et
sur la réalisation de donner trouvé dans le dw. Notamment,
l'argument principal affecte la partie la plus importante de la
structure clé.
Le monde de l'application est influencé à la fois par la conception de la date
base et de la conception du processus. Le monde de
dw se concentre uniquement sur la modélisation donner et le
dessin du base de données. La conception du processus (sous sa forme
classic) ne fait pas partie de l'environnement dw.
Les différences entre le choix du processus / de la fonction et de l'application
le choix par sujet se révèle également sous forme de différences de contenu
de donner à un niveau détaillé. LE donner del dw n'inclut pas i donner que
ils ne seront pas utilisés pour le processus DSS pendant que les applications
opérationnel orienté vers donner contient i donner pour satisfaire
immédiatement les exigences fonctionnelles / de traitement qui peuvent ou
moins avoir une quelconque utilité pour l'analyste DSS.
Une autre manière importante dans laquelle les applications orientées opérationnelles
ai donner différer donner de dw est dans les rapports de donner. Les donner
opérationnel maintenir une relation continue entre deux ou plusieurs tables
basé sur une règle métier active. LES donner par dw
ils couvrent un spectre de temps et les ratios trouvés dans le dw sont
beaucoup de. De nombreuses règles de trading (et par conséquent, de nombreuses
rapports de donner ) sont représentés dans l'entrepôt de donner entre deux o
plusieurs tables.
(Pour une explication détaillée de la manière dont les relations entre les donner sont
géré dans le DW, nous renvoyons au Tech Topic à ce sujet
question.)
De nulle autre perspective que celle de la différence
fondamental entre un choix de fonction / processus et d'application
un choix de sujet, il y a une plus grande différence entre les systèmes
opérationnel et donner et le DW.
INTÉGRATION INTÉGRATION
L'aspect le plus important de l'environnement de dw est que je donner trouvé
au sein du dw, ils s’intègrent facilement. TOUJOURS. SANS
EXCEPTIONS. L'essence même de l'environnement dw est que je donner
contenus dans les limites de l'entrepôt sont intégrés.
L'intégration se manifeste de différentes manières – dans les conventions
identifiées comme cohérentes, dans la mesure des variables cohérentes, dans
structures codifiées cohérentes, dans les attributs physiques du donner
cohérent, etc.
Au fil des ans, les concepteurs de différentes applications l'ont fait
tenir de nombreuses décisions sur la façon dont une application devrait
être développé. Décisions de style et de conception individualisées
les applications des designers se révèlent de cent manières: en
différences de codage, de structure clé, de caractéristiques physiques,
conventions d'identification, etc. La capacité collective de nombreux
les concepteurs d'applications pour créer des applications incohérentes
c'est légendaire. La figure 3 expose certaines des différences les plus importantes
important dans la manière dont les applications sont conçues.
Encodage: Encode:
Les concepteurs d'applications ont choisi le codage de champ -
sexe - de plusieurs manières. Un designer représente le sexe comme
un "m" et "f". Un autre designer représente le sexe comme un "1"
et un « 0 ». Un autre designer représente le genre par un « x » et
"Y". Un autre designer représente le sexe comme «masculin» e
"femelle". Peu importe la façon dont le sexe entre dans la DW. Eux"
et le "F" est probablement aussi bon que l'ensemble
représentation.
Ce qui compte, c'est que quelle que soit l'origine du champ du sexe,
ce champ arrive dans le DW dans un état intégré cohérent. De
conséquence lorsque le champ est chargé dans le DW à partir de
une application où elle a été représentée au format
"M" et "F", i donner doit être converti au format DW.
Mesure des attributs : mesure de
Les attributs:
Les concepteurs d'applications ont choisi de mesurer le pipeline en
une variété de façons au cours du cours
Quelques années. Un créateur magasins je donner du pipeline dans
centimètres. Un autre concepteur d'applications stocke je donner
du pipeline en pouces. Un autre designer de
magasins d'applications je donner du pipeline en millions de pieds cubes
par seconde. Et un autre designer stocke les informations du
pipeline en termes de yards. Quelle que soit la source, lorsque le
les informations sur le pipeline arrivent dans le DW elles doivent être
mesuré de la même manière.
Selon les indications de la figure 3, les problèmes d'intégration
ils affectent presque tous les aspects du projet - les fonctionnalités
physique de donner, le dilemme d'avoir plus d'une source de donner, la
question d'échantillons identifiés incohérents, formats de donner
incohérent, etc.
Quel que soit l'argument de conception, le résultat est le même -
i donner doit être stocké dans le DW dans un e singulier
de manière globalement acceptable même lorsque les systèmes d'exploitation
fonds stocker différemment je donner.
Lorsque l'analyste DSS regarde le DW, la cible de l'analyste
devrait être l'exploitation de donner qui sont dans l'entrepôt,
plutôt que de s'interroger sur la crédibilité ou la cohérence de la
donner.
VARIANCE DE TEMPS
tous donner dans le DW, ils sont précis à un moment donné.
Cette caractéristique fondamentale du donner dans DW est très différent de donner
trouvé dans l'environnement d'exploitation. LES donner de l'environnement d'exploitation sont
aussi précis qu'au moment de l'accès. Autrement dit,
dans l'environnement d'exploitation lors de l'accès à un lecteur donner, Mais aussi
attendez qu'il reflète des valeurs précises comme au moment de l'accès.
Pourquoi je donner dans le DW sont aussi précis qu'à un moment donné dans le
temps (c'est-à-dire pas « maintenant »), je donner trouvé dans le DW
ce sont des « variances temporelles ».
L'écart temporel de donner DW est désigné de nombreuses manières.
Le moyen le plus simple est que je donner d'un DW représentent donner sur un
horizon à long terme - cinq à dix ans. L'horizon
le temps représenté pour l'environnement d'exploitation est beaucoup plus court
▪ des valeurs actuelles d'aujourd'hui jusqu'à soixante quatre vingt dix
Des applications qui doivent bien fonctionner et doivent être
disponible pour le traitement des transactions doit porter le
montant minimum de donner s'ils admettent un quelconque degré de
la flexibilité. Les applications opérationnelles ont donc un horizon
peu de temps, en tant que sujet de conception de
applications audio.
La deuxième façon dont la `` variance temporelle '' apparaît dans le DW est dans le
structure clé. Chaque structure clé du DW contient,
implicitement ou explicitement, un élément temporel, tel que
jour, semaine, mois, etc. L'élément temps est presque toujours
au bas de la clé concaténée trouvée dans le DW. Dans ces
les occasions, l'élément time existera implicitement, selon le cas
où un fichier entier est dupliqué à la fin du mois ou du trimestre.
La troisième façon dont la variance de temps est affichée est que je donner de la
DW, juste correctement enregistré, ne peut pas être
mise à jour. LES donner du DW sont, à toutes fins pratiques, une longue
série d'instantanés (instantané). Bien sûr, si les instantanés sont
n'a pas été prise correctement, les instantanés peuvent être
modifié. Mais en supposant que les instantanés sont faits
correctement, ils ne sont pas modifiés dès qu'ils sont terminés. Dans certaines
les cas peuvent être contraires à l'éthique ou même invalides que les instantanés dans le
DW sont modifiés. LES donner opérationnel, étant précis comme dans
lors de la connexion, ils peuvent être mis à jour au fur et à mesure qu'ils se présentent
le besoin.
PAS VOLATILE
La quatrième caractéristique importante de DW est qu'il est non volatil.
Des mises à jour, des insertions, des annulations et des modifications sont effectuées
régulièrement pour les environnements opérationnels enregistrement par enregistrement. Mais le
manipulation de base de donner ce qui est nécessaire dans le DW est bien plus
Facile. Il n'y a que deux types d'opérations qui se produisent dans le
DW – le chargement initial du donner et accès à donner. Il n'y a
toute mise à jour du donner (au sens général de
update) dans le DW comme une opération de traitement normale.
Il y a des conséquences très puissantes de cette différence
base entre le traitement opérationnel et le traitement DW. Au niveau
conception, la nécessité d'être prudent lors de la mise à jour
anormal n'est pas un facteur dans le DW, car la mise à jour du donner n'est pas
effectuée. Cela signifie qu'au niveau physique de la conception,
des libertés peuvent être prises pour optimiser l'accès à donner,
en particulier pour traiter les thèmes de la normalisation et
dénormalisation physique. Une autre conséquence de la simplicité
des opérations de DW est dans la technologie sous-jacente utilisée pour
exécutez l'environnement DW. Devoir prendre en charge les mises à jour
enregistrement par enregistrement en ligne (comme c'est souvent le cas avec
traitement opérationnel) la technologie doit avoir
des fondations très complexes sous une apparente simplicité.
La technologie qui prend en charge la sauvegarde et la récupération, les transactions
et l'intégrité de donner et la découverte et le remède de la condition de blocage est
assez complexe et pas nécessaire pour le traitement DW.
Les caractéristiques d'un DW, l'orientation de la conception,
l'intégration de donner au sein du DW, variabilité temporelle et simplicité
gestion de donner, tout cela conduit à un environnement qui est très, très
différent de l'environnement d'exploitation classique. La source de presque tous
donner de DW sont l'environnement d'exploitation. Il est tentant de penser
qu'il y a une redondance massive donner entre les deux milieux.
En fait, la première impression que beaucoup de gens ont est celle de
grande redondance de donner entre l'environnement d'exploitation et le
DW. Une telle interprétation est superficielle et le prouve
manque de compréhension de ce qui se passe dans le DW.
En fait, il y a un minimum de redondance de donner entre l'environnement d'exploitation
et donner du DW. Nous considérons les éléments suivants :
▪ je donner sont filtrés date que vous passez de l'environnement d'exploitation
à l’environnement DW. Beaucoup donner ils ne s'évanouissent jamais
de l'environnement d'exploitation. Sauf que je donner qui sont nécessaires pour
Le traitement DSS trouve sa direction dans l'environnement
▪ l'horizon temporel de donner c'est très différent d'un environnement
à l'autre. LES donner dans l'environnement d'exploitation, ils sont très frais. LES donner
dans DW, ils sont beaucoup plus âgés. Seulement du point de vue
de l'horizon temporel, il y a très peu de chevauchement
entre l'environnement d'exploitation et le DW.
▪ Le DW contient donner de résumé qui ne sont jamais retrouvés
dans l'environnement
▪ je donner subissent une transformation fondamentale depuis
comme ils passent à la figure 3 montre que la plupart
partie de la donner sont significativement modifiés à condition
pour être sélectionné et déplacé vers le DW. En d'autres termes, le
les plus donner est physiquement modifié e
radicalement comment il est déplacé dans le DW. Du point de vue
d'intégration ne sont pas les mêmes donner qui résident
dans l’environnement opérationnel.
À la lumière de ces facteurs, la redondance des donner entre les deux environnements est
un événement rare, conduisant à moins de 1% de redondance entre les deux
environnements.
LA STRUCTURE DE L'ENTREPÔT
Les DW ont une structure distincte. Il existe différents niveaux de résumé et de di
détail qui délimite les DW.
Les différents composants d'un DW sont:
▪ Métadonnées
Donner détails actuels
Donner de vieux détails
Donner légèrement résumé
Donner très résumé
De loin, la principale préoccupation est pour i donner de détail
courants. C'est la principale préoccupation car:
▪ je donner les détails actuels reflètent les événements les plus récents,
qui sont toujours d'un grand intérêt et
▪ je donner des détails actuels sont volumineux car ils sont
stocké au plus bas niveau de granularité e
▪ je donner les détails actuels sont presque toujours stockés sur
la mémoire disque, qui est rapide d'accès, mais coûteuse e
complexe de
I donner les détails sont plus anciens donner qui sont stockés sur
un peu de souvenir de massa. Il y a accès de façon sporadique et est
stocké à un niveau de détail compatible avec donner détaillé
courants. Bien qu'il ne soit pas obligatoire de stocker sur un
mémoire alternative, en raison du grand volume de donner unis avec
accès sporadique de donner, le support de stockage pour donner di
les détails plus anciens ne sont généralement pas stockés sur le disque.
I donner résumés légèrement sont donner qui sont distillés en bas
niveau de détail trouvé au niveau de détail actuel. Ce
Le niveau DW est presque toujours stocké dans la mémoire du disque. LES
problèmes de conception qui sont présentés à l'architecte du donner
dans la construction de ce niveau du DW sont:
▪ Quelle unité de temps est le résumé fait ci-dessus
▪ Quel contenu, quels attributs résumeront légèrement le
contenu de donner
Le prochain niveau de donner trouvé dans le DW est celui de donner très
résumé. LES donner hautement résumés sont compacts et faciles
accessible. LES donner très résumés, on trouve parfois
dans l'environnement DW et dans d'autres cas i donner sont très résumés
trouvé en dehors des murs immédiats de la technologie hébergeant le DW.
(dans tous les cas, je donner très résumés font partie du DW
peu importe où je donner sont physiquement hébergés).
Le dernier composant du DW est celui des métadonnées. À bien des égards
les métadonnées se trouvent dans une dimension différente des autres donner
du DW, car les métadonnées ne contiennent aucun date directement
tirés de l'environnement d'exploitation. Les métadonnées ont un rôle spécial e
très important dans le DW. Les métadonnées sont utilisées comme:
▪ un répertoire pour aider l'analyste DSS à localiser
contenu du DW,
▪ un guide pour cartographier les donner comment je donner étaient
transformé de l'environnement d'exploitation à l'environnement DW,
▪ un guide des algorithmes utilisés pour la synthèse entre donner di
détail actuel ei donner légèrement résumé, je donner très
résumés,
Les métadonnées jouent un rôle beaucoup plus important dans l'environnement DW
par rapport à ce qu'ils ont jamais eu dans l'environnement d'exploitation
ANCIEN SUPPORT DE STOCKAGE DE DÉTAILS
Une bande magnétique peut être utilisée pour stocker ce type de
donner. En fait, il existe une grande variété d'outils de mémorisation qui
devrait être envisagé pour la préservation des anciens donner di
détail.
En fonction du volume de donner, la fréquence d'accès, le coût
des outils et du type d'accès, il est tout à fait probable
que d'autres outils auront besoin de l'ancien niveau de détail
dans le DW.
FLUX DE DONNÉES
Il y a un flux normal et prévisible de dieux donner au sein du DW.
I donner entrez le DW à partir de l'environnement d'exploitation. (REMARQUE: il y a
quelques exceptions très intéressantes à cette règle. Cependant, presque
tous donner saisir le DW à partir de l'environnement d'exploitation). Date que donner
entrez le DW à partir de l'environnement d'exploitation, il est transformé comme il l'a été
décrit ci-dessus. À condition que vous saisissiez le DW, je donner entrer le
niveau de détail actuel, comme indiqué. Il y réside et est utilisé
jusqu'à ce que l'un des trois événements se produise:
▪ est purifié,
▪ est résumé, et/ou
▪ est
Processus obsolète dans un mouvement DW i donner détails actuels
a donner de détails anciens, en fonction de l'âge de donner. Le processus
le résumé utilise le détail de donner calculer i donner
niveaux légèrement résumés et très résumés de donner. il y a
quelques exceptions au flux montré (à discuter plus tard).
Cependant, généralement, pour la grande majorité des donner trouvé
dans un DW, le flux de donner est comme sur la photo.
UTILISER L'ENTREPÔT DE DONNÉES
Sans surprise, les différents niveaux de donner dans le DW pas
ils reçoivent différents niveaux d'utilisation. En règle générale, plus le niveau de
résumé, plus i donner ils sont utilisés.
De nombreuses utilisations se produisent dans donner très résumé, alors que l'ancien
donner les détails ne sont presque jamais utilisés. Il y a une bonne raison dans le
déplacer l'organisation vers le paradigme d'utilisation des ressources. Plus a
résumé i donner, plus il est rapide et efficace d'accéder au donnerNous recommandons
un boutique constater qu'il effectue de nombreux processus au niveau de détail des DW,
puis une grande quantité correspondante de ressources machine
est consommé. Il est dans l'intérêt de tous de poursuivre
comme dans un haut niveau de synthèse dès que possible.
Pour de nombreux magasins, l'analyste DSS dans un pré-environnement DW a utilisé
donner au niveau du détail. À bien des égards, l'arrivée d'un donner détaillé
cela ressemble à une couverture de sécurité, même quand ils sont disponibles
autres niveaux de récapitulation. L'une des activités de l'architecte de donner è
ne pas habituer l'utilisateur DSS à utiliser donner au niveau plus
peu de détails. Il y a deux raisons disponibles
par l'architecte de donner:
▪ en installant un système de rétrofacturation, dans lequel l'utilisateur final paie
ressources consommées e
▪ qui indiquent que le temps de réponse peut être très bon
obtenu lorsque le comportement avec i donner c'est à un niveau élevé
de résumé, alors que le faible temps de réponse résulte de la
le comportement de donner à un faible niveau de
AUTRES CONSIDÉRATIONS
Il y a d'autres considérations de construction et de gestion
DW.
La première considération est celle des indices. LES donner aux plus hauts niveaux de
le résumé peut être librement indexé, tandis que i donner
aux niveaux de détail inférieurs, ils sont si volumineux qu'ils peuvent être
peu indexés. Du même coup, je donner aux niveaux élevés de
les détails peuvent être remis à neuf relativement facilement,
tandis que le volume de donner aux niveaux inférieurs, il est si grand que je donner non
ils peuvent être facilement remis à neuf. Par conséquent, le modèle
de donner et le travail formel effectué par la conception a défini le
fondation pour le DW appliquée presque exclusivement au niveau
détail actuel. En d'autres termes, les activités de modélisation de
donner ils ne s'appliquent pas aux niveaux de récapitulation dans presque tous les cas.
Une autre considération structurelle est celle de la subdivision de
donner par DW.
Le partitionnement peut être effectué à deux niveaux - au niveau de dbm et
niveau d'application. Dans la division au niveau dbm, le dbm è
informé des divisions et les contrôle en conséquence. Dans le cas d
division au niveau de l'application, seul le programmeur est
informé des divisions et de la responsabilité de celles-ci
l'administration lui est laissée
Sous le niveau dbm, beaucoup de travail se fait automatiquement. Il y a
beaucoup de rigidité associée à l'administration automatique de
divisions. Dans le cas de la division au niveau de l'application de donner de la
entrepôt de données, beaucoup de travail est sur le programmeur, mais le
le résultat final est la flexibilité dans l'administration donner dans la date
entrepôt
AUTRES ANOMALIES
Alors que les composants du entrepôt de données travail comme décrit
pour presque tous donner, il y a quelques exceptions utiles qui doivent
être discuté. Une exception est celle de donner résumés publics
(données récapitulatives publiques). Ceux-ci sont donner résumés qui ont été
calculé en dehors du entrepôt de données mais ils sont utilisés par la société. LES donner
les résumés publics sont stockés et gérés dans le entrepôt de données,
bien que comme mentionné ci-dessus, ils sont compris. LES
les comptables travaillent pour produire ces trimestres donner comme le
revenus, dépenses trimestrielles, bénéfices trimestriels, etc. L'oeuvre
effectuée par les comptables est externe à la entrepôt de données. Cependant, je donner sont
utilisé « en interne » au sein de l’entreprise – de marketing, ventes, etc.
Une autre anomalie, qui ne sera pas discutée, est celle de donner externe.
Un autre grand genre de donner que l'on peut trouver dans une donnée
l'entrepôt est celui des données de détail permanentes. Ceux-ci provoquent le
besoin de stocker en permanence je donner à un niveau
détaillé pour des raisons éthiques ou juridiques. Si une entreprise expose i
travailleurs liés à des substances dangereuses donner
détaillé et permanent. Si une entreprise fabrique un produit qui
cela implique la sécurité publique, quelles parties d'un avion, il y a
Le besoin de donner des détails permanents, ainsi que si une entreprise
conclure des contrats dangereux.
L'entreprise ne peut pas se permettre d'ignorer les détails pourquoi
au cours des prochaines années, dans le cas d'un procès, d'un rappel, d'un
défaut de construction contesté, etc. l'exposition de l'entreprise
ça pourrait être génial. Par conséquent, il existe un type unique de donner
connues sous le nom de données détaillées permanentes.
RÉSUMÉ
Un entrepôt de données est un objet orienté, intégré, variant de
temps, une collection de donner non volatile pour répondre aux besoins des
décision de l’administration. Chacune des principales fonctions de
un entrepôt de données a ses implications. De plus, il y a quatre
niveaux de donner de la entrepôt de données:
▪ Ancien détail
▪ Détail actuel
Donner légèrement résumé
Donner très résumé
Les métadonnées constituent également une partie importante du entrepôt de données.
ABSTRAIT
Le concept de stockage de donner récemment reçu
beaucoup d'attention et c'est devenu une tendance des années 90. C'est tout
en raison de la capacité d'un entrepôt de données pour surmonter le
les limites des systèmes de soutien administratif tels que i
systèmes d'aide à la décision (DSS) et systèmes d'information
exécutif (EIS).
Même si le concept de entrepôt de données Cela semble prometteur,
mettre en œuvre je entrepôt de données peut être problématique parce que
processus de stockage à grande échelle. Malgré la
complexité des projets d'entreposage donner, de nombreux fournisseurs
et consultants en entreposage donner ils prétendent que
le stockage de donner ne présente aucun problème.
Cependant, au début de ce projet de recherche, presque aucun
des recherches indépendantes, rigoureuses et systématiques ont été menées. De
Par conséquent, il est difficile de dire ce qui se passe réellement
dans l'industrie lorsqu'ils construisent entrepôt de données.
Cette étude a exploré la pratique de stockage des donner
contemporains qui vise à développer une compréhension plus riche
de la pratique australienne. L'analyse de la littérature a permis de
contexte et fondement de l’étude empirique.
Il y a un certain nombre de résultats de cette recherche. D'abord
lieu, cette étude a révélé les activités qui se sont déroulées
lors du développement de entrepôt de données. Dans de nombreux domaines, je donner recueillies
a confirmé la pratique rapportée dans la littérature. Deuxième
site, problèmes et problèmes qui peuvent avoir un impact
développement de la entrepôt de données ont été identifiés à partir de cette étude.
Enfin, les bénéfices tirés des organisations australiennes associées à
l'utilisation de entrepôt de données ont été révélés.
Chapitre 1
Contexte de recherche
Le concept d’entreposage de données a été largement accepté
exposition et s'est transformée en une tendance émergente
Années 90 (McFadden 1996, TDWI 1996, Shah et Milstein 1997,
Shanks et autres. 1997, Eckerson 1998, Adelman et Oates 2000). Cette
peut être vu par le nombre croissant d'articles à la date
l'entreposage dans les publications commerciales (Little et Gibson 1999).
De nombreux articles (voir, par exemple, Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett et King 1996, Graham et al. 1996,
Sakaguchi et Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997, McCarthy 1997, O 'Donnell 1997, Edwards 1998, TDWI
1999) ont fait état d'avantages importants pour les organisations
qui implémente je entrepôt de données. Ils ont soutenu leur théorie
avec des preuves anecdotiques de mises en œuvre réussies, le rendement élevé
sur les chiffres d'investissement (ROI) et, également, fournir des conseils
référence ou des méthodologies pour le développement de entrepôt de données
(Shanks et al.1997, Seddon et Benjamin 1998, Little et Gibson
1999). Dans un cas extrême, Graham et al. (1996) ont
a déclaré un rendement moyen sur un investissement de trois ans de 401%.
Cependant, une grande partie de la littérature actuelle a négligé
complexités liées à la réalisation de tels projets. Les projets de
entrepôt de données ils sont normalement complexes et à grande échelle e
par conséquent, ils impliquent une forte probabilité d'échec s'ils ne sont pas
soigneusement contrôlée (Shah et Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs et Clymer 1998, Rao
1998). Ils nécessitent de grandes quantités d'humains et de
financières et, temps et efforts pour les construire (Hill 1998, Crofts 1998). le
le temps typique et les moyens financiers nécessaires sont respectivement
environ deux ans et deux ou trois millions de dollars (Braly 1995, Foley
1997b, Bort 1998, Humphries et al. 1999). Ces temps et ces moyens
les finances doivent contrôler et consolider de nombreux aspects
différents types d'entreposage de données (Cafasso 1995, Hill 1998). Sur le côté
considérations matérielles et logicielles, autres fonctions, qui varient
de l'extraction de donner aux processus de chargement de donner, à partir
capacité de mémoire pour gérer les mises à jour et les méta donner
pour la formation des utilisateurs, ils doivent être pris en compte.
Au moment du démarrage de ce projet de recherche, il y avait très peu de
recherches académiques menées dans le domaine de l'entreposage de données,
surtout en Australie. Cela était évident du fait de la pénurie d'articles
publié dans l'entrepôt de données à partir de journaux ou d'autres écrits
universitaires de l'époque. De nombreux écrits académiques
disponible décrit l'expérience américaine. Le manque de
La recherche universitaire dans le domaine de l'entreposage de données sl a provoqué
demande de recherches rigoureuses et d'études empiriques (McFadden 1996,
Shanks et autres. 1997, Little et Gibson 1999). En particulier, les études
recherches sur le processus de mise en œuvre de entrepôt de données
ils doivent être faits pour étendre les connaissances
général concernant la mise en œuvre de entrepôt de données e
ils serviront de base à une future étude de recherche (Shanks ed
autres. 1997, Little et Gibson 1999).
Le but de cette étude est donc d'étudier ce qui est vraiment
cela se produit lorsque les organisations maintiennent et utilisent des données
entrepôt en Australie. Plus précisément, cette étude impliquera
une analyse de l'ensemble du processus de développement d'un entrepôt de données,
à partir de l'initiation et de la planification jusqu'à la conception et
mise en œuvre et utilisation ultérieure au sein des organisations
Australien. En outre, l'étude contribuera également à la pratique existante
identifier les domaines où la pratique peut être plus poussée
améliorées et les inefficacités et les risques peuvent être minimisés ou
évité. En outre, il servira de base à d'autres études sur entrepôt de données in
Australie et comblera le vide qui existe actuellement dans la littérature.
Questions de recherche
Le but de cette recherche est d'étudier les activités impliquées
dans la mise en œuvre de entrepôt de données et leur utilisation par
Organisations australiennes. En particulier, les éléments sont étudiés
concernant la planification de projet, le développement, al
fonctionnement, utilisation et risques en question. D'où la question
de cette recherche est:
« Comment est la pratique actuelle du entrepôt de données en Australie?"
Pour répondre efficacement à ce problème, un
un certain nombre de questions de recherche subsidiaires. En particulier, trois
des sous-questions ont été identifiées à partir de la littérature, c'est-à-dire
présenté au chapitre 2, pour guider ce projet de recherche:
Comment suis-je entrepôt de données par des organisations
Australien? Quels sont les problèmes rencontrés?
Quels sont les bénéfices ressentis ?
Pour répondre à ces questions, un dessin a été utilisé
recherche exploratoire faisant appel à l’enquête. En tant qu'étude
exploratoire, les réponses aux questions ci-dessus ne sont pas complètes
(Shanks et al.1993, Denscombe 1998). Dans ce cas, c'est
la triangulation est nécessaire pour améliorer les réponses à ces
des questions. Cependant, l'enquête fournira une base solide pour
travaux futurs examinant ces questions. Un détaillé
discussion sur la justification de la méthode de recherche et sur la conception
est présentée au chapitre 3.
Structure du projet de recherche
Ce projet de recherche est divisé en deux parties: l'étude contextuelle
du concept d'entreposage de données et de recherche empirique (voir
figure 1.1), dont chacun est discuté ci-dessous.
Partie I : Étude contextuelle
La première partie de la recherche a consisté à réexaminer les
la littérature actuelle sur divers types d'entreposage de données, y compris i
systèmes d'aide à la décision (DSS), systèmes d'information
cadres (EIS), les études de cas de entrepôt de données et notions de date
entrepôt. De plus, les résultats du foum sui entrepôt de données et
des groupes de réunion d'experts et de professionnels animés par le groupe de
Recherche Monash DSS, a contribué à cette phase de l'étude
qui visait à obtenir des informations sur la pratique des données
entrepôt et d'identifier les risques liés à leur adoption.
Au cours de cette période d'étude contextuelle, la compréhension
la zone problématique a été établie pour fournir des connaissances sur
base des investigations empiriques ultérieures. Cependant, ce
était un processus continu lors de la réalisation de l'étude de
la recherche.
Partie II : Recherche empirique
Le concept relativement nouveau d'entreposage de données, en particulier
en Australie, il a créé la nécessité de mener une enquête pour
obtenez une vue d'ensemble de l'expérience d'utilisation. Cette
une partie a été faite une fois que le domaine du problème était
été établie grâce à une vaste revue de la littérature. Le concept
de l'entrepôt de données formé lors de la phase d'étude contextuelle est
a été utilisé comme entrée pour le questionnaire initial de cette étude.
Après cela, le questionnaire a été revu. Six experts en date
l'entrepôt a participé au test. Le but du test de la
Le questionnaire initial visait à vérifier l'exhaustivité et l'exactitude
quelques questions. Sur la base des résultats du test, le questionnaire est
été modifié et la version modifiée a été envoyée à
participants au sondage. Les questionnaires renvoyés étaient alors
analysé pour i donner dans des tableaux, des diagrammes et d'autres formats. LES
résultats d'analyse de donner former une photographie instantanée de
pratique de l'entreposage de données en Australie.
APERÇU DE L'ENTREPOSAGE DE DONNÉES
Le concept d'entreposage de données a évolué avec les améliorations
de la technologie informatique.
Il vise à surmonter les problèmes rencontrés par des groupes de
prise en charge d'applications telles que le système d'aide à la décision (DSS) e
Système d'information de la direction (SIE).
Dans le passé, le plus grand obstacle de ces applications a été
l'incapacité de ces applications à fournir une base de données
nécessaire à l’analyse.
Ceci est principalement causé par la nature du travail du
leadership. Les intérêts de la direction d'une entreprise varient
constamment en fonction de la zone traitée. Donc, je donner
fondamentale pour ces applications doit pouvoir
changer rapidement en fonction de la pièce à traiter.
Cela signifie que je donner ils doivent être disponibles sous la forme
adéquat pour les analyses requises. En fait, les groupes de soutien de la
les applications ont rencontré de nombreuses difficultés dans le passé pour collecter et
intégration donner provenant de sources complexes et diverses.
Le reste de cette section présente un aperçu du concept de
l'entreposage des données et traite de la façon dont le entrepôt de données peut dépasser je
Problèmes liés aux groupes de support d'application.
Le terme "Entreposage De Données« A été publié par William Inmon en 1990.
Sa définition souvent citée voit le Entreposage De Données comment
collecte de donner orienté sujet, intégré, non volatile et variable
au fil du temps, à l'appui des décisions de gestion.
En utilisant cette définition, Inmon souligne que je donner résidents
dans un entrepôt de données doit posséder les 4 suivants
caractéristiques:
▪ Orienté sujet
▪ Intégré
▪ Non volatile
▪ Variable dans le temps
Par «Subject Oriented Inmon» signifie que je donner dans la date
entrepôt dans les plus grandes zones d'organisation qui ont été
défini dans le modèle donner. Par exemple tous donner concernant i clientèle
sont contenus dans le domaine CLIENTS. De même tous
donner liés aux produits sont contenus dans le domaine
PRODUITS.
Par Integrated Inmon signifie que je donner venant de différents
les plates-formes, les systèmes et les emplacements sont combinés et stockés dans
lieu unique. En conséquence donner similaire doit être transformé
dans des formats cohérents à ajouter et à comparer
facilement.
Par exemple, le sexe masculin et féminin sont représentés
par les lettres M et F dans un système, et avec 1 et 0 dans un autre. Pour
les intégrer de la bonne manière, un ou les deux formats doivent
être transformé pour que les deux formats soient égaux. Dans ce
cas, nous pourrions changer M en 1 et F en 0 ou vice versa. Orienté vers
sujet et intégré indiquent que le entrepôt de données Il est conçu pour
fournir une vision fonctionnelle et transversale de donner donne une partie
société.
Par non volatile, il veut dire que je donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données rester
cohérence et mise à jour des donner ce n'est pas nécessaire. Au lieu de cela, chacun
changer donner les originaux sont ajoutés à base de données de la date
entrepôt. Cela signifie que l'historien de la donner est contenu dans le
entrepôt de données.
Pour les variables au fil du temps, Inmon indique que je donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données
contiennent toujours des marqueurs de temps et i donner normalement
s'étendre sur un certain horizon temporel. Par exemple un
entrepôt de données peut contenir 5 ans de valeurs historiques de la clientèle à partir de
1993 à 1997. La disponibilité de l'historien et d'une série chronologique
de donner vous permet d’analyser les tendances.
Un entrepôt de données il peut récupérer le sien donner des systèmes
OLTP; des origines donner externe à l'organisation et / ou par d'autres spécialistes
projets de systèmes de capture donner.
I donner les extraits peuvent passer par un processus de nettoyage, en
ce cas je donner ils sont transformés et intégrés avant d'être
stocké dans le base de données de la entrepôt de données. Alors je donner
résidant dans le base de données de la entrepôt de données sont mis à disposition
connexions des utilisateurs finaux et outils de récupération. Utilisant
ces outils l'utilisateur final peut accéder à la vue intégrée
de l'organisation de donner.
I donner résidant dans le base de données de la entrepôt de données sont
stockés à la fois en détail et dans des formats de résumé
Le niveau de résumé peut dépendre de la nature de la donner. Les donner
détaillé peut consister en donner courant et donner historiens
I donner les redevances ne sont pas incluses dans le entrepôt de données jusqu'à ce que je donner
Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données sont rafraîchis.
En plus de stocker i donner eux-mêmes, un entrepôt de données peut aussi
stocker un autre type de date appelé METADATA qui
décrire je donner résidant dans son base de données.
Il existe deux types de métadonnées: les métadonnées de développement et
Analyse.
Les métadonnées de développement sont utilisées pour gérer et automatiser
processus d'extraction, de nettoyage, de cartographie et de chargement de donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas.
entrepôt de données.
Les informations contenues dans les métadonnées de développement peuvent contenir
les détails des systèmes d'exploitation, les détails des éléments à extraire, les
modèle donner de la entrepôt de données et les règles de l'entreprise pour
conversion de donner.
Le deuxième type de métadonnées, appelées métadonnées analytiques
permet à l'utilisateur final d'explorer le contenu des données
entrepôt pour trouver le donner disponibles et leur signification en termes
clair et non technique.
Par conséquent, les métadonnées analytiques fonctionnent comme un pont entre les données
entrepôt et applications pour les utilisateurs finaux. Ces métadonnées peuvent
contiennent le modèle économique, les descriptions de donner correspondants
au business model, requêtes et rapports prédéfinis,
informations pour les connexions utilisateur et l'index.
Les métadonnées d'analyse et de développement doivent être combinées en une seule
le confinement intégré des métadonnées pour fonctionner correctement.
Malheureusement, de nombreux outils existants ont leur propre
métadonnées et actuellement il n'y a pas de normes existantes qui
permettre aux outils d'entreposage de données d'intégrer ces
métadonnées. Pour remédier à cette situation, de nombreux marchands du
les principaux outils d'entreposage de données ont formé des métadonnées
Conseil qui est devenu plus tard la Meta Data Coalition.
Le but de cette coalition est de construire un ensemble de métadonnées
standard qui permet à différents outils d'entreposage de données de
convertir les métadonnées
Leurs efforts ont abouti à la naissance du Meta
Spécification d'échange de données (MDIS) qui permettra l'échange
d'informations entre les archives Microsoft et les fichiers MDIS associés.
L'existence de donner à la fois résumé / indexé et détaillé donne
à l'utilisateur la possibilité de réaliser un DRILL DROWN
(forage) allez donner indexés sur les détaillés et vice versa.
L'existence de donner des historiques détaillés permettent de créer
analyse des tendances au fil du temps. De plus, les métadonnées d'analyse peuvent
être utilisé comme répertoire de base de données de la entrepôt de données /
aider les utilisateurs finaux à localiser i donner nécessaire.
Par rapport aux systèmes OLTP, avec leur capacité à prendre en charge
analyse de donner et les rapports, le entrepôt de données c'est vu comme un système
plus approprié pour les processus d'information tels que la réalisation de e
répondre aux questions et produire des rapports. La section suivante
mettra en évidence les différences entre les deux systèmes.
ENTREPT DE DONNÉES CONTRE LES SYSTÈMES OLTP
De nombreux systèmes d'information au sein des organisations
ils sont destinés à soutenir les opérations quotidiennes. Celles-ci
les systèmes appelés OLTP SYSTEMS, capturent les transactions
mis à jour en permanence tous les jours.
I donner dans ces systèmes, ils sont souvent modifiés, ajoutés ou
supprimé. Par exemple, une adresse client ne fait que changer
il se déplace d'un endroit à un autre. Dans ce cas, la nouvelle adresse
sera enregistré en modifiant le champ d'adresse de base de données.
L'objectif principal de ces systèmes est de réduire les coûts de
transactions et en même temps réduire les délais de traitement.
Des exemples de systèmes OLTP incluent des actions critiques telles que les écritures
comptabilité des commandes, des paies, des factures, de la fabrication, des services d'intelligence artificielle clientèle.
Contrairement aux systèmes OLTP, qui ont été conçus pour les processus
en fonction des transactions et des événements, je entrepôt de données ont été créés
pour soutenir les processus basés sur l'analyse des donner et
processus de décision.
Ceci est normalement réalisé en intégrant i donner à partir de divers systèmes
OLTP et externe dans un seul "conteneur" de donner,Tel que discuté
dans la section précédente.
Modèle de processus d'entreposage de données Monash
Le modèle de processus pour entrepôt de données Monash a été développé par
chercheurs du Monash DSS Research Group, est basé sur le
littératures de entrepôt de données, sur l'expérience de l'accompagnement de la
développement de domaines de systèmes, sur des discussions avec les fournisseurs de
applications à utiliser sur entrepôt de donnéessur un groupe d'experts
dans l'utilisation de entrepôt de données.
Les phases sont: Initiation, Planification, Développement, Opérations et
Explications. Le diagramme explique la nature itérative o
développement évolutif d'un entrepôt de données processus utilisant
flèches bidirectionnelles placées entre les différentes étapes. Dans ce
Les contextes «itératif» et «évolutif» signifient qu'à chaque
étape du processus, les activités de mise en œuvre sont possibles
toujours se propager à l'étape précédente. C'est
en raison de la nature du projet, un entrepôt de données dans lequel
les demandes supplémentaires de la partie prennent le relais à tout moment
utilisateur final. Par exemple, pendant la phase de développement d'un
processus de entrepôt de données, un est demandé par l'utilisateur final
une nouvelle dimension ou un nouveau domaine, qui ne relevait pas de la
plan original, celui-ci doit être ajouté au système. Ce
provoque un changement dans le projet. Le résultat est que le
la conception doit changer les exigences des documents créés jusqu'à présent
pendant la phase de conception. Dans de nombreux cas, l'état actuel du
le projet doit revenir à la phase de conception où
la nouvelle demande doit être ajoutée et documentée. L'utilisateur
final doit être en mesure de voir la documentation spécifique examinée et
modifications apportées au cours de la phase de développement. Au bout du
ce cycle de développement, le projet doit bénéficier d'un excellent retour d'expérience
les deux équipes, l'équipe de développement et l'équipe des utilisateurs. LES
les commentaires sont ensuite réutilisés pour améliorer un futur projet.
Planification des capacités
Les DW ont tendance à être de très grande taille et à croître
très rapidement (Best 1995, Rudin 1997a) suite au
montant de donner historiens qu'ils conservent de leur vie. Là
la croissance peut aussi être causée par donner supplémentaire requis par
utilisateurs pour augmenter la valeur de donner qu'ils ont déjà. De
en conséquence, les exigences de stockage pour donner peut
être considérablement améliorée (Eckerson 1997). Donc c'est
essentiel pour assurer, mener une planification de la
capacité avec laquelle le système à construire peut évoluer
besoins croissants (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
Lors de la planification de l'évolutivité dw, il faut connaître le
Croissance attendue de la taille de l'entrepôt, types de questions
susceptible d'être réalisée et le nombre d'utilisateurs finaux pris en charge (Best
1995, Rudin 1997b, Foley 1997a). Créez des applications évolutives
nécessite une combinaison de technologies de serveur évolutives et techniques
conception d'application évolutive (Best 1995, Rudin 1997b.
Les deux sont nécessaires pour créer une application
extrêmement évolutif. Les technologies de serveur évolutives peuvent
rendre facile et pratique l'ajout de stockage, de mémoire et
Processeur sans dégradation des performances (Lang 1997, Telephony 1997).
Il existe deux principales technologies de serveur évolutif : Compute
traitement multiple symétrique (SMP) et massif
parallèle (MPP)) (IDC 1997, Humphries et al.1999). Un serveur
SMP a normalement plusieurs processeurs partageant une mémoire,
système de bus et autres ressources (IDC 1997, Humphries et al. 1999).
Des processeurs supplémentaires peuvent être ajoutés pour augmenter
son potenza informatique. Une autre méthode pour augmenter le
potenza calcul du serveur SMP, vous combinez de nombreux
Machines SMP. Cette technique est connue sous le nom de clustering (Humphries
et coll. 1999). Un serveur MPP, d'autre part, a plusieurs processeurs chacun
avec sa propre mémoire, système de bus et autres ressources (IDC 1997,
Humphries et coll. 1999). Chaque processeur est appelé un nœud. UNE
augmentation de potenza le calcul peut être obtenu
ajouter des nœuds supplémentaires aux serveurs MPP (Humphries et al.
1999).
Une faiblesse des serveurs SMP est que trop d'opérations d'entrée-sortie
(I / O) peut encombrer le système de bus (IDC 1997). Ce
problème ne se produit pas dans les serveurs MPP car chaque
le processeur a son propre système de bus. Cependant, les interconnexions
entre chaque nœud, ils sont généralement beaucoup plus lents que le système de bus
des SMP. De plus, les serveurs MPP peuvent ajouter une couche
complexité supplémentaire pour les développeurs d'applications (IDC
1997). Ainsi, le choix entre les serveurs SMP et MPP peut être influencé
par de nombreux facteurs, y compris la complexité des questions, la relation
prix / performances, la capacité de traitement requise, le
applications dw empêchées et l'augmentation de la taille de base de données
de dw et en nombre d'utilisateurs finaux.
De nombreuses techniques de conception d'applications évolutives
ils peuvent être utilisés dans la planification des capacités. Une
utilise diverses périodes de notification telles que des jours, des semaines, des mois et des années.
Ayant différentes périodes de notification, le base de données Peut être divisé en
morceaux regroupés de manière gérable (Inmon et al. 1997). Un autre
technique consiste à utiliser des tableaux récapitulatifs construits
résumer donner da donner détaillé. Ainsi, je donner les résumés sont plus
compact que détaillé, ce qui nécessite moins d'espace mémoire.
Donc, le donner les détails peuvent être stockés dans une unité de
un stockage moins cher, ce qui économise encore plus de stockage.
Bien que l'utilisation de tableaux récapitulatifs puisse économiser de l'espace
mémoire, ils nécessitent beaucoup d'efforts pour les maintenir à jour et en
en adéquation avec les besoins commerciaux. Cependant, cette technique est
largement utilisé et souvent utilisé en conjonction avec la technique
précédent (Best 1995, Inmon 1996a, Chauduri et Dayal
1997).
Définir Entreposage De Données Technique
Architectures Définition des techniques
architectures par dw
Les premiers adeptes de l'entreposage de données sont principalement conçus
une implémentation dw centralisée où tous donner, y compris
i donner externe, ont été intégrés en un seul,
dépôt physique (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Le principal avantage de cette approche est que les utilisateurs finaux
Je peux accéder à la vue à l'échelle entrepreneuriale
(vue à l'échelle de l'entreprise) dei donner organisationnelle (Ovum 1998). Un autre
l'avantage est qu'il offre une standardisation de donner à travers
l'organisation, ce qui signifie qu'il n'y a qu'une seule version ou
définition de chaque terminologie utilisée dans le référentiel dw
(reposity) métadonnées (Flanagan et Safdie 1997, Ovum 1998). le
L'inconvénient de cette approche, en revanche, est qu'elle est coûteuse et difficile
à construire (Flanagan et Safdie 1997, Ovum 1998, Inmon et al.
1998). Peu de temps après l'architecture de stockage donner
centralisé est devenu populaire, le concept d'extraction a évolué
des plus petits sous-ensembles du donner pour répondre aux besoins de
applications spécifiques (Varney 1996, IDC 1997, Berson et Smith
1997, paon 1998). Ces petits systèmes sont dérivés du plus
grand entrepôt de données centralisé. Ils sont appelés date
entrepôts départementaux dépendants ou magasins de données dépendants.
L'architecture dépendante du data mart est connue sous le nom de
architecture à trois niveaux dans laquelle la première ligne se compose de la date
entrepôt centralisé, le second se compose des entrepôts de donner
départemental et le troisième consiste en l'accès à donner et les outils de
analyse (Demarest 1994, Inmon et al.1997).
Les magasins de données sont normalement construits après la entrepôt de données
centralisé a été conçu pour répondre aux besoins des
spécifications de l'unité (White 1995, Varney 1996).
Magasin Data Marts I donner très pertinent en ce qui concerne les détails
unités (Inmon et al.1997, Inmon et al.1998, IA 1998).
L'avantage de cette méthode est qu'il n'y en aura pas date non
intégré et que je donner ils seront moins redondants dans les données
marts depuis tout donner ils viennent d'un entrepôt donner intégré.
Un autre avantage est qu'il y aura peu de liens entre chacun
magasin de données et sources connexes de donner parce que chaque data mart n'a que
une source de donner. De plus, avec cette architecture en place, les utilisateurs
les fins peuvent toujours accéder à la vue d'ensemble de donner
organisation commerciale. Cette méthode est connue sous le nom de
méthode descendante, dans laquelle les magasins de données sont construits après la date
entrepôt (paon 1998, Goff 1998).
Augmentation de la nécessité de montrer les résultats tôt, certains
les organisations ont commencé à construire des data marts indépendants
(Flanagan et Safdie 1997, White 2000). Dans ce cas, les data marts
ils prennent le leur donner directement à partir des bases de donner OLTP et pas depuis
stockage centralisé et intégré, éliminant ainsi le besoin
avoir un stockage central sur place.
Chaque data mart nécessite au moins un lien vers ses sources
di donner. Un inconvénient d'avoir plusieurs liens pour chaque date
mart est que, par rapport aux deux architectures précédentes, le
surabondance de donner augmente considérablement.
Chaque datamart doit stocker tous les donner requis localement pour
n'ont aucun effet sur les systèmes OLTP. Cela provoque le donner
ils sont stockés dans différents magasins de données (Inmon et al. 1997).
Un autre inconvénient de cette architecture est qu'elle conduit à la
création d'interconnexions complexes entre les data marts et les leurs
sources de donner qui sont difficiles à réaliser et à contrôler (Inmon ed
autres. 1997).
Un autre inconvénient est que les utilisateurs finaux ne peuvent pas alimenter
accéder à l'aperçu des informations sur l'entreprise depuis que je donner
des différents data marts ne sont pas intégrés (Ovum 1998).
Un autre inconvénient est qu'il peut y en avoir plus d'un
définition de toute terminologie utilisée dans les data marts qu'elle génère
incohérences de donner en organisation (Ovum 1998).
Malgré les inconvénients évoqués ci-dessus, les data marts indépendants
ils suscitent toujours l'intérêt de nombreuses organisations (IDC 1997).
Un facteur qui les rend attrayants est qu'ils se développent plus rapidement
et nécessitent moins de temps et de ressources (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Par conséquent, ils servent principalement
comme projets de preuve qui peuvent être utilisés pour identifier
rapidement les bénéfices et / ou imperfections du projet (Parsaye
1995, Braly 1995, Newing 1996). Dans ce cas, la partie de
la mise en œuvre dans le projet pilote doit être petite mais importante
pour l'organisation (Newing 1996, Mansell-Lewis 1996).
En examinant le prototype, les utilisateurs finaux et l'administration peuvent
décider de poursuivre ou d'arrêter le projet (Flanagan et Safdie
1997).
Si la décision est de continuer, les data marts pour d'autres secteurs
ils doivent être construits un par un. Il existe deux options pour
utilisateurs finaux en fonction de leurs besoins en matière de création de données
matrices indépendantes: intégrées / fédérées et non intégrées (Ovum
1998)
Dans la première méthode, chaque nouveau data mart doit être construit
basé sur les data marts et le modèle actuels donner d'occasion
par l'entreprise (Varney 1996, Berson et Smith 1997, Peacock 1998).
La nécessité d'utiliser le modèle donner de l'entreprise rend nécessaire
s'assurer qu'il n'y a qu'une seule définition pour chaque terminologie
utilisé à travers les data marts, ceci aussi pour s'assurer que la date
différents marts peuvent être réunis pour donner un aperçu de la
informations d'entreprise (Bresnahan 1996). Cette méthode est
appelé le bottom-up et est préférable quand il y a une contrainte sur
les moyens financiers et le temps (Flanagan et Safdie 1997, Ovum 1998,
paon 1998, Goff 1998). Dans la seconde méthode, les data marts
built ne peut répondre qu'aux besoins d'une unité spécifique.
Une variante du data mart fédéré est le entrepôt de données distribué
où le base de données le middleware de concentrateur de serveur est utilisé pour joindre de nombreux
data marts dans un référentiel unique de donner distribué (White 1995). Dans
ce cas, je donner les entreprises sont réparties dans plusieurs data marts.
Les demandes des utilisateurs finaux sont transmises à base de données
middleware du serveur hub, qui extrait tout donner requis par les données
commercialise et renvoie les résultats aux applications des utilisateurs finaux. Ce
La méthode fournit des informations commerciales aux utilisateurs finaux. Toutefois,
les problèmes des data marts ne sont toujours pas éliminés
indépendant. Il existe une autre architecture qui peut être utilisée.
appelé le entrepôt de données virtuel (White 1995). Cependant, celui-ci
l'architecture, qui est décrite dans la figure 2.9, n'est pas une architecture
de stockage de donner réel car il ne déplace pas la charge
des systèmes OLTP aux entrepôt de données (Demarest 1994).
En fait, les demandes de donner les utilisateurs finaux ont dépassé le
Systèmes OLTP qui renvoient des résultats après le traitement
demandes des utilisateurs. Bien que cette architecture permette aux utilisateurs
pour générer des rapports et formuler des demandes, ne peut pas fournir i
donner historique et aperçu des informations sur l'entreprise depuis que je donner
des différents systèmes OLTP ne sont pas intégrés. Alors, celui-ci
l'architecture ne peut pas satisfaire l'analyse de donner complexe quelle annonce
exemple de prévision.
Sélection des accès et des demandes d'accès
récupération de donner
Le but de construire un entrepôt de données est de transmettre
informations aux utilisateurs finaux (Inmon et al 1997, Poe 1996,
McFadden 1996, Shanks et al 1997, Hammergren 1998); un ou
applications d'accès et de récupération multiples donner doit être fourni. À
aujourd'hui, il existe une grande variété de ces applications parmi lesquelles l'utilisateur peut
choisir (Hammergren 1998, Humphries et al 1999). le
les applications sélectionnées déterminent le succès de l'effort
de stockage de donner dans une organisation parce que
les applications sont la partie la plus visible du entrepôt de données à l'utilisateur
final (Inmon et al 1997, Poe 1996). Pour une date réussie
entrepôt, doit être en mesure de prendre en charge les activités d'analyse de donner
utilisateur final (Poe 1996, Seddon et Benjamin 1998, Eckerson
1999). Donc, le "niveau" de ce que veut l'utilisateur final doit être
identifiés (Poe 1996, Mattison 1996, Inmon et al 1997,
Humphries et al 1999).
En général, les utilisateurs finaux peuvent être regroupés en trois
catégories: utilisateurs exécutifs, analystes commerciaux et utilisateurs expérimentés (Poe
1996, Humphries et al. 1999). Les utilisateurs exécutifs ont besoin
accès facile à des ensembles prédéfinis de rapports (Humphries ed
autres 1999). Ces rapports peuvent être obtenus facilement avec
navigation dans les menus (Poe 1996). De plus, les rapports devraient
présenter des informations à l'aide d'une représentation graphique
comme des tableaux et des modèles pour livrer rapidement
informations (Humphries et al 1999). Les analystes d'affaires, qui ne le font pas
ils peuvent avoir les capacités techniques pour établir des relations à partir de
zéro par eux-mêmes, il faut pouvoir modifier les ratios actuels pour
répondre à leurs besoins spécifiques (Poe 1996, Humphries et al
1999). Les utilisateurs expérimentés, en revanche, sont le type d'utilisateurs finaux qui
ils ont la capacité de générer et d'écrire des demandes et des rapports à partir de
zéro (Poe 1996, Humphries et al 1999). Ce sont eux qui
élaborer des rapports pour d'autres types d'utilisateurs (Poe 1996, Humphries
et al 1999).
Une fois que les exigences de l'utilisateur final ont été déterminées, cela doit être fait
une sélection d'applications d'accès et de récupération donner tra tutti
ceux disponibles (Poe 1996, Inmon et al 1997).
Accès à donner et les outils de récupération peuvent être
classés en 4 types: outil OLAP, outil EIS / DSS, outil de requête et
outil de reporting et d'exploration de données.
Les outils OLAP permettent aux utilisateurs de créer des requêtes ad hoc ainsi que
ceux faits sur base de données de la entrepôt de données. De plus ces produits
autoriser les utilisateurs à explorer depuis donner général à ceux
détaillé.
Les outils EIS / DSS fournissent des rapports exécutifs sous forme d'analyse «et si»
et l'accès aux rapports organisés en menus. Les rapports doivent être
prédéfinis et fusionnés avec des menus pour une navigation plus facile.
Les outils de requête et de rapport permettent aux utilisateurs de produire des rapports
prédéfini et spécifique.
Les outils d'exploration de données sont utilisés pour identifier les relations qui
pourrait apporter un éclairage nouveau sur les opérations oubliées en donner de la
entrepôt de données.
Parallèlement à l'optimisation des besoins de chaque type d'utilisateur, je
les outils sélectionnés doivent être intuitifs, efficaces et faciles à utiliser.
Ils doivent également être compatibles avec d'autres parties de l'architecture e
capable de travailler avec les systèmes existants. Il est également suggéré de
choisissez des outils d'accès et de récupération de données avec des prix et des performances
raisonnable. D'autres critères à considérer incluent l'engagement du
fournisseur de l'outil en supportant leur produit et les développements qui en font
il en sera de même dans les versions futures. Pour garantir l'engagement des utilisateurs
en utilisant l'entrepôt de données, l'équipe de développement implique le
utilisateurs dans le processus de sélection des outils. Dans ce cas
une évaluation pratique des utilisateurs doit être effectuée.
Pour améliorer la valeur de l'entrepôt de données, l'équipe de développement peut
fournissent également un accès Web à leurs entrepôts de données. UN
l'entrepôt de données Web permet aux utilisateurs d'accéder donner
depuis des endroits éloignés ou en voyage. Aussi les informations peuvent
être fournis à moindre coût en réduisant les coûts
di formation.
2.4.3 Entreposage De Données Phase d'exploitation
Cette phase se compose de trois activités: définition de stratégies de dates
actualisation, contrôle des activités de l'entrepôt de données et gestion des
sécurité de l'entrepôt de données.
Définition des stratégies d'actualisation des données
Après le chargement initial, je donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. base de données de l'entrepôt de données
ils doivent être périodiquement renouvelés pour se reproduire
modifications apportées sur donner originaux. Nous devons donc décider
quand actualiser, à quelle fréquence le
actualiser et comment actualiser le donner. Il est suggéré de faire le
rafraîchissement de donner lorsque le système peut être mis hors ligne. Là
le taux de rafraîchissement est déterminé par l'équipe de développement de confiance
sur les besoins des utilisateurs. Il existe deux approches pour actualiser le
datawarehouse: actualisation complète et chargement continu de
changements.
La première approche, l'actualisation complète, nécessite de recharger le
tous donner de zéro. Cela signifie que tous les donner obligatoire doit
être extrait, nettoyé, transformé et intégré à chaque rafraichissement. Ce
l'approche doit être évitée autant que possible car
cela prend beaucoup de temps et de ressources.
Une autre approche consiste à charger en continu le
changements. Cela ajoute que je donner qui ont été modifiés
à partir du dernier cycle d'actualisation de l'entrepôt de données. L'identification de
les enregistrements nouveaux ou modifiés réduisent considérablement la quantité de
donner qui doit être propagé à l'entrepôt de données dans chaque
mise à jour puisque seulement ceux-ci donner sera ajouté au base de données
de l’entrepôt de données.
Il y a au moins 5 approches qui peuvent être utilisées pour se retirer
i donner nouveau ou modifié. Pour obtenir une stratégie efficace
rafraîchissement de donner un mélange de ces approches peut être utile
ramasser tous les changements dans le système.
La première approche, qui utilise des horodatages, suppose qu'elle vient
assigné à tous donner modifié et mis à jour un horodatage afin
pouvoir identifier facilement tous les donner modifié et nouveau.
Cette approche, cependant, n'a pas été largement utilisée dans la plupart des
partie des systèmes d'exploitation actuels.
La deuxième approche consiste à utiliser un fichier delta généré par
une application qui contient uniquement les modifications apportées au donner.
L'utilisation de ce fichier amplifie également le cycle de mise à jour.
Cependant, même cette méthode n'a pas été utilisée dans de nombreux
applications.
La troisième approche consiste à analyser un fichier journal, qui
il contient essentiellement des informations similaires au fichier delta. Le seul
la différence est qu'un fichier journal est créé pour le processus de récupération et
cela peut être difficile à comprendre.
La quatrième approche consiste à modifier le code de l'application.
Cependant, la plupart du code d'application est ancien et
fragile; par conséquent, cette technique doit être évitée.
La dernière approche consiste à comparer les donner sources avec le fichier
principal de donner.
Contrôle des activités de l'entrepôt de données
Une fois l'entrepôt de données mis à la disposition des utilisateurs, il est
nécessaire de le surveiller au fil du temps. Dans ce cas, l'administrateur
de l'entrepôt de données peut utiliser un ou plusieurs outils de gestion e
contrôle pour surveiller l'utilisation de l'entrepôt de données. En particulier
des informations sur les personnes et le temps peuvent être collectées dans
auquel ils accèdent à l'entrepôt de données. Allez donner des cultures peuvent être créées
un profil du travail effectué qui peut être utilisé comme entrée
dans la mise en œuvre de la rétrofacturation de l'utilisateur. Le Chargeback
permet aux utilisateurs d'être informés du coût de traitement des
entrepôt de données.
En outre, le contrôle de l'entrepôt de données peut également être utilisé pour
identifier les types de requêtes, leur taille, le nombre de requêtes par
jour, temps de réponse aux requêtes, secteurs atteints et quantité
di donner traité. Un autre objectif de faire la vérification de la
datawarehouse consiste à identifier les donner qui ne sont pas utilisés. Ces donner
ils peuvent être supprimés de l'entrepôt de données pour gagner du temps
réponse à l'exécution des requêtes et contrôle la croissance
donner qui résident dans le base de données de l’entrepôt de données.
Gestion de la sécurité de l'entrepôt de données
Un entrepôt de données contient donner intégré, critique, sensible qui
peut être atteint facilement. Pour cette raison, il devrait
être protégé des utilisateurs non autorisés. Une façon de
mettre en œuvre la sécurité consiste à utiliser la fonction de SGBD
pour attribuer différents privilèges à différents types d'utilisateurs. Dans ce
façon, un profil doit être maintenu pour chaque type d'utilisateur
accès. Une autre façon de sécuriser l'entrepôt de données est de le chiffrer
comme il est écrit dans base de données de l’entrepôt de données. Accès à
donner et les outils de récupération doivent décrypter le donner avant de présenter je
résultats aux utilisateurs.
2.4.4 Entreposage De Données Phase de déploiement
Il s'agit de la dernière phase du cycle de mise en œuvre de l'entrepôt de données. le
les activités à réaliser à ce stade comprennent la formation de
utilisateurs pour utiliser l'entrepôt de données et effectuer des revues
de l’entrepôt de données.
Formation des utilisateurs
La formation des utilisateurs doit être effectuée en premier
accès à donner de l'entrepôt de données et l'utilisation du
récupération. En règle générale, les sessions doivent commencer par
l'introduction au concept de stockage de donnerà
contenu de l'entrepôt de données, à la méta donner et les fonctionnalités de base
d'outils. Ensuite, les utilisateurs plus avancés pourraient également étudier le
les tables physiques et les caractéristiques des utilisateurs de l'accès aux données et des outils de
récupération.
Il existe de nombreuses approches pour former les utilisateurs. Un des
ceux-ci fournissent une sélection de nombreux utilisateurs ou analystes choisis par un
ensemble d'utilisateurs, en s'appuyant sur leur leadership et leurs compétences
la communication. Ceux-ci sont formés à titre personnel sur
tout ce dont ils ont besoin pour se familiariser avec le
système. Une fois la formation terminée, ils reprennent leur travail et
ils commencent à enseigner aux autres utilisateurs comment utiliser le système. Au
en fonction de ce qu'ils ont appris, d'autres utilisateurs peuvent commencer à
explorez l’entrepôt de données.
Une autre approche consiste à former plusieurs utilisateurs dans le même
temps, comme si vous suiviez un cours en classe. Cette méthode
il convient lorsqu'il y a de nombreux utilisateurs qui ont besoin d'être formés
en même temps. Encore une autre méthode consiste à former
chaque utilisateur individuellement, un par un. Cette méthode est
convient lorsqu'il y a peu d'utilisateurs.
Le but de la formation des utilisateurs est de vous familiariser
avec accès à donner et les outils de recherche ainsi que le contenu du
entrepôt de données. Cependant, certains utilisateurs peuvent être dépassés
la quantité d'informations fournies pendant la session
formation. Donc, un certain nombre de doit être fait
mettre à jour les sessions d'assistance en cours et répondre
à des questions précises. Dans certains cas, un groupe de
aux utilisateurs de fournir ce type de support.
Recueillir des commentaires
Une fois l'entrepôt de données déployé, les utilisateurs peuvent
utiliser je donner résidant dans l'entrepôt de données à des fins diverses.
Principalement, les analystes ou les utilisateurs utilisent le donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas.
datawarehouse pour:
1 Identifier les tendances de l'entreprise
2 Analyser les profils d'achat des clientèle
3 Diviser i clientèle et
4 Offrir les meilleurs services à clientèle – personnaliser les services
5 Formuler des stratégies marketing
6 Faites des estimations compétitives pour les analyses de coûts et l'aide
des bactéries
7 Soutenir la prise de décision stratégique
8 Identifier les opportunités qui émergent
9 Améliorer la qualité des processus commerciaux actuels
10 Vérifiez le bénéfice
Suivant la direction de développement de l'entrepôt de données, ils pourraient
effectuer une série de révisions du système pour obtenir des commentaires
de l'équipe de développement et de la communauté
les utilisateurs finaux.
Les résultats obtenus peuvent être pris en compte pour la
prochain cycle de développement.
Étant donné que l'entrepôt de données a une approche incrémentale,
il est essentiel d'apprendre des succès et des erreurs des précédents
développements.
2.5 Résumé
Dans ce chapitre, les approches trouvées dans
Littérature. La section 1 a abordé le concept de
datawarehouse et son rôle dans la science de la décision. Dans
la section 2 décrit les principales différences entre
entrepôt de données et systèmes OLTP. La section 3 traitait de la
Modèle d'entrepôt de données Monash utilisé
dans la section 4 pour décrire les activités impliquées dans le processus
développement d'un data warehouse, ces thèses ne reposaient pas sur
recherche rigoureuse. Ce qui se passe en réalité peut être
très différent de ce que la littérature rapporte, mais ces
les résultats peuvent être utilisés pour créer un bagage de base qui
mettre l'accent sur le concept d'entrepôt de données pour cette recherche.
Chapitre 3
Méthodes de recherche et de conception
Ce chapitre traite des méthodes de recherche et de conception pour
cette étude. La première partie présente une vue générique des méthodes
également disponible pour la recherche d'informations
Les critères de sélection de la meilleure méthode pour l'un sont discutés
étude particulière. Deux méthodes sont ensuite discutées dans la section 2
sélectionné avec les critères énoncés ci-dessus; parmi ceux-ci seront choisis et
en a adopté un avec les motifs exposés à l’article 3 lorsqu’ils sont
les raisons de l'exclusion de l'autre critère ont également été présentées. Là
la section 4 présente le plan de recherche et la section 5 le présente
conclusions.
3.1 Recherche dans les systèmes d'information
La recherche dans les systèmes d'information ne se limite pas simplement à
au domaine technologique mais doit également être étendu pour inclure
fins liées au comportement et à l’organisation.
Nous le devons aux thèses de diverses disciplines allant de
sciences sociales aux sciences naturelles; cela conduit à la nécessité d'un
un certain spectre de méthodes de recherche impliquant des méthodes quantitatives
et qualitatif à utiliser pour les systèmes d'information.
Toutes les méthodes de recherche disponibles sont importantes, en fait variées
des chercheurs tels que Jenkins (1985), Nunamaker et al. (1991) et Galliers
(1992) soutiennent qu'il n'y a pas de méthode spécifique universelle
mener des recherches dans divers domaines des systèmes d'information; en fait
une méthode peut convenir à une recherche particulière mais pas
pour les autres. Cela nous conduit à la nécessité de sélectionner une méthode qui
convient à notre projet de recherche particulier: pour cela
choix Benbasat et al. (1987) déclarent qu'ils doivent être pris en compte
la nature et le but de la recherche.
3.1.1 Nature de la recherche
Diverses méthodes basées sur la nature de la recherche peuvent être
classés en trois traditions scientifiques largement connues
de l'information : recherche positiviste, interprétative et critique.
3.1.1.1 Recherches positivistes
La recherche positiviste est également connue sous le nom d'étude scientifique ou
empirique. Il essaie de: «expliquer et prédire ce qui se passera dans le
monde social regardant les régularités et les relations de cause à effet
parmi ses éléments constitutifs »(Shanks et al 1993).
La recherche positiviste se caractérise également par la répétabilité,
simplifications et réfutations. De plus, la recherche positiviste admet
l'existence de relations a priori entre les phénomènes étudiés.
Selon Galliers (1992), la taxonomie est une méthode de recherche
inclus dans le paradigme positiviste, qui ne se limite cependant pas à cela,
en fait il y a des expériences de laboratoire, des expériences sur le terrain,
études de cas, preuves de théorèmes, prédictions et simulations.
En utilisant ces méthodes, les chercheurs admettent que les phénomènes
étudiées peuvent être observées objectivement et rigoureusement.
3.1.1.2 Recherche interprétative
La recherche interprétative, souvent appelée phénoménologie ou
l'anti-positivisme est décrit par Neuman (1994) comme «l'analyse
systématique de la signification sociale de l'action par e
observation détaillée des personnes en situation naturelle afin
pour arriver à comprendre et à interpréter comment
les gens créent et maintiennent leur monde social ». Études
interprétative rejettent l'hypothèse que les phénomènes observés
peut être observé objectivement. En effet, ils sont basés
sur les interprétations subjectives. De plus, les chercheurs en interprétation ne
ils imposent des significations a priori aux phénomènes qu'ils étudient.
Cette méthode comprend des études subjectives / argumentatives, des actions de
recherche, études descriptives / interprétatives, recherches futures et jeux de
rôle. En plus de ces enquêtes et études de cas,
inclus dans cette approche car ils concernent les études de
des individus ou des organisations dans des situations complexes
du monde réel.
3.1.1.3 Recherche critique
La recherche critique est l'approche la moins connue en sciences
sociale mais a récemment retenu l'attention des chercheurs
dans le domaine des systèmes d'information. L'hypothèse philosophique selon laquelle le
la réalité sociale est historiquement produite et reproduite par les personnes,
ainsi que les systèmes sociaux avec leurs actions et leurs interactions. Leur
la compétence, cependant, est médiée par un certain nombre de considérations
sociale, culturelle et politique.
En plus de la recherche interprétative, la recherche critique soutient que le
la recherche positiviste n'a rien à voir avec le contexte social et ignore le
son influence sur les actions humaines.
La recherche critique, en revanche, critique la recherche interprétative pour
être trop subjectif et parce qu'il ne vise pas à aider
les gens pour améliorer leur vie. La plus grande différence entre le
la recherche critique et les deux autres approches est sa dimension évaluative.
Alors que l'objectivité des traditions positivistes et interprétatives est pour
prédire ou expliquer le statu quo ou la réalité sociale, recherche critique
vise à évaluer de manière critique et à transformer la réalité sociale ci-dessous
studio.
Les chercheurs critiques s'opposent généralement au statu quo afin de
supprimer les différences sociales et améliorer les conditions sociales. Là
la recherche critique a un engagement envers une vision procédurale de la
phénomènes d'intérêt et, par conséquent, est normalement longitudinale.
Des exemples de méthodes de recherche sont des études historiques à long terme et
études ethnographiques. La recherche critique, cependant, n'a pas été
largement utilisé dans la recherche sur les systèmes d'information
3.1.2 Objectif de la recherche
Avec la nature de la recherche, son objectif peut être utilisé
guider le chercheur dans le choix d’une méthode particulière de
Recherche. Le but d'un projet de recherche est étroitement lié
la position de la recherche par rapport au cycle de recherche qui consiste en
trois phases: construction de la théorie, test de la théorie et raffinement de la
théorie. Ainsi, en s'appuyant sur le moment relatif au cycle de recherche, un
le projet de recherche peut avoir un but explicatif et descriptif
exploration ou prédictive.
3.1.2.1 Recherche exploratoire
La recherche exploratoire vise à étudier un sujet
totalement nouveau et formuler des questions et des hypothèses pour la recherche
futur. Ce type de recherche est utilisé dans la construction du
théorie pour obtenir des références initiales dans un nouveau domaine.
Normalement, des méthodes de recherche qualitatives sont utilisées, comme des cas
d'étude ou d'études phénoménologiques.
Cependant, il est également possible d'employer des techniques quantitatives telles que
investigations ou expériences exploratoires.
3.1.3.3 Recherche descriptive
La recherche descriptive vise à analyser et à décrire de manière
détailler une situation ou une pratique organisationnelle particulière. Cette
il convient à la construction de théories et peut également être utilisé pour
confirmer ou contester des hypothèses. Recherche descriptive généralement
comprend l'utilisation de mesures et d'échantillons. Les méthodes de recherche les plus adaptées
ils comprennent une enquête et une analyse des antécédents.
3.1.2.3 Recherche explicative
La recherche explicative tente d'expliquer pourquoi les choses se produisent.
Il est construit sur des faits qui ont déjà été étudiés et tente de trouver
les raisons de ces faits.
La recherche explicative repose donc normalement sur la recherche
exploratoire ou descriptif et est accessoire pour tester et affiner
les théories. La recherche explicative utilise généralement des études de cas
o méthodes de recherche basées sur des enquêtes.
3.1.2.4 Recherche préventive
La recherche préventive vise à prédire les événements et les comportements
sous observation qu'ils sont à l'étude (Marshall et Rossman
1995). La prédiction est le test scientifique standard de la vérité.
Ce type de recherche emploie généralement une enquête ou une analyse de
donner historiens. (Yin 1989)
La discussion ci-dessus montre qu'il existe un certain nombre de
méthodes de recherche possibles pouvant être utilisées dans une étude
particulier. Cependant, il doit y avoir une méthode spécifique qui soit plus appropriée
d'autres pour un type particulier de projet de recherche. (Galliers
1987, Yin 1989, De Vaus 1991). Chaque chercheur a donc
besoin d'évaluer soigneusement les forces et les faiblesses de
diverses méthodes, afin d'adopter la méthode de recherche la plus appropriée e
compatible avec le projet de recherche. (Jenkins 1985, Pervan et Klass
1992, Bonomia 1985, Yin 1989, Himilton et Ives 1992).
3.2. Méthodes de recherche possibles
Le but de ce projet était d'étudier l'expérience en
Organisations australiennes avec moi donner stocké avec un
développement de entrepôt de données. Date qui, actuellement, il y en a un
manque de recherche dans le domaine de l'entreposage de données en Australie,
ce projet de recherche est encore dans la phase théorique du cycle
recherche et a un but exploratoire. Explorer l'expérience en
Les organisations australiennes adoptent l'entreposage de données
cela nécessite l'interprétation de la société réelle. Par conséquent, le
l'hypothèse philosophique qui sous-tend le projet de recherche suit
l'interprétation traditionnelle.
Après un examen rigoureux des méthodes disponibles, elles ont été identifiées
deux méthodes de recherche possibles: enquêtes et études de cas
(études de cas), qui peuvent être utilisées pour la recherche
exploratoire (Shanks et al.1993). Galliers (1992) soutient que
la pertinence de ces deux méthodes pour cette étude particulière en
sa taxonomie révisée en disant qu'ils sont adaptés à la construction
théorique. Les deux sous-sections suivantes traitent de chaque méthode
détail.
3.2.1 Méthode de recherche d'investigation
La méthode de recherche d'investigation provient de l'ancienne méthode de
recensement. Un recensement consiste à collecter des informations
une population entière. Cette méthode est coûteuse et peu pratique, en
surtout si la population est importante. Donc, par rapport au
recensement, une enquête est normalement axée sur
recueillir des informations sur un petit nombre, ou un échantillon, de
représentants de la population (Fowler 1988, Neuman 1994). UNE
l'échantillon reflète la population dont il est issu, avec des
niveaux de précision, selon la structure de l'échantillon, le
taille et méthode de sélection utilisées (Fowler 1988, Babbie
1982, Neumann 1994).
La méthode d'enquête est définie comme des "instantanés des pratiques,
situations ou points de vue à un moment donné, entrepris en utilisant
questionnaires ou entretiens, à partir desquels des inférences peuvent être
fait "(Galliers 1992: 153) [instantané des fichiers,
situations ou vues à un moment donné, entreprises à l'aide de
questionnaires ou entretiens, à partir desquels des inférences peuvent être faites]. le
les enquêtes traitent de la collecte d'informations sur certains aspects
de l'étude, par un certain nombre de participants, faisant
questions (Fowler 1988). Même ces questionnaires et entretiens, qui
inclure des entretiens téléphoniques en face à face et des entretiens structurés,
sont les techniques de collecte de donner le plus couramment utilisé dans
enquêtes (Blalock 1970, Nachmias et Nachmias 1976, Fowler
1988), des observations et des analyses peuvent être utilisées (Gable
1994). De toutes ces méthodes de collecte des donner, l'utilisation du
questionnaire est la technique la plus populaire, car elle garantit que je donner
collectées sont structurées et formatées, et facilite ainsi la
classification des informations (Hwang 1987, de Vaus 1991).
En analysant le donner, une stratégie d'enquête emploie souvent
techniques quantitatives, telles que l'analyse statistique, mais elles peuvent être
des techniques qualitatives sont également employées (Galliers 1992, Pervan
et Klass 1992, Gable 1994). Normalement, je donner collectés sont
utilisé pour analyser les distributions et les modèles d'association
(Fowler 1988).
Bien que les enquêtes soient généralement appropriées pour la recherche
traitant de la question "quoi?" (quoi) ou de lui
dérivant, comme 'quantum' (combien) et 'quant'è' (combien), esse
peut être posée via la question `` pourquoi '' (Sonquist et
Dunkelberg 1977, Yin 1989). D'après Sonquist et Dunkelberg
(1977), la recherche met en évidence des hypothèses difficiles, programme de
évaluation, décrivant la population et développant des modèles de
comportement humain. En outre, les enquêtes peuvent être utilisées
pour étudier une certaine opinion de la population, des conditions,
opinions, caractéristiques, attentes et même comportements passés
ou présent (Neuman 1994).
Les investigations permettent au chercheur de découvrir les relations entre les
population et les résultats sont généralement plus génériques que
d'autres méthodes (Sonquist et Dunkelberg 1977, Gable 1994). le
les enquêtes permettent aux chercheurs de se rapporter à une zone géographique
plus large et pour atteindre de nombreux déclarants (Blalock 1970,
Sonquist et Dunkelberg 1977, Hwang et Lin 1987, Gable 1994,
Neuman 1994). Enfin, les enquêtes peuvent fournir les informations
qui ne sont pas disponibles ailleurs ou sous la forme requise pour l'analyse
(Fowler 1988).
Il existe cependant certaines limites à la réalisation d’une enquête. Un
l'inconvénient est que le chercheur ne peut pas obtenir beaucoup d'informations
sur l'objet étudié. Cela est dû au fait que le
les enquêtes ne sont menées qu'à un moment précis et, par conséquent,
il existe un nombre limité de variables et de personnes que le chercheur peut
étude (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Un autre inconvénient est ce que peut être la réalisation d'une enquête
très coûteux en termes de temps et de ressources, surtout si
implique des entretiens en face à face (Fowler 1988).
3.2.2. Méthode de recherche par enquête
La méthode de recherche par enquête implique une étude approfondie de
une situation particulière dans son contexte réel dans un
période définie, sans aucune intervention du
chercheur (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Cette méthode est principalement utilisée pour décrire les relations entre
les variables étudiées dans une situation particulière
(Galliers 1992). Les enquêtes peuvent concerner des cas individuels ou
multiple, selon le phénomène analysé (Franz et Robey 1987,
Eisenhardt 1989, Yin 1989).
La méthode de recherche par enquête est appelée «une enquête
étude empirique qui étudie un phénomène contemporain dans le
son contexte réel, en utilisant plusieurs sources collectées à partir de l'un ou l'autre
plusieurs entités telles que des personnes, des groupes ou des organisations »(Yin 1989).
Il n'y a pas de séparation claire entre le phénomène et son contexte e
il n'y a pas de contrôle expérimental ou de manipulation des variables (Yin
1989, Benbasat et al. 1987).
Il existe une variété de techniques pour la collecte des donner qu'ils peuvent
être utilisé dans la méthode d'enquête, qui comprend les
observations directes, examens des archives, questionnaires,
revue de la documentation et entretiens structurés. Ayant
une gamme variée de techniques de récolte donner, les demandes
permettre aux chercheurs de traiter à la fois donner qualitatif que
quantitatif en même temps (Bonoma 1985, Eisenhardt 1989, Yin
1989, Gable 1994). Comme c'est le cas avec la méthode d'enquête, un
Le chercheur investigateur agit en tant qu'observateur ou chercheur et non
en tant que participant actif de l'organisation à l'étude.
Benbasat et al. (1987) affirment que la méthode d'enquête est
particulièrement adapté à la construction de la théorie de la recherche, qui
il commence par une question de recherche et se poursuit par la formation
d'une théorie au cours du processus de collecte donner. être
convient également pour la scène
de la théorie de la construction, Franz et Robey (1987) suggèrent que
la méthode d'investigation peut également être utilisée pour le complexe
stade de la théorie. Dans ce cas, sur la base des preuves recueillies, un
une théorie ou une hypothèse donnée est vérifiée ou réfutée. De plus, l'enquête est
convient également aux recherches traitant des questions « comment » ou « comment »
« parce que » (Yin 1989).
Par rapport à d'autres méthodes, les investigations permettent au chercheur de
capturer plus en détail les informations essentielles (Galliers
1992, Shanks et al. 1993). De plus, les enquêtes permettent au
chercheur pour comprendre la nature et la complexité des processus étudiés
(Benbasat et al 1987).
Il y a quatre principaux inconvénients associés à la méthode
enquête. Le premier est le manque de déductions contrôlées. Là
La subjectivité du chercheur peut fausser les résultats et les conclusions
de l'étude (Yin 1989). Le deuxième inconvénient est le manque de
observation contrôlée. Contrairement aux méthodes expérimentales, le
le chercheur investigateur ne peut pas contrôler les phénomènes étudiés
puisqu'ils sont examinés dans leur contexte naturel (Gable 1994). le
le troisième inconvénient est le manque de reproductibilité. Cela est dû au fait
qu'il est peu probable que le chercheur observe les mêmes événements, e
ne peut pas vérifier les résultats d'une étude particulière (Lee 1989).
Enfin, en raison de la non-réplicabilité, il est difficile
généraliser les résultats d'une ou plusieurs enquêtes (Galliers
1992, Shanks et al.1993). Cependant, tous ces problèmes échouent
sont insurmontables et peuvent, en fait, être minimisés par
chercheur appliquant les actions appropriées (Lee 1989).
3.3. Justifier la méthodologie de recherche
adopté
À partir des deux méthodes de recherche possibles pour cette étude, le
l'enquête est considérée comme la plus appropriée. Celui de l'enquête est
a été écarté après un examen attentif du parent
mérites et faiblesses. La commodité ou le caractère inapproprié de chacun
méthode pour cette étude est discutée ci-dessous.
3.3.1. Méthode de recherche inappropriée
d'enquête
La méthode d'enquête nécessite une étude approfondie sur un
situation particulière au sein d'une ou plusieurs organisations pour un
période (Eisenhardt 1989). Dans ce cas, la période peut
dépasser le délai imparti pour cette étude. Une autre
la raison pour laquelle la méthode d'enquête n'a pas été adoptée est que les résultats
ils peuvent souffrir d'un manque de rigueur (Yin 1989). Subjectivité
du chercheur peut influencer les résultats et les conclusions. Une autre
la raison en est que cette méthode est plus adaptée à la recherche sur des questions
du type `` comment '' ou `` pourquoi '' (Yin 1989), tandis que la question de recherche
pour cette étude, il est du type «quoi». Enfin et surtout
Surtout, il est difficile de généraliser les résultats à partir d'un seul o
peu d'enquêtes (Galliers 1992, Shanks et al. 1993). Sur la base de
cette justification, la méthode de recherche d'investigation n'est pas
a été choisi comme inapproprié pour cette étude.
3.3.2. Commodité de la méthode de recherche
enquête
Lorsque cette recherche a été menée, la pratique du datawarehousing
il n'avait pas été largement adopté par
Organisations australiennes. Donc, il n'y avait pas beaucoup d'informations
concernant leur mise en œuvre au sein du
Organisations australiennes. Les informations disponibles sont venues
par des organisations qui avaient implémenté ou utilisé une donnée
entrepôt. Dans ce cas, la méthode de recherche par sondage est la plus
adapté car il permet d'obtenir des informations qui ne sont pas
disponible ailleurs ou sous la forme requise pour l'analyse (Fowler 1988).
De plus, la méthode de recherche par sondage permet au chercheur de
avoir un bon aperçu des pratiques, des situations ou des situations
vu à un moment donné (Galliers 1992, Denscombe 1998).
Un aperçu avait été demandé pour augmenter le
connaissance de l'expérience australienne de l'entreposage de données.
Encore une fois, Sonquist et Dunkelberg (1977) affirment que les résultats de
Les recherches par enquête sont plus générales que les autres méthodes.
3.4. Conception de la recherche par sondage
L'enquête sur les pratiques d'entreposage de données a été menée en 1999.

La population cible était constituée d'organisations
Les Australiens intéressés par les études sur l'entreposage de données, comme ils l'étaient
probablement déjà informé de moi donner qu'ils stockent et,
par conséquent, il pourrait fournir des informations utiles pour cette étude. Là
la population cible a été identifiée grâce à une enquête initiale
tous les membres australiens de «The Data Warehousing Institute» (Tdwiaap).
Cette section traite de la conception de la phase de recherche
preuves empiriques de cette étude.
3.4.1. Technique de récolte donner
À partir des trois techniques couramment utilisées dans la recherche par sondage
(c.-à-d. questionnaire par courrier, entretien téléphonique et entretien
personnel) (Nachmias 1976, Fowler 1988, de Vaus 1991), par
cette étude a été adoptée le questionnaire par courrier. Le premier
la raison de l'adoption de ce dernier est qu'il peut atteindre
population dispersée géographiquement (Blalock 1970, Nachmias e
Nachmias 1976, Hwang et Lin 1987, de Vaus 1991, Gable 1994).
Deuxièmement, le questionnaire postal est adapté aux participants
très instruit (Fowler 1988). Le questionnaire par mail pour cela
étude a été adressée aux porteurs de projets d'entreposage de données,
directeurs et / ou chefs de projet. Troisièmement, les questionnaires sur
mail conviennent lorsque vous avez une liste sûre de
adresses (Salant et Dilman 1994). TDWI, dans ce cas, un
une association d'entreposage de données de confiance a fourni la liste de diffusion
de ses membres australiens. Un autre avantage du questionnaire
par courrier pour le questionnaire téléphonique ou les entretiens
personnel, c'est qu'il permet aux inscrits de répondre avec une plus grande
l'exactitude, en particulier lorsque les déclarants doivent consulter
enregistre ou discute des questions avec d'autres personnes (Fowler
1988).
Un inconvénient potentiel peut être le temps qu'il faut pour
mener des questionnaires par courrier. Normalement, un questionnaire sur
le courrier se déroule dans cet ordre: envoyez des lettres, attendez-les
réponses et envoyer une confirmation (Fowler 1988, Bainbridge 1989).
Par conséquent, le temps total peut être plus long que le temps requis pour
entretiens personnels ou entretiens téléphoniques. Cependant, le
le temps total peut être connu à l'avance (Fowler 1988,
Denscombe 1998). Le temps passé à mener les entretiens
personnel ne peut pas être connu à l'avance car il varie de
d'une entrevue à l'autre (Fowler 1988). Les entretiens téléphoniques
peut être plus rapide que l'envoi de questionnaires et
entretiens personnels mais peut avoir un taux élevé de disparitions
réponse en raison de l'indisponibilité de certaines personnes (Fowler 1988).
De plus, les entretiens téléphoniques se limitent généralement à des listes de
questions relativement courtes (Bainbridge 1989).
Une autre faiblesse d'un questionnaire par courrier est le taux élevé de
absence de réponse (Fowler 1988, Bainbridge 1989, Neuman
1994). Cependant, des contre-mesures ont été prises en associant
cette étude avec une institution de confiance dans le domaine des données
l'entreposage (c'est-à-dire TDWI) (Bainbridge 1989, Neuman 1994), le
qui envoie deux lettres de rappel à ceux qui n'ont pas répondu
(Fowler 1988, Neuman 1994) et comprend également une lettre
ce qui explique le but de l'étude (Neuman 1994).
3.4.2. Unité d'analyse
Le but de cette étude est d'obtenir des informations sur
la mise en place de l'entreposage de données et son utilisation
au sein des organisations australiennes. La population cible
est composé de toutes les organisations australiennes qui ont
mis en œuvre, ou sont en train de mettre en œuvre, je entrepôt de données. En
les organisations individuelles sont alors enregistrées. Le questionnaire
il a été envoyé aux organisations intéressées par l'adoption
di entrepôt de données. Cette méthode garantit que les informations
collectées auprès des ressources les plus appropriées de chaque organisation
participant.
3.4.3. Échantillon d'enquête
La liste de diffusion des répondants au sondage a été obtenue auprès de
TDWI. De cette liste, 3000 organisations australiennes
ont été sélectionnés comme base de l’échantillonnage. UNE
une lettre supplémentaire expliquait le projet et le but de l'enquête,
avec une carte de réponse et une enveloppe prépayée pour
retourner le questionnaire rempli ont été envoyés à l'échantillon.
Sur les 3000 organisations, 198 ont accepté de participer à la
étude. Un si petit nombre de réponses était attendu date il
un grand nombre d'organisations australiennes qu'ils avaient alors
étreint ou respectait la stratégie de date
l'entreposage au sein de leurs organisations. Alors le
la population cible de cette étude était composée de seulement 198
organisations.
3.4.4. Contenu du questionnaire
La structure du questionnaire était basée sur le modèle de date
Entreposage Monash (discuté précédemment dans la partie 2.3). le
le contenu du questionnaire était basé sur l'analyse
littérature présentée au chapitre 2. Une copie du questionnaire
envoyé aux participants au sondage peut être trouvé
à l'annexe B. Le questionnaire comprend six sections, qui
suivre les phases du modèle traité. Les six paragraphes suivants
résumez brièvement le contenu de chaque section.
Section A: Informations de base sur l'organisation
Cette section contient des questions relatives au profil de
organisations participantes. De plus, certaines des questions sont
relative à l'état du projet d'entreposage de données de
participant. Informations confidentielles telles que le nom
de l’organisation n’ont pas été divulgués dans l’analyse de l’enquête.
Section B: Début
Les questions de cette section sont liées à l'activité de démarrage de
entreposage de données. Des questions ont été posées pendant combien de temps
il s'agit de porteurs de projets, de sponsors, de compétences et de connaissances
exigences, les objectifs du développement de l'entrepôt de données et le
attentes des utilisateurs finaux.
Section C: Conception
Cette section contient des questions relatives aux activités de
planification de entrepôt de données. En particulier, les questions sont
préciser la portée de l'exécution, la durée du projet, le coût
du projet et l’analyse coûts / bénéfices.
Section D : Développement
Dans la section développement, il y a des questions relatives aux activités de
développement de la entrepôt de données: recueil des besoins des utilisateurs
enfin, les sources de donner, le modèle logique de donner, prototypes, le
planification des capacités, architectures techniques et sélection des
outils de développement d'entrepôt de données.
Section E : Fonctionnement
Questions d'opération liées à l'opération ed
extensibilité de entrepôt de données, au fur et à mesure qu'il évolue vers le
prochaine phase de développement. Là qualité des données, les stratégies de
rafraîchissement de donner, la granularité du donnerévolutivité des données
l'entrepôt et les problèmes de sécurité du entrepôt de données ils étaient entre
les types de questions posées.
Section F : Développement
Cette section contient des questions relatives à l'utilisation de la date
entrepôt par les utilisateurs finaux. Le chercheur était intéressé
aux fins et à l'utilité du entrepôt de données, bilan et stratégies
les procédures de formation adoptées et la stratégie de contrôle des données
entrepôt adopté.
3.4.5. Taux de réponse
Bien que les enquêtes postales soient critiquées pour avoir
faible réponse, des mesures ont été prises pour augmenter la
taux de rendement (comme indiqué précédemment en partie
3.4.1). Le terme `` taux de réponse '' fait référence au pourcentage de
personnes faisant partie d'un échantillon d'enquête particulier qui répond à la
questionnaire (Denscombe 1998). Ce qui suit a été utilisé
formule pour calculer le taux de réponse pour cette étude:
Nombre de personnes ayant répondu
Taux de réponse =
———————————————————————————– X 100
Nombre total de questionnaires envoyés
3.4.6. Test pilote
Avant que le questionnaire ne soit envoyé à l'échantillon, les questions sont
ont été testés en effectuant des tests pilotes, comme suggéré par Luck
et Rubin (1987), Jackson (1988) et de Vaus (1991). Le but de la
le test pilote consiste à révéler toutes les expressions inconfortables, ambiguës et
questions difficiles à interpréter, à clarifier
définitions et termes utilisés et pour identifier le temps approximatif
requis pour remplir le questionnaire (Warwick et Lininger 1975,
Jackson 1988, Salant et Dilman 1994). Les tests pilotes ont été
réalisée en sélectionnant des sujets présentant des caractéristiques similaires à celles
des sujets finaux, comme suggéré par Davis e Cosenza (1993). Dans
cette étude, six professionnels de l'entreposage de données ont été
sélectionnés comme sujets pilotes. Après chaque essai pilote, ils sont
les corrections nécessaires ont été apportées. À partir des essais pilotes effectués, je
les participants ont aidé à remodeler et à réinitialiser le
version finale du questionnaire.
3.4.7. Méthodes d'analyse par Donner
I donner des enquêtes collectées à partir de questionnaires à questions fermées sont
ont été analysés à l'aide d'un progiciel statistique
appelé SPSS. De nombreuses réponses ont été analysées
en utilisant des statistiques descriptives. Un certain nombre de questionnaires
ils sont revenus incomplets. Ceux-ci ont été traités avec des
attention pour être sûr que je donner il n'y en avait pas un
conséquence des erreurs de saisie de données, mais pourquoi les questions ne
ils convenaient au déclarant, ou le déclarant a décidé de ne pas
répondez à une ou plusieurs questions spécifiques. Ces réponses
manquants ont été ignorés lors de l'analyse de donner et ils étaient
codé «- 9» pour vérifier leur exclusion du processus
Analyse.
Lors de la préparation du questionnaire, les questions fermées ont été
précodé en attribuant un numéro à chaque option. Le nombre
puis il a été utilisé pour préparer le donner pendant l'analyse
(Denscombe 1998, Sapsford et Jupp 1996). Par exemple, il y avait
six options énumérées à la question 1 de la section B: conseils
administration, cadre supérieur, service informatique, unité
des entreprises, des consultants et plus encore. Dans le dossier de donner de SPSS, est
une variable a été générée pour indiquer «l'initiateur du projet»,
avec six étiquettes de valeur: «1» pour le «conseil d'administration», «2»
pour «l'exécutif de haut niveau» et ainsi de suite. L'utilisation de l'échelle de Likertin
dans certaines des questions fermées ont également permis
une identification qui ne demande pas d'effort compte tenu de l'utilisation de valeurs
numéros correspondants saisis dans SPSS. Pour des questions avec
des réponses non exhaustives, qui ne s'excluent pas mutuellement,
chaque option a été traitée comme une seule variable avec deux
étiquettes de valeur: «1» pour «marqué» et «2» pour «non marqué».
Les questions ouvertes ont été traitées différemment des questions
fermé. Les réponses à ces questions n'ont pas été publiées dans
SPSS. Au contraire, ils ont été analysés à la main. L'utilisation de ce
type de questions vous permet d'obtenir des informations sur les idées
Expériences librement exprimées et personnelles des déclarants
(Bainbridge 1989, Denscombe 1998). Dans la mesure du possible, cela a été fait
une catégorisation des réponses.
Pour l'analyse de donner, des méthodes d'analyse statistique simple sont utilisées,
comme la fréquence des réponses, la moyenne, l'écart type
moyenne et médiane (Argyrous 1996, Denscombe 1998).
Le test Gamma était en cours pour obtenir des mesures quantitatives
associations entre donner ordinaux (Norusis 1983, Argyrous 1996).
Ces tests étaient appropriés car les échelles ordinales utilisées n'étaient pas
ils avaient de nombreuses catégories et pouvaient être affichés dans un tableau
(Norusis 1983).
3.5 Résumé
Dans ce chapitre, la méthodologie de recherche et le
conceptions adoptées pour cette étude.
Sélection de la méthode de recherche la plus appropriée pour un
une étude particulière prend en compte
considérer un certain nombre de règles, y compris la nature et le type
recherche, ainsi que les mérites et les faiblesses de chaque possible
méthode (Jenkins 1985, Benbasat et al.1097, Galliers et Land 1987,
yin 1989, Hamilton et Ives 1992, Galliers 1992, neuman 1994). Vue
le manque de connaissances et de théories existantes à ce sujet
de l'adoption de l'entreposage de données en Australie, cette étude réalisée par
la recherche nécessite une méthode de recherche interprétative avec une compétence
exploratoire pour explorer les expériences des organisations
Australien. La méthode de recherche choisie a été sélectionnée pour
recueillir des informations concernant l'adoption du concept de date
entrepôt-logement par des organisations australiennes. UNE
Le questionnaire postal a été choisi comme technique de collecte donner. la
justifications de la méthode de recherche et de la technique de collecte donner
sélectionné sera fourni dans ce chapitre. C'était aussi
a présenté une discussion sur l'unité d'analyse, l'échantillon
utilisé, les pourcentages de réponses, le contenu du questionnaire, les
pré-test du questionnaire et de la méthode d'analyse donner.

La conception d'un Entreposage De Données:
Combinaison de la relation d'entité et de la modélisation dimensionnelle
RÉSUMÉ
Magasin i donner c'est un problème actuel majeur pour beaucoup
organisations. Un problème majeur de développement
du stockage de donner c'est sa conception.
La conception doit prendre en charge la détection des concepts dans les données
entreposer un système hérité et d'autres sources de donner et aussi un
compréhension facile et efficacité dans la mise en œuvre des données
entrepôt.
Une grande partie de la documentation sur le stockage donner recommandé
l'utilisation de la modélisation des relations d'entité ou de la modélisation dimensionnelle pour
représente la conception de entrepôt de données.
Dans ce journal, nous montrons comment les deux
les représentations peuvent être combinées dans une approche pour
dessin de entrepôt de données. L'approche utilisée est systématiquement
examiné dans une étude de cas et identifié dans un certain nombre de
implications importantes avec les professionnels.
ENTREPOSAGE DE DONNÉES
Un entrepôt de données il est généralement défini comme un « orienté sur le sujet,
collecte intégrée, variable dans le temps et non volatile de données à l'appui
des décisions de la direction »(Inmon et Hackathorn, 1994).
Axé sur le sujet et intégré signifie que le entrepôt de données è
conçu pour franchir les limites fonctionnelles des systèmes existants pour
offrir une perspective intégrée de donner.
La variante temporelle concerne la nature historique ou chronologique de la vidéo donner in
un entrepôt de données, ce qui permet d'analyser les tendances.
Non volatile indique que le entrepôt de données ce n'est pas en continu
mis à jour en tant que base de données d'OLTP. Il est plutôt mis à jour
périodiquement, avec donner provenant de sources internes et externes. Le
entrepôt de données il est spécialement conçu pour la recherche
plutôt que pour l'intégrité des mises à jour et les performances du
opérations.
L'idée de stocker je donner ce n'est pas nouveau, c'était l'un des buts
gestion de donner depuis les années 1982 (Il Martin, XNUMX).
I entrepôt de données ils offrent l'infrastructure donner pour la gestion
systèmes de soutien. Les systèmes d'aide à la gestion incluent la décision
les systèmes de soutien (DSS) et les systèmes d’information exécutifs (SIE).
Un DSS est un système d'information informatisé
conçu pour améliorer le processus et par conséquent l'adhérence des
décision humaine. Un EIS est généralement un système de livraison de
donner qui permet aux dirigeants d'entreprise d'accéder facilement à la vue
de donner.
L'architecture générale d'un entrepôt de données souligne le rôle de
entrepôt de données en soutien à la gestion. En plus d'offrir
l'infrastructure donner pour EIS et DSS, al entrepôt de données Est-il possible
y accéder directement via des requêtes. LES donner inclus dans une date
l'entrepôt sont basés sur une analyse des besoins d'information de
gestion et sont obtenus à partir de trois sources: les systèmes hérités internes,
systèmes de saisie de données à usage spécial et sources de données externes. LES
donner dans les anciens systèmes internes, ils sont souvent redondants,
incohérent, de mauvaise qualité et stocké dans différents formats
ils doivent donc être réconciliés et nettoyés avant de pouvoir être chargés dans le
entrepôt de données (Inmon, 1992 ; McFadden, 1996). LE donner de
des systèmes de stockage donner ponctuellement et à partir de sources donner
externes sont souvent utilisés pour augmenter (mettre à jour, remplacer) i
donner à partir de systèmes existants.
Il existe de nombreuses raisons impérieuses de développer un entrepôt de données,
qui incluent une meilleure prise de décision grâce à l'utilisation
efficace davantage d'informations (Ives 1995), soutien à une concentration
sur l'ensemble de l'entreprise (Graham 1996), et la réduction des coûts de
provision de donner pour l'EIS et le DSS (Graham 1996, McFadden
1996).
Une étude empirique récente a révélé, en moyenne, un retour de
investissements pour moi entrepôt de données de 401 % après trois ans (Graham,
1996). Cependant, les autres études empiriques de entrepôt de données avoir
trouvé des problèmes importants, notamment des difficultés à mesurer l'ED
attribuer des avantages, sans objectif clair, sous-estimer
objectif et complexité du processus de stockage i donneren
notamment en ce qui concerne les sources et la propreté des donner.
Magasin i donner peut être considéré comme une solution
au problème de gestion donner entre les organisations. Là
manipulation de donner en tant que ressource sociale, il est resté l'un des
les enjeux clés de la gestion des systèmes d'information autour du
monde depuis de nombreuses années (Brancheau et al.1996, Galliers et al.1994,
Niederman et coll. 1990, Pervan 1993).
Une approche populaire de la gestion d’actifs donner c'était dans les années XNUMX
le développement d'un modèle donner social. Modèle donner c'était social
conçu pour offrir une base stable pour le développement de nouveaux systèmes
applications et base de données et reconstruction et intégration héritées
systèmes (Brancheau et al.
1989, Goodhue et al. 1988: 1992, Kim et Everest 1994).
Cependant, cette approche pose de nombreux problèmes, en
en particulier, la complexité et le coût de chaque tâche, ainsi que la durée
nécessaire pour obtenir des résultats tangibles (Beynon-Davies 1994, Earl
1993, Goodhue et coll. 1992, Periasamy 1994, Shanks 1997).
Il entrepôt de données il s'agit d'une base de données distincte qui coexiste avec l'héritage
bases de données plutôt que de les remplacer. Il vous permet donc de
diriger la gestion de donner et éviter une reconstruction coûteuse
des systèmes existants.
APPROCHES EXISTANTES DE CONCEPTION DE DONNÉES
ENTREPÔT
Le processus de construction et de perfectionnement d'un entrepôt de données
il doit être compris plus comme un processus évolutif que comme un
cycle de vie de développement des systèmes traditionnels (Desio, 1995, Shanks,
O'Donnell et Arnott 1997a). Il existe de nombreux processus impliqués dans un
projet de entrepôt de données telles que l'initialisation, la planification ;
les informations acquises auprès des prérequis demandés aux chefs d'entreprise
sources, transformations, nettoyage des donner et synchronisation à partir de l'héritage
systèmes et autres sources de donner; systèmes de prestation en cours de développement;
suivi de entrepôt de données; et l'absurdité du processus
évolutive et construction d'un entrepôt de données (Shin, O'Donnell
et Arnott 1997b). Dans ce journal, nous nous concentrons sur la façon dont
dessine je donner stockés dans le cadre de ces autres processus.
Il existe un certain nombre d'approches proposées pour l'architecture des données
entrepôt de littérature (Inmon 1994, Ives 1995, Kimball 1994
McFadden 1996). Chacune de ces méthodologies a un bref
revoir avec une analyse de leurs forces et non.
L'approche d'Inmon (1994) pour Entreposage De Données
Conception
Inmon (1994) a proposé quatre étapes itératives pour concevoir une date
entrepôt (voir Figure 2). La première étape consiste à concevoir un modèle
donner social pour comprendre comment je donner peut être intégré
à travers les domaines fonctionnels au sein d'une organisation
en divisant le donner stocker dans les zones. Modèle donner c'est fait pour
ranger donner relative à la prise de décision, y compris donner
historique et inclus donner déduit et agrégé. La deuxième étape est
identifier les domaines de mise en œuvre. Ceux-ci sont basés
sur les priorités déterminées par une organisation particulière. Le troisième
L'étape consiste à dessiner un base de données pour le sujet, pose
une attention particulière est accordée à l'inclusion de niveaux de granularité appropriés.
Inmon recommande d'utiliser le modèle d'entités et de relations. Quatrième
l'étape consiste à identifier les systèmes de sources donner requis et développer
processus de transformation pour acquérir, nettoyer et formater i donner.
Les points forts de l'approche d'Inmon sont que le modèle donner social
offre la base de l'intégration de donner au sein de l'organisation
et planification des supports pour le développement itératif de la date
entrepôt. Ses inconvénients sont la difficulté et le coût du dessin
le modèle donner social, la difficulté à comprendre les modèles d'entités e
relations utilisées dans les deux modèles, qui donner social et celui de donner
stocké par domaine, et la pertinence de donner de la
dessin de entrepôt de données pour la réalisation de base de données
relationnel mais pas pour base de données multidimensionnel.
L'approche d'Ives (1995) Entreposage De Données
Conception
Ives (1995) propose une approche en quatre étapes pour dessiner un
système d'information qu'il juge applicable à la conception d'une date
entrepôt (voir Figure 3). L'approche est très basée sur
Ingénierie de l'information pour le développement de systèmes d'information
(Martin 1990). La première étape consiste à déterminer les objectifs, les facteurs
indicateurs de performance critiques et réussis et clés. LES
les processus commerciaux clés et les informations nécessaires sont
modélisé pour nous conduire à un modèle donner sociale. La deuxième étape
cela implique le développement d'une architecture déterminante donner
stocké par zones, base de données di entrepôt de données, les composants
de la technologie requise, l'ensemble du soutien organisationnel
nécessaires pour mettre en œuvre et fonctionner avec entrepôt de données. Le troisième
Cette étape comprend la sélection des progiciels et des outils requis.
La quatrième étape est la conception détaillée et la construction du
entrepôt de données. Ives note ce magasin donner est une borne
processus itératif.
La force de l'approche d'Ives est l'utilisation de spécifications techniques pour
déterminer les besoins d'information, l'utilisation d'une information structurée
processus pour soutenir l’intégration de entrepôt de données,
la sélection appropriée du matériel et des logiciels, et l'utilisation de plusieurs
techniques de représentation pour entrepôt de données. Ses défauts
ils sont inhérents à la complexité. D'autres incluent des difficultés à
développer de nombreux niveaux de base de données dans le entrepôt de données in
délai et coût raisonnables.
L'approche de Kimball (1994) Entreposage De Données
Conception
Kimball (1994) a proposé cinq étapes itératives pour dessiner une date
entrepôt (voir Figure 4). Son approche est particulièrement
dédié au dessin d'un seul entrepôt de données et sur l'utilisation de modèles
dimensionnelle de préférence aux modèles d'entités et de relations. Kimball
analyser ces modèles dimensionnels car il est plus facile pour i de comprendre
les dirigeants d'entreprise sont plus efficaces lorsqu'ils traitent
consultations complexes, et la conception de base de données physique c'est plus
efficace (Kimball 1994). Kimball reconnaît que le développement d'un
entrepôt de données est itératif, et que entrepôt de données peut séparé
être intégré par la division en tableaux de dimensions
commun.
La première étape consiste à identifier le domaine particulier à
perfectionné. Les deuxième et troisième étapes concernent la modélisation
dimensionnelle. Dans la deuxième étape, les mesures identifient des éléments de
intérêt pour le sujet et regroupés dans un tableau de faits.
Par exemple, dans un domaine des ventes, les mesures d'intérêt
ils pourraient inclure la quantité d'articles vendus et le dollar
comme monnaie de vente. La troisième étape consiste à identifier le
dimensions qui sont la manière dont elles peuvent être regroupées i
les faits. Dans un domaine de vente, dimensions pertinentes
ils peuvent inclure l'article, le lieu et la période. Là
la table de faits a une clé en plusieurs parties à relier à chacun
de tables de dimension et contient généralement un très grand nombre
super en fait. En revanche, les tableaux de taille contiennent
des informations descriptives sur les dimensions et autres attributs
ils peuvent être utilisés pour regrouper des faits. La table des faits e
dimensions associées à la proposition forment ce qu'on appelle une
motif en étoile en raison de sa forme. La quatrième étape implique
construire un base de données multidimensionnel pour le perfectionner
schéma d'étoiles. La dernière étape consiste à identifier les systèmes sources donner
nécessaires et développer des processus de transformation pour acquérir, nettoyer
et formater i donner.
Les points forts de l'approche de Kimball incluent l'utilisation de modèles
dimensionnel pour représenter je donner stocké qui en fait
facile à comprendre et conduit à une conception physique efficace. UNE
modèle dimensionnel qui utilise facilement les deux
systèmes de base de données les systèmes relationnels peuvent être perfectionnés ou les systèmes
base de données multidimensionnel. Ses défauts incluent le manque
certaines techniques pour faciliter la planification ou l'intégration de
plusieurs schémas d'étoiles en un seul entrepôt de données et la
difficulté de concevoir à partir de la structure dénormalisée extrême dans un
modèle dimensionnel a donner dans l'ancien système.
L'approche des données de McFadden (1996)
Conception d'entrepôt
McFadden (1996) propose une approche en cinq étapes pour
dessine un entrepôt de données (voir la figure 5).
Son approche est basée sur une synthèse d'idées issues de la littérature
et se concentre sur le dessin d'un solo entrepôt de données. Le premier
Cette étape implique une analyse des besoins. Même si les détails
les techniques ne sont pas prescrites, les notes de McFadden identifient les
entité donner spécifications et leurs attributs, et fait référence aux lecteurs Watson
et Frolick (1993) pour l'acquisition des besoins.
Dans la deuxième étape, un modèle d'entité de relation est dessiné pour
entrepôt de données puis validés par des dirigeants d'entreprise. Le troisième
l'étape comprend la détermination du mappage à partir du système hérité
et sources externes de entrepôt de données. La quatrième étape consiste
processus de développement, de distribution et de synchronisation de donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas.
entrepôt de données. Dans la dernière étape, la livraison du système est
développé avec un accent particulier sur une interface utilisateur.
McFadden souligne que le processus de dessin est généralement
itératif.
Les atouts de l'approche de McFadden reposent sur la participation
par les dirigeants d'entreprise dans la détermination des exigences et aussi
l'importance des ressources donnerleur nettoyage et leur collecte. Son
les inconvénients sont liés à l'absence de processus de fractionnement d'un
grand projet de entrepôt de données en plusieurs étapes intégrées, et le
difficulté à comprendre les modèles d'entités et de relations utilisés dans la conception de
entrepôt de données.

    0/5 (0 avis)
    0/5 (0 avis)
    0/5 (0 avis)

    En savoir plus sur l'agence Web en ligne

    Abonnez-vous pour recevoir les derniers articles par email.

    auteur avatar
    admin Directeur Général
    👍Agence Web en ligne | Agence Web experte en Marketing Digital et SEO. Web Agency Online est une agence Web. Pour Agenzia Web Online, le succès de la transformation numérique repose sur les fondements d'Iron SEO version 3. Spécialités : Intégration de systèmes, Intégration d'applications d'entreprise, Architecture orientée services, Cloud Computing, Entrepôt de données, business intelligence, Big Data, portails, intranets, Application Web Conception et gestion de bases de données relationnelles et multidimensionnelles. Conception d'interfaces pour supports numériques : convivialité et graphisme. Online Web Agency propose aux entreprises les services suivants : -SEO sur Google, Amazon, Bing, Yandex ; -Web Analytics : Google Analytics, Google Tag Manager, Yandex Metrica ; -Conversions d'utilisateurs : Google Analytics, Microsoft Clarity, Yandex Metrica ; -SEM sur Google, Bing, Amazon Ads ; -Marketing des réseaux sociaux (Facebook, Linkedin, Youtube, Instagram).
    Ma confidentialité agile
    Ce site utilise des cookies techniques et de profilage. En cliquant sur accepter, vous autorisez tous les cookies de profilage. En cliquant sur rejeter ou sur le X, tous les cookies de profilage sont rejetés. En cliquant sur personnaliser, vous pouvez sélectionner les cookies de profilage à activer.
    Ce site est conforme à la Loi Informatique et Libertés (LPD), loi fédérale suisse du 25 septembre 2020, et au RGPD, Règlement UE 2016/679, relatif à la protection des données personnelles ainsi qu'à la libre circulation de ces données.