https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

Entreposage de données et planification des ressources d'entreprise | DWH et ERP

ARCHIVER DONNÉES CENTRALE : HISTOIRE ED ÉVOLUTIONS

Les deux thèmes dominants de la technologie d'entreprise dans les années 90 étaient : entrepôt de données et ERP. Pendant longtemps, ces deux courants puissants ont fait partie de l’informatique d’entreprise sans jamais se croiser. C'était presque comme s'il s'agissait de matière et d'antimatière. Mais la croissance de ces deux phénomènes a inévitablement conduit à leur croisement. Aujourd'hui, les entreprises sont confrontées au problème de savoir quoi faire avec les ERP et entrepôt de données. Cet article décrira quels sont les problèmes et comment les entreprises les résolvent.

AU DÉBUT…

Au début, il y avait le entrepôt de données. Entrepôt de données a été créé pour contrecarrer le système d'application de traitement des transactions. Au début, la mémorisation de donner il s'agissait simplement d'un contrepoint aux applications de traitement des transactions. Mais il existe aujourd’hui des visions beaucoup plus sophistiquées de ce qu’est un entrepôt de données. Dans le monde d'aujourd'hui, le entrepôt de données elle est insérée au sein d'une structure que l'on peut appeler Corporate Information Factory.

L'USINE D'INFORMATION D'ENTREPRISE (CAF)

La Corporate Information Factory dispose de composants architecturaux standards : un niveau de transformation et d'intégration de code qui intègre le donner alors que je donner ils passent de l’environnement applicatif vers l’environnement de entrepôt de données de la compagnie; une entrepôt de données de l'entreprise où je donner des histoires détaillées et intégrées. le entrepôt de données de l'entreprise sert de base sur laquelle toutes les autres parties de l'environnement peuvent être construites entrepôt de données; un magasin de données opérationnel (ODS). Un ODS est une structure hybride qui contient certains aspects du entrepôt de données et d'autres aspects d'un environnement OLTP ; des data marts, où différents départements peuvent avoir leur propre version du entrepôt de données, Un entrepôt de données d'exploration dans laquelle les « philosophes » de l'entreprise peuvent soumettre leurs requêtes pendant 72 heures sans effet néfaste sur le entrepôt de données; et une mémoire proche de la ligne, dans laquelle donner vieux et donner les détails en vrac peuvent être stockés à moindre coût.

OÙ L'ERP SE COMBINE AVEC LE USINE D'INFORMATIONS D'ENTREPRISE

L'ERP fusionne avec la Corporate Information Factory à deux endroits. D'abord en tant qu'application de base (baseline) qui fournit donner de la demande à entrepôt de données. Dans ce cas je donner, générés en tant que sous-produit d'un processus de transaction, sont intégrés et chargés dans le entrepôt de données de la compagnie. Le deuxième point d’union entre ERP et CIF et ODS. En fait, dans de nombreux environnements, l’ERP est utilisé comme un ODS classique.

Dans le cas où l'ERP est utilisé comme application de base, le même ERP peut également être utilisé dans le CIF comme ODS. Dans tous les cas, si l’ERP doit être utilisé dans les deux rôles, il doit y avoir une distinction claire entre les deux entités. Autrement dit, lorsque l’ERP joue le rôle d’application cœur et d’ODS, il faut distinguer les deux entités architecturales. Si une seule implémentation ERP tente de remplir les deux rôles simultanément, des problèmes se poseront inévitablement dans la conception et la mise en œuvre de cette structure.

SAO SÉPARÉES ET APPLICATIONS DE BASE

De nombreuses raisons conduisent à la division des éléments architecturaux. Le problème le plus révélateur concernant la séparation des différents composants d’une architecture est peut-être que chaque composant de l’architecture a sa propre vision. L’application de base a un objectif différent de celui de l’ODS. Essayez de se chevaucher

une vue d'application de base sur le monde d'un ODS ou vice versa n'est pas une bonne façon de travailler.

Par conséquent, le premier problème d’un ERP dans le CIF est de vérifier s’il existe une distinction entre les applications de base et l’ODS.

MODÈLES DE DONNÉES DANS L'ENTREPRISE USINE D'INFORMATION

Pour parvenir à une cohésion entre les différentes composantes de l'architecture des CIF, il doit exister un modèle de donner. Les modèles de donner ils servent de lien entre les différents composants de l'architecture tels que les applications de base et l'ODS. Les modèles de donner ils deviennent la « feuille de route intellectuelle » pour donner le bon sens aux différentes composantes architecturales du CIF.

Allant de pair avec cette notion, l’idée est qu’il devrait y avoir un modèle vaste et unique de donner. Il faut évidemment un modèle de donner pour chacun des composants et il doit également y avoir un chemin judicieux reliant les différents modèles. Chaque composant de l'architecture – ODS, applications de base, entrepôt de données de l’entreprise, etc. – a besoin de son propre modèle donner. Il faut donc définir précisément comment ces modèles donner ils s'interfacent les uns avec les autres.

MOVE I DONNÉES DE LA DATE ERP ENTREPÔT

Si l'origine du donner est une application de base et/ou un ODS, lorsque l'ERP insère le donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données, cette insertion doit avoir lieu au niveau de « granularité » le plus bas. Résumez ou regroupez simplement i donner car ils sortent de l’application de base ERP ou de l’ERP ODS n’est pas la bonne chose à faire. LE donner des détails sont nécessaires dans entrepôt de données pour constituer la base du processus DSS. Tel donner sera remodelé à bien des égards par les data marts et les explorations de entrepôt de données.

Le déplacement de donner de l'environnement d'application de base de l'ERP au entrepôt de données de l'entreprise se fait de manière raisonnablement détendue. Ce déplacement intervient environ 24 heures après la mise à jour ou la création dans l'ERP. Le fait d'avoir un mouvement "paresseux" du donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données de l'entreprise permet donner venant de l’ERP pour « déposer ». Une fois que je donner sont stockés dans l'application de base, vous pouvez alors déplacer en toute sécurité le donner de l'ERP dans l'entreprise. Un autre objectif réalisable grâce au mouvement « paresseux » du donner c'est la délimitation claire entre les processus opérationnels et le DSS. Avec un mouvement « rapide » du donner la frontière entre DSS et opérationnel reste vague.

Le mouvement de donner de l'ODS de l'ERP à entrepôt de données de l'entreprise se fait périodiquement, généralement hebdomadairement ou mensuellement. Dans ce cas, le mouvement de donner il est basé sur la nécessité de « nettoyer » les anciens donner historiens. Bien sûr, l'ODS contient je donner qui sont beaucoup plus récents que les donner historiens trouvés dans le entrepôt de données.

Le déplacement de donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données cela ne se fait presque jamais en « gros » (de manière grossiste). Copiez une table de l'environnement ERP vers entrepôt de données cela n'a aucun sens. Une approche beaucoup plus réaliste consiste à déplacer des unités sélectionnées du donner. Seulement je donner qui ont changé depuis la dernière mise à jour de entrepôt de données ce sont eux qui devraient être déplacés vers le entrepôt de données. Une façon de savoir lesquels donner ont changé depuis la dernière mise à jour est de regarder les horodatages des donner trouvés dans l’environnement ERP. Le concepteur sélectionne toutes les modifications survenues depuis la dernière mise à jour. Une autre approche consiste à utiliser des techniques de capture des changements donner. Grâce à ces techniques, les journaux et les bandes de journaux sont analysés afin de déterminer lesquels donner doit être déplacé de l’environnement ERP vers celui de entrepôt de données. Ces techniques sont les meilleures car les journaux et les bandes de journaux peuvent être lus à partir de fichiers ERP sans impact supplémentaire sur les autres ressources ERP.

AUTRES COMPLICATIONS

L'un des problèmes ERP de CIF est ce qui arrive aux autres sources d'applications ou aux donner de l'ODS auquel ils doivent contribuer entrepôt de données mais ils ne font pas partie de l'environnement ERP. Compte tenu de la nature fermée des ERP, notamment SAP, tenter d'intégrer des clés provenant de sources externes de donner avec donner qui proviennent de l'ERP lors du déplacement du donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données, c'est un grand défi. Et quelles sont exactement les probabilités que je donner d'applications ou d'ODS extérieurs à l'environnement ERP seront intégrés dans le entrepôt de données? Les chances sont en réalité très élevées.

TROUVE DONNÉES HISTORIQUES DE L'ERP

Un autre problème avec le donner de l'ERP est celui qui découle de la nécessité d'avoir donner historiens au sein du entrepôt de données. Habituellement le entrepôt de données il a besoin donner historiens. Et la technologie ERP ne les stocke généralement pas donner historique, du moins pas au point où cela est nécessaire dans le entrepôt de données. Lorsqu'une grande quantité de donner l’histoire commence à s’accumuler dans l’environnement ERP, cet environnement doit être nettoyé. Par exemple, supposons qu'un entrepôt de données doit être chargé de cinq ans de donner historiques alors que l’ERP conserve au maximum six mois de ces derniers donner. Tant que l'entreprise se contente de collecter une série de donner historiens, au fil du temps, il n'y a aucun problème à utiliser l'ERP comme source pour les entrepôt de données. Mais quand le entrepôt de données il doit remonter le temps et trouver des dieux donner des historiques qui n'ont pas été collectés et sauvegardés auparavant par l'ERP, l'environnement ERP devient alors inefficace.

ERP ET METADATA

Une autre considération à faire sur l'ERP et entrepôt de données est celui sur les métadonnées existant dans l’environnement ERP. Tout comme les métadonnées circulent de l'environnement ERP vers le entrepôt de données, les métadonnées doivent être déplacées de la même manière. De plus, les métadonnées doivent être transformées dans le format et la structure requis par l'infrastructure entrepôt de données. Il existe une grande différence entre les métadonnées opérationnelles et les métadonnées DSS. Les métadonnées opérationnelles sont principalement destinées au développeur et au

programmeur. Les métadonnées DSS sont principalement destinées à l'utilisateur final. Les métadonnées existantes dans les applications ERP ou ODS doivent être converties, et cette conversion n'est pas toujours facile et directe.

SOURCE DES DONNÉES ERP

Si l'ERP est utilisé comme fournisseur de donner le entrepôt de données il doit y avoir une interface solide qui déplace le donner de l'environnement ERP à l'environnement entrepôt de données. L'interface doit :

▪ être facile à utiliser
▪ permettre l'accès à donner de l'ERP
▪ prendre le sens de donner qui sont sur le point d'être déplacés vers entrepôt de données
▪ connaître les limitations de l'ERP qui peuvent survenir lors de l'accès au donner de l'ERP:
▪ intégrité référentielle
▪ relations hiérarchiques
▪ relations logiques implicites
▪ convention d'application
▪ toutes les structures de donner pris en charge par l'ERP, et ainsi de suite ...
▪ être efficace dans l'accès donner, en fournissant:
▪ mouvement direct de donner
▪ acquisition du changement donner
▪ soutenir l'accès en temps opportun à donner
▪ comprendre le format de donner, etc… INTERFACE AVEC SAP L’interface peut être de deux types, locale ou commerciale. Certaines des principales interfaces de trading incluent :

▪ SAS
▪ Solutions Prims
▪ D2k, et ainsi de suite… PLUSIEURS TECHNOLOGIES ERP Traiter l’environnement ERP comme s’il s’agissait d’une seule technologie est une grave erreur. Il existe de nombreuses technologies ERP, chacune avec ses propres atouts. Les vendeurs les plus connus sur le marché sont :

▪ SAP
▪ Oracle Finances
▪ PeopleSoft
▪ JD Edwards
▪ Baan SAP SAP est le logiciel ERP le plus vaste et le plus complet. Les applications SAP incluent de nombreux types d'applications dans de nombreux domaines. SAP a la réputation d'être :

▪ très grand
▪ très difficile et coûteux à mettre en œuvre
▪ nécessite de nombreuses personnes et consultants pour être mis en œuvre
▪ nécessite des personnes spécialisées pour la mise en œuvre
▪ est long à mettre en œuvre. Par ailleurs, SAP a la réputation de mémoriser ses donner très soigneusement, ce qui rend difficile l'accès à ceux-ci pour une personne extérieure à la zone SAP. La force de SAP est qu'il est capable de capturer et de stocker une grande quantité de données. donner. SAP a récemment annoncé son intention d'étendre ses applications à entrepôt de données. Il existe de nombreux avantages et inconvénients à utiliser SAP en tant que fournisseur entrepôt de données. Un avantage est que SAP est déjà installé et que la plupart des consultants connaissent déjà SAP.
Les inconvénients d'avoir SAP comme fournisseur de entrepôt de données il y en a beaucoup : SAP n'a aucune expérience dans le monde des entrepôt de données Si SAP est le fournisseur de entrepôt de données, il faut « sortir » i donner de SAP al entrepôt de données. Date l'expérience d'un système fermé SAP, il est peu probable qu'il soit facile d'y faire entrer des informations de SAP (???). Il existe de nombreux environnements existants qui alimentent SAP, tels qu'IMS, VSAM, ADABAS, ORACLE, DB2, etc. SAP insiste sur une approche « non inventée ici ». SAP ne souhaite pas s'associer à d'autres fournisseurs pour utiliser ou créer le entrepôt de données. SAP insiste pour générer lui-même tous ses logiciels.

Bien que SAP soit une entreprise grande et puissante, elle tente de réécrire la technologie ELT, OLAP, l'administration système et même le code de base de dbm c'est juste fou. Au lieu d'adopter une attitude coopérative avec les fournisseurs de entrepôt de données Depuis longtemps, SAP suit l'approche « ils savent mieux ». Cette attitude freine le succès que SAP pourrait avoir dans le domaine de entrepôt de données.
Le refus de SAP de permettre aux fournisseurs externes d'accéder rapidement et gracieusement à leurs donner. L'essence même de l'utilisation d'un entrepôt de données est un accès facile à donner. Toute l'histoire de SAP repose sur le fait de rendre l'accès difficile donner.
Le manque d'expérience de SAP dans le traitement de gros volumes de donner; dans le domaine de entrepôt de données il y a des volumes de donner jamais vu par SAP et pour gérer ces grandes quantités de donner vous devez disposer d’une technologie adaptée. SAP n'a apparemment pas conscience de cette barrière technologique qui existe pour entrer dans le domaine de entrepôt de données.
Culture d'entreprise de SAP : SAP s'est donné pour mission d'obtenir le donner du système. Mais pour cela, il faut avoir une mentalité différente. Traditionnellement, les éditeurs de logiciels qui réussissaient à transférer des données dans un environnement ne réussissaient pas à faire passer les données dans l'autre sens. Si SAP parvient à réaliser ce type de changement, elle sera la première entreprise à le faire.

En bref, on peut se demander si une entreprise devrait choisir SAP comme fournisseur entrepôt de données. Il y a des risques très sérieux d’une part et très peu de récompenses de l’autre. Mais il existe une autre raison qui décourage le choix de SAP comme fournisseur. entrepôt de données. Parce que chaque entreprise devrait avoir le même entrepôt de données que toutes les autres sociétés ? Le entrepôt de données c'est le cœur de l'avantage concurrentiel. Si chaque entreprise adoptait le même entrepôt de données il serait difficile, voire impossible, d’obtenir un avantage concurrentiel. SAP semble penser qu'un entrepôt de données cela peut être considéré comme un cookie et c'est un signe supplémentaire de leur mentalité « d'intégrer les données » dans les applications.

Aucun autre fournisseur ERP n'est aussi dominant que SAP. Il y aura sans aucun doute des entreprises qui suivront le chemin de SAP pour elles entrepôt de données mais probablement ceux-ci entrepôt de données SAP sera volumineux, coûteux et long à créer.

Ces environnements incluent des activités telles que le traitement des guichets bancaires, les processus de réservation des compagnies aériennes, les processus de réclamation d'assurance, etc. Plus le système transactionnel était performant, plus la nécessité de séparer le processus opérationnel et le DSS (Decision Support System) était évidente. Cependant, avec les systèmes RH et du personnel, vous n’êtes jamais confronté à de gros volumes de transactions. Et bien sûr, lorsqu’une personne est embauchée ou quitte l’entreprise, il s’agit d’un enregistrement d’une transaction. Mais par rapport à d’autres systèmes, les systèmes RH et du personnel ne comportent tout simplement pas beaucoup de transactions. Par conséquent, dans les systèmes RH et du personnel, il n’est pas tout à fait évident qu’un DataWarehouse soit nécessaire. À bien des égards, ces systèmes représentent la fusion des systèmes DSS.

Mais il y a un autre facteur à prendre en compte si vous avez affaire à des entrepôts de données et à PeopleSoft. Dans de nombreux environnements, je donner des ressources humaines et personnelles sont secondaires par rapport à l'activité principale de l'entreprise. La plupart des entreprises se consacrent à la fabrication, à la vente, à la fourniture de services, etc. Les ressources humaines et les systèmes de gestion du personnel sont généralement secondaires (ou soutiennent) le secteur d'activité principal de l'entreprise. Il est donc équivoque et peu pratique entrepôt de données distinct pour les ressources humaines et le soutien au personnel.

PeopleSoft est très différent de SAP à cet égard. Avec SAP, il est obligatoire qu'il y ait un entrepôt de données. Avec PeopleSoft, ce n'est pas si clair. Un entrepôt de données est facultatif avec PeopleSoft.

La meilleure chose que l'on puisse dire pour le donner PeopleSoft est que le entrepôt de données peut être utilisé pour archiver je donner relatifs aux ressources humaines et personnelles anciennes. Une deuxième raison pour laquelle une entreprise voudrait utiliser un entrepôt de données a

L’inconvénient de l’environnement PeopleSoft est de permettre l’accès et le libre accès aux outils d’analyse, de donner par PeopleSoft. Mais au-delà de ces raisons, il peut y avoir des cas où il est préférable de ne pas disposer d'un entrepôt de données pour donner PeopleSoft.

En bref

Il existe de nombreuses idées concernant la construction d'un entrepôt de données au sein d'un logiciel ERP.
Certains d'entre eux sont:

▪ Il est logique d'avoir un entrepôt de données c'est comme n'importe quoi d'autre dans l'industrie ?
▪ Quelle est la flexibilité d'un ERP entrepôt de données logiciel?
▪ Un ERP entrepôt de données le logiciel peut gérer un volume de donner qui est situé dans un "entrepôt de données arène"?
▪ Quel est l'enregistrement de trace effectué par le fournisseur ERP face à une solution simple et peu coûteuse, en termes de temps, donner? (quel est le bilan des fournisseurs d’ERP en matière de livraison de données peu coûteuses, ponctuelles et faciles d’accès ?)
▪ Quelle est la compréhension du fournisseur ERP de l'architecture DSS et de l'usine d'informations d'entreprise ?
▪ Les fournisseurs d'ERP comprennent comment réaliser donner dans l'environnement, mais aussi comprendre comment les exporter ?
▪ Dans quelle mesure le fournisseur ERP est-il ouvert aux outils d'entreposage de données ?
Toutes ces considérations doivent être prises en compte pour déterminer où placer le entrepôt de données qui va héberger je donner ERP et autres donner. En général, sauf raison impérieuse de faire autrement, il est recommandé de construire entrepôt de données en dehors de l'environnement du fournisseur ERP. CHAPITRE 1 Présentation des points clés de l'organisation BI :
Les référentiels d'informations fonctionnent à l'inverse de l'architecture de business intelligence (BI) :
La culture d'entreprise et l'informatique peuvent limiter le succès de la création d'organisations BI.

La technologie n'est plus le facteur limitant pour les organisations BI. La question pour les architectes et les planificateurs de projets n’est pas de savoir si la technologie existe, mais plutôt de savoir s’ils peuvent mettre en œuvre efficacement la technologie disponible.

Pour de nombreuses entreprises, un entrepôt de données ce n'est guère plus qu'un dépôt passif qui distribue les donner aux utilisateurs qui en ont besoin. LE donner ils sont extraits des systèmes sources et sont renseignés dans les structures cibles de entrepôt de données. Les donner ils peuvent également être nettoyés avec un peu de chance. Cependant, aucune valeur supplémentaire n'est ajoutée ou collectée par donner au cours de ce processus.

Essentiellement, le Dw passif, au mieux, ne fournit que i donner propre et opérationnel aux associations d’usagers. La création d’informations et la compréhension analytique dépendent entièrement des utilisateurs. Jugez si le DW (Entrepôt de données) est une réussite, c'est subjectif. Si nous jugeons le succès sur la capacité à collecter, intégrer et nettoyer efficacement les donner entreprise sur une base prévisible, alors oui, le DW est un succès. En revanche, si l’on considère la collecte, la consolidation et l’exploitation de l’information par l’organisation dans son ensemble, alors la DW est un échec. Un DW fournit peu ou pas de valeur informative. En conséquence, les utilisateurs sont contraints de se débrouiller, créant ainsi des silos d’informations. Ce chapitre présente une vue globale pour résumer l'architecture BI (Business Intelligence) de l'entreprise. Nous commençons par une description de la BI, puis passons aux discussions sur la conception et le développement de l'information, par opposition à la simple fourniture d'informations. donner aux utilisateurs. Les discussions portent ensuite sur le calcul de la valeur de vos efforts BI. Nous concluons en définissant comment IBM répond aux exigences architecturales BI de votre organisation.

Description architecturale de organisation de la BI

De puissants systèmes d'information orientés transactions sont désormais monnaie courante dans toutes les grandes entreprises, égalisant ainsi les règles du jeu pour les entreprises du monde entier.

Toutefois, pour rester compétitif, il faut désormais des systèmes orientés analytiquement qui peuvent révolutionner la capacité de l'entreprise à redécouvrir et à utiliser les informations qu'elle possède déjà. Ces systèmes analytiques découlent de la compréhension de la richesse de donner disponible. La BI peut améliorer les performances dans toute l’entreprise. Les entreprises peuvent améliorer les relations client-fournisseur, améliorer la rentabilité des produits et services, générer de nouvelles et meilleures offres, contrôler les risques et, entre autres gains, réduire considérablement leurs dépenses. Avec la BI, votre entreprise commence enfin à utiliser les informations clients comme un atout compétitif grâce à des applications qui ont des objectifs de marché.

Disposer des bons outils business, c’est avoir des réponses définitives à des questions clés telles que :

▪ Lequel des nôtres clientèle nous font-ils gagner plus ou nous font-ils perdre de l’argent ?
▪ Où vivent nos meilleurs clientèle par rapport à boutique/entrepôt qu'ils fréquentent ?
▪ Lesquels de nos produits et services peuvent être vendus le plus efficacement et à qui ?
▪ Quels produits peuvent être vendus le plus efficacement et à qui ?
▪ Quelle campagne commerciale est la plus réussie et pourquoi ?
▪ Quels canaux de vente sont les plus efficaces pour quels produits ?
▪ Comment pouvons-nous améliorer les relations avec nos meilleurs collaborateurs clientèle? La plupart des entreprises ont donner des manières approximatives de répondre à ces questions.
Les systèmes opérationnels génèrent de grandes quantités de produits, de clients et donner marché depuis les points de vente, les réservations, le service client et les systèmes de support technique. Le défi est d’extraire et d’exploiter ces informations. De nombreuses entreprises ne profitent que d’une petite fraction de leurs revenus. donner pour les analyses stratégiques.
I donner restant, souvent rejoint avec moi donner dérivée de sources externes telles que des rapports gouvernementaux et d’autres informations achetées, est une mine d’or qui ne demande qu’à être explorée, et donner ils doivent simplement être affinés dans le contexte informationnel de votre organisation.

Ces connaissances peuvent être appliquées de plusieurs manières, allant de la conception d'une stratégie globale d'entreprise à la communication personnelle avec les fournisseurs, en passant par les centres d'appels, la facturation, Internet et d'autres points. L'environnement commercial actuel exige que DW et les solutions BI associées évoluent au-delà des structures commerciales traditionnelles. donner que je donner normalisés au niveau atomique et les « fermes étoiles/cubes ».

Ce qu’il faut pour rester compétitif, c’est une fusion des technologies traditionnelles et avancées dans le but de prendre en charge un vaste paysage analytique.
En conclusion, l'environnement général doit améliorer la connaissance de l'entreprise dans son ensemble, en veillant à ce que les actions menées à la suite des analyses réalisées soient utiles pour que chacun en profite.

Par exemple, disons que vous classez le vôtre clientèle en catégories à risque élevé ou faible.
Si ces informations sont générées par un extracteur de modèle ou d'autres moyens, elles doivent être introduites dans le DW et rendues accessibles à tous, au moyen de tout outil d'accès, tel que des rapports statiques, des feuilles de calcul, des tableaux ou un traitement analytique en ligne (OLAP). .

Cependant, à l’heure actuelle, une grande partie de ce type d’informations reste cloisonnée. donner des individus ou des services qui génèrent l’analyse. L’organisation, dans son ensemble, a peu ou pas de visibilité pour comprendre. Ce n'est qu'en intégrant ce type de contenu d'informations dans votre DW d'entreprise que vous pourrez éliminer les silos d'informations et élever votre environnement DW.
Il existe deux obstacles majeurs au développement d’une organisation BI.
Premièrement, nous avons le problème de l’organisation elle-même et de sa discipline.
Même si nous ne pouvons pas contribuer aux changements de politique organisationnelle, nous pouvons vous aider à comprendre les composants de la BI d'une organisation, son architecture et la manière dont la technologie IBM facilite son développement.
Le deuxième obstacle à surmonter est le manque de technologie intégrée et de connaissance d’une méthode qui aborde l’ensemble de l’espace BI plutôt qu’un petit composant.

IBM s'attaque aux changements dans la technologie d'intégration. Il est de votre responsabilité de fournir une conception réfléchie. Cette architecture doit être développée avec une technologie choisie pour une intégration sans contrainte, ou à tout le moins, avec une technologie adhérant à des standards ouverts. De plus, la direction de votre entreprise doit s'assurer que le projet de BI est réalisé conformément au plan et ne pas permettre le développement de silos d'informations résultant de programmes ou d'objectifs égoïstes.
Cela ne veut pas dire que l’environnement BI n’est pas sensible à la réaction aux différents besoins et exigences des différents utilisateurs ; cela signifie plutôt que la mise en œuvre de ces besoins et exigences individuels se fait au profit de l’ensemble de l’organisation BI.
Une description de l'architecture de l'organisation BI est disponible à la page 9 dans la figure 1.1. L'architecture démontre un riche mélange de technologies et de techniques.
Du point de vue traditionnel, l'architecture comprend les composants d'entrepôt suivants

Couche atomique.

C’est le fondement, le cœur de l’ensemble du DW et donc du reporting stratégique.
I donner stocké ici conservera l’intégrité historique, les relations de donner et incluent des métriques dérivées, tout en étant nettoyées, intégrées et stockées à l'aide de l'extraction de modèle.
Toute utilisation ultérieure de ceux-ci donner et les informations associées sont dérivées de cette structure. C'est une excellente source pour l'exploitation minière donner et pour les rapports avec des requêtes SQL structurées

Entrepôt opérationnel de donner ou rapporter la base de donner(Magasin de données opérationnelles (ODS) ou reporting base de données.)

Il s'agit d'une structure de donner spécialement conçu pour les rapports techniques.

I donner stockés et signalés au-dessus de ces structures peuvent finalement se propager dans l'entrepôt via la zone de transit, où ils pourraient être utilisés pour la signalisation stratégique.

Zone de transit.

Le premier arrêt pour la plupart donner destinée à l'environnement de l'entrepôt est la zone d'organisation.
Ici je donner ils sont intégrés, nettoyés et transformés en donner des bénéfices qui peupleront la structure de l'entrepôt

Date marts.

Cette partie de l'architecture représente la structure de donner utilisé spécifiquement pour OLAP. La présence de datamarts, si je donner sont stockés dans les schémas en étoile qui se chevauchent donner multidimensionnel dans un environnement relationnel, ou dans les fichiers de donner Les informations confidentielles utilisées par une technologie OLAP spécifique, telle que DB2 OLAP Server, ne sont pas pertinentes.

La seule contrainte est que l'architecture facilite l'utilisation de donner multidimensionnel.
L'architecture comprend également des technologies et techniques Bi critiques qui se distinguent par :

Analyse spatiale

L’espace est une aubaine d’informations pour l’analyste et est essentiel à la résolution complète du problème. L'espace peut représenter des informations sur les personnes qui vivent dans un certain endroit, ainsi que des informations sur la position physique de cet emplacement par rapport au reste du monde.

Pour effectuer cette analyse, vous devez commencer par lier vos informations aux coordonnées de latitude et de longitude. C'est ce qu'on appelle le « géocodage » et doit faire partie du processus d'extraction, de transformation et de chargement (ETL) au niveau atomique de votre entrepôt.

Exploration de données.

L'extraction de donner permet à nos entreprises d'augmenter le nombre de clientèle, pour prédire les tendances des ventes et permettre la gestion des relations avec clientèle (CRM), entre autres initiatives BI.

L'extraction de donner il doit donc être intégré aux structures de donner du Dwhouse et soutenu par des processus d'entrepôt pour garantir à la fois l'utilisation efficace et efficiente de la technologie et des techniques pertinentes.

Comme indiqué dans l'architecture BI, le niveau atomique du Dwhouse, ainsi que les datamarts, sont une excellente source d'information. donner pour l'extraction. Ces mêmes installations doivent également être destinataires des résultats d’extraction pour garantir leur disponibilité au public le plus large.

Agents.

Il existe différents « agents » pour examiner le client sur tous les points, tels que les systèmes d'exploitation de l'entreprise et les logiciels eux-mêmes. Ces agents peuvent être des réseaux neuronaux avancés formés pour connaître les tendances à chaque point, comme la demande future de produits basée sur les promotions des ventes, les moteurs basés sur des règles pour réagir à un date un ensemble de circonstances, voire de simples agents qui signalent les exceptions aux « hauts dirigeants ». Ces processus se produisent généralement en temps réel et doivent donc être étroitement liés à leur mouvement. donner. Toutes ces structures de donner, technologies et techniques garantissent que vous ne passerez pas la nuit à générer une organisation de votre BI.

Cette activité sera développée par étapes progressives, pour de petits points.
Chaque étape est un effort de projet indépendant et est appelée une itération dans votre initiative DW ou BI. Les itérations peuvent inclure la mise en œuvre de nouvelles technologies, en commençant par de nouvelles techniques, en ajoutant de nouvelles structures donner , je charge donner supplémentaires, ou avec l'élargissement de l'analyse de votre environnement. Ce paragraphe est abordé plus en profondeur au chapitre 3.

En plus des structures DW et des outils BI traditionnels, vous devez concevoir d'autres fonctions de votre organisation BI, telles que :

Points de contact client (contact client points).

Comme dans toute organisation moderne, il existe un certain nombre de points de contact client qui indiquent comment vivre une expérience positive pour la vôtre. clientèle. Il existe des canaux traditionnels tels que les détaillants, les standardistes, le publipostage, la publicité multimédia et imprimée, ainsi que des canaux plus actuels tels que le courrier électronique et le Web, donner les produits ayant un certain point de contact doivent être acquis, transportés, nettoyés, traités puis remplis dans les installations donner de BI.

Bases de donner associations opérationnelles et d'utilisateurs (Opérationnel

bases de données et communautés d’utilisateurs).
A la fin des points de contact du clientèle les fondations sont trouvées donner application de l'entreprise et des communautés d'utilisateurs. LES donner existants sont donner traditionnel qui doit être réuni et fusionné avec le donner qui découlent des points de contact pour satisfaire les informations nécessaires.

Analystes. (Analystes)

Le principal bénéficiaire de l’environnement BI est l’analyste. C'est lui qui profite de l'extraction actuelle de donner opérationnel, intégré à différentes sources de donner , augmenté de fonctionnalités telles que l'analyse géographique (géocodage) et présenté dans les technologies BI qui permettent l'extraction, OLAP, le reporting SQL avancé et l'analyse géographique. La principale interface d'analyste pour l'environnement de reporting est le portail BI.

Cependant, l’analyste n’est pas le seul à bénéficier de l’architecture BI.
Dirigeants, grandes associations d'utilisateurs et même partenaires, fournisseurs et i clientèle ils devraient trouver des avantages dans la BI d'entreprise.

Boucle de retour.

L'architecture BI est un environnement d'apprentissage. Un principe caractéristique du développement est de permettre aux structures persistantes de donner être mis à jour par la technologie BI utilisée et par les actions entreprises par l'utilisateur. Un exemple est la notation des clients.

Si le service commercial modélise les scores des clients pour utiliser un nouveau service, alors le service commercial ne devrait pas être le seul groupe à bénéficier du service.

Au lieu de cela, l'extraction de modèles doit être effectuée comme une partie naturelle du flux de données au sein de l'entreprise et les scores des clients doivent devenir une partie intégrée du contexte des informations de l'entrepôt, visible par tous les utilisateurs. La suite IBM centrée sur Bi-bI comprenant DB2 UDB et DB2 OLAP Server comprend la plupart des principaux composants technologiques définis dans la figure 1.1.

Nous utilisons l'architecture telle qu'elle apparaît dans cette figure du livre pour nous donner un niveau de continuité et démontrer comment chaque produit IBM s'intègre dans le schéma BI global.

Fournir le contenu de l'information (fournir contenu de l'information)

Concevoir, développer et mettre en œuvre votre environnement BI est une tâche ardue. La conception doit tenir compte des exigences commerciales actuelles et futures. Le dessin architectural doit être complet pour inclure toutes les conclusions trouvées lors de la phase de conception. L'exécution doit rester engagée dans un seul objectif : développer l'architecture BI telle que formellement présentée dans la conception et ancrée dans les exigences de l'entreprise.

Il est particulièrement difficile d’affirmer que la discipline garantira un succès relatif.
C'est simple car vous ne développez pas un environnement BI d'un seul coup, mais vous le faites par petites étapes au fil du temps.

Cependant, l'identification des composants BI de votre architecture est importante pour deux raisons : Vous guiderez toutes les décisions d'architecture technique ultérieures.
Vous serez en mesure de planifier consciemment une utilisation particulière de la technologie, même si vous n’en aurez peut-être pas besoin avant plusieurs mois.

Comprendre suffisamment les besoins de votre entreprise influencera le type de produits que vous acquérez pour votre architecture.
Concevoir et développer votre architecture garantit que votre entrepôt est

Il ne s’agit pas d’un événement aléatoire, mais plutôt d’un « événement bien pensé » soigneusement construit. opera de l'art comme une mosaïque de technologies mixtes.

Concevoir le contenu des informations

Toute conception initiale doit se concentrer sur et identifier les composants BI clés qui seront nécessaires à l'environnement global, aujourd'hui et à l'avenir.
Il est important de connaître les exigences commerciales.

Même avant le début de toute conception formelle, le planificateur de projet peut souvent identifier immédiatement un ou deux composants.
Cependant, l’équilibre des composants qui peuvent être nécessaires à votre architecture n’est pas facile à trouver. Pendant la phase de conception, la partie principale de l'architecture lie la session de développement d'applications (JAD) à une quête d'identification des besoins métier.

Parfois, ces exigences peuvent être confiées à des outils de requête et de reporting.
Par exemple, les utilisateurs déclarent que s'ils souhaitent automatiser un rapport actuel, ils doivent le générer manuellement en intégrant deux rapports actuels et en ajoutant des calculs dérivés de la combinaison des deux rapports actuels. donner.
Bien que cette exigence soit simple, elle définit une certaine fonctionnalité de la fonctionnalité que vous devez inclure lors de l'achat d'outils de reporting pour votre organisation.

Le concepteur doit également répondre à des exigences supplémentaires pour obtenir une image complète. Les utilisateurs souhaitent-ils s'abonner à ce rapport ?
Des sous-ensembles de rapports sont-ils générés et envoyés par courrier électronique à différents utilisateurs ? Veulent-ils voir ce rapport sur le portail de l'entreprise ? Toutes ces exigences font partie de la simple nécessité de remplacer un rapport manuel à la demande des utilisateurs. L’avantage de ce type d’exigences est que tout le monde, utilisateurs et concepteurs, comprend le concept de rapports.

Il existe cependant d’autres types d’entreprises pour lesquelles nous devons planifier. Lorsque les exigences commerciales sont énoncées sous la forme de questions commerciales stratégiques, il est facile pour le concepteur expert de discerner les exigences de mesure/de fait et les exigences dimensionnelles.

Si les utilisateurs de JAD ne savent pas comment énoncer leurs exigences sous la forme d'un problème métier, le concepteur fournira souvent des exemples pour relancer la session de collecte des exigences.
Le concepteur expert peut aider les utilisateurs à comprendre non seulement le trading stratégique, mais également comment le créer.
L'approche de collecte des exigences est abordée au chapitre 3 ; pour l'instant, nous voulons simplement souligner la nécessité de concevoir pour tous les types d'exigences BI.

Un problème commercial stratégique n’est pas seulement une exigence commerciale, mais aussi un indice de conception. Si vous devez répondre à une question multidimensionnelle, alors vous devez mémoriser, présenter donner dimensions, et si vous avez besoin de mémoriser les donner multidimensionnel, vous devez décider quel type de technologie ou de technique vous allez utiliser.

Implémentez-vous un schéma de cube en étoile réservé, ou les deux ? Comme vous pouvez le constater, même un simple problème commercial peut influencer considérablement la conception. Mais ces types d’exigences commerciales sont courants et compris, du moins par les concepteurs et les planificateurs ayant une expérience en matière de projets.

Il y a eu suffisamment de discussions sur les technologies et le support OLAP, et un large éventail de solutions sont disponibles. Jusqu’à présent, nous avons mentionné la nécessité de combiner des rapports simples avec des exigences métier, et la manière dont ces exigences influencent les décisions architecturales techniques.

Mais quelles sont les exigences qui ne sont pas facilement comprises par les utilisateurs ou l'équipe Dw ? Aurez-vous un jour besoin d’une analyse spatiale ?
Les modèles miniers de donner seront-ils une partie nécessaire de votre avenir ? Qui sait?

Il est important de noter que ces types de technologies ne sont pas bien connus des communautés d'utilisateurs en général et des membres de l'équipe Dw, en partie parce qu'elles sont généralement gérées par des experts techniques internes ou tiers. Il s’agit d’un cas extrême des problèmes que génèrent ce type de technologies. Si les utilisateurs ne peuvent pas décrire les exigences métier ou les formuler de manière à guider les concepteurs, ils peuvent passer inaperçus ou, pire encore, tout simplement ignorés.

Cela devient encore plus problématique lorsque le concepteur et le développeur ne peuvent pas reconnaître l'application de l'une de ces technologies avancées mais critiques.
Comme nous l'avons souvent entendu dire par les designers : « eh bien, pourquoi ne pas le mettre de côté jusqu'à ce que nous obtenions cette autre chose ? « Sont-ils vraiment intéressés par les priorités, ou évitent-ils simplement les exigences qu'ils ne comprennent pas ? Il s’agit très probablement de la dernière hypothèse. Supposons que votre équipe commerciale ait communiqué une exigence commerciale, comme indiqué dans la figure 1.3, comme vous pouvez le constater, l'exigence est formulée sous la forme d'un problème commercial. La différence entre ce problème et le problème dimensionnel typique est la distance. Dans ce cas, l'équipe commerciale souhaite connaître, sur une base mensuelle, les ventes totales des produits, des entrepôts et clientèle qui habitent à moins de 5 miles de l’entrepôt où ils achètent.

Malheureusement, les concepteurs ou les architectes peuvent simplement ignorer la composante spatiale en disant : « nous avons le client, le produit et le donner du dépôt. Gardons la distance jusqu'à une autre itération.

"Mauvaise réponse. Ce type de problème commercial concerne uniquement la BI. Il représente une compréhension plus approfondie de notre activité et un espace analytique robuste pour nos analystes. La BI va au-delà des simples requêtes ou des rapports standard, ou même d'OLAP. Cela ne veut pas dire que ces technologies ne sont pas importantes pour votre BI, mais elles ne représentent pas à elles seules l’environnement BI.

Conception pour le contexte d'information (Conception pour le contenu d'information)

Maintenant que nous avons identifié les exigences métier qui distinguent les différents composants fondamentaux, il faut les inclure dans une conception architecturale globale. Certains composants BI font partie de nos efforts initiaux, tandis que d’autres ne seront pas mis en œuvre avant plusieurs mois.

Cependant, toutes les exigences connues sont reflétées dans la conception, de sorte que lorsque nous devons mettre en œuvre une technologie particulière, nous sommes prêts à le faire. Quelque chose dans le projet reflétera la pensée traditionnelle.

Cet ensemble de donner est utilisé pour prendre en charge les utilisations ultérieures de donner dimensionnelle guidée par les problématiques Business que nous avons identifiées. À mesure que des documents supplémentaires sont générés, tels que le développement de la conception de donner, nous allons commencer à formaliser comment je donner ils se propagent dans l'environnement. Nous avons constaté la nécessité de représenter je donner de manière dimensionnelle, en les divisant (selon des besoins spécifiques spécifiques) en data marts.

La prochaine question à laquelle il faut répondre est la suivante : comment ces data marts seront-ils construits ?
Construisez-vous les étoiles pour soutenir les cubes, ou seulement les cubes, ou seulement les étoiles ? (ou bons cubes, ou bonnes étoiles). Générer une architecture pour les datamarts dépendants qui nécessitent une couche atomique pour tous donner acquis? Autoriser l'acquisition de data marts indépendants donner directement à partir des systèmes d'exploitation?

Quelle technologie de cube allez-vous essayer de standardiser?

Vous avez d'énormes quantités de dieux donner requis pour l'analyse dimensionnelle ou avez-vous besoin de cubes de votre force de vente nationale sur une base hebdomadaire ou les deux ? Créez-vous quelque chose d'aussi puissant que DB2 OLAP Server pour la finance ou les cubes Cognos PowerPlay pour votre organisation commerciale, ou les deux ? Ce sont les grandes décisions de conception architecturale qui auront désormais un impact sur votre environnement BI. Oui, vous avez établi un besoin pour OLAP. Maintenant, comment allez-vous mettre en œuvre ce type de technique et de technologie ?

Comment certaines des technologies les plus avancées affectent-elles vos conceptions ? Supposons que vous ayez identifié un besoin d'espace dans votre organisation. Vous devez désormais rappeler les éditions de dessins d'architecture même si vous ne prévoyez pas de réaliser de composants spatiaux avant plusieurs mois. L'architecte doit concevoir aujourd'hui en fonction de ce qui est nécessaire. Prédire le besoin d'analyses spatiales qui génèrent, stockent, exécutent et donnent accès à donner spatial. Cela devrait à son tour constituer une contrainte concernant le type de technologie logicielle et les spécifications de plate-forme que vous pouvez actuellement envisager. Par exemple, le système d'administration de base de données La couche relationnelle (SGBDR) que vous effectuez pour votre couche atomique doit disposer d'une étendue spatiale robuste. Cela garantirait des performances maximales lors de l’utilisation d’objets géométriques et spatiaux dans vos applications analytiques. Si votre SGBDR ne peut pas gérer le donner (spatial-centrique) en interne, vous devrez donc établir une base de données (spatial-centrique) externe. Cela complique la gestion des problèmes et compromet vos performances globales, sans parler des problèmes supplémentaires créés pour vos administrateurs de base de données, car ils ont probablement une compréhension minimale des bases de donner spatiale également. D'un autre côté, si votre moteur RDMBS gère tous les composants spatiaux et que son optimiseur est conscient des besoins particuliers (par exemple, indexation) des objets spatiaux, alors vos administrateurs de base de données peuvent facilement gérer la gestion des problèmes et vous pouvez maximiser les performances.

De plus, vous devez ajuster la zone de transit et la couche d'environnement atomique pour inclure le nettoyage des adresses (un

élément clé de l'analyse spatiale), ainsi que la sauvegarde ultérieure des objets spatiaux. La succession des éditions de dessins se poursuit maintenant que nous avons introduit la notion de direction claire. D'une part, cette application dictera le type de logiciel nécessaire à votre effort ETL.

Avez-vous besoin de produits comme Trillium pour lui fournir une adresse propre, ou d'un fournisseur ETL de votre choix pour fournir cette fonctionnalité ?
Pour l’instant, il est important que vous appréciiez le niveau de conception qui doit être réalisé avant de commencer la mise en œuvre de votre entrepôt. Les exemples ci-dessus doivent démontrer la multitude de décisions de conception qui doivent suivre l'identification d'une exigence commerciale particulière. Si elles sont prises correctement, ces décisions de conception favorisent l'interdépendance entre les structures physiques de votre environnement, le choix de la technologie utilisée et le flux de propagation du contenu de l'information. Sans cette architecture BI conventionnelle, votre organisation sera soumise à un mélange chaotique de technologies existantes, au mieux vaguement assemblées pour offrir une apparente stabilité.

Maintenir le contenu des informations

Apporter la valeur de l’information à votre organisation est une tâche très difficile. Sans une compréhension et une expérience suffisantes, ou sans une planification et une conception appropriées, même les meilleures équipes échoueront. D’un autre côté, si vous avez une grande intuition et une planification détaillée mais aucune discipline d’exécution, vous venez de perdre votre temps et votre argent car vos efforts sont voués à l’échec. Le message doit être clair : si vous manquez d'une ou plusieurs de ces compétences, compréhension/expérience ou discipline de planification/conception ou de mise en œuvre, cela paralysera ou détruira la construction de l'organisation BI.

Votre équipe est-elle suffisamment préparée ? Y a-t-il quelqu'un dans votre équipe BI qui comprend le vaste paysage analytique disponible dans les environnements BI, ainsi que les techniques et technologies nécessaires pour maintenir ce paysage ? Y a-t-il quelqu'un dans votre équipe qui peut reconnaître la différence d'application entre les applications avancées

reporting statique et OLAP, ou les différences entre ROLAP et OLAP ? L'un des membres de votre équipe reconnaît-il clairement comment extraire et quel impact cela peut avoir sur l'entrepôt ou comment l'entrepôt peut soutenir les performances d'extraction ? Un membre de l’équipe comprend la valeur de donner technologie spatiale ou basée sur des agents ? Avez-vous quelqu'un qui apprécie l'application unique des outils ETL par rapport à la technologie des courtiers de messages ? Si vous n'en avez pas, procurez-vous-en un. La BI est bien plus grande qu'une couche atomique normalisée, OLAP, des schémas en étoile et un ODS.

Avoir la compréhension et l’expérience nécessaires pour reconnaître les exigences BI et leurs solutions est essentiel pour votre capacité à formaliser correctement les besoins des utilisateurs et à concevoir et mettre en œuvre leurs solutions. Si votre communauté d'utilisateurs a des difficultés à décrire ses exigences, il incombe à l'équipe de l'entrepôt de fournir cette compréhension. Mais si l'équipe de l'entrepôt

ne reconnaît pas l'application spécifique de la BI - par exemple, l'exploration de données - alors ce n'est pas la meilleure chose que les environnements BI se limitent souvent à être des référentiels passifs. Cependant, ignorer ces technologies ne diminue en rien leur importance et l'effet qu'elles ont sur l'émergence des capacités de business intelligence de votre organisation, ainsi que sur le paysage informationnel que vous envisagez de favoriser.

La planification doit inclure la notion de dessin, et les deux nécessitent une personne compétente. De plus, la conception nécessite une philosophie d’entrepôt en équipe et le respect des normes. Par exemple, si votre entreprise a établi une plate-forme standard ou a identifié un SGBDR particulier que vous souhaitez normaliser sur l'ensemble de la plate-forme, il incombe à tous les membres de l'équipe d'adhérer à ces normes. Généralement, une équipe expose le besoin de normalisation (aux communautés d'utilisateurs), mais l'équipe elle-même n'est pas disposée à adhérer aux normes également établies dans d'autres domaines de l'entreprise ou peut-être même dans des entreprises similaires. Non seulement c’est hypocrite, mais cela démontre que l’entreprise est incapable d’exploiter les ressources et les investissements existants. Cela ne signifie pas qu’aucune situation ne justifie une plate-forme ou une technologie non standardisée ; cependant, les efforts d'entrepôt

ils doivent jalousement protéger les normes de l'entreprise jusqu'à ce que les exigences commerciales en décident autrement.

Le troisième élément clé nécessaire à la construction d’une organisation BI est la discipline.
Cela dépend en totalité, autant des individus que de l’environnement. Les planificateurs de projets, les sponsors, les architectes et les utilisateurs doivent apprécier la discipline nécessaire pour construire le paysage informationnel de l'entreprise. Les designers doivent orienter leurs efforts de conception de manière à compléter les autres efforts nécessaires de la société.

Par exemple, disons que votre entreprise crée une application ERP dotée d'un composant d'entrepôt.
Il est donc de la responsabilité des concepteurs ERP de collaborer avec l’équipe de l’environnement de l’entrepôt afin de ne pas concurrencer ou dupliquer le travail déjà commencé.

La discipline est également un sujet qui doit être abordé par l'ensemble de l'organisation et est généralement établie et confiée à un niveau exécutif.
Les managers sont-ils prêts à adhérer à une approche conçue ? Une approche qui promet de créer un contenu informatif qui, à terme, apportera de la valeur à tous les domaines de l'entreprise, mais qui compromet peut-être les agendas individuels ou départementaux ? Rappelez-vous le dicton « Il est plus important de penser à tout que de penser à une seule chose ». Ce dicton est vrai pour les organisations BI.

Malheureusement, de nombreux entrepôts concentrent leurs efforts sur le ciblage et la valeur ajoutée d’un service ou d’utilisateurs spécifiques, sans se soucier de l’organisation dans son ensemble. Supposons que le cadre demande l’aide de l’équipe du garrot. L'équipe répond par un effort de 90 jours qui comprend non seulement la fourniture des exigences de notification définies par le responsable, mais également la garantie que tous donner Les bases sont mélangées au niveau atomique avant d'être introduites dans la technologie du cube proposée.
Cet ajout technique garantit que l'entreprise de l'entrepôt bénéficiera de donner nécessaire au gestionnaire.
Cependant, l'exécutif s'est entretenu avec des cabinets de conseil externes qui ont proposé une application similaire avec une livraison en moins de 4 semaines.

En supposant que l’équipe interne de l’entrepôt soit compétente, le dirigeant a le choix. Qui peut prendre en charge la discipline d'ingénierie supplémentaire nécessaire pour développer l'entreprise d'actifs informationnels ou peut choisir de créer rapidement sa propre solution. Cette dernière option semble être choisie trop souvent et ne sert qu’à créer des conteneurs d’informations qui ne profitent qu’à quelques-uns ou à l’individu.

Objectifs à court et à long terme

Les architectes et les concepteurs de projets doivent formaliser une vision à long terme de l'architecture globale et des plans de croissance dans une organisation BI. Cette combinaison de gain à court terme et de planification à long terme représente les deux faces des efforts de BI. Le gain à court terme est la facette de la BI associée aux itérations de votre entrepôt.

C'est là que les planificateurs, les architectes et les sponsors se concentrent sur la satisfaction d'exigences commerciales spécifiques. C’est à ce niveau que les structures physiques sont construites, que la technologie est achetée et que les techniques sont mises en œuvre. Ils ne sont en aucun cas conçus pour répondre à des exigences spécifiques telles que définies par des communautés d'utilisateurs particulières. Tout est fait pour répondre aux exigences spécifiques définies par une communauté particulière.
Toutefois, la planification à long terme constitue l’autre facette de la BI. C'est là que les plans et les conceptions garantissaient que toute structure physique était construite, que les technologies sélectionnées et les techniques mises en œuvre étaient conçues dans un souci d'entreprise. C'est une planification à long terme qui assure la cohésion nécessaire pour garantir que les bénéfices commerciaux découlent de tout gain à court terme constaté.

Justifiez votre effort BI

Un entrepôt de données en soi, il n'a aucune valeur inhérente. En d’autres termes, il n’y a aucune valeur inhérente entre les technologies d’entrepôt et les techniques de mise en œuvre.

La valeur de tout effort d'entrepôt réside dans les actions effectuées en raison de l'environnement de l'entrepôt et du contenu informationnel cultivé au fil du temps. Il s’agit d’un point essentiel à comprendre avant de tenter d’estimer la valeur d’une initiative de localisation.

Trop souvent, les architectes et les concepteurs tentent d'appliquer une valeur aux composants physiques et techniques de l'entrepôt alors qu'en fait, la valeur est basée sur les processus métiers qui sont positivement impactés par l'entrepôt et les informations bien acquises.

C’est là que réside le défi de la mise en place de la BI : comment justifier l’investissement ? Si l'entrepôt lui-même n'a aucune valeur intrinsèque, les concepteurs du projet doivent étudier, définir et formaliser les avantages obtenus par les personnes qui utiliseront l'entrepôt pour améliorer des processus métier spécifiques ou la valeur des informations protégées, ou les deux.

Pour compliquer les choses, tout processus métier affecté par les efforts d’entreposage pourrait apporter des avantages « considérables » ou « légers ». Des avantages considérables fournissent une mesure tangible pour mesurer le retour sur investissement (ROI) – par exemple, en tournant les stocks une fois supplémentaire au cours d’une période spécifique ou en réduisant le coût de transport par expédition. Il est plus difficile de définir des avantages subtils, comme un meilleur accès à l'information, en termes de valeur tangible.

Liez votre projet pour en savoir plus sur Demandes commerciales

Trop souvent, les planificateurs de projets tentent de lier la valeur de l’entrepôt à des objectifs d’entreprise flous. En déclarant que « la valeur d'un entrepôt repose sur notre capacité à satisfaire des demandes stratégiques », nous ouvrons la discussion de manière agréable. Mais cela ne suffit pas à lui seul à déterminer s’il est judicieux d’investir dans des stocks. Il est préférable de lier les itérations de l’entrepôt à des demandes commerciales spécifiques et connues.

Mesurer le ROI

Calculer le retour sur investissement dans un entrepôt peut être particulièrement difficile. C'est particulièrement difficile si l'avantage

Le principe d’une répétition particulière est quelque chose qui n’est ni tangible ni facile à mesurer. Une étude a révélé que les utilisateurs perçoivent deux avantages principaux des initiatives BI :

▪ Créer la capacité de prendre des décisions
▪ Créer un accès à l'information
Ces avantages sont des avantages doux (ou légers). Il est facile de voir comment calculer un retour sur investissement basé sur un avantage concret (ou majeur) comme la réduction des coûts de transport, mais comment mesurer la capacité à prendre de meilleures décisions ?
Il s’agit certainement d’un défi pour les planificateurs de projets lorsqu’ils tentent de convaincre l’entreprise d’investir dans un effort particulier en matière d’entrepôt. L'augmentation des ventes ou la diminution des coûts ne sont plus les thèmes centraux qui animent l'environnement BI.
Au lieu de cela, vous étudiez les demandes des entreprises pour un meilleur accès à l'information afin qu'un service particulier puisse prendre des décisions plus rapidement. Il s’agit de facteurs stratégiques qui sont tout aussi importants pour l’entreprise, mais qui sont plus ambigus et plus difficiles à caractériser par une mesure tangible. Dans ce cas, le calcul du ROI peut être trompeur, voire hors de propos.
Les planificateurs de projet doivent être en mesure de démontrer une valeur tangible pour que les dirigeants puissent décider si l'investissement dans une itération particulière en vaut la peine. Cependant, nous ne proposerons pas de nouvelle méthode de calcul du ROI, ni n’avancerons d’arguments pour ou contre celle-ci.
Il existe de nombreux articles et livres traitant des principes fondamentaux du calcul du retour sur investissement. Il existe des propositions de valeur spéciales telles que la valeur sur investissement (VOI), proposées par des groupes comme Gartner, que vous pouvez rechercher. Au lieu de cela, nous nous concentrerons sur les aspects essentiels de tout retour sur investissement ou autre proposition de valeur que vous devez prendre en compte. Appliquer le ROI Au-delà de l’argument entre les avantages « concrets » et les avantages « immatériels » associés aux efforts de BI, il existe d’autres questions à prendre en compte lors de l’application du retour sur investissement. Par exemple:

Attribuer trop d'économies aux efforts de DW qui se produiraient de toute façon
Supposons que votre entreprise soit passée d'une architecture mainframe à un environnement UNIX distribué. Ainsi, les économies qui pourraient (ou non) être réalisées grâce à cet effort ne devraient pas être attribuées exclusivement, voire pas du tout (?), à l'entrepôt.

Ne pas tout prendre en compte coûte cher. Et il y a beaucoup de choses à prendre en compte. Considérez la liste suivante :

▪ Coût de démarrage, y compris la faisabilité.
▪ Coût du matériel dédié avec stockage et communications associés
▪ Coût du logiciel, y compris la gestion donner et extensions client/serveur, logiciels ETL, technologies DSS, outils de visualisation, applications de planification et de flux de travail et logiciels de surveillance.
▪ Coût de conception de la structure donner, avec la création et l'optimisation de
▪ Coût de développement logiciel directement associé à l'effort BI
▪ Coût du support sur site, y compris l'optimisation des performances, y compris le contrôle des versions du logiciel et les opérations d'aide Appliquez un retour sur investissement «Big-Bang». Construire l'entrepôt comme un effort unique et gigantesque est voué à l'échec, alors même calculer le retour sur investissement pour une initiative de grande entreprise. L'offre est surprenante et les planificateurs continuent de faire de faibles tentatives pour estimer la valeur de l'ensemble de l'effort. Pourquoi les planificateurs tentent-ils d’attribuer une valeur monétaire à l’initiative commerciale s’il est largement reconnu et accepté qu’il est difficile d’estimer des répétitions spécifiques ? Comment est-ce possible? Ce n’est pas possible à quelques exceptions près. Ne le fais pas. Maintenant que nous avons établi ce qu'il ne faut pas faire lors du calcul du ROI, voici quelques points qui nous aideront à établir un processus fiable pour estimer la valeur de vos efforts BI.

Obtenir un consensus sur le retour sur investissement. Quel que soit votre choix de technique pour estimer la valeur de vos efforts de BI, elle doit être acceptée par toutes les parties, y compris les concepteurs de projet, les sponsors et les dirigeants d'entreprise.

Réduisez le retour sur investissement en parties identifiables. Une étape nécessaire pour calculer raisonnablement un retour sur investissement consiste à concentrer ce calcul sur un projet spécifique. Cela vous permet ensuite d'estimer une valeur en fonction des exigences commerciales spécifiques satisfaites.

Définir les coûts. Comme mentionné, de nombreux coûts doivent être considérés. De plus, les coûts doivent inclure non seulement ceux associés à une seule itération, mais également les coûts associés à la garantie du respect des normes de l'entreprise.

Définir les avantages. En liant clairement le retour sur investissement aux exigences commerciales spécifiques, nous devrions être en mesure d'identifier les avantages qui permettront de répondre aux exigences.

Réduisez les coûts et les bénéfices en termes de bénéfices imminents. C'est le meilleur moyen de baser vos évaluations sur la valeur actuelle nette (VAN) plutôt que d'essayer de prédire la valeur future des bénéfices futurs.

Gardez le timing de partage de votre retour sur investissement au minimum. Il est bien documenté sur la longue période pendant laquelle il a été utilisé dans votre retour sur investissement.

Utilisez plusieurs formules de retour sur investissement. Il existe de nombreuses méthodes pour prévoir le retour sur investissement et vous devez planifier si vous souhaitez en utiliser une ou plusieurs, notamment la valeur actuelle nette, le taux de rendement interne (TRI) et le retour sur investissement.

Définir un processus reproductible. Ceci est crucial pour calculer toute valeur à long terme. Un seul processus reproductible doit être documenté pour toutes les sous-séquences du projet à suivre.

Les problèmes répertoriés sont les plus courants définis par les experts de l’environnement des dépôts. L'insistance de la direction à obtenir un retour sur investissement « big-bang » est très désorientante. Si vous commencez tous vos calculs de retour sur investissement en les décomposant en éléments identifiables et tangibles, vous avez de bonnes chances d'estimer un retour sur investissement précis.

Questions sur les avantages du retour sur investissement

Quels que soient vos avantages, doux ou durs, vous pouvez utiliser quelques questions de base pour déterminer leur valeur. Par exemple, en utilisant un système d'échelle simple, de 1 à 10, vous pouvez mesurer l'impact de tout effort en utilisant les questions suivantes :

Comment évalueriez-vous la compréhension de donner vous suivez ce projet de votre entreprise ?
Comment estimeriez-vous les améliorations de processus résultant de ce projet ?
Comment mesureriez-vous l’impact des nouvelles connaissances et déductions désormais disponibles grâce à cette itération ?
Quel a été l’impact des environnements informatiques nouveaux et performants suite à ce qui a été appris ? Si les réponses à ces questions sont peu nombreuses, il est possible que l’entreprise ne vaut pas l’investissement réalisé. Les questions à score élevé indiquent des gains de valeur significatifs et devraient servir de guides pour une enquête plus approfondie. Par exemple, un score élevé pour l’amélioration des processus devrait amener les concepteurs à examiner comment les processus ont été améliorés. Vous constaterez peut-être que tout ou partie des gains réalisés sont tangibles et qu’une valeur monétaire peut donc être facilement appliquée. Tirer le meilleur parti de la première itération du entrepôt Le plus grand résultat des efforts de votre entreprise se situe souvent dans les premières itérations. Ces premiers efforts établissent traditionnellement le contenu d’information le plus utile pour le public et contribuent à établir la base technologique des applications BI ultérieures. Habituellement, chaque sous-séquence ultérieure de donner des projets d'entrepôts apportent de moins en moins de valeur ajoutée à l'entreprise dans son ensemble. Cela est particulièrement vrai si l'itération n'ajoute pas de nouveaux sujets ou ne répond pas aux besoins d'une nouvelle communauté d'utilisateurs.

Cette fonctionnalité de stockage s'applique également aux piles croissantes de donner les historiens. Comme les efforts ultérieurs nécessitent plus donner et comment plus donner sont versés dans l'entrepôt au fil du temps, la plupart des donner cela devient moins pertinent pour l'analyse utilisée. Celles-ci donner ils sont souvent appelés donner dormants et il est toujours coûteux de les conserver car ils ne sont presque jamais utilisés.

Qu’est-ce que cela signifie pour les porteurs de projets ? Essentiellement, les premiers sponsors partagent plus que ce que coûte l’investissement. Ceci est primordial car ils constituent le moteur de l'établissement de la vaste couche d'environnement technologique et de ressources de l'entrepôt, y compris les produits biologiques.

Mais ces premières étapes apportent la plus grande valeur et les concepteurs de projets doivent donc souvent justifier l'investissement.
Les projets réalisés après votre initiative BI peuvent avoir des coûts directs inférieurs (par rapport au premier), mais apporter moins de valeur à l'entreprise.

Et les propriétaires d’organisations doivent commencer à envisager de jeter l’accumulation donner et des technologies moins pertinentes.

Exploration de données: exploitation minière Donner

De nombreux composants architecturaux nécessitent des variations dans les technologies et techniques d'exploration de données :
par exemple, les différents «agents» pour l'examen des points d'intérêt de la clientèle, les systèmes d'exploitation de l'entreprise et pour le dw lui-même. Ces agents peuvent être des réseaux neuronaux avancés formés sur les tendances POT, telles que la demande future de produits basée sur les promotions des ventes ; moteurs basés sur des règles pour réagir à un ensemble date de circonstances, par exemple un diagnostic médical et des recommandations de traitement ; ou même de simples agents ayant pour rôle de signaler les exceptions aux hauts dirigeants. Généralement, ces procédés d'extraction donner si

vérifier en temps réel ; par conséquent, ils doivent être complètement unis au mouvement de donner eux-mêmes.

Traitement du traitement analytique en ligne

Analyse en ligne

La capacité de trancher, de découper en dés, de lancer, d'explorer et d'effectuer des analyses
et si, fait partie du champ d'application de la suite technologique IBM. Par exemple, des fonctions de traitement analytique en ligne (OLAP) existent pour DB2 qui intègrent l'analyse dimensionnelle dans le moteur logiciel. base de données même.

Les fonctions ajoutent une utilité dimensionnelle à SQL tout en profitant de tous les avantages d'être une partie naturelle de DB2. Un autre exemple d'intégration OLAP est l'outil d'extraction, DB2 OLAP Server Analyzer. Cette technologie permet d'analyser rapidement et automatiquement les cubes DB2 OLAP Server pour localiser et générer des rapports sur les valeurs de valeur. donner inhabituel ou inattendu dans tout le cube pour l'analyste commercial. Enfin, les fonctionnalités de DW Center permettent aux architectes de contrôler, entre autres choses, le profil d'un cube serveur DB2 OLAP en tant que partie naturelle des processus ETL.

Analyse spatiale Analyse spatiale

L'espace représente la moitié des ancres analytiques (leads) nécessaires à un panorama
analytique large (le temps représente l’autre moitié). Le niveau atomique de l’entrepôt, illustré à la figure 1.1, comprend à la fois les fondamentaux temporels et spatiaux. Les horodatages ancrent les analyses par temps et les informations d’adresse ancrent les analyses par espace. Les horodatages effectuent une analyse par temps et les informations d'adresse effectuent une analyse par espace. Le diagramme montre le géocodage – le processus de conversion d'adresses en points sur une carte ou en points dans l'espace afin que des concepts tels que la distance et l'intérieur/l'extérieur puissent être utilisés dans l'analyse – mené au niveau atomique et l'analyse spatiale qui est mise à la disposition des utilisateurs. l'analyste. IBM fournit des extensions spatiales, développées avec l'Environmental System Research Institute (ESRI), pour base de données DB2 afin que les objets spatiaux puissent être stockés comme partie normale du base de données relationnel. DB2

Spatial Extenders fournit également toutes les extensions SQL pour tirer parti de l’analyse spatiale. Par exemple, les extensions SQL sur lesquelles interroger
La distance entre les adresses ou le fait qu'un point se trouve à l'intérieur ou à l'extérieur d'une zone polygonale définie sont une norme analytique avec Spatial Extender. Voir le chapitre 16 pour plus d'informations.

Base de données-Outils outils résidents Base de données-Résident

DB2 possède de nombreuses fonctionnalités SQL résidentes BI qui facilitent l'action d'analyse. Ceux-ci inclus:

Fonctions de récursion pour effectuer des analyses, telles que « trouver toutes les trajectoires de vol possibles à partir de San Francisco a New York ».
Les fonctions analytiques de classement, les fonctions cumulatives, le cube et le rollup pour faciliter les tâches qui ne se produisent normalement qu'avec la technologie OLAP, font désormais naturellement partie du moteur. base de données
La possibilité de créer des tableaux contenant des résultats
Vendeurs de base de données les dirigeants intègrent davantage de capacités BI dans le base de données même.
Les principaux fournisseurs de base de données ils intègrent davantage de capacités BI dans le base de données même.
Cela offre de meilleures performances et davantage d’options d’exécution pour les solutions BI.
Les caractéristiques et fonctions de DB2 V8 sont abordées en détail dans les chapitres suivants :
Fondements de l'architecture technique et de la gestion des données (Chapitre 5)

Principes fondamentaux de DB2 BI (Chapitre 6)
Tables de requêtes matérialisées DB2 (Chapitre 7)
Fonctions DB2 OLAP (Chapitre 13)
Fonctionnalités et fonctions de BI améliorées de DB2 (Chapitre 15) Système de livraison de données simplifié Système de livraison de donner simplifié

L'architecture représentée à la figure 1.1 comprend de nombreuses structures donner physique. L'un est l'entrepôt de donner en fonctionnement. De manière générale, un ODS est un objet orienté sujet, intégré et actuel. Vous créeriez un ODS pour prendre en charge, par exemple, le bureau des ventes. Les ventes de SAO compléteraient donner provenant de nombreux systèmes différents mais ne conserverait, par exemple, que les transactions du jour. L'ODS peut également être mis à jour plusieurs fois par jour. Dans le même temps, les processus poussent le donner intégré à d’autres applications. Cette structure est spécifiquement conçue pour intégrer donner actuel et dynamique et serait un candidat probable pour prendre en charge l'analyse en temps réel, comme la fourniture aux agents de service clientèle les informations de vente actuelles d'un client en extrayant les informations sur les tendances des ventes de l'entrepôt lui-même. Une autre structure illustrée à la figure 1.1 est un état formel pour le dw. Non seulement c'est le lieu de l'exécution de l'intégration nécessaire, mais aussi de la qualité donner, et de la transformation de donner d'entrepôt entrant, mais c'est aussi une zone de stockage fiable et temporaire pour donner des répliques qui pourraient être utilisées dans des analyses en temps réel. Si vous décidez d'utiliser un ODS ou une zone de transit, l'un des meilleurs outils pour peupler ces structures donner l'utilisation de différentes sources opérationnelles est la requête distribuée hétérogène de DB2. Cette fonctionnalité est fournie par la fonctionnalité DB2 facultative appelée DB2 Relational Connect (requête uniquement) et via DB2 DataJoiner (un produit distinct qui offre des fonctionnalités d'interrogation, d'insertion, de mise à jour et de suppression aux SGBDR distribués hétérogènes).

Cette technologie permet aux architectes de donner di legare donner production avec des processus analytiques. Non seulement la technologie peut s'adapter à pratiquement toutes les demandes de réplication pouvant survenir avec l'analyse en temps réel, mais elle peut également se connecter à une grande variété de bases de données. donner les plus populaires, notamment DB2, Oracle, Sybase, SQL Server, Informix et autres. DB2 DataJoiner peut être utilisé pour remplir une structure donner formel comme un ODS ou même une table permanente représentée dans l'entrepôt conçue pour une récupération rapide des mises à jour instantanées ou pour la vente. Bien entendu, ces mêmes structures donner peut être rempli en utilisant

une autre technologie importante conçue pour la réplication de donner, IBM DataPropagator relationnel. (DataPropagator est un produit distinct pour les systèmes centraux. DB2 UNIX, Linux, Windows et OS/2 incluent des services de réplication de données. donner en standard).
Une autre méthode pour déménager donner opérant dans l'entreprise est un intégrateur d'applications d'entreprise autrement connu sous le nom de courtier de messages. Cette technologie unique permet un contrôle inégalé pour le ciblage et le déplacement donner autour de l’entreprise. IBM propose le courtier de messages le plus largement utilisé, MQSeries, ou une variante du produit qui inclut les exigences de e-commerce, IBM WebSphere MQ.
Pour plus d'informations sur la façon d'exploiter MQ pour prendre en charge un entrepôt et un environnement BI, visitez site web du livre. Pour l'instant, il suffit de dire que cette technologie est un excellent moyen de capturer et de transformer (en utilisant MQSeries Integrator) donner opérateurs centrés (ciblés) recrutés pour les solutions BI. La technologie MQ a été intégrée et packagée dans UDB V8, ce qui signifie que les files d'attente de messages peuvent désormais être gérées comme s'il s'agissait de tables DB2. Le concept de soudage des messages en file d'attente et l'univers de base de données relationnel se dirige vers un environnement de livraison puissant de donner.

Zéro latence Zéro latence

L'objectif stratégique ultime d'IBM est l'analyse sans latence. Tel que défini par
Gartner, un système BI doit être capable de déduire, d'assimiler et de fournir des informations aux analystes à la demande. Le défi, bien sûr, est de savoir comment mélanger donner actuel et en temps réel avec les informations historiques nécessaires, telles que je donner modèle/tendance associé, ou compréhension extraite, telle que le profilage des clients.

Ces informations comprennent, par exemple, l'identification des clientèle risque élevé ou faible ou quels produits je clientèle ils achèteront très probablement s'ils ont déjà du fromage dans leur panier.

Atteindre une latence nulle dépend en réalité de deux mécanismes fondamentaux :

Union complète de donner qui sont analysés avec les techniques et outils établis créés par BI
Un système de livraison de donner efficace pour garantir que l'analyse en temps réel est réellement disponible. Ces conditions préalables à une latence nulle ne diffèrent pas des deux objectifs fixés par IBM et décrits ci-dessus. L'accouplement étroit de donner Il fait partie du programme d'intégration transparente d'IBM. Et créer un système de livraison de donner L'efficacité dépend entièrement de la technologie disponible qui simplifie le processus de livraison de donner. En conséquence, deux des trois objectifs d'IBM sont essentiels à la réalisation du troisième. IBM fait consciemment évoluer sa technologie pour garantir que la latence zéro soit une réalité pour les efforts d'entrepôt. Résumé / Synthèse L'organisation BI fournit une feuille de route pour construire votre environnement
de manière itérative. Il doit être ajusté pour refléter les besoins de votre entreprise, actuels et futurs. Sans une vision architecturale globale, les itérations d’entrepôt ne sont guère plus que des implémentations aléatoires de l’entrepôt central qui ne contribuent guère à créer une entreprise vaste et informative. Le premier obstacle pour les chefs de projet est de savoir comment justifier les investissements nécessaires au développement de l'organisation BI. Même si le calcul du retour sur investissement reste un pilier de la mise en œuvre des entrepôts, il devient de plus en plus difficile de le prévoir avec précision. Cela a conduit à d'autres méthodes pour déterminer si vous en avez pour votre argent. La valeur sur investissement2 (VOI), par exemple, est présentée comme une solution. Il incombe aux architectes de donner et les planificateurs de projets génèrent et fournissent délibérément des informations aux associations d'utilisateurs et ne leur fournissent pas simplement un service. donner. Il y a une énorme différence entre les deux. L'information est quelque chose qui fait la différence dans la prise de décision et l'efficacité ; relativement, je donner ce sont des éléments de base pour obtenir ces informations.

Même si je critique la source donner Pour répondre aux demandes des entreprises, l'environnement BI devrait jouer un rôle plus important dans la création de contenu informatif. Nous devons prendre des mesures supplémentaires pour nettoyer, intégrer, transformer ou créer d'une autre manière un contenu d'information sur lequel les utilisateurs peuvent agir, puis nous devons nous assurer que ces actions et décisions, lorsqu'elles sont raisonnables, sont reflétées dans l'environnement BI. Si nous reléguons l'entrepôt à servir uniquement donner, il est assuré que les associations d'utilisateurs créeront le contenu informationnel nécessaire pour agir. Cela garantit que leur communauté sera en mesure de prendre de meilleures décisions, mais l'entreprise souffre du manque de connaissances qu'elle a utilisées. Date Lorsque les architectes et les planificateurs de projets lancent des projets spécifiques dans l'environnement BI, ils restent responsables devant l'entreprise dans son ensemble. Un exemple simple de cette caractéristique bilatérale des itérations BI se trouve dans la source donner. tous donner reçus pour des demandes commerciales spécifiques doivent être renseignés dans la première couche atomique. Cela garantit le développement de l'actif informationnel de l'entreprise, ainsi que la gestion et la réponse aux demandes spécifiques des utilisateurs définies dans l'itération.

Qu’est-ce qu’un DataWarehouse ?

Entrepôt de données il est au cœur de l'architecture des systèmes d'information depuis 1990 et soutient les processus d'information en offrant une plateforme intégrée solide donner données historiques utilisées comme base pour les analyses ultérieures. LE entrepôt de données ils offrent une facilité d'intégration dans un monde de systèmes d'application incompatibles. Entrepôt de données c’est devenu une tendance. Entrepôt de données organise et stocke i donner nécessaires aux processus d’information et d’analyse basés sur une perspective temporelle historique longue. Tout cela implique un engagement considérable et constant dans la construction et l'entretien de entrepôt de données.

Alors qu'est-ce qu'un entrepôt de données? A entrepôt de données est:

▪ orienté sujet
▪ système intégré
▪ heure variable
▪ non volatile (ne peut pas être effacé)

une collection de donner utilisé pour soutenir les décisions managériales dans la mise en œuvre des processus.
I donner inséré dans entrepôt de données dans la plupart des cas, ils proviennent d’environnements opérationnels. Le entrepôt de données il est créé par une unité de stockage, physiquement séparée du reste du système, qu'il contient donner auparavant transformé par des applications qui fonctionnent sur des informations provenant de l'environnement d'exploitation.

La définition littérale d'un entrepôt de données mérite une explication approfondie car il existe des motivations importantes et des significations sous-jacentes qui décrivent les caractéristiques d'un entrepôt.

ORIENTATION DU SUJET ORIENTATION THÉMATIQUE

La première caractéristique d'un entrepôt de données c'est qu'il est orienté vers les acteurs majeurs d'une entreprise. Le guide des épreuves à travers le donner elle s'oppose à la méthode plus classique qui implique l'orientation des applications vers des processus et des fonctions, méthode largement partagée par la plupart des systèmes de management les moins récents.

Le monde opérationnel est conçu autour d'applications et de fonctions telles que les prêts, l'épargne, les cartes bancaires et la confiance pour une institution financière. Le monde de dw s'organise autour de sujets principaux tels que le client, le vendeur, le produit et l'activité. L'alignement autour des sujets affecte la conception et la mise en œuvre de donner trouvé dans le dw. Plus important encore, le sujet principal affecte la partie la plus importante de la structure clé.

Le monde de l’application est influencé à la fois par la conception de la base de données et par la conception des processus. Le monde de dw se concentre exclusivement sur la modélisation donner et sur la conception du base de données. La conception de processus (sous sa forme classique) ne fait pas partie de l'environnement dw.

Les différences entre le choix de l'application du processus/fonction et le choix du sujet se révèlent également comme des différences dans le contenu du donner à un niveau détaillé. LE donner del dw n'inclut pas i donner qui ne sera pas utilisé pour le processus DSS pendant que les candidatures

opérationnel orienté vers donner contient i donner pour satisfaire immédiatement les exigences fonctionnelles/de traitement qui peuvent ou non avoir une quelconque utilité pour l'analyste DSS.
Une autre manière importante par laquelle les applications orientées opérationnelles donner différer donner de dw est dans les rapports de donner. Les donner les opérations maintiennent une relation continue entre deux ou plusieurs tables en fonction d’une règle métier active. LE donner de dw traversent un spectre temporel et les relations trouvées dans le dw sont nombreuses. De nombreuses règles commerciales (et par conséquent de nombreuses relations de donner ) sont représentés dans l'entrepôt de donner entre deux ou plusieurs tables.

(Pour une explication détaillée de la manière dont les relations entre les donner sont traités dans le DW, nous nous référons au Tech Topic à ce sujet.)
Du point de vue de la différence fondamentale entre un choix d’application fonctionnelle/processus et un choix de sujet, il n’y a pas de plus grande différence entre les systèmes d’exploitation et les systèmes d’exploitation. donner et le DW.

INTÉGRATION INTÉGRATION

L'aspect le plus important de l'environnement de dw est que je donner trouvés dans le dw sont facilement intégrés. TOUJOURS. SANS EXCEPTIONS. L'essence même de l'environnement dw est que je donner contenus dans les limites de l'entrepôt sont intégrés.

L'intégration se révèle de différentes manières – dans des conventions identifiées cohérentes, dans des mesures de variables cohérentes, dans des structures codées cohérentes, dans les attributs physiques des donner cohérent, etc.

Au fil des années, les concepteurs de diverses applications ont pris de nombreuses décisions sur la manière dont une application devait être développée. Le style et les décisions de conception individualisées des applications des concepteurs se révèlent de cent manières : dans les différences de codage, de structure clé, de caractéristiques physiques, de conventions d'identification, etc. La capacité collective de nombreux concepteurs d’applications à créer des applications incohérentes est légendaire. La figure 3 présente certaines des différences les plus importantes dans la manière dont les applications sont conçues.

Encodage: Encode:

Les concepteurs d’applications ont choisi l’encodage du champ – sexe – de différentes manières. Un designer représente le genre par un « m » et un « f ». Un autre designer représente le genre par un « 1 » et un « 0 ». Un autre designer représente le sexe comme un « x » et un « y ». Un autre designer représente le sexe comme étant « masculin » et « féminin ». Peu importe la manière dont le sexe entre dans la DW. Le « M » et le « F » sont probablement aussi bons que toute la pièce.

Ce qui compte, c’est que, quelle que soit l’origine du champ sexuel, ce champ arrive dans le DW dans un état intégré cohérent. Par conséquent, lorsque le champ est chargé dans le DW à partir d'une application où il a été représenté au format « M » et « F », le donner doit être converti au format DW.

Mesure des attributs : mesure de Les attributs:

Les concepteurs d’applications ont choisi de mesurer le pipeline de diverses manières au fil des ans. Un designer stocke le donner du pipeline en centimètres. Un autre concepteur d'applications stocke le donner du pipeline en termes de pouces. Un autre concepteur d'applications stocke le donner de pipeline en millions de pieds cubes par seconde. Et un autre concepteur stocke les informations sur les pipelines en termes de chantiers. Quelle que soit la source, lorsque les informations sur le pipeline arrivent dans le DW, elles doivent être mesurées de la même manière.

Selon les indications de la figure 3, les problèmes d'intégration affectent presque tous les aspects du projet – les caractéristiques physiques des donner, le dilemme d'avoir plus d'une source de donner, la question des échantillons identifiés incohérents, des formats de donner incohérent, etc.

Quel que soit le sujet de conception, le résultat est le même : je donner doivent être stockés dans le DW d'une manière singulière et globalement acceptable, même lorsque les systèmes d'exploitation sous-jacents les stockent différemment donner.

Lorsque l'analyste DSS examine le DW, son objectif devrait être d'exploiter le donner qui sont dans l'entrepôt,

plutôt que de s'interroger sur la crédibilité ou la cohérence de la donner.

VARIANCE DE TEMPS

tous donner dans le DW, ils sont précis jusqu'à un certain point dans le temps. Cette caractéristique fondamentale du donner dans DW est très différent de donner trouvé dans l'environnement d'exploitation. LES donner de l’environnement d’exploitation sont aussi précis qu’au moment de l’accès. En d'autres termes, dans l'environnement d'exploitation, lors de l'accès à un lecteur donner, il est prévu qu'il reflète des valeurs précises au moment de l'accès. Parce que je donner dans le DW sont précis car à un moment donné (c'est-à-dire pas « en ce moment »), il est dit que je donner trouvés dans le DW sont des « variances temporelles ».
L'écart temporel de donner DW est désigné de nombreuses manières.
Le moyen le plus simple est que je donner d'un DW représentent donner sur un horizon temporel long – cinq à dix ans. L'horizon temporel représenté pour l'environnement opérationnel est beaucoup plus court que les valeurs actuelles, allant jusqu'à soixante quatre-vingt-dix
Les applications qui doivent fonctionner correctement et doivent être disponibles pour le traitement des transactions doivent contenir le montant minimum de donner s'ils permettent un certain degré de flexibilité. Les applications opérationnelles ont donc un horizon temporel court, comme un sujet de conception d'applications audio.
La deuxième façon dont la « variance temporelle » apparaît dans le DW est dans la structure clé. Chaque structure clé du DW contient, implicitement ou explicitement, un élément temporel, tel que le jour, la semaine, le mois, etc. L'élément temporel se trouve presque toujours au bas de la clé concaténée trouvée dans le DW. Dans ces cas-là, l'élément temporel existera implicitement, comme dans le cas où un fichier entier est dupliqué à la fin du mois ou du trimestre.
La troisième façon dont la variance de temps est affichée est que je donner du DW, une fois correctement enregistré, ne peut pas être mis à jour. LE donner du DW sont, à toutes fins pratiques, une longue série d’instantanés. Bien entendu, si les instantanés n’ont pas été pris correctement, ils peuvent alors être modifiés. Mais en supposant que les instantanés soient pris correctement, ils ne sont pas modifiés dès leur prise. Dans certaines

Dans certains cas, il peut être contraire à l'éthique, voire invalide, de modifier des instantanés du DW. LE donner opérationnels, étant précis au moment de l'accès, ils peuvent être mis à jour en cas de besoin.

PAS VOLATILE

La quatrième caractéristique importante de DW est qu'il est non volatil.
Des mises à jour, insertions, suppressions et modifications sont apportées régulièrement aux environnements opérationnels, enregistrement par enregistrement. Mais la manipulation basique du donner qui sont nécessaires dans le DW est beaucoup plus simple. Il n'y a que deux types d'opérations qui se produisent dans le DW : le chargement initial de donner et accès à donner. Il n'y a pas de mise à jour du donner (au sens général de mise à jour) dans le DW en tant qu'opération de traitement normale. Cette différence fondamentale entre le traitement opérationnel et le traitement DW a des conséquences très importantes. Au niveau de la conception, la nécessité d'être prudent quant à la mise à jour anormale n'est pas un facteur dans le DW, puisque la mise à jour de donner n’est pas réalisé. Cela signifie qu'au niveau de la conception physique, des libertés peuvent être prises pour optimiser l'accès à donner, en particulier en abordant les thèmes de la normalisation et de la dénormalisation physiques. Une autre conséquence de la simplicité des opérations DW réside dans la technologie sous-jacente utilisée pour exécuter l’environnement DW. Devoir prendre en charge les mises à jour en ligne enregistrement par enregistrement (comme c'est souvent le cas avec le traitement opérationnel) nécessite que la technologie repose sur une base très complexe sous une apparente simplicité.
La technologie qui prend en charge la sauvegarde et la restauration, les transactions et l'intégrité des donner et la détection et la résolution d'une condition de blocage sont assez complexes et ne sont pas nécessaires pour le traitement DW. Les caractéristiques d'un DW, l'orientation de la conception, l'intégration de donner au sein de la DW, variance temporelle et simplicité de gestion donner, tout cela conduit à un environnement très, très différent de l’environnement d’exploitation classique. La source de presque tout donner de DW sont l’environnement d’exploitation. Il est tentant de penser qu'il existe une redondance massive donner entre les deux milieux.
En fait, la première impression que beaucoup de gens ont est celle d'une grande redondance donner entre l'environnement d'exploitation et le

DW. Une telle interprétation est superficielle et démontre un manque de compréhension de ce qui se passe au DW.
En fait, il y a un minimum de redondance de donner entre l'environnement d'exploitation et moi donner du DW. Considérez ce qui suit : je donner sont filtrés date passage de l’environnement d’exploitation à l’environnement DW. Beaucoup donner ils ne sortent jamais de l’environnement opérationnel. Sauf que je donner qui sont nécessaires au traitement DSS trouvent leur direction dans l'environnement

▪ l'horizon temporel de donner c'est très différent d'un environnement à l'autre. LE donner dans l'environnement d'exploitation, ils sont très frais. LES donner dans le DW, ils sont beaucoup plus âgés. Uniquement du point de vue temporel, il y a très peu de chevauchement entre l’environnement opérationnel et le DW.

▪ Le DW contient donner résumé que l'on ne retrouve jamais dans l'environnement

▪ Je donner subissent une transformation fondamentale lors de leur transition vers la figure 3 illustre que la plupart donner sont considérablement modifiés à condition qu'ils soient sélectionnés et déplacés vers le DW. Autrement dit, la plupart des donner il est physiquement et radicalement modifié à mesure qu'il est transféré dans le DW. Du point de vue de l'intégration, ce ne sont pas les mêmes donner qui résident dans l’environnement d’exploitation. Compte tenu de ces facteurs, la redondance de donner entre les deux environnements est un événement rare, conduisant à moins de 1 % de redondance entre les deux environnements. LA STRUCTURE DE L'ENTREPÔT Les DW ont une structure distincte. Il existe différents niveaux de résumé et de détail qui délimitent les DW.
Les différents composants d'un DW sont:

Métadonnées
Donner détails actuels
Donner de vieux détails
Donner légèrement résumé
Donner très résumé

De loin, la principale préoccupation est pour i donner détails actuels. C’est la principale préoccupation car :

I donner les détails actuels reflètent les événements les plus récents, qui sont toujours d'un grand intérêt et
i donner Les détails actuels sont volumineux car ils sont stockés au niveau de granularité le plus bas et
i donner Les détails actuels sont presque toujours stockés sur la mémoire disque, qui est rapide d'accès, mais coûteuse et complexe à utiliser. donner les détails sont plus anciens donner qui sont stockés dans une certaine mémoire massa. Il est consulté sporadiquement et est stocké à un niveau de détail compatible avec donner détails actuels. Bien qu'il ne soit pas obligatoire de stocker sur un support de stockage alternatif, en raison du volume important de donner combiné à un accès sporadique de donner, le support de stockage pour donner les données détaillées plus anciennes ne sont généralement pas stockées sur le disque. LE donner résumés légèrement sont donner qui sont distillés du faible niveau de détail trouvé au niveau de détail actuel. Ce niveau du DW est presque toujours stocké sur disque. Les problèmes de conception auxquels est confronté l'architecte donner dans la construction de ce niveau du DW sont:

Quelle unité de temps est le résumé fait ci-dessus
Quel contenu, quels attributs résumeront légèrement le contenu du donner Le prochain niveau de donner trouvé dans le DW est celui de donner très résumé. LE donner Les documents hautement résumés sont compacts et facilement accessibles. LE donner très résumés se trouvent parfois dans l'environnement DW et dans d'autres cas, je donner très résumés se trouvent en dehors des murs immédiats de la technologie qui héberge le DW. (en tout cas, je donner hautement résumés font partie du DW, quel que soit l'endroit où je donner sont physiquement hébergés). Le dernier composant du DW sont les métadonnées. À bien des égards, les métadonnées se situent dans une dimension différente des autres donner du DW, car les métadonnées ne contiennent aucun date extraits directement de l’environnement d’exploitation. Les métadonnées jouent un rôle particulier et très important dans DW. Les métadonnées sont utilisées comme :

un répertoire pour aider l'analyste DSS à localiser le contenu du DW,
un guide pour cartographier donner comment je donner ont été transformés de l’environnement opérationnel à l’environnement DW,
un guide des algorithmes utilisés pour la synthèse entre les donner des détails actuels ei donner légèrement résumé, je donner très résumé, les métadonnées jouent un rôle beaucoup plus important dans l'environnement DW qu'elles ne l'ont jamais eu dans l'environnement opérationnel ANCIEN SUPPORT DE STOCKAGE DE DÉTAILS Une bande magnétique peut être utilisée pour stocker ce type de donner. En fait, il existe une grande variété de supports de stockage à prendre en compte pour le stockage ancien. donner de détail. En fonction du volume de donner, la fréquence d'accès, le coût des outils et le type d'accès, il est tout à fait probable que d'autres outils auront besoin de l'ancien niveau de détail du DW. FLUX DE DONNÉES Il y a un flux normal et prévisible de dieux donner au sein du DW.
I donner ils entrent dans le DW depuis l’environnement d’exploitation. (REMARQUE : Il existe quelques exceptions très intéressantes à cette règle. Cependant, presque tous donner saisir le DW à partir de l'environnement d'exploitation). Date que donner entrez le DW depuis l’environnement d’exploitation, il est transformé comme décrit précédemment. A condition d'entrer dans le DW, je donner entrez le niveau de détail actuel, comme indiqué. Il y réside et est utilisé jusqu'à ce que l'un des trois événements suivants se produise :

est purifié,
est résumé, et/ou ▪è Le processus obsolète au sein d'un DW se déplace i donner détails actuels un donner de détails anciens, en fonction de l'âge de donner. Le processus

le résumé utilise le détail de donner calculer i donner niveaux légèrement résumés et très résumés de donner. Il existe quelques exceptions au flux indiqué (nous en parlerons plus tard). Cependant, généralement, pour la grande majorité des donner trouvé dans un DW, le flux de donner est comme sur la photo.

UTILISER L'ENTREPÔT DE DONNÉES

Sans surprise, les différents niveaux de donner au sein du DW, ils ne reçoivent pas différents niveaux d’utilisation. En règle générale, plus le niveau de synthèse est élevé, plus je donner ils sont utilisés.
De nombreuses utilisations se produisent dans donner très résumé, alors que l'ancien donner de détails ne sont presque jamais utilisés. Il y a une bonne raison de faire évoluer l’organisation vers le paradigme de l’utilisation des ressources. Plus résumé, je donner, plus il est rapide et efficace d'accéder au donner. Si un boutique constate qu'il effectue de nombreux processus au niveau de détail du DW, une grande quantité correspondante de ressources machine est alors consommée. Il est dans l’intérêt de tous de traiter des résumés d’un niveau aussi élevé que possible dans les plus brefs délais.

Pour de nombreux magasins, l'analyste DSS dans un pré-environnement DW a utilisé donner au niveau du détail. À bien des égards, l'arrivée d'un donner Le résumé détaillé ressemble à une couverture de sécurité, même lorsque d’autres niveaux de résumé sont disponibles. Une des activités de l'architecte donner est de sevrer l'utilisateur du DSS de l'utilisation constante de donner au niveau de détail le plus bas. Deux motivations s'offrent à l'architecte de donner:

en installant un système de rétrofacturation, où l'utilisateur final paie pour les ressources consommées et
ce qui indique qu'un très bon temps de réponse peut être obtenu lorsque le comportement avec i donner est à un niveau de synthèse élevé, tandis que le faible temps de réponse vient du comportement du donner à un faible niveau de AUTRES CONSIDÉRATIONS Il existe d’autres considérations en matière de construction et de gestion de DW.
La première considération est celle des indices. LES donner à des niveaux de synthèse plus élevés, ils peuvent être librement indexés, tandis que je donner

à des niveaux de détail inférieurs, ils sont si volumineux qu’ils peuvent être indexés avec parcimonie. Du même coup, je donner à des niveaux de détail élevés peuvent être relativement facilement restructurés, tandis que le volume de donner aux niveaux inférieurs, il est si grand que je donner ils ne peuvent pas être facilement rénovés. Par conséquent, le modèle de donner et le travail formel effectué par la conception pose les bases du DW appliqué presque exclusivement au niveau de détail actuel. En d’autres termes, les activités de modélisation de donner ils ne s'appliquent pas aux niveaux de synthèse, dans presque tous les cas. Une autre considération structurelle est celle de la subdivision des donner par DW.

Le partitionnement peut être effectué à deux niveaux - au niveau de dbm et au niveau de l'application. Dans la division au niveau dbm, le dbm est informé des divisions et les contrôle en conséquence. Dans le cas de division au niveau application, seul le programmeur est informé des divisions et la responsabilité de leur administration lui est laissée.

Sous le niveau dbm, une grande partie du travail est effectuée automatiquement. Il y a beaucoup de rigidité associée à l’administration automatique des divisions. Dans le cas de divisions au niveau de l'application de donner de la entrepôt de données, beaucoup de travail pèse sur le programmeur, mais le résultat final est une flexibilité dans l'administration de donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données

AUTRES ANOMALIES

Alors que les composants du entrepôt de données Ils fonctionnent comme décrit pour presque tous donner, il existe quelques exceptions utiles qui doivent être discutées. Une exception est celle de donner données de synthèse publiques. Ceux-ci sont donner des résumés qui ont été calculés à partir du entrepôt de données mais ils sont utilisés par la société. LES donner les résumés publics sont stockés et gérés dans le entrepôt de données, bien que, comme mentionné précédemment, ils soient calculés. Les comptables s'efforcent de produire de tels rapports trimestriels donner tels que les revenus, les dépenses trimestrielles, les bénéfices trimestriels, etc. Le travail effectué par les comptables est externe à entrepôt de données. Cependant, je donner sont utilisés « en interne » au sein de l’entreprise – depuis marketing, ventes, etc. Une autre anomalie, qui ne sera pas évoquée, est celle de donner externe.

Un autre grand genre de donner que l'on peut trouver dans un entrepôt de données est celle des données de détail permanentes. Cela entraîne la nécessité de stocker en permanence le donner à un niveau détaillé pour des raisons éthiques ou juridiques. Si une entreprise expose ses travailleurs à des substances dangereuses, il est nécessaire de donner détaillée et permanente. Si une entreprise fabrique un produit qui implique la sécurité publique, comme des pièces d'avion, il est nécessaire de donner détails permanents, ainsi que si une entreprise conclut des contrats dangereux.

L'entreprise ne peut pas se permettre de négliger les détails car au cours des prochaines années, en cas de poursuite, de rappel, de défaut de construction contesté, etc. l'exposition de l'entreprise pourrait être importante. Il en résulte un type unique de donner connues sous le nom de données détaillées permanentes.

RÉSUMÉ

Un entrepôt de données est une variante temporelle intégrée et orientée objet, une collection de donner non volatile pour soutenir les besoins décisionnels de l’administration. Chacune des fonctions principales d'un entrepôt de données a ses implications. De plus, il existe quatre niveaux de donner de la entrepôt de données:

Détail ancien
Détail actuel
Donner légèrement résumé
Donner Les métadonnées hautement résumées constituent également une partie importante du entrepôt de données. ABSTRAIT Le concept de stockage de donner Il a récemment reçu beaucoup d'attention et est devenu une tendance des années 90. Cela est dû à la capacité d'un entrepôt de données pour surmonter les limites des systèmes d'aide à la gestion tels que les systèmes d'aide à la décision (DSS) et les systèmes d'information exécutifs (EIS). Même si le concept de entrepôt de données ça semble prometteur, je l'implémente entrepôt de données peut être problématique en raison des processus d'entreposage à grande échelle. Malgré la complexité des projets d'entreposage donner, de nombreux fournisseurs et consultants qui stockent donner ils prétendent que le stockage de donner le courant ne pose aucun problème. Cependant, au début de ce projet de recherche, presque aucune recherche indépendante, rigoureuse et systématique n’avait été réalisée. Il est donc difficile de dire ce qui se passe réellement dans l'industrie lorsqu'ils sont construits. entrepôt de données. Cette étude a exploré les pratiques d'entreposage de donner contemporains qui vise à développer une compréhension plus riche de la pratique australienne. L’analyse documentaire a fourni le contexte et le fondement de l’étude empirique. Il existe un certain nombre de résultats issus de cette recherche. Premièrement, cette étude a révélé les activités qui ont surgi au cours du développement du entrepôt de données. Dans de nombreux domaines, je donner recueillies ont confirmé la pratique rapportée dans la littérature. Deuxièmement, les questions et problèmes qui peuvent avoir un impact sur le développement du entrepôt de données ont été identifiés par cette étude. Enfin, les avantages retirés par les organisations australiennes associés à l'utilisation de entrepôt de données ont été révélés.

Chapitre 1

Contexte de recherche

Le concept d’entreposage de données a été largement diffusé et est devenu une tendance émergente dans les années 90 (McFadden 1996, TDWI 1996, Shah et Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman et Oates 2000). Cela ressort du nombre croissant d’articles sur l’entreposage de données dans les publications spécialisées (Little et Gibson 1999). De nombreux articles (voir par exemple Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett et King 1996, Graham et al. 1996, Sakaguchi et Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, McCarthy 1997, O'Donnell 1997, Edwards 1998, TDWI 1999) ont signalé des avantages significatifs obtenus par les organisations qui mettent en œuvre i entrepôt de données. Ils ont étayé leur théorie par des preuves anecdotiques de mises en œuvre réussies, des chiffres de retour sur investissement (ROI) élevés et, également, en fournissant des lignes directrices ou des méthodologies pour développer le entrepôt de données

(Shanks et al. 1997, Seddon et Benjamin 1998, Little et Gibson 1999). Dans un cas extrême, Graham et al. (1996) ont rapporté un retour sur investissement moyen sur trois ans de 401 %.

Cependant, une grande partie de la littérature actuelle a négligé les complexités liées à la réalisation de tels projets. Les projets de entrepôt de données ils sont normalement complexes et à grande échelle et comportent donc une forte probabilité d’échec s’ils ne sont pas soigneusement contrôlés (Shah et Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs et Clymer 1998, Rao 1998). Leur construction nécessite d’énormes quantités de ressources humaines et financières, ainsi que du temps et des efforts (Hill 1998, Crofts 1998). Le temps et les moyens financiers généralement requis sont respectivement d'environ deux ans et de deux à trois millions de dollars (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Ce temps et ces moyens financiers sont nécessaires pour contrôler et consolider de nombreux aspects différents de l'entreposage de données (Cafasso 1995, Hill 1998). Outre les considérations matérielles et logicielles, d'autres fonctions, qui varient de l'extraction de donner aux processus de chargement de donner, la capacité mémoire pour gérer les mises à jour et les méta donner pour la formation des utilisateurs, ils doivent être pris en compte.

Au début de ce projet de recherche, très peu de recherches universitaires étaient menées dans le domaine de l’entreposage de données, notamment en Australie. Cela ressort clairement du manque d’articles publiés sur l’entreposage de données dans des revues ou d’autres écrits universitaires de l’époque. De nombreux écrits universitaires disponibles décrivent l’expérience américaine. Le manque de recherche universitaire dans le domaine de l'entreposage de données a suscité des appels à des recherches rigoureuses et à des études empiriques (McFadden 1996, Shanks et al. 1997, Little et Gibson 1999). En particulier, des études de recherche sur le processus de mise en œuvre de entrepôt de données doivent être réalisées pour approfondir les connaissances générales concernant la mise en œuvre de entrepôt de données et servira de base à une future étude de recherche (Shanks et al. 1997, Little et Gibson 1999).

Le but de cette étude est donc d'étudier ce qui se passe réellement lorsque les organisations réalisent et utilisent i entrepôt de données en Australie. Plus précisément, cette étude impliquera une analyse de l'ensemble d'un processus de développement d'un entrepôt de données, depuis l'initiation et la planification jusqu'à la conception, la mise en œuvre et l'utilisation ultérieure au sein des organisations australiennes. En outre, l'étude contribuera également à la pratique actuelle en identifiant les domaines dans lesquels la pratique peut être encore améliorée et les inefficacités et les risques peuvent être minimisés ou évités. En outre, il servira de base à d'autres études sur entrepôt de données en Australie et comblera le vide qui existe actuellement dans la littérature.

Questions de recherche

L’objectif de cette recherche est d’étudier les activités impliquées dans la mise en œuvre de entrepôt de données et leur utilisation par les organisations australiennes. En particulier, les éléments concernant la planification du projet, le développement, l'exploitation, l'utilisation et les risques encourus sont étudiés. La question de cette recherche est donc :

« Comment est la pratique actuelle du entrepôt de données en Australie?"

Pour répondre efficacement à cette question, un certain nombre de questions de recherche subsidiaires sont nécessaires. En particulier, trois sous-questions ont été identifiées à partir de la littérature, présentée au chapitre 2, pour guider ce projet de recherche : Comment les entrepôt de données des organisations australiennes ? Quels problèmes avez-vous rencontrés ?

Quels sont les bénéfices ressentis ?
Pour répondre à ces questions, un modèle de recherche exploratoire utilisant une enquête a été utilisé. En tant qu'étude exploratoire, les réponses aux questions ci-dessus ne sont pas complètes (Shanks et al. 1993, Denscombe 1998). Dans ce cas, une triangulation est nécessaire pour améliorer les réponses à ces questions. Cependant, l’enquête fournira une base solide pour les travaux futurs examinant ces questions. Une discussion détaillée sur la justification et la conception des méthodes de recherche est présentée au chapitre 3.

Structure du projet de recherche

Ce projet de recherche est divisé en deux parties : l'étude contextuelle du concept d'entreposage de données et la recherche empirique (voir Figure 1.1), dont chacune est discutée ci-dessous.

Partie I : Étude contextuelle

La première partie de la recherche consistait à passer en revue la littérature actuelle sur divers types d'entreposage de données, notamment les systèmes d'aide à la décision (DSS), les systèmes d'information exécutifs (EIS), les études de cas de entrepôt de données et les notions de entrepôt de données. De plus, les résultats des forums entrepôt de données et des groupes de réunions d'experts et de praticiens dirigés par l'équipe de recherche Monash DSS, ont contribué à cette phase de l'étude qui visait à mieux comprendre la pratique de entrepôt de données et d'identifier les risques liés à leur adoption. Au cours de cette période d'étude contextuelle, la compréhension du problème a été établie afin de fournir les connaissances de base pour les enquêtes empiriques ultérieures. Cependant, il s’agissait d’un processus continu au cours de la conduite de l’étude de recherche.

Partie II : Recherche empirique

Le concept relativement nouveau d'entreposage de données, notamment en Australie, a créé la nécessité de mener une enquête pour obtenir une vue d'ensemble de l'expérience utilisateur. Cette partie a été réalisée une fois que le domaine problématique avait été établi grâce à une revue approfondie de la littérature. Le concept d'entreposage de données formé au cours de la phase d'étude contextuelle a été utilisé comme entrée pour le questionnaire initial de cette étude. Après cela, le questionnaire a été examiné. Vous êtes des experts en entrepôt de données participé à l'épreuve. Le but du test du questionnaire initial était de vérifier l’exhaustivité et l’exactitude des questions. Sur la base des résultats des tests, le questionnaire a été modifié et la version modifiée a été envoyée aux participants à l'enquête. Les questionnaires retournés ont ensuite été analysés pour moi donner dans des tableaux, des diagrammes et d'autres formats. LES

résultats d'analyse de donner ils constituent un instantané des pratiques d'entreposage de données en Australie.

APERÇU DE L'ENTREPOSAGE DE DONNÉES

Le concept d'entreposage de données a évolué avec les améliorations de la technologie informatique.
Il vise à surmonter les problèmes rencontrés par les groupes de support d'application tels que le système d'aide à la décision (DSS) et le système d'information exécutif (EIS).

Dans le passé, le plus grand obstacle de ces applications était leur incapacité à fournir une base de données nécessaire à l’analyse.
Ceci est principalement dû à la nature du travail de la direction. Les intérêts de la direction d'une entreprise varient constamment en fonction du domaine couvert. Donc, je donner fondamentaux pour ces applications ils doivent pouvoir évoluer rapidement en fonction de la pièce à traiter.
Cela signifie que je donner doivent être disponibles sous la forme appropriée aux analyses demandées. En fait, les groupes de support aux applications ont trouvé très difficile dans le passé de collecter et d'intégrer donner provenant de sources complexes et diverses.

Le reste de cette section présente un aperçu du concept d'entreposage de données et explique comment le entrepôt de données peut surmonter les problèmes des groupes de support d'application.
Le terme "Entreposage De Données» a été popularisé par William Inmon en 1990. Sa définition souvent citée voit le Entreposage De Données comme une collection de donner orientés sujet, intégrés, non volatiles et variables dans le temps, en support aux décisions de gestion.

En utilisant cette définition, Inmon souligne que je donner résidant dans un entrepôt de données ils doivent posséder les 4 caractéristiques suivantes :

▪ Orienté sujet
▪ Intégré
▪ Non volatile
▪ Variable dans le temps Par Inmon orienté sujet signifie que je donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données dans les plus grands domaines organisationnels qui ont été

défini dans le modèle donner. Par exemple tous donner concernant i clientèle sont contenus dans le domaine CLIENTS. De même tous donner relatifs aux produits sont contenus dans le domaine PRODUITS.

Par Integrated Inmon signifie que je donner provenant de différentes plates-formes, systèmes et emplacements sont combinés et stockés en un seul endroit. En conséquence donner les fichiers similaires doivent être transformés dans des formats cohérents afin de pouvoir être facilement ajoutés et comparés.
Par exemple, les genres masculin et féminin sont représentés par les lettres M et F dans un système, et par 1 et 0 dans un autre. Pour les intégrer correctement, un ou les deux formats doivent être transformés pour que les deux formats soient identiques. Dans ce cas, nous pourrions changer M en 1 et F en 0 ou vice versa. Orienté sujet et intégré indiquent que le entrepôt de données est conçu pour apporter une vision fonctionnelle et transversale de donner par l'entreprise.

Par non volatile, il veut dire que je donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données rester cohérent et la mise à jour de donner ce n'est pas nécessaire. Au lieu de cela, chaque changement dans donner les originaux sont ajoutés à base de données de la entrepôt de données. Cela signifie que la déi historique donner est contenu dans le entrepôt de données.

Pour les variables au fil du temps, Inmon indique que je donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données contiennent toujours des marqueurs de temps et i donner ils traversent normalement un certain horizon temporel. Par exemple un
entrepôt de données peut contenir 5 ans de valeurs historiques de la clientèle de 1993 à 1997. La disponibilité de l’historique et d’une série chronologique de donner vous permet d’analyser les tendances.

Un entrepôt de données il peut récupérer le sien donner à partir de systèmes OLTP ; à partir de sources donner externe à l'organisation et/ou par d'autres projets spéciaux de système de capture donner.
I donner les extraits peuvent passer par un processus de nettoyage, dans ce cas je donner sont transformés et intégrés avant d'être stockés dans le base de données de la entrepôt de données. Alors je donner

résidant dans le base de données de la entrepôt de données sont mis à la disposition des connexions des utilisateurs finaux et des outils de récupération. Grâce à ces outils, l'utilisateur final peut accéder à la vue intégrée de l'organisation de donner.

I donner résidant dans le base de données de la entrepôt de données ils sont stockés à la fois sous forme détaillée et sous forme de résumé.
Le niveau de résumé peut dépendre de la nature de la donner. Les donner détaillé peut consister en donner courant et donner historiens
I donner les redevances ne sont pas incluses dans le entrepôt de données jusqu'à ce que je donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données sont rafraîchis.
En plus de stocker i donner eux-mêmes, un entrepôt de données il peut également stocker un autre type de date appelé METADATA décrivant le donner résidant dans son base de données.
Il existe deux types de métadonnées : les métadonnées de développement et les métadonnées d'analyse.
Les métadonnées de développement sont utilisées pour gérer et automatiser les processus d'extraction, de nettoyage, de mappage et de chargement du donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données.
Les informations contenues dans les métadonnées de développement peuvent contenir des détails sur les systèmes d'exploitation, des détails sur les éléments à extraire, le modèle donner de la entrepôt de données et règles métier pour la conversion donner.

Le deuxième type de métadonnées, appelées métadonnées analytiques, permet à l'utilisateur final d'explorer le contenu du entrepôt de données pour trouver le donner disponibles et leur signification en termes clairs et non techniques.

Les métadonnées analytiques fonctionnent donc comme un pont entre les entrepôt de données et les applications des utilisateurs finaux. Ces métadonnées peuvent contenir le modèle économique, des descriptions de donner correspondant au modèle économique, aux requêtes et rapports prédéfinis, aux informations d'accès des utilisateurs et à l'index.

Les métadonnées d'analyse et de développement doivent être combinées en une seule métadonnée de confinement intégrée pour fonctionner correctement.

Malheureusement, de nombreux outils existants ont leurs propres métadonnées et il n'existe actuellement aucune norme pour cela.

permettre aux outils d’entreposage de données d’intégrer ces métadonnées. Pour remédier à cette situation, de nombreux traders des principaux outils d’entreposage de données ont formé le Meta Data Council qui est devenu plus tard la Meta Data Coalition.

L'objectif de cette coalition est de créer un ensemble de métadonnées standard permettant à différents outils d'entreposage de données de convertir les métadonnées
Leurs efforts ont abouti à la naissance de la Meta Data Interchange Spécification (MDIS) qui permettra l'échange d'informations entre les archives Microsoft et les fichiers MDIS associés.

L'existence de donner à la fois résumé/indexé et détaillé donne à l'utilisateur la possibilité de réaliser un DRILL DROWN (forage) à partir de donner indexés sur les détaillés et vice versa. L'existence de donner des historiques détaillés permettent de créer des analyses de tendances au fil du temps. De plus, les métadonnées d'analyse peuvent être utilisées comme répertoire de base de données de la entrepôt de données pour aider les utilisateurs finaux à localiser le donner nécessaire.

Par rapport aux systèmes OLTP, avec leur capacité à prendre en charge l'analyse des donner et les rapports, le entrepôt de données il est considéré comme un système plus approprié pour les processus d'information tels que la formulation et la réponse à des requêtes et la production de rapports. La section suivante mettra en évidence les différences entre les deux systèmes en détail.

ENTREPT DE DONNÉES CONTRE LES SYSTÈMES OLTP

De nombreux systèmes d'information au sein des organisations sont destinés à soutenir les opérations quotidiennes. Ces systèmes, connus sous le nom de OLTP SYSTEMS, capturent les transactions quotidiennes mises à jour en permanence.

I donner au sein de ces systèmes, ils sont souvent modifiés, ajoutés ou supprimés. Par exemple, l'adresse d'un client change à mesure qu'il se déplace d'un endroit à un autre. Dans ce cas la nouvelle adresse sera enregistrée en modifiant le champ d'adresse base de données. L'objectif principal de ces systèmes est de réduire les coûts de transaction tout en réduisant les délais de traitement. Des exemples de systèmes OLTP incluent des actions critiques telles que la saisie des commandes, la paie, la facture, la fabrication, le service client. clientèle.

Contrairement aux systèmes OLTP, qui ont été créés pour les processus basés sur des transactions et des événements, je entrepôt de données ont été créés pour fournir un support aux processus basés sur l'analyse donner et les processus de prise de décision.

Ceci est normalement réalisé en intégrant i donner à partir de divers OLTP et systèmes externes dans un seul « conteneur » de donner, comme discuté dans la section précédente.

Modèle de processus d'entreposage de données Monash

Le modèle de processus pour entrepôt de données Monash a été développé par des chercheurs du Monash DSS Research Group et est basé sur la littérature de entrepôt de données, sur l'expérience dans l'accompagnement du développement de domaines systèmes, sur les discussions avec les fournisseurs d'applications à utiliser sur entrepôt de données, sur un groupe d'experts dans l'utilisation de entrepôt de données.

Les phases sont : Initiation, Planification, Développement, Opérations et Explications. Le diagramme explique le caractère itératif ou évolutif du développement d'un entrepôt de données processus à l’aide de flèches bidirectionnelles placées entre les différentes phases. Dans ce contexte, « itératif » et « évolutif » signifient qu'à chaque étape du processus, les activités de mise en œuvre peuvent toujours se propager à rebours vers la phase précédente. Cela est dû à la nature d'un projet entrepôt de données dans lequel des demandes supplémentaires de l'utilisateur final surviennent à tout moment. Par exemple, lors de la phase de développement d'un processus entrepôt de données, une nouvelle dimension ou un nouveau domaine est demandé par l'utilisateur final, qui ne faisait pas partie du plan d'origine, celui-ci doit être ajouté au système. Cela provoque un changement dans le projet. Le résultat est que l’équipe de conception doit modifier les exigences des documents créés jusqu’à présent pendant la phase de conception. Dans de nombreux cas, l'état actuel du projet doit remonter à la phase de conception où la nouvelle exigence doit être ajoutée et documentée. L'utilisateur final doit pouvoir voir la documentation spécifique examinée et les modifications qui ont été apportées au cours de la phase de développement. A la fin de ce cycle de développement, le projet doit bénéficier d'un excellent retour de la part des équipes de développement et des utilisateurs. Les retours sont ensuite réutilisés pour améliorer un futur projet.

Planification des capacités
Les dw ont tendance à être de très grande taille et à croître très rapidement (Best 1995, Rudin 1997a) en raison de la quantité de donner histoires qu’ils retiennent de leur durée. La croissance peut également être causée par donner ajouts demandés par les utilisateurs pour augmenter la valeur de donner qu'ils ont déjà. En conséquence, les exigences de stockage pour donner peut être considérablement amélioré (Eckerson 1997). Il est donc essentiel de garantir, en planifiant la capacité, que le système en cours de construction puisse croître à mesure que les besoins augmentent (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Lors de la planification de l'évolutivité de la base de données, il faut connaître la croissance attendue de la taille de l'entrepôt, les types de requêtes susceptibles d'être effectuées et le nombre d'utilisateurs finaux pris en charge (Best 1995, Rudin 1997b, Foley 1997a). La création d'applications évolutives nécessite une combinaison de technologies de serveur évolutives et de techniques de conception d'applications évolutives (Best 1995, Rudin 1997b. Les deux sont nécessaires à la création d'une application hautement évolutive. Les technologies de serveur évolutives peuvent rendre facile et avantageux l'ajout de stockage, de mémoire et de CPU sans dégrader performance (Lang 1997, Téléphonie 1997).

Il existe deux principales technologies de serveur évolutif : le traitement multiple symétrique (SMP) et le traitement massivement parallèle (MPP) (IDC 1997, Humphries et al. 1999). Un serveur SMP dispose généralement de plusieurs processeurs partageant une mémoire, un bus système et d'autres ressources (IDC 1997, Humphries et al. 1999). Des processeurs supplémentaires peuvent être ajoutés pour augmenter son potenza informatique. Une autre méthode pour augmenter le potenza du serveur SMP, consiste à regrouper de nombreuses machines SMP. Cette technique est connue sous le nom de clustering (Humphries et al. 1999). Un serveur MPP, en revanche, possède plusieurs processeurs, chacun avec sa propre mémoire, son propre système de bus et d'autres ressources (IDC 1997, Humphries et al. 1999). Chaque processeur est appelé un nœud. Une augmentation de potenza le calcul peut être obtenu

ajout de nœuds supplémentaires aux serveurs MPP (Humphries et al. 1999).

Une faiblesse des serveurs SMP est que trop d'opérations d'entrée-sortie (E/S) peuvent encombrer le bus système (IDC 1997). Ce problème ne se produit pas au sein des serveurs MPP puisque chaque processeur possède son propre système de bus. Cependant, les interconnexions entre chaque nœud sont généralement beaucoup plus lentes que le système de bus SMP. De plus, les serveurs MPP peuvent ajouter un niveau supplémentaire de complexité aux développeurs d'applications (IDC 1997). Ainsi, le choix entre les serveurs SMP et MPP peut être influencé par de nombreux facteurs, parmi lesquels la complexité des applications, le rapport prix/performance, la capacité de traitement requise, les applications dw empêchées et l'augmentation de la taille du serveur. base de données de dw et en nombre d'utilisateurs finaux.

De nombreuses techniques de conception d’applications évolutives peuvent être utilisées dans la planification des capacités. On utilise différentes périodes de notification telles que des jours, des semaines, des mois et des années. Disposant de différents délais de notification, le base de données il peut être divisé en morceaux regroupés de manière gérable (Inmon et al. 1997). Une autre technique consiste à utiliser des tableaux récapitulatifs construits en résumant donner da donner détaillé. Ainsi, je donner Les résumés sont plus compacts que détaillés, ce qui nécessite moins d'espace mémoire. Alors le donner Les détails peuvent être stockés dans une unité de stockage moins coûteuse, ce qui permet d'économiser encore plus de stockage. Même si l’utilisation de tableaux récapitulatifs permet d’économiser de l’espace mémoire, ils nécessitent beaucoup d’efforts pour les maintenir à jour et en adéquation avec les besoins de l’entreprise. Cependant, cette technique est largement utilisée et souvent utilisée en conjonction avec la technique précédente (Best 1995, Inmon 1996a, Chauduri et Dayal
1997).

Définir Entreposage De Données Architectures techniques Définition des techniques d'architecture dw

Les premiers adeptes de l'entreposage de données concevaient principalement une implémentation centralisée du dw dans laquelle tous les donner, y compris moi donner externe, ont été intégrés en un seul,
dépôt physique (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Le principal avantage de cette approche est que les utilisateurs finaux peuvent accéder à une vue d'ensemble de l'entreprise. donner organisationnelle (Ovum 1998). Un autre avantage est qu'il offre une standardisation des donner par l'organisation, ce qui signifie qu'il n'existe qu'une seule version ou définition pour chaque terminologie utilisée dans le référentiel dw (métadonnées) (Flanagan et Safdie 1997, Ovum 1998). L'inconvénient de cette approche, en revanche, est qu'elle est coûteuse et difficile à construire (Flanagan et Safdie 1997, Ovum 1998, Inmon et al. 1998). Peu de temps après l'architecture de stockage donner centralisé est devenu populaire, le concept d'extraction de sous-ensembles plus petits de l'évolution donner pour répondre aux besoins d'applications spécifiques (Varney 1996, IDC 1997, Berson et Smith 1997, peacock 1998). Ces petits systèmes sont des dérivés du plus grand entrepôt de données centralisé. Ils s'appellent entrepôt de données datamarts départementaux ou dépendants dépendants. L'architecture du datamart dépendant est connue sous le nom d'architecture à trois niveaux, où le premier niveau comprend les entrepôt de données centralisée, la seconde est constituée des dépôts de donner départemental et le troisième consiste en l'accès à donner et par des outils d'analyse (Demarest 1994, Inmon et al. 1997).

Les magasins de données sont normalement construits après la entrepôt de données centralisé a été construit pour répondre aux besoins d’unités spécifiques (White 1995, Varney 1996).
Magasin Data Marts I donner très pertinent par rapport à des unités particulières (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

L'avantage de cette méthode est qu'il n'y en aura pas date pas intégré et que je donner sera moins redondant dans les data marts car tous donner ils viennent d'un entrepôt donner intégré. Un autre avantage est qu'il y aura peu de connexions entre chaque data mart et ses sources. donner car chaque datamart n'a qu'une seule source de donner. De plus, avec cette architecture en place, les utilisateurs finaux peuvent toujours accéder à la vue d'ensemble de donner

organisations corporatives. Cette méthode est connue sous le nom de méthode descendante, dans laquelle les datamarts sont construits après entrepôt de données (paon 1998, Goff 1998).
Face à la nécessité croissante de montrer des résultats rapidement, certaines organisations ont commencé à créer des datamarts indépendants (Flanagan et Safdie 1997, White 2000). Dans ce cas, les datamarts ont leur propre donner directement à partir des bases de donner OLTP et non de l'entrepôt centralisé et intégré, éliminant ainsi le besoin d'avoir l'entrepôt central sur place.

Chaque data mart nécessite au moins un lien vers ses sources donner. L'inconvénient d'avoir plusieurs connexions pour chaque magasin de données est que, par rapport aux deux architectures précédentes, la surabondance de donner augmente considérablement.

Chaque datamart doit stocker tous les donner requis localement pour n’avoir aucun effet sur les systèmes OLTP. Cela fait que je donner ils sont stockés dans différents magasins de données (Inmon et al. 1997). Un autre inconvénient de cette architecture est qu’elle conduit à la création d’interconnexions complexes entre les datamarts et leurs sources de données. donner qui sont difficiles à réaliser et à contrôler (Inmon et al. 1997).

Un autre inconvénient est que les utilisateurs finaux ne peuvent pas accéder à l'aperçu des informations sur l'entreprise, car je donner des différents data marts ne sont pas intégrés (Ovum 1998).
Un autre inconvénient est qu'il peut y avoir plus d'une définition pour chaque terminologie utilisée dans les data marts, ce qui génère des incohérences de donner en organisation (Ovum 1998).
Malgré les inconvénients évoqués ci-dessus, les datamarts indépendants suscitent toujours l’intérêt de nombreuses organisations (IDC 1997). Un facteur qui les rend attrayants est qu’ils se développent plus rapidement et nécessitent moins de temps et de ressources (Bresnahan 1996, Berson et Smith 1997, Ovum 1998). Par conséquent, ils servent principalement de projets tests qui peuvent être utilisés pour identifier rapidement les avantages et/ou les imperfections du projet (Parsaye 1995, Braly 1995, Newing 1996). Dans ce cas, la part à mettre en œuvre dans le projet pilote doit être petite mais importante pour l'organisation (Newing 1996, Mansell-Lewis 1996).

En examinant le prototype, les utilisateurs finaux et l'administration peuvent décider de poursuivre ou d'arrêter le projet (Flanagan et Safdie 1997).
Si la décision doit être maintenue, les datamarts destinés aux autres secteurs devraient être construits un par un. Il existe deux options pour les utilisateurs finaux en fonction de leurs besoins en matière de création de matrices de données indépendantes : intégrée/fédérée et non intégrée (Ovum 1998).

Dans la première méthode, chaque nouveau data mart doit être construit sur la base des data marts actuels et du modèle donner utilisé par l'entreprise (Varney 1996, Berson et Smith 1997, Peacock 1998). La nécessité d'utiliser le modèle donner de l'entreprise signifie qu'il faut s'assurer qu'il n'y a qu'une seule définition pour chaque terminologie utilisée dans les data marts, ceci afin de garantir également que différents data marts peuvent être combinés pour donner un aperçu des informations de l'entreprise (Bresnahan 1996). Cette méthode est dite ascendante et est la meilleure lorsqu'il existe une contrainte de moyens financiers et de temps (Flanagan et Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). Dans la deuxième méthode, les datamarts construits ne peuvent satisfaire que les besoins d’une unité spécifique. Une variante du datamart fédéré est le entrepôt de données distribué dans lequel le base de données Le middleware Hub Server est utilisé pour fusionner de nombreux datamarts en un seul référentiel donner distribué (White 1995). Dans ce cas, je donner les entreprises sont réparties dans plusieurs data marts. Les demandes des utilisateurs finaux sont transmises à base de données middleware du serveur hub, qui extrait tout donner demandé par les data marts et renvoie les résultats aux applications des utilisateurs finaux. Cette méthode fournit des informations commerciales aux utilisateurs finaux. Toutefois, les problèmes des datamarts indépendants ne sont toujours pas éliminés. Il existe une autre architecture qui peut être utilisée, appelée entrepôt de données virtuel (White 1995). Cependant, cette architecture, décrite dans la figure 2.9, n'est pas une architecture de stockage de données. donner réel car il ne déplace pas le chargement des systèmes OLTP vers entrepôt de données (Demarest 1994).

En fait, les demandes de donner Les informations provenant des utilisateurs finaux sont transmises aux systèmes OLTP qui renvoient les résultats après avoir traité les demandes des utilisateurs. Bien que cette architecture permette aux utilisateurs finaux de générer des rapports et d'effectuer des requêtes, elle ne peut pas fournir la

donner historique et aperçu des informations sur l'entreprise depuis que je donner des différents systèmes OLTP ne sont pas intégrés. Par conséquent, cette architecture ne peut pas satisfaire l’analyse de donner complexes comme les prévisions.

Sélection des applications d'accès et de récupération donner

Le but de construire un entrepôt de données est de transmettre des informations aux utilisateurs finaux (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998) ; une ou plusieurs applications d'accès et de récupération donner doit être fourni. À ce jour, il existe une grande variété de ces applications parmi lesquelles l'utilisateur peut choisir (Hammergren 1998, Humphries et al. 1999). Les applications que vous sélectionnez déterminent le succès de votre effort d'entreposage donner dans une organisation car les applications constituent la partie la plus visible de entrepôt de données à l'utilisateur final (Inmon et al. 1997, Poe 1996). Pour réussir un entrepôt de données, doit être en mesure de soutenir les activités d'analyse de donner de l'utilisateur final (Poe 1996, Seddon et Benjamin 1998, Eckerson 1999). Ainsi, le « niveau » de ce que souhaite l’utilisateur final doit être identifié (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

En général, les utilisateurs finaux peuvent être regroupés en trois catégories : les utilisateurs exécutifs, les analystes commerciaux et les utilisateurs expérimentés (Poe 1996, Humphries et al. 1999). Les utilisateurs exécutifs ont besoin d'un accès facile à des ensembles prédéfinis de rapports (Humphries et al. 1999). Ces ratios sont facilement accessibles grâce à la navigation dans les menus (Poe 1996). De plus, les rapports doivent présenter les informations à l'aide d'une représentation graphique telle que des tableaux et des modèles pour transmettre rapidement les informations (Humphries et al. 1999). Les analystes commerciaux, qui n'ont peut-être pas les capacités techniques nécessaires pour développer eux-mêmes des rapports à partir de zéro, doivent être capables de modifier les rapports actuels pour répondre à leurs besoins spécifiques (Poe 1996, Humphries et al. 1999). Les utilisateurs expérimentés, quant à eux, sont le type d'utilisateurs finaux qui ont la capacité de générer et d'écrire des requêtes et des rapports à partir de zéro (Poe 1996, Humphries et al. 1999). Ce sont eux qui

ils élaborent des rapports pour d'autres types d'utilisateurs (Poe 1996, Humphries et al. 1999).

Une fois les besoins de l'utilisateur final déterminés, une sélection d'applications d'accès et de récupération doit être effectuée. donner parmi tous ceux disponibles (Poe 1996, Inmon et al. 1997).
Accès à donner et les outils de récupération peuvent être classés en 4 types : outils OLAP, outils EIS/DSS, outils de requête et de reporting et outils d'exploration de données.

Les outils OLAP permettent aux utilisateurs de créer des requêtes ad hoc ainsi que celles effectuées sur le base de données de la entrepôt de données. De plus, ces produits permettent aux utilisateurs d'explorer donner du général au détaillé.

Les outils EIS/DSS fournissent des rapports exécutifs tels que des analyses « et si » et un accès à des rapports pilotés par menu. Les rapports doivent être prédéfinis et fusionnés avec des menus pour une navigation plus facile.
Les outils de requête et de reporting permettent aux utilisateurs de produire des rapports prédéfinis et spécifiques.

Les outils d’exploration de données sont utilisés pour identifier les relations qui pourraient apporter un nouvel éclairage sur des opérations oubliées dans le monde. donner de l’entrepôt de données.

En plus d'optimiser les exigences de chaque type d'utilisateur, les outils sélectionnés doivent être intuitifs, efficaces et faciles à utiliser. Ils doivent également être compatibles avec d’autres parties de l’architecture et capables de fonctionner avec les systèmes existants. Il est également recommandé de choisir des outils d’accès et de récupération de données offrant des prix et des performances raisonnables. D'autres critères à prendre en compte incluent l'engagement du fournisseur d'outils à prendre en charge son produit et la manière dont il évoluera dans les versions futures. Pour garantir l'engagement des utilisateurs dans l'utilisation de l'entrepôt de données, l'équipe de développement implique les utilisateurs dans le processus de sélection des outils. Dans ce cas, une évaluation pratique des utilisateurs doit être réalisée.

Pour améliorer la valeur de l'entrepôt de données, l'équipe de développement peut également fournir un accès Web à son entrepôt de données. Un entrepôt de données Web permet aux utilisateurs d'accéder au donner depuis des endroits éloignés ou en voyage. Aussi les informations peuvent

être fournis à moindre coût grâce à une réduction des coûts de formation.

2.4.3 Entreposage De Données Phase d'exploitation

Cette phase comprend trois activités : définition des stratégies de rafraîchissement des données, contrôle des activités de l'entrepôt de données et gestion de la sécurité de l'entrepôt de données.

Définition des stratégies d'actualisation des données

Après le chargement initial, je donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. base de données de l'entrepôt de données doivent être actualisés périodiquement pour reproduire les modifications qui y ont été apportées donner originaux. Vous devez donc décider quand actualiser, à quelle fréquence l'actualisation doit être planifiée et comment actualiser les données. donner. Il est suggéré d'actualiser le donner lorsque le système peut être mis hors ligne. La fréquence de rafraîchissement est déterminée par l'équipe de développement en fonction des besoins des utilisateurs. Il existe deux approches pour actualiser l'entrepôt de données : l'actualisation complète et le chargement continu des modifications.

La première approche, l'actualisation complète, nécessite de recharger tous donner de zéro. Cela signifie que tous les donner requis doivent être extraits, nettoyés, transformés et intégrés à chaque rafraîchissement. Cette approche doit, dans la mesure du possible, être évitée car elle nécessite beaucoup de temps et de ressources.

Une approche alternative consiste à télécharger continuellement les modifications. Cela ajoute que je donner qui ont été modifiés depuis le dernier cycle d'actualisation de l'entrepôt de données. L'identification des enregistrements nouveaux ou modifiés réduit considérablement la quantité de donner qui doit être propagé à l'entrepôt de données à chaque mise à jour puisque seuls ces donner sera ajouté au base de données de l’entrepôt de données.

Il existe au moins 5 approches qui peuvent être utilisées pour retirer i donner nouveau ou modifié. Pour obtenir une stratégie de rafraîchissement des données efficace donner un mélange de ces approches qui capture tous les changements dans le système peut être utile.

La première approche, qui utilise des horodatages, suppose que tous sont attribués donner édité et mis à jour un horodatage afin que vous puissiez facilement identifier tous donner modifié et nouveau. Cette approche n'a cependant pas été largement utilisée dans la plupart des systèmes d'exploitation actuels.
La deuxième approche consiste à utiliser un fichier delta généré par une application qui contient uniquement les modifications apportées à donner. L'utilisation de ce fichier amplifie également le cycle de mise à jour. Cependant, même cette méthode n’a pas été utilisée dans de nombreuses applications.
La troisième approche consiste à analyser un fichier journal, qui contient essentiellement des informations similaires au fichier delta. La seule différence est qu'un fichier journal est créé pour le processus de récupération et peut être difficile à comprendre.
La quatrième approche consiste à modifier le code de l'application. Cependant, la plupart du code des applications est ancien et fragile ; cette technique doit donc être évitée.
La dernière approche consiste à comparer les donner sources avec le fichier dei principal donner.

Contrôle des activités de l'entrepôt de données

Une fois l’entrepôt de données mis à la disposition des utilisateurs, il doit être surveillé au fil du temps. Dans ce cas, l'administrateur de l'entrepôt de données peut utiliser un ou plusieurs outils de gestion et de contrôle pour surveiller l'utilisation de l'entrepôt de données. En particulier, des informations peuvent être collectées sur les personnes et l'heure à laquelle elles accèdent à l'entrepôt de données. Allez donner collectées, un profil du travail effectué peut être créé et utilisé comme entrée dans la mise en œuvre de la rétrofacturation de l'utilisateur. La rétrofacturation permet aux utilisateurs d'être informés du coût de traitement de l'entrepôt de données.

De plus, l'audit de l'entrepôt de données peut également être utilisé pour identifier les types de requêtes, leur taille, le nombre de requêtes par jour, les temps de réaction aux requêtes, les secteurs touchés et le montant des requêtes. donner traité. Un autre objectif de l'audit d'un entrepôt de données est d'identifier les donner qui ne sont pas utilisés. Ces donner ils peuvent être supprimés de l'entrepôt de données pour gagner du temps

réponse à l'exécution des requêtes et contrôle la croissance donner qui résident dans le base de données de l’entrepôt de données.

Gestion de la sécurité de l'entrepôt de données

Un entrepôt de données contient donner intégré, critique, sensible et facilement accessible. C'est pour cette raison qu'il doit être protégé des utilisateurs non autorisés. Une façon d'implémenter la sécurité consiste à utiliser la fonction del SGBD pour attribuer différents privilèges à différents types d'utilisateurs. De cette manière, un profil d'accès doit être maintenu pour chaque type d'utilisateur. Une autre façon de sécuriser l'entrepôt de données consiste à le chiffrer comme indiqué dans le base de données de l’entrepôt de données. Accès à donner et les outils de récupération doivent décrypter le donner avant de présenter les résultats aux utilisateurs.

2.4.4 Entreposage De Données Phase de déploiement

Il s'agit de la dernière phase du cycle de mise en œuvre de l'entrepôt de données. Les activités à réaliser au cours de cette phase comprennent la formation des utilisateurs à l'utilisation de l'entrepôt de données et la réalisation d'examens de l'entrepôt de données.

Formation des utilisateurs

La formation des utilisateurs doit être effectuée avant d'accéder au donner de l'entrepôt de données et l'utilisation d'outils de récupération. En général, les sessions devraient commencer par une introduction au concept de stockage donner, le contenu de l'entrepôt de données, le méta donner et les fonctionnalités de base des outils. Ensuite, les utilisateurs plus avancés pourraient également étudier les tables physiques et les fonctionnalités utilisateur des outils d’accès et de récupération des données.

Il existe de nombreuses approches pour former les utilisateurs. L’une d’elles implique une sélection de nombreux utilisateurs ou analystes choisis parmi un ensemble d’utilisateurs, en fonction de leurs compétences en leadership et en communication. Ils sont personnellement formés sur tout ce qu’ils doivent savoir pour se familiariser avec le système. Une fois la formation terminée, ils retournent à leur travail et commencent à enseigner aux autres utilisateurs comment utiliser le système. Sur le

Sur la base de ce qu'ils ont appris, d'autres utilisateurs peuvent commencer à explorer l'entrepôt de données.
Une autre approche consiste à former plusieurs utilisateurs en même temps, comme si vous suiviez un cours en classe. Cette méthode convient lorsque de nombreux utilisateurs doivent être formés en même temps. Une autre méthode consiste à former chaque utilisateur individuellement, un par un. Cette méthode convient lorsqu'il y a peu d'utilisateurs.

L'objectif de la formation des utilisateurs est de vous familiariser avec l'accès au donner et des outils de récupération ainsi que le contenu de l'entrepôt de données. Cependant, certains utilisateurs peuvent être dépassés par la quantité d’informations fournies lors de la session de formation. Un certain nombre de séances de remise à niveau doivent donc être réalisées pour une assistance continue et pour répondre à des questions précises. Dans certains cas, un groupe d'utilisateurs est constitué pour fournir ce type de support.

Recueillir des commentaires

Une fois l'entrepôt de données déployé, les utilisateurs peuvent utiliser i donner qui résident dans l’entrepôt de données à diverses fins. La plupart du temps, les analystes ou les utilisateurs utilisent i donner dans l'entrepôt de données pour :

1 Identifier les tendances de l'entreprise
2 Analyser les profils d'achat des clientèle
3 Diviser je clientèle et
4 Offrir les meilleurs services à clientèle – personnaliser les services
5 Formuler des stratégies marketing
6 Fournir des devis compétitifs pour les analyses de coûts et aider au contrôle
7 Soutenir la prise de décision stratégique
8 Identifier les opportunités de se démarquer
9 Améliorer la qualité des processus métier actuels
10 Vérifiez le bénéfice

Suivant l'orientation du développement de l'entrepôt de données, une série d'examens pourrait être menée sur le système pour obtenir des commentaires.

à la fois de l'équipe de développement et de la communauté des utilisateurs finaux.
Les résultats obtenus pourront être pris en considération pour le prochain cycle de développement.

L’entrepôt de données ayant une approche incrémentale, il est crucial de tirer les leçons des succès et des erreurs des développements précédents.

2.5 Résumé

Dans ce chapitre, les approches présentes dans la littérature ont été discutées. Dans la section 1, le concept d'entrepôt de données et son rôle dans la science décisionnelle ont été discutés. La section 2 décrit les principales différences entre les entrepôts de données et les systèmes OLTP. Dans la section 3, nous avons discuté du modèle d'entrepôt de données Monash qui a été utilisé dans la section 4 pour décrire les activités impliquées dans le processus de développement d'un entrepôt de données, ces thèses n'étaient pas basées sur une recherche rigoureuse. Ce qui se passe dans la réalité peut être très différent de ce que rapporte la littérature, mais ces résultats peuvent être utilisés pour créer un contexte de base qui souligne le concept d'entrepôt de données pour cette recherche.

Chapitre 3

Méthodes de recherche et de conception

Ce chapitre aborde les méthodes de recherche et de conception de cette étude. La première partie montre une vue générique des méthodes de recherche disponibles pour la recherche d'informations, en outre les critères de sélection de la meilleure méthode pour une étude particulière sont discutés. Dans la section 2, deux méthodes sélectionnées avec les critères qui viennent d'être exposés sont ensuite discutées ; parmi ceux-ci, l’un sera choisi et adopté avec les raisons exposées à la section 3 où les raisons d’exclure l’autre critère sont également exposées. La section 4 présente la conception de la recherche et la section 5 les conclusions.

3.1 Recherche dans les systèmes d'information

La recherche en systèmes d'information ne se limite pas simplement au domaine technologique mais doit également être étendue à des fins comportementales et organisationnelles.
Nous le devons aux thèses de diverses disciplines allant des sciences sociales aux sciences naturelles ; cela conduit à la nécessité d'utiliser un certain éventail de méthodes de recherche impliquant des méthodes quantitatives et qualitatives pour les systèmes d'information.
Toutes les méthodes de recherche disponibles sont importantes, en fait plusieurs chercheurs comme Jenkins (1985), Nunamaker et al. (1991) et Galliers (1992) soutiennent qu'il n'existe pas de méthode universelle spécifique pour mener des recherches dans les différents domaines des systèmes d'information ; en fait, une méthode peut convenir à une recherche particulière mais pas à d’autres. Cela nous amène à sélectionner une méthode adaptée à notre projet de recherche particulier : pour ce choix, Benbasat et al. (1987) affirment que la nature et le but de la recherche doivent être pris en compte.

3.1.1 Nature de la recherche

Les différentes méthodes basées sur la nature de la recherche peuvent être classées en trois traditions largement connues en sciences de l'information : la recherche positiviste, interprétative et critique.

3.1.1.1 Recherches positivistes

La recherche positiviste est également connue sous le nom d’étude scientifique ou empirique. Il cherche à : « expliquer et prédire ce qui va se passer dans le monde social en examinant les régularités et les relations de cause à effet entre les éléments qui le constituent » (Shanks et al 1993).

La recherche positiviste se caractérise également par la répétabilité, les simplifications et les réfutations. Par ailleurs, les recherches positivistes admettent l’existence de relations a priori entre les phénomènes étudiés.
Selon Galliers (1992), la taxonomie est une méthode de recherche incluse dans le paradigme positiviste, qui ne se limite cependant pas à cela, on y trouve en effet des expériences en laboratoire, des expériences sur le terrain, des études de cas, des démonstrations de théorèmes, des prédictions et des simulations. En utilisant ces méthodes, les chercheurs admettent que les phénomènes étudiés peuvent être observés de manière objective et rigoureuse.

3.1.1.2 Recherche interprétative

La recherche interprétative, souvent appelée phénoménologie ou antipositivisme, est décrite par Neuman (1994) comme « l’analyse systématique du sens social de l’action par l’observation directe et détaillée de personnes dans des situations naturelles, afin d’arriver à une compréhension et à une compréhension ». à l’interprétation de la manière dont les gens créent et entretiennent leur monde social ». Les études interprétatives rejettent l’hypothèse selon laquelle les phénomènes observés peuvent être observés objectivement. En fait, ils reposent sur des interprétations subjectives. De plus, les chercheurs interprétatifs n’imposent pas de significations a priori aux phénomènes qu’ils étudient.

Cette méthode comprend des études subjectives/argumentatives, des recherches-actions, des études descriptives/interprétatives, des recherches prospectives et des jeux de rôle. En plus de ces enquêtes et études de cas peuvent être incluses dans cette approche car elles concernent des études d'individus ou d'organisations dans des situations complexes du monde réel.

3.1.1.3 Recherche critique

L'enquête critique est l'approche la moins connue des sciences sociales, mais elle a récemment retenu l'attention des chercheurs en systèmes d'information. L'hypothèse philosophique selon laquelle la réalité sociale est historiquement produite et reproduite par les personnes, ainsi que par les systèmes sociaux avec leurs actions et interactions. Leur capacité dépend toutefois d’un certain nombre de considérations sociales, culturelles et politiques.

Tout comme la recherche interprétative, la recherche critique soutient que la recherche positiviste n’a rien à voir avec le contexte social et ignore son influence sur les actions humaines.
La recherche critique, en revanche, critique la recherche interprétative parce qu’elle est trop subjective et ne vise pas à aider les gens à améliorer leur vie. La plus grande différence entre la recherche critique et les deux autres approches réside dans sa dimension évaluative. Alors que l’objectivité des traditions positivistes et interprétatives est de prédire ou d’expliquer le statu quo ou la réalité sociale, la recherche critique vise à évaluer et à transformer de manière critique la réalité sociale étudiée.

Les chercheurs critiques s’opposent généralement au statu quo afin d’éliminer les différences sociales et d’améliorer les conditions sociales. La recherche critique s'engage dans une vision processuelle des phénomènes d'intérêt et, par conséquent, est normalement longitudinale. Des exemples de méthodes de recherche sont les études historiques à long terme et les études ethnographiques. Cependant, la recherche critique n’a pas été largement utilisée dans la recherche sur les systèmes d’information.

3.1.2 Objectif de la recherche

Outre la nature de la recherche, son objectif peut être utilisé pour guider le chercheur dans le choix d'une méthode de recherche particulière. L'objectif d'un projet de recherche est étroitement lié à la position de la recherche par rapport au cycle de recherche qui comprend trois phases : l'élaboration de la théorie, la vérification de la théorie et l'affinement de la théorie. Ainsi, selon le timing du cycle de recherche, un projet de recherche peut avoir une finalité explicative, descriptive, exploratoire ou prédictive.

3.1.2.1 Recherche exploratoire

La recherche exploratoire vise à étudier un sujet totalement nouveau et à formuler des questions et des hypothèses pour des recherches futures. Ce type de recherche est utilisé dans la construction théorique pour obtenir de premières références dans un nouveau domaine. Généralement, des méthodes de recherche qualitatives sont utilisées, telles que des études de cas ou des études phénoménologiques.

Cependant, il est également possible d'avoir recours à des techniques quantitatives telles que des enquêtes exploratoires ou des expérimentations.

3.1.3.3 Recherche descriptive

La recherche descriptive vise à analyser et décrire de manière très détaillée une situation ou une pratique organisationnelle particulière. Ceci est approprié pour construire des théories et peut également être utilisé pour confirmer ou contester des hypothèses. La recherche descriptive comprend généralement l'utilisation de mesures et d'échantillons. Les méthodes de recherche les plus appropriées comprennent les enquêtes et l'analyse des antécédents.

3.1.2.3 Recherche explicative

La recherche explicative tente d'expliquer pourquoi les choses se produisent. Il s'appuie sur des faits déjà étudiés et tente de trouver les raisons de ces faits.
Ainsi, la recherche explicative repose normalement sur une recherche exploratoire ou descriptive et est auxiliaire pour tester et affiner les théories. La recherche explicative utilise normalement des études de cas ou des méthodes de recherche basées sur des enquêtes.

3.1.2.4 Recherche préventive

La recherche préventive vise à prédire les événements et les comportements observés et étudiés (Marshall et Rossman 1995). La prédiction est le test scientifique standard de la vérité. Ce type de recherche fait généralement appel à des enquêtes ou à des analyses de donner historiens. (Yin 1989)

La discussion ci-dessus démontre qu'il existe un certain nombre de méthodes de recherche possibles qui peuvent être utilisées dans une étude particulière. Cependant, il doit exister une méthode spécifique plus adaptée que les autres à un type particulier de projet de recherche. (Galliers 1987, Yin 1989, De Vaus 1991). Chaque chercheur doit donc évaluer soigneusement les forces et les faiblesses des différentes méthodes, afin d'adopter la méthode de recherche la plus adaptée et compatible avec le projet de recherche. (Jenkins 1985, Pervan et Klass 1992, Bonomia 1985, Yin 1989, Himilton et Ives 1992).

3.2. Méthodes de recherche possibles

L'objectif de ce projet était d'étudier l'expérience des organisations australiennes avec i donner stocké avec un développement de entrepôt de données. Date que, actuellement, il y a un manque de recherche dans le domaine de l'entreposage de données en Australie, ce projet de recherche est encore dans la phase théorique du cycle de recherche et a un but exploratoire. L’exploration de l’expérience des organisations australiennes adoptant l’entreposage de données nécessite une interprétation de la société réelle. Par conséquent, l’hypothèse philosophique qui sous-tend le projet de recherche suit l’interprétation traditionnelle.

Après un examen rigoureux des méthodes disponibles, deux méthodes de recherche possibles ont été identifiées : les enquêtes et les études de cas, qui peuvent être utilisées pour la recherche exploratoire (Shanks et al. 1993). Galliers (1992) plaide en faveur de la pertinence de ces deux méthodes pour cette étude particulière dans sa taxonomie révisée en affirmant qu'elles conviennent à l'élaboration de théories. Les deux sous-sections suivantes traitent chaque méthode en détail.

3.2.1 Méthode de recherche d'investigation

La méthode de recherche par enquête est issue de l’ancienne méthode de recensement. Un recensement consiste à collecter des informations sur l’ensemble d’une population. Cette méthode est coûteuse et peu pratique, surtout si la population est nombreuse. Ainsi, par rapport à un recensement, une enquête se concentre normalement sur la collecte d'informations sur un petit nombre, ou échantillon, de représentants de la population (Fowler 1988, Neuman 1994). Un échantillon reflète la population à partir de laquelle il est issu, avec différents niveaux de précision, selon la structure de l'échantillon, sa taille et la méthode de sélection utilisée (Fowler 1988, Babbie 1982, Neuman 1994).

La méthode d’enquête est définie comme « des instantanés de pratiques, de situations ou d’opinions à un moment donné, réalisés à l’aide de questionnaires ou d’entretiens, à partir desquels des déductions peuvent être tirées ».
made » (Galliers 1992 : 153) [instantané de pratiques, de situations ou d’opinions à un moment donné, réalisé à l’aide de questionnaires ou d’entretiens, à partir desquels des déductions peuvent être tirées]. Les enquêtes consistent à recueillir des informations sur certains aspects de l'étude, auprès d'un certain nombre de participants, en posant des questions (Fowler 1988). Ces questionnaires et entretiens, qui comprennent des entretiens téléphoniques en face-à-face et des entretiens structurés, sont également des techniques de collecte de données. donner les plus couramment utilisées dans les enquêtes (Blalock 1970, Nachmias et Nachmias 1976, Fowler 1988), les observations et les analyses peuvent être utilisées (Gable 1994). De toutes ces méthodes de collecte des donner, l'utilisation d'un questionnaire est la technique la plus populaire, car elle garantit que je donner

Les données collectées sont structurées et formatées, et facilitent donc la classification des informations (Hwang 1987, de Vaus 1991).

En analysant le donner, une stratégie d'enquête fait souvent appel à des techniques quantitatives, telles que l'analyse statistique, mais des techniques qualitatives peuvent également être utilisées (Galliers 1992, Pervan

et Klass 1992, Gable 1994). Normalement, je donner Les données collectées sont utilisées pour analyser les distributions et les modèles d'associations (Fowler 1988).

Bien que les enquêtes soient généralement appropriées pour les recherches traitant de la question « quoi ? » (quoi) ou en dérivant, comme « combien » et « combien », elles peuvent être posées via la question « pourquoi » (Sonquist et Dunkelberg 1977, Yin 1989). Selon Sonquist et Dunkelberg (1977), la recherche par enquête vise à remettre en question des hypothèses, à évaluer des programmes, à décrire la population et à développer des modèles de comportement humain. De plus, les enquêtes peuvent être utilisées pour étudier l'opinion, les conditions, les opinions, les caractéristiques, les attentes et même les comportements passés ou présents d'une certaine population (Neuman 1994).

Les enquêtes permettent au chercheur de découvrir les relations au sein de la population et les résultats sont normalement plus généraux que les autres méthodes (Sonquist et Dunkelberg 1977, Gable 1994). Les enquêtes permettent aux chercheurs de couvrir une zone géographique plus vaste et d'atteindre de nombreux répondants (Blalock 1970, Sonquist et Dunkelberg 1977, Hwang et Lin 1987, Gable 1994, Neuman 1994). Enfin, les enquêtes peuvent fournir des informations qui ne sont pas disponibles ailleurs ou sous la forme requise pour les analyses (Fowler 1988).

Il existe cependant certaines limites à la réalisation d'une enquête. Un inconvénient est que le chercheur ne peut pas obtenir beaucoup d’informations sur l’objet étudié. Cela est dû au fait que les enquêtes sont réalisées uniquement à un moment précis et que, par conséquent, le nombre de variables et de personnes que le chercheur peut évaluer est limité.

étude (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Un autre inconvénient est que la réalisation d'une enquête peut être très coûteuse en termes de temps et de ressources, en particulier si elle implique des entretiens en face-à-face (Fowler 1988).

3.2.2. Méthode de recherche par enquête

La méthode de recherche par enquête implique une étude approfondie d’une situation particulière dans son contexte réel sur une période de temps définie, sans aucune intervention de la part du chercheur (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Cette méthode est principalement utilisée pour décrire les relations entre les variables étudiées dans une situation particulière (Galliers 1992). Les enquêtes peuvent porter sur un ou plusieurs cas, selon le phénomène analysé (Franz et Robey 1987, Eisenhardt 1989, Yin 1989).

La méthode de recherche par enquête est définie comme « une enquête empirique qui étudie un phénomène contemporain dans son contexte réel, en utilisant de multiples sources recueillies auprès d'une ou plusieurs entités telles que des personnes, des groupes ou des organisations » (Yin 1989). Il n'y a pas de séparation claire entre le phénomène et son contexte et il n'y a pas de contrôle expérimental ni de manipulation des variables (Yin 1989, Benbasat et al. 1987).

Il existe une variété de techniques pour la collecte des donner qui peuvent être utilisés dans la méthode d'enquête, qui comprennent des observations directes, des examens de documents d'archives, des questionnaires, un examen de la documentation et des entretiens structurés. Avoir une gamme diversifiée de techniques de récolte donner, les enquêtes permettent aux chercheurs d'aborder à la fois donner à la fois qualitative et quantitative (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Comme c'est le cas pour la méthode d'enquête, un chercheur en enquête sert d'observateur ou de chercheur et non de participant actif dans l'organisation étudiée.

Benbasat et ses collègues (1987) affirment que la méthode d'enquête est particulièrement adaptée à l'élaboration d'une théorie de la recherche, qui commence par une question de recherche et se poursuit par l'éducation.

d'une théorie au cours du processus de collecte donner. Etant également adapté à la scène

de construction théorique, Franz et Robey (1987) suggèrent que la méthode d’enquête peut également être utilisée pour la phase théorique complexe. Dans ce cas, sur la base des preuves recueillies, une théorie ou une hypothèse donnée est vérifiée ou réfutée. En outre, l'enquête convient également aux recherches portant sur les questions « comment » ou « pourquoi » (Yin 1989).

Comparées à d'autres méthodes, les enquêtes permettent au chercheur de saisir les informations essentielles de manière plus détaillée (Galliers 1992, Shanks et al. 1993). De plus, les enquêtes permettent au chercheur de comprendre la nature et la complexité des processus étudiés (Benbasat et al. 1987).

Il existe quatre inconvénients principaux associés à la méthode d’enquête. Le premier est le manque de déductions contrôlées. La subjectivité du chercheur peut modifier les résultats et les conclusions de l'étude (Yin 1989). Le deuxième inconvénient est le manque d’observation contrôlée. Contrairement aux méthodes expérimentales, le chercheur enquêteur ne peut contrôler les phénomènes étudiés car ils sont examinés dans leur contexte naturel (Gable 1994). Le troisième inconvénient est le manque de réplicabilité. En effet, il est peu probable que le chercheur observe les mêmes événements et ne puisse pas vérifier les résultats d'une étude particulière (Lee 1989). Enfin, en raison de la non-réplicabilité, il est difficile de généraliser les résultats obtenus à partir d'une ou plusieurs enquêtes (Galliers 1992, Shanks et al 1993). Tous ces problèmes ne sont cependant pas insurmontables et peuvent en fait être minimisés par le chercheur en appliquant des actions appropriées (Lee 1989).

3.3. Justifier la méthodologie de recherche adopté

Parmi les deux méthodes de recherche possibles pour cette étude, la méthode d’enquête est considérée comme la plus adaptée. L'enquête a été abandonnée après un examen attentif des questions pertinentes.

mérites et faiblesses. Le caractère approprié ou inapproprié de chaque méthode pour cette étude est discuté ci-dessous.

3.3.1. Méthode de recherche inappropriée d'enquête

La méthode d’enquête nécessite une étude approfondie d’une situation particulière au sein d’une ou plusieurs organisations sur une période donnée (Eisenhardt 1989). Dans ce cas, le délai peut dépasser le délai imparti pour cette étude. Une autre raison pour ne pas adopter la méthode d'enquête est que les résultats peuvent souffrir d'un manque de rigueur (Yin 1989). La subjectivité du chercheur peut influencer les résultats et les conclusions. Une autre raison est que cette méthode est plus adaptée à la recherche sur des questions de type « comment » ou « pourquoi » (Yin 1989), alors que la question de recherche de cette étude est du type « quoi ». Enfin et surtout, il est difficile de généraliser les résultats d'une ou de quelques enquêtes seulement (Galliers 1992, Shanks et al. 1993). C’est pour cette raison que la méthode de recherche par enquête n’a pas été choisie car elle ne convenait pas à cette étude.

3.3.2. Commodité de la méthode de recherche enquête

Au moment où cette recherche a été menée, la pratique de l’entreposage de données n’avait pas été largement adoptée par les organisations australiennes. Il n’y avait donc pas beaucoup d’informations sur leur mise en œuvre au sein des organisations australiennes. Les informations disponibles provenaient d'organisations qui avaient mis en œuvre ou utilisé un entrepôt de données. Dans ce cas, la méthode de recherche par enquête est la plus adaptée puisqu'elle permet d'obtenir des informations qui ne sont pas disponibles ailleurs ou sous la forme requise pour l'analyse (Fowler 1988). De plus, la méthode de recherche par enquête permet au chercheur d'avoir un bon aperçu des pratiques, des situations ou des opinions à un moment donné (Galliers 1992, Denscombe 1998). Un aperçu était nécessaire pour accroître les connaissances sur l’expérience australienne en matière d’entreposage de données.

En outre, Sonquist et Dunkelberg (1977) affirment que les résultats des enquêtes sont plus généraux que ceux des autres méthodes.

3.4. Conception de la recherche par sondage

L'enquête sur les pratiques d'entreposage de données a été réalisée en 1999. La population cible était constituée d'organisations australiennes intéressées par les études d'entreposage de données, car elles étaient probablement déjà informées des donner qu'ils stockent et pourraient donc fournir des informations utiles pour cette étude. La population cible a été identifiée grâce à une enquête initiale auprès de tous les membres australiens du Data Warehousing Institute (TDWIAAP). Cette section traite de la conception de la phase de recherche empirique de cette étude.

3.4.1. Technique de récolte donner

Parmi les trois techniques couramment utilisées dans la recherche par enquête (c'est-à-dire le questionnaire postal, l'entretien téléphonique et l'entretien personnel) (Nachmias 1976, Fowler 1988, de Vaus 1991), le questionnaire postal a été adopté pour cette étude. La première raison d’adopter cette dernière est qu’elle peut atteindre une population géographiquement dispersée (Blalock 1970, Nachmias et Nachmias 1976, Hwang et Lin 1987, de Vaus 1991, Gable 1994). Deuxièmement, le questionnaire postal convient aux participants très instruits (Fowler 1988). Le questionnaire postal de cette étude a été adressé aux sponsors, directeurs et/ou chefs de projet de projets d'entreposage de données. Troisièmement, les questionnaires envoyés par courrier conviennent lorsqu'une liste de diffusion sécurisée est disponible (Salant et Dilman 1994). TDWI, dans ce cas, une association d'entreposage de données de confiance a fourni la liste de diffusion de ses membres australiens. Un autre avantage du questionnaire postal par rapport au questionnaire téléphonique ou aux entretiens personnels est qu'il permet aux répondants de répondre avec plus de précision, en particulier lorsque les répondants doivent consulter des notes ou discuter de questions avec d'autres personnes (Fowler 1988).

Un inconvénient potentiel peut être le temps nécessaire pour répondre aux questionnaires par courrier. Normalement, une enquête postale est menée dans cet ordre : envoyer des lettres, attendre les réponses et envoyer la confirmation (Fowler 1988, Bainbridge 1989). Ainsi, la durée totale peut être plus longue que celle requise pour les entretiens personnels ou téléphoniques. Cependant, la durée totale peut être connue à l'avance (Fowler 1988, Denscombe 1998). Le temps consacré aux entretiens personnels ne peut être connu à l'avance car il varie d'un entretien à l'autre (Fowler 1988). Les entretiens téléphoniques peuvent être plus rapides que les questionnaires postaux et les entretiens personnels, mais peuvent entraîner un taux de non-réponse élevé en raison du manque de disponibilité de certaines personnes (Fowler 1988). De plus, les entretiens téléphoniques se limitent généralement à des listes de questions relativement courtes (Bainbridge 1989).

Une autre faiblesse du questionnaire postal est le taux élevé de non-réponse (Fowler 1988, Bainbridge 1989, Neuman 1994). Cependant, des contre-mesures ont été prises en associant cette étude à une institution d'entreposage de données fiable (c'est-à-dire TDWI) (Bainbridge 1989, Neuman 1994), qui envoie deux lettres de rappel aux non-répondants (Fowler 1988, Neuman 1994) et comprend également une lettre supplémentaire. expliquant le but de l’étude (Neuman 1994).

3.4.2. Unité d'analyse

Le but de cette étude est d'obtenir des informations sur la mise en œuvre de l'entreposage de données et son utilisation au sein des organisations australiennes. La population cible est constituée de toutes les organisations australiennes qui ont mis en œuvre, ou sont en train de mettre en œuvre, i entrepôt de données. Les organisations individuelles sont ensuite enregistrées sous leur nom. Le questionnaire a été envoyé par courrier aux organisations intéressées à adopter entrepôt de données. Cette méthode garantit que les informations collectées proviennent des ressources les plus appropriées de chaque organisation participante.

3.4.3. Échantillon d'enquête

La « liste de diffusion » des participants à l'enquête a été obtenue auprès de TDWI. À partir de cette liste, 3000 3000 organisations australiennes ont été sélectionnées comme base d'échantillonnage. Une lettre complémentaire expliquant le projet et l'objet de l'enquête, ainsi qu'une feuille de réponse et une enveloppe préaffranchie pour renvoyer le questionnaire complété ont été envoyées à l'échantillon. Sur les 198 XNUMX organisations, XNUMX ont accepté de participer à l’étude. Un si petit nombre de réponses était attendu date le grand nombre d'organisations australiennes qui avaient alors adopté ou étaient en train d'adopter une stratégie d'entreposage de données au sein de leur organisation. Ainsi, la population cible de cette étude est constituée de seulement 198 organisations.

3.4.4. Contenu du questionnaire

La structure du questionnaire était basée sur le modèle d'entreposage de données Monash (discuté précédemment dans la partie 2.3). Le contenu du questionnaire était basé sur l'analyse de la littérature présentée au chapitre 2. Une copie du questionnaire envoyé aux participants à l'enquête se trouve à l'annexe B. Le questionnaire comprend six sections, qui suivent les phases du modèle couvert. Les six paragraphes suivants résument brièvement le contenu de chaque section.

Section A: Informations de base sur l'organisation
Cette section contient des questions relatives au profil des organisations participantes. De plus, certaines questions sont liées au statut du projet d'entreposage de données du participant. Les informations confidentielles telles que le nom de l'organisation n'ont pas été révélées dans l'analyse de l'enquête.

Section B: Début
Les questions de cette section sont liées à la tâche de démarrage de l'entreposage de données. Des questions ont été posées concernant les initiateurs du projet, les garants, les compétences et connaissances requises, les objectifs de développement de l'entreposage de données et les attentes des utilisateurs finaux.

Section C: Conception
Cette section contient des questions liées aux activités de planification entrepôt de données. Les questions portaient notamment sur la portée de l'exécution, la durée du projet, le coût du projet et l'analyse coûts/avantages.

Section D : Développement
Dans la section développement, vous trouverez des questions relatives aux activités de développement du entrepôt de données: recueil des besoins des utilisateurs finaux, sources de donner, le modèle logique de donner, prototypes, planification des capacités, architectures techniques et sélection d'outils de développement d'entrepôts de données.

Section E : Fonctionnement
Questions opérationnelles liées au fonctionnement et à l’extensibilité du entrepôt de données, comment il évolue dans la prochaine phase de développement. Là qualité des données, les stratégies de rafraîchissement de donner, la granularité du donner, l'évolutivité de entrepôt de données et les problèmes de sécurité de entrepôt de données faisaient partie des types de questions posées.

Section F : Développement
Cette section contient des questions liées à l'utilisation du entrepôt de données par les utilisateurs finaux. Le chercheur s'est intéressé au but et à l'utilité du entrepôt de données, les stratégies de revue et de formation adoptées et la stratégie de contrôle des entrepôt de données adopté.

3.4.5. Taux de réponse

Bien que les enquêtes postales soient critiquées pour leur faible taux de réponse, des mesures ont été prises pour augmenter le taux de réponse (comme indiqué précédemment dans la partie 3.4.1). Le terme « taux de réponse » fait référence au pourcentage de personnes dans un échantillon d'enquête particulier qui répondent au questionnaire (Denscombe 1998). La formule suivante a été utilisée pour calculer le taux de réponse à cette étude :

Nombre de personnes ayant répondu
Taux de réponse = ——————————————————————————– X 100 Nombre total de questionnaires envoyés

3.4.6. Test pilote

Avant l'envoi du questionnaire à l'échantillon, les questions ont été examinées en réalisant des tests pilotes, comme le suggèrent Luck et Rubin (1987), Jackson (1988) et de Vaus (1991). Le but des tests pilotes est de révéler les expressions maladroites et ambiguës et les questions difficiles à interpréter, de clarifier les définitions et les termes utilisés et d'identifier le temps approximatif requis pour remplir le questionnaire (Warwick et Lininger 1975, Jackson 1988, Salant et Dilman 1994). Les tests pilotes ont été réalisés en sélectionnant des sujets présentant des caractéristiques similaires à celles des sujets finaux, comme suggéré par Davis e Cosenza (1993). Dans cette étude, six professionnels de l'entreposage de données ont été sélectionnés comme sujets pilotes. Après chaque test pilote, les corrections nécessaires ont été apportées. A partir des tests pilotes réalisés, les participants ont contribué à remodeler et réinitialiser la version finale du questionnaire.

3.4.7. Méthodes d'analyse par Donner

I donner des enquêtes recueillies à partir des questionnaires fermés ont été analysées à l'aide d'un programme statistique appelé SPSS. De nombreuses réponses ont été analysées à l’aide de statistiques descriptives. Un certain nombre de questionnaires ont été retournés incomplets. Ceux-ci ont été traités avec plus de soin pour garantir que je donner les questions manquantes n'étaient pas la conséquence d'erreurs de saisie des données, mais du fait que les questions ne convenaient pas au déclarant ou que le déclarant avait décidé de ne pas répondre à une ou plusieurs questions spécifiques. Ces réponses manquantes ont été ignorées lors de l'analyse donner et ont été codés « - 9 » pour garantir leur exclusion du processus d'analyse.

Lors de la préparation du questionnaire, les questions fermées ont été précodées en attribuant un numéro à chaque option. Le numéro a ensuite été utilisé pour préparer le donner au cours de l'analyse (Denscombe 1998, Sapsford et Jupp 1996). Par exemple, six options étaient énumérées à la question 1 de la section B : conseil d'administration, cadre supérieur, service informatique, unité commerciale, consultants et autres. Dans le dossier de donner de SPSS, une variable a été générée pour indiquer « l'initiateur du projet », avec six étiquettes de valeur : « 1 » pour « conseil d'administration », « 2 » pour « cadre supérieur », etc. L'utilisation de l'échelle de Likertin dans certaines des questions fermées a également permis une identification sans effort étant donné l'utilisation des valeurs numériques correspondantes saisies dans SPSS. Pour les questions avec des réponses non exhaustives, qui ne s'excluent pas mutuellement, chaque option a été traitée comme une variable unique avec deux étiquettes de valeur : « 1 » pour « marqué » et « 2 » pour « non marqué ».

Les questions ouvertes ont été traitées différemment des questions fermées. Les réponses à ces questions n'ont pas été saisies dans SPSS. Au lieu de cela, ils ont été analysés à la main. L'utilisation de ce type de questions permet d'acquérir des informations sur les idées librement exprimées et les expériences personnelles des répondants (Bainbridge 1989, Denscombe 1998). Dans la mesure du possible, une catégorisation des réponses a été effectuée.

Pour l'analyse de donner, des méthodes d'analyse statistique simples sont utilisées, telles que la fréquence de réponse, la moyenne, l'écart type et la médiane (Argyrous 1996, Denscombe 1998).
Le test Gamma a donné de bons résultats pour obtenir des mesures quantitatives des associations entre donner ordinaux (Norusis 1983, Argyrous 1996). Ces tests étaient appropriés car les échelles ordinales utilisées ne comportaient pas beaucoup de catégories et pouvaient être présentées dans un tableau (Norusis 1983).

3.5 Résumé

Dans ce chapitre, la méthodologie et la conception de recherche adoptées pour cette étude ont été discutées.

La sélection de la méthode de recherche la plus appropriée pour une étude particulière prend en compte
prise en compte d'un certain nombre de règles, notamment la nature et le type de recherche, ainsi que les mérites et les faiblesses de chaque méthode possible (Jenkins 1985, Benbasat et al. 1097, Galliers et Land 1987, yin 1989, Hamilton et ives 1992, Galliers 1992, Neuman 1994). Compte tenu du manque de connaissances et de théories existantes concernant l’adoption de l’entreposage de données en Australie, cette étude de recherche nécessite une méthode de recherche interprétative dotée d’une capacité exploratoire pour explorer les expériences des organisations australiennes. La méthode de recherche choisie a été sélectionnée pour recueillir des informations concernant l'adoption du concept d'entreposage de données par les organisations australiennes. Un questionnaire postal a été choisi comme technique de collecte donner. Justifications de la méthode de recherche et de la technique de collecte donner sélectionnés seront fournis dans ce chapitre. Par ailleurs, une discussion a été présentée sur l'unité d'analyse, l'échantillon utilisé, les pourcentages de réponses, le contenu du questionnaire, le pré-test du questionnaire et la méthode d'analyse des résultats. donner.

La conception d'un Entreposage De Données:

Combinaison de la relation d'entité et de la modélisation dimensionnelle

RÉSUMÉ
Magasin i donner est un enjeu majeur d’actualité pour de nombreuses organisations. Un enjeu clé dans le développement du stockage informatique donner c'est sa conception.
La conception doit prendre en charge la détection de concepts dans le entrepôt de données au système existant et à d'autres sources de donner mais aussi une compréhension aisée et une efficacité dans la mise en œuvre des entrepôt de données.
Une grande partie de la documentation sur le stockage donner recommande l'utilisation de la modélisation des relations entre entités ou de la modélisation dimensionnelle pour représenter la conception de entrepôt de données.
Dans cet article, nous montrons comment les deux représentations peuvent être combinées dans une seule approche de dessin. entrepôt de données. L'approche utilisée est systématiquement

examiné dans une étude de cas et est identifié dans un certain nombre d’implications importantes pour les praticiens.

ENTREPOSAGE DE DONNÉES

Un entrepôt de données elle est généralement définie comme « une collection de données orientées sujet, intégrées, variables dans le temps et non volatiles à l'appui des décisions de gestion » (Inmon et Hackathorn, 1994). Orienté sujet et intégré indique que le entrepôt de données est conçu pour franchir les frontières fonctionnelles des systèmes Legaci pour offrir une perspective intégrée de donner.
La variante temporelle concerne la nature historique ou chronologique de la vidéo donner dans un entrepôt de données, qui permet d’analyser les tendances. Non volatile indique que le entrepôt de données il n'est pas continuellement mis à jour comme un base de données d'OLTP. Il est plutôt mis à jour périodiquement, avec donner provenant de sources internes et externes. Le entrepôt de données il est spécifiquement conçu pour la recherche plutôt que pour la mise à jour de l'intégrité et des performances de fonctionnement.
L'idée de stocker je donner n'est pas nouveau, c'était l'un des objectifs de gestion de donner depuis les années 1982 (Il Martin, XNUMX).
I entrepôt de données ils offrent l'infrastructure donner pour les systèmes d’aide à la gestion. Les systèmes d'aide à la gestion comprennent les systèmes d'aide à la décision (DSS) et les systèmes d'information exécutifs (EIS). Un DSS est un système d’information informatisé conçu pour améliorer la prise de décision humaine. Un EIS est généralement un système de fourniture de donner qui permet aux chefs d'entreprise d'accéder facilement à la vue de donner.
L'architecture générale d'un entrepôt de données souligne le rôle de entrepôt de données en accompagnement à la gestion. En plus d'offrir l'infrastructure donner pour EIS et DSS, al entrepôt de données il est accessible directement via des requêtes. LE donner inclus dans un entrepôt de données sont basés sur une analyse des besoins en informations de gestion et sont obtenus à partir de trois sources : les systèmes internes existants, les systèmes de saisie de données à usage spécial et les sources de données externes. LE donner dans les systèmes internes existants, ils sont souvent redondants, incohérents, de mauvaise qualité et stockés dans différents formats. Ils doivent donc être réconciliés et nettoyés avant de pouvoir être chargés dans le système.

entrepôt de données (Inmon, 1992 ; McFadden, 1996). LE donner provenant des systèmes de stockage donner ponctuellement et à partir de sources donner externes sont souvent utilisés pour augmenter (mettre à jour, remplacer) i donner à partir de systèmes existants.

Il existe de nombreuses raisons impérieuses de développer un entrepôt de données, qui incluent une prise de décision améliorée grâce à l'utilisation efficace de davantage d'informations (Ives 1995), le soutien à une concentration sur les transactions globales (Graham 1996) et la réduction des donner pour l'EIS et le DSS (Graham 1996, McFadden 1996).

Une étude empirique récente a révélé, en moyenne, un retour sur investissement pour entrepôt de données de 401 % après trois ans (Graham, 1996). Cependant, les autres études empiriques sur entrepôt de données constaté des problèmes importants, notamment des difficultés à mesurer et à attribuer les prestations, un manque d'objectif clair, une sous-estimation de l'objectif et de la complexité du processus de stockage des prestations. donner, notamment en ce qui concerne les sources et la propreté des donner. Je stocke donner peut être considéré comme une solution au problème de gestion donner entre les organisations. La manipulation de donner en tant que ressource sociale, elle est restée pendant de nombreuses années l’un des problèmes clés de la gestion des systèmes d’information dans le monde (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Une approche populaire de la gestion d’actifs donner dans les années XNUMX, c'était le développement d'un modèle donner social. Modèle donner social a été conçu pour offrir une base stable pour le développement de nouveaux systèmes d'application et base de données et la reconstruction et l'intégration des systèmes existants (Brancheau et al.

1989, Goodhue et coll. 1988 : 1992, Kim et Everest 1994). Cependant, cette approche présente de nombreux problèmes, notamment la complexité et le coût de chaque tâche, ainsi que le temps nécessaire pour produire des résultats tangibles (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997). ).

Il entrepôt de données il s'agit d'une base de données distincte qui coexiste avec les bases de données existantes plutôt que de les remplacer. Il vous permet donc de diriger la gestion de donner et éviter une reconstruction coûteuse des systèmes existants.

APPROCHES EXISTANTES DE CONCEPTION DE DONNÉES

ENTREPÔT

Le processus de construction et de perfectionnement d'un entrepôt de données il doit être compris davantage comme un processus évolutif plutôt que comme un cycle de vie de développement de systèmes traditionnels (Desio, 1995, Shanks, O'Donnell et Arnott 1997a ). De nombreux processus sont impliqués dans un projet entrepôt de données tels que l'initialisation, la planification ; les informations acquises à partir des exigences demandées aux dirigeants d'entreprises ; sources, transformations, nettoyage des donner et synchronisation à partir de systèmes existants et d'autres sources donner; systèmes de livraison en développement ; suivi de entrepôt de données; et l'absurdité du processus évolutif et de la construction d'un entrepôt de données (Stinchi, O'Donnell et Arnott, 1997b). Dans ce journal, nous nous concentrons sur la façon de dessiner le donner stockés dans le contexte de ces autres processus. Il existe un certain nombre d'approches proposées en matière d'architecture entrepôt de données en littérature (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Chacune de ces méthodologies fait l’objet d’un bref examen avec une analyse de leurs forces et faiblesses.

L'approche d'Inmon (1994) pour Entreposage De Données Conception

Inmon (1994) a proposé quatre étapes itératives pour concevoir un entrepôt de données (voir Figure 2). La première étape consiste à concevoir un modèle donner social pour comprendre comment je donner ils peuvent être intégrés dans les domaines fonctionnels d'une organisation en divisant les donner stocker dans les zones. Modèle donner il est fait pour le stockage donner relative à la prise de décision, y compris donner historique et inclus donner déduits et cumulés. La deuxième étape consiste à identifier les domaines à mettre en œuvre. Celles-ci sont basées sur des priorités déterminées par une organisation particulière. La troisième étape consiste à dessiner un base de données pour le domaine, veillez particulièrement à inclure des niveaux de granularité appropriés. Inmon recommande d'utiliser le modèle d'entités et de relations. La quatrième étape consiste à identifier les systèmes sources donner requis et développer des processus de transformation pour capturer, nettoyer et formater i donner.

Les points forts de l'approche d'Inmon sont que le modèle donner social constitue la base de l’intégration des donner dans l’organisation et la planification des supports pour le développement itératif des entrepôt de données. Ses défauts sont la difficulté et le coût de conception du modèle donner social, la difficulté de comprendre les modèles d'entités et de relations utilisés dans les deux modèles, qui donner social et celui de donner stocké par domaine, et la pertinence de donner du dessin de entrepôt de données pour la réalisation de base de données relationnel mais pas pour base de données multidimensionnel.

L'approche d'Ives (1995) Entreposage De Données Conception

Ives (1995) propose une approche en quatre étapes pour concevoir un système d'information qui, selon lui, est applicable à la conception d'un entrepôt de données (voir Figure 3). L'approche s'appuie beaucoup sur l'ingénierie de l'information pour le développement des systèmes d'information (Martin 1990). La première étape consiste à déterminer les objectifs, les facteurs critiques et de réussite ainsi que les indicateurs de performance clés. Les processus métier clés et les informations nécessaires sont modélisés pour nous conduire à un modèle donner sociale. La deuxième étape consiste à développer une architecture de définition donner stocké par zones, base de données di entrepôt de données, les composants technologiques requis, l'ensemble du support organisationnel requis pour mettre en œuvre et fonctionner avec entrepôt de données. La troisième étape comprend la sélection des progiciels et des outils requis. La quatrième étape est la conception détaillée et la construction du entrepôt de données. Ives note ce magasin donner c'est un processus itératif contraint.

Les points forts de l'approche Ives résident dans l'utilisation de techniques spécifiques pour déterminer les besoins en informations, l'utilisation d'un processus structuré pour soutenir l'intégration des entrepôt de données, la sélection matérielle et logicielle appropriée et l'utilisation de techniques de représentation multiples pour le entrepôt de données. Ses défauts sont inhérents à la complexité. D'autres incluent la difficulté à développer plusieurs niveaux de base de données dans le entrepôt de données dans des délais et à des coûts raisonnables.

L'approche de Kimball (1994) Entreposage De Données Conception

Kimball (1994) a proposé cinq étapes itératives pour concevoir un entrepôt de données (voir figures 4). Sa démarche est particulièrement dédiée à la conception d'un solo entrepôt de données et sur l'utilisation de modèles dimensionnels de préférence aux modèles d'entités et de relations. Kimball analyse ces modèles dimensionnels parce qu'il est plus facile pour les chefs d'entreprise de comprendre les affaires, plus efficace lorsqu'il s'agit de consultations complexes et de conception de base de données le physique est plus efficace (Kimball 1994). Kimball reconnaît que le développement d'un entrepôt de données est itératif, et que entrepôt de données des tableaux séparés peuvent être intégrés en les divisant en tableaux de dimensions communes.

La première étape consiste à identifier le domaine particulier à perfectionner. Les deuxième et troisième étapes concernent la modélisation dimensionnelle. Dans la deuxième étape, les mesures identifient les éléments d'intérêt dans le domaine et sont regroupés dans un tableau de faits. Par exemple, dans un domaine de vente, les mesures d'intérêt peuvent inclure la quantité d'articles vendus et le dollar comme devise de vente. La troisième étape consiste à identifier les dimensions qui constituent la manière dont les faits peuvent être regroupés. Dans un domaine de vente, les dimensions pertinentes peuvent inclure l'article, l'emplacement et la période. La table de faits possède une clé en plusieurs parties pour la lier à chacune des tables de dimensions et contient généralement un très grand nombre de faits. En revanche, les tables de dimensions contiennent des informations descriptives sur les dimensions et d'autres attributs pouvant être utilisés pour regrouper des faits. La table de faits et de dimensions proposée associée forme ce que l'on appelle un schéma en étoile en raison de sa forme. La quatrième étape consiste à construire un base de données multidimensionnel pour parfaire le motif en étoile. La dernière étape consiste à identifier les systèmes sources donner requis et développer des processus de transformation pour capturer, nettoyer et formater i donner.

Les points forts de l'approche de Kimball incluent l'utilisation de modèles dimensionnels pour représenter le donner stocké, ce qui le rend facile à comprendre et conduit à une conception physique efficace. Un modèle dimensionnel qui utilise également facilement les deux systèmes de base de données les systèmes relationnels peuvent être perfectionnés ou les systèmes base de données multidimensionnel. Ses défauts incluent le manque de certaines techniques pour faciliter la planification ou l'intégration de nombreux modèles d'étoiles dans un entrepôt de données et la difficulté de concevoir à partir de la structure dénormalisée extrême vers un modèle dimensionnel a donner dans l'ancien système.

L'approche des données de McFadden (1996) Conception d'entrepôt

McFadden (1996) propose une approche en cinq étapes pour concevoir un entrepôt de données (voir la figure 5).
Son approche s'appuie sur une synthèse des idées issues de la littérature et se concentre sur la conception d'un modèle unique. entrepôt de données. La première étape implique une analyse des besoins. Bien que les spécifications techniques ne soient pas prescrites, les notes de McFadden identifient les entités donner spécifications et leurs attributs, et renvoie aux lecteurs Watson et Frolick (1993) pour la capture des exigences.
Dans la deuxième étape, un modèle d'entité de relation est dessiné pour entrepôt de données puis validé par les chefs d’entreprise. La troisième étape consiste à déterminer le mappage à partir des systèmes existants et des sources externes entrepôt de données. La quatrième étape implique des processus de développement, de déploiement et de synchronisation donner Nous avons mis en place un contrôle de gestion innovatif et une stratégie d'achat centralisée, basée sur l'utilisation d’un software sur une plate-forme online,obtenant en moins de deux mois de baisser le food cost de XNUMX% à XNUMX% pour s’établir en moins d'un an, à XNUMX% sur le prix de vente moyen des repas. entrepôt de données. Dans la dernière étape, la livraison du système est développée avec un accent particulier sur une interface utilisateur. McFadden note que le processus de dessin est généralement itératif.

Les points forts de l'approche de McFadden mettent en évidence la participation des chefs d'entreprise à la détermination des exigences ainsi que de l'importance des ressources. donner, leur nettoyage et leur collecte. Ses défauts incluent l'absence de processus pour décomposer un grand projet entrepôt de données en plusieurs étapes intégrées, et le

difficulté à comprendre les modèles d'entités et de relations utilisés dans la conception de entrepôt de données.

Nous ne sommes pas choisis uniquement par nos proches.

0/5 (0 avis)

En savoir plus sur l'agence Web en ligne

Abonnez-vous pour recevoir les derniers articles par email.

admin Directeur Général

👍Agence Web en ligne | Agence Web experte en Marketing Digital et SEO. Web Agency Online est une agence Web. Pour Agenzia Web Online, le succès de la transformation numérique repose sur les fondements d'Iron SEO version 3. Spécialités : Intégration de systèmes, Intégration d'applications d'entreprise, Architecture orientée services, Cloud Computing, Entrepôt de données, business intelligence, Big Data, portails, intranets, Application Web Conception et gestion de bases de données relationnelles et multidimensionnelles. Conception d'interfaces pour supports numériques : convivialité et graphisme. Online Web Agency propose aux entreprises les services suivants : -SEO sur Google, Amazon, Bing, Yandex ; -Web Analytics : Google Analytics, Google Tag Manager, Yandex Metrica ; -Conversions d'utilisateurs : Google Analytics, Microsoft Clarity, Yandex Metrica ; -SEM sur Google, Bing, Amazon Ads ; -Marketing des réseaux sociaux (Facebook, Linkedin, Youtube, Instagram).

Voir la biographie complète

Marketing Numérique Base de données SGBD Entreposage De Données Sciences des données Publicité en ligne Technologies de l'information Agence Web Agence de publicité Stratégie

Partager:

J'aime:

En savoir plus sur l'agence Web en ligne