fbpx

データ ウェアハウジングとエンタープライズ リソース プランニング | DWHとERP

アーカイブ DATA 中央: 歴史ED 進化

90 年代の企業テクノロジーの XNUMX つの主要なテーマは次のとおりでした。 データウェアハウス そしてERP。長い間、これら 2 つの強力な流れは、交わることなく企業 IT の一部となってきました。まるで物質と反物質であるかのようでした。しかし、両方の現象の成長により、必然的にそれらが交差するようになりました。今日、企業は ERP をどうするかという問題に直面しています。 データウェアハウス。この記事では、何が問題なのか、そして企業はどのようにそれに対処しているのかを概説します。

開始時…

初めに、 データウェアハウス. データウェアハウス トランザクション処理アプリケーション システムに対抗するために作成されました。初期の頃の暗記は、 与えます これは、トランザクション処理アプリケーションに対する単なる対抗手段であることを意図していました。しかし今日では、 データウェアハウス。今日の世界では、 データウェアハウス これは、企業情報ファクトリーと呼ばれる構造内に挿入されます。

企業情報ファクトリー (CIF)

Corporate Information Factory には、標準的なアーキテクチャ コンポーネントがあります。これは、レベルの変換とコード統合を統合するものです。 与えます 私は 与えます アプリケーション環境から環境へと移行します。 データウェアハウス 会社の。ある データウェアハウス がいる会社の 与えます 詳細かつ統合された履歴。の データウェアハウス 企業の基盤は、環境の他のすべての部分を構築するための基盤として機能します。 データウェアハウス;オペレーショナル データ ストア (ODS)。 ODS は、次のいくつかの側面を含むハイブリッド構造です。 データウェアハウス および OLTP 環境のその他の側面。データ マート。さまざまな部門が独自のバージョンの データウェアハウス; a データウェアハウス 同社の「哲学者」が 72 時間、環境に悪影響を与えることなくクエリを送信できる探査の期間。 データウェアハウス;そしてニアラインメモリ、 与えます 古くて 与えます 大量の詳細を安価に保存できます。

ERP が LA と提携する場所 企業情報ファクトリー

ERP は 2 か所で Corporate Information Factory と統合されます。まず、基本的なアプリケーション (ベースライン) として、 与えます へのアプリケーションの データウェアハウス。 この場合、私は 与えます、トランザクション プロセスの副産物として生成され、統合され、 データウェアハウス 会社の。 ERP、CIF、ODS 間の結合の 2 番目のポイント。実際、多くの環境で ERP が従来の ODS として使用されています。

ERP が基本アプリケーションとして使用される場合、同じ ERP を CIF で ODS として使用することもできます。いずれにせよ、ERP を両方の役割で使用する場合は、2 つのエンティティを明確に区別する必要があります。言い換えれば、ERP がコア アプリケーションと ODS の役割を果たす場合、2 つのアーキテクチャ エンティティを区別する必要があります。単一の ERP 実装が両方の役割を同時に実行しようとすると、必然的にその構造の設計と実装に問題が発生します。

個別のODSと基本アプリケーション

アーキテクチャコンポーネントの分割には多くの理由があります。おそらく、アーキテクチャのさまざまなコンポーネントを分離する際の最も重要な問題は、アーキテクチャの各コンポーネントが独自のビューを持っていることです。ベースライン アプリケーションは、ODS とは異なる目的を果たします。重ねてみる

ODS の世界に対するベースラインのアプリケーション ビュー、またはその逆は、正しい作業方法ではありません。

したがって、CIF における ERP の最初の問題は、ベースライン アプリケーションと ODS の間に違いがあるかどうかを検証することです。

企業内のデータモデル 情報工場

CIF アーキテクチャのさまざまなコンポーネント間の一貫性を実現するには、次のモデルが必要です。 与えます。 のモデル 与えます これらは、ベースライン アプリケーションや ODS などのアーキテクチャのさまざまなコンポーネント間のリンクとして機能します。のモデル 与えます これらは、CIF のさまざまなアーキテクチャ コンポーネントから正しい意味を理解するための「知的ロードマップ」になります。

この概念と連携して、大規模で単一のモデルが存在する必要があるという考えです。 与えます。明らかにモデルが存在するはずです 与えます 各コンポーネントには、異なるモデルを接続する合理的なパスが必要です。アーキテクチャの各コンポーネント - ODS、ベースライン アプリケーション、 データウェアハウス 会社のなど。 – 独自のモデルが必要です 与えます。したがって、これらのモデルがどのように機能するかを正確に定義する必要があります。 与えます それらは相互にインターフェイスします。

ムーブI DATA ERP の日付 倉庫

の起源であれば、 与えます ERP が 与えますデータウェアハウス、この挿入は最低レベルの「粒度」で行われる必要があります。単に要約または集計するだけです 与えます これらは ERP ベースライン アプリケーションから派生したものであるため、または ERP ODS は正しい行動ではありません。ザ 与えます 詳細が必要です データウェアハウス DSS プロセスの基礎を形成します。そのような 与えます データマートと探索によってさまざまな方法で再形成されるだろう データウェアハウス.

の変位 与えます ERP ベースライン アプリケーション環境から データウェアハウス 会社の業務は適度にリラックスして行われます。この移動は、ERP での更新または作成の約 24 時間後に行われます。の「怠惰な」動きがあるという事実 与えますデータウェアハウス 会社の許可する 与えます ERPから「入金」されます。一度 与えます がベースライン アプリケーションに保存されている場合は、安全に移動できます。 与えます 企業における ERP の導入。の「怠惰な」動きのおかげで達成可能なもう一つの目標 与えます これは、運用プロセスと DSS の間の明確な境界線です。 「速い」動きで、 与えます DSS と運用の境界線は依然として曖昧です。

の動き 与えます ERP ODS から データウェアハウス 会社の評価は定期的に (通常は毎週または毎月) 行われます。この場合の動きは、 与えます それは古いものを「掃除」する必要性に基づいています 与えます 歴史家。もちろん、ODS には i が含まれています。 与えます よりもはるかに最近のものです 与えます で見つかった歴史家 データウェアハウス.

の変位 与えますデータウェアハウス 「卸売り」(卸売業者のやり方で)が行われることはほとんどありません。 ERP 環境からテーブルをコピーします。 データウェアハウス それは意味がありません。より現実的なアプローチは、選択したユニットを移動することです。 与えます。 のみ 与えます 前回の更新以降に変更された点 データウェアハウス 彼らは、に移動されるべきものです データウェアハウス。どちらかを知るための 1 つの方法 与えます 前回の更新以降に変更されたのは、 与えます ERP環境で見つかります。デザイナーは、最後の更新以降に発生したすべての変更を選択します。もう 1 つのアプローチは、変更キャプチャ手法を使用することです。 与えます。これらの技術を使用して、ログとジャーナルテープを分析して、どのログとジャーナルテープがどれであるかを判断します。 与えます ERP 環境から ERP 環境に移行する必要がある データウェアハウス。他の ERP リソースにさらに影響を与えることなく、ERP ファイルからログとジャーナル テープを読み取ることができるため、これらの手法が最適です。

その他の合併症

CIF における ERP の問題の 1 つは、他のアプリケーション ソースやアプリケーションに何が起こるかということです。 与えます 貢献しなければならないODSのうち データウェアハウス ただし、これらは ERP 環境の一部ではありません。 ERP、特に SAP の閉鎖的な性質を考慮して、外部ソースからのキーを統合しようとしています。 与えます とともに 与えます 移動時に ERP から取得される 与えますデータウェアハウス、それは大きな挑戦です。そして、私がそうなる確率は正確には何ですか? 与えます ERP 環境外のアプリケーションまたは ODS は、ERP 環境に統合されます。 データウェアハウス?実際、その確率は非常に高いです。

探す DATA ERP からの履歴

私に関する別の問題 与えます ERP のニーズは次のとおりです。 与えます 内部の歴史家 データウェアハウス。 通常、 データウェアハウス 彼は必要です 与えます 歴史家。そして、ERP テクノロジーは通常、これらを保存しません 与えます 歴史的、少なくとも必要な点までは データウェアハウス。大量にあるときは、 与えます ERP 環境に履歴が蓄積され始めると、その環境をクリーンアップする必要があります。たとえば、 データウェアハウス 5年分を積み込む必要がある 与えます ERP はこれらの履歴を最大 6 か月保存します。 与えます。会社が一連の情報を収集することに満足している限り、 与えます 歴史家が時間が経つと、ERP を情報源として使用しても問題ありません。 データウェアハウス。しかし、 データウェアハウス 彼は時間を遡って神を手に入れなければならない 与えます ERP によって以前に収集および保存されていない履歴が存在すると、ERP 環境は非効率になります。

ERP とメタデータ

ERP に関して考慮すべきもう 1 つの考慮事項 データウェアハウス ERP環境に存在するメタデータ上のものです。メタデータが ERP 環境から ERP 環境に流れるのと同じように、 データウェアハウスの場合、メタデータも同じ方法で移動する必要があります。さらに、メタデータはインフラストラクチャに必要な形式と構造に変換する必要があります。 データウェアハウス。運用メタデータと DSS メタデータには大きな違いがあります。運用メタデータは主に開発者と

プログラマー。 DSS メタデータは主にエンド ユーザー向けです。 ERP アプリケーションまたは ODS の既存のメタデータは変換する必要がありますが、この変換は必ずしも簡単で簡単であるとは限りません。

ERP データの入手

ERP をプロバイダーとして使用する場合 与えます 以下のために データウェアハウス を動かす堅牢なインターフェースが必要です。 与えます ERP環境から環境へ データウェアハウス。インターフェイスは次のことを行う必要があります。

  • ▪ 使いやすいこと
  • ▪ へのアクセスを許可する 与えます ERPの
  • ▪ の意味を理解する 与えます に移動しようとしているもの データウェアハウス
  • ▪ ERP にアクセスする際に発生する可能性のある ERP の制限を理解する。 与えます ERP の:
  • ▪ 参照整合性
  • ▪ 階層関係
  • ▪ 暗黙的な論理関係
  • ▪ アプリケーション規約
  • ▪ のすべての構造 与えます ERP によるサポートなど…
  • ▪ 効率的にアクセスする 与えます、以下を提供することで、
  • ▪ 直接移動 与えます
  • ▪ おつりの取得 与えます
  • ▪ タイムリーなアクセスをサポート 与えます
  • ▪ の形式を理解する 与えます、 等々… SAP とのインターフェース インターフェイスには、自社製または商用の 2 つのタイプがあります。主要な取引インターフェイスには次のようなものがあります。
  • ▪ SAS
  • ▪ プリムズソリューション
  • ▪ D2k など… 複数のERPテクノロジー ERP 環境を単一のテクノロジーであるかのように扱うのは大きな間違いです。 ERP テクノロジーは数多くあり、それぞれに独自の強みがあります。市場で最もよく知られているベンダーは次のとおりです。
  • ▪ SAP
  • ▪ オラクルの財務
  • ▪ ピープルソフト
  • ▪ JD エドワーズ
  • ▪ バーン SAP SAP は最大かつ最も完全な ERP ソフトウェアです。 SAP アプリケーションには、さまざまな分野のさまざまなタイプのアプリケーションが含まれています。 SAP には次のような評判があります。
  • ▪ 非常に大きい
  • ▪ 導入は非常に困難で費用がかかる
  • ▪ 実装には多くの人員とコンサルタントが必要
  • ▪ 導入には専門の人材が必要
  • ▪ 導入には長い時間がかかる さらに、SAP は、 与えます これにより、SAP エリア外のユーザーがアクセスすることが困難になります。 SAP の強みは、大量のデータを取得して保存できることです。 与えます。最近 SAP は、アプリケーションを以下に拡張する意向を発表しました。 データウェアハウス。 SAP をベンダーとして使用することには多くの利点と欠点があります データウェアハウス。利点は、SAP がすでにインストールされており、ほとんどのコンサルタントがすでに SAP を知っていることです。
    SAP をサプライヤーとして使用する場合の欠点 データウェアハウス SAP には、次のような世界における経験がありません。 データウェアハウス SAP がサプライヤーの場合 データウェアハウス、iを「取り出す」必要があります。 与えます SAP から データウェアハウス. ダト SAP にはクローズド システムの実績があるため、SAP から i をそこに導入するのは簡単ではありません (???)。 IMS、VSAM、ADABAS、ORACLE、DB2 など、SAP を強化するレガシー環境は数多くあります。 SAP は「ここで発明されたものではない」アプローチを主張しています。 SAP は、他のベンダーと提携して、 データウェアハウス。 SAP はすべてのソフトウェアを自社で生成することにこだわっています。

SAP は大規模で強力な企業ですが、ELT、OLAP、システム管理のテクノロジ、さらにはコア コードさえも書き直そうとしています。 DBMS それはただクレイジーです。サプライヤーに対して協力的な態度をとる代わりに、 データウェアハウス SAP は長年にわたり、「彼らが一番よく知っている」というアプローチを採用してきました。このような姿勢は、SAP が次の分野で成功することを妨げます。 データウェアハウス.
SAP は、外部ベンダーによる迅速かつ適切なアクセスを許可することを拒否しています。 与えます。を使用することの本質は、 データウェアハウス に簡単にアクセスできます 与えます。 SAP の歴史全体は、アクセスを困難にすることに基づいています。 与えます.
SAP には大量のデータを処理する経験が不足しています。 与えます;の分野で データウェアハウス のボリュームがあります 与えます SAP ではこれまで見たことがなく、これらの大量の 与えます 適切な技術が必要です。 SAP は、この分野に参入するために存在するこの技術的障壁を認識していないようです。 データウェアハウス.
SAP の企業文化: SAP は、 与えます システムから。しかし、これを行うには、別の考え方が必要です。従来、環境にデータを取り込むのが得意だったソフトウェア会社は、データを別の方向に取り込むのが苦手でした。 SAP がこの種の切り替えに成功すれば、それを行う最初の企業となります。

つまり、企業がサプライヤーとして SAP を選択すべきかどうかは疑問です データウェアハウス。一方では非常に深刻なリスクがあり、他方では得られるものはほとんどありません。しかし、SAP をサプライヤーとして選択することを妨げる別の理由があります。 データウェアハウス。どの会社も同じはずだから データウェアハウス 他の会社は全部?の データウェアハウス それは競争上の優位性の核心です。すべての企業が同じものを採用した場合 データウェアハウス 不可能ではありませんが、競争上の優位性を獲得することは困難です。 SAP は次のように考えているようです。 データウェアハウス これは Cookie と見なすことができ、これはアプリケーションの「データを取得する」という考え方のさらなる兆候です。

SAP ほど支配的な ERP ベンダーは他にありません。 SAP の道を自分たちのために歩む企業が現れることは間違いありません。 データウェアハウス しかしおそらくこれらは データウェアハウス SAP は大規模で、作成には高価で時間がかかります。

これらの環境には、銀行窓口の処理、航空会社の予約プロセス、保険請求プロセスなどのアクティビティが含まれます。トランザクション システムのパフォーマンスが向上するほど、運用プロセスと DSS (意思決定支援システム) を分離する必要性が明らかになります。しかし、人事および人事システムを使用すると、大量のトランザクションに直面することはありません。そしてもちろん、人が入社したり退職したりするとき、これは取引の記録となります。しかし、他のシステムと比較して、HR および人事システムではトランザクションがあまり多くありません。したがって、人事および人事システムでは、DataWarehouse の必要性が完全に明らかというわけではありません。多くの点で、これらのシステムは DSS システムの融合を表しています。

ただし、データ ウェアハウスと PeopleSoft を扱う場合は、考慮する必要がある別の要素があります。多くの環境では、私は 与えます 人的資源や人的資源の活用は、会社の主要な事業の二の次です。ほとんどの企業は製造、販売、サービスの提供などを行っています。人事や人事システムは通常、会社の本業の二次的なもの(またはサポート)です。したがって、曖昧で不便です データウェアハウス 人事と人事サポートは別のものです。

この点において、PeopleSoft は SAP とは大きく異なります。 SAP では、 データウェアハウス。 PeopleSoft の場合、それはそれほど明確ではありません。 PeopleSoft ではデータ ウェアハウスはオプションです。

私にとって言える最善のことは 与えます PeopleSoft は、 データウェアハウス 私をアーカイブするために使用できます 与えます 古い人的資源や個人的資源に関連するもの。企業が データウェアハウス a

PeopleSoft 環境の弊害は、分析ツールへのアクセスと自由なアクセスを許可することです。 与えます PeopleSoft による。しかし、これらの理由以外にも、データ ウェアハウスを持たない方が望ましい場合もあります。 与えます PeopleSoft。

要約すると

建築に関してはいろいろなアイデアがありますが、 データウェアハウス ERP ソフトウェア内で。
その一部は次のとおりです。

  • ▪ を持つことは理にかなっています。 データウェアハウス それは業界の他の何かと同じですか?
  • ▪ ERP の柔軟性の高さ データウェアハウス ソフトウェアですか?
  • ▪ ERP データウェアハウス ソフトウェアは次の量を処理できます 与えます にありますデータウェアハウス アリーナ"?
  • ▪ ERP ベンダーが、時間の点で簡単かつ安価であるにもかかわらず行っているトレース記録とは何ですか。 与えます? (ERP ベンダーは、安価で期限通りにアクセスしやすいデータを提供する実績はどのようなものですか?)
  • ▪ ERP ベンダーは DSS アーキテクチャと企業情報ファクトリーについてどのように理解していますか?
  • ▪ ERP ベンダーは、次のことを達成する方法を理解しています。 与えます 環境内にあるだけでなく、それらをエクスポートする方法も理解していますか?
  • ▪ ERP ベンダーはデータ ウェアハウス ツールに対してどの程度オープンですか?
    どこに配置するかを決定する際には、これらすべてを考慮する必要があります。 データウェアハウス 私をホストするのは 与えます ERPなどの 与えます。一般に、やむを得ない理由がない限り、構築することをお勧めします。 データウェアハウス ERP ベンダーの環境外。 第1章 BI 組織の概要 重要なポイント:
    情報リポジトリは、ビジネス インテリジェンス (BI) アーキテクチャとは逆に機能します。
    企業文化と IT によって、BI 組織の構築の成功が制限される可能性があります。

テクノロジーはもはや BI 組織にとって制限要因ではありません。アーキテクトやプロジェクト プランナーにとっての問題は、テクノロジーが存在するかどうかではなく、利用可能なテクノロジーを効果的に実装できるかどうかです。

多くの企業にとって、 データウェアハウス それは、 与えます 必要とするユーザーへ。ザ 与えます それらはソース システムから抽出され、ターゲット構造に取り込まれます。 データウェアハウス。 私は 与えます 運が良ければ掃除することもできます。ただし、追加の価値が追加または収集されることはありません。 与えます このプロセス中に。

基本的に、パッシブ Dw はせいぜい i のみを提供します。 与えます ユーザー協会にとってクリーンで運用可能なもの。情報の作成と分析の理解は完全にユーザーに任されています。 DW(データウェアハウス) 成功は主観的なものです。効率的に収集、統合、クリーンアップできる能力で成功を判断する場合、 与えます 予測可能なベースで企業としての成功を収めているのであれば、はい、DW は成功しています。一方、組織全体による情報の収集、統合、活用という観点から見ると、DW は失敗です。 DW は情報価値をほとんど提供しません。その結果、ユーザーはその場しのぎを強いられ、情報サイロが形成されてしまいます。この章では、企業の BI (ビジネス インテリジェンス) アーキテクチャを要約するための包括的なビューを示します。まず BI について説明し、その後、単なる情報提供ではなく、情報の設計と開発についての議論に移ります。 与えます ユーザーへ。その後、BI の取り組みの価値を計算することに焦点を当てて議論します。最後に、IBM が組織の BI アーキテクチャ要件にどのように対処するかを定義します。

のアーキテクチャの説明 BI組織

強力なトランザクション指向の情報システムは現在、あらゆる大企業で一般的になり、世界中の企業の競争条件を効果的に平準化しています。

しかし、競争力を維持するには、企業がすでに所有している情報を再発見して使用する能力に革命をもたらす、分析指向のシステムが必要です。これらの分析システムは、 与えます 利用可能。 BI は企業全体のパフォーマンスを向上させることができます。企業は顧客とサプライヤーの関係を改善し、製品やサービスの収益性を向上させ、新しくより良いオファーを生み出し、リスクを制御し、とりわけ経費を大幅に削減することができます。 BI を使用すると、市場目的を持つアプリケーションのおかげで、企業は最終的に顧客情報を競争力のある資産として使用し始めます。

適切なビジネス ツールを持つということは、次のような重要な質問に対する明確な答えがあることを意味します。

  • ▪ 私たちのどちらですか 顧客 彼らは私たちにもっと稼がせるのか、それとも損をさせるのか?
  • ▪ 私たちの優秀な人材が住む場所 顧客 に関して ショップ/ 彼らがよく行く倉庫は?
  • ▪ 当社の製品とサービスのうち、誰に最も効果的に販売できるのはどれですか?
  • ▪ どの製品を誰に最も効果的に販売できるか?
  • ▪ 最も成功した販売キャンペーンとその理由は何ですか?
  • ▪ どの販売チャネルがどの製品にとって最も効果的か?
  • ▪ 最高の人材との関係を改善するにはどうすればよいか 顧客?ほとんどの企業は、 与えます これらの質問に答えるための大まかな方法​​。
    運用システムは大量の製品、顧客、およびサービスを生成します。 与えます 販売時点管理、予約、顧客サービス、テクニカル サポート システムに至るまで、市場をサポートします。課題は、この情報を抽出して活用することです。多くの企業は利益のほんの一部からしか利益を得ていません 与えます 戦略分析用。
    I 与えます 残り、多くの場合 i と結合します 与えます 政府報告書やその他購入した情報などの外部ソースから得られた情報は、まさに探索されるのを待っている金鉱です。 与えます 必要なのは、組織の情報コンテキスト内で洗練されることだけです。

この知識は、全体的な企業戦略の設計から、コールセンター、請求書発行、サプライヤーとの個人的なコミュニケーションに至るまで、さまざまな方法で応用できます。 インターネット などの点。今日のビジネス環境では、DW および関連する BI ソリューションが従来のビジネス構造の運用を超えて進化することが求められています。 与えます 私は 与えます 原子レベルと「スター/キューブ ファーム」で正規化されます。

競争力を維持するために必要なのは、広大な分析環境をサポートするために従来のテクノロジーと先進的なテクノロジーを融合することです。
結論として、一般的な環境は会社全体の知識を向上させ、実行された分析の結果として実行されるアクションが全員に利益をもたらすように確実に役立つものでなければなりません。

たとえば、自分のものを分類するとします。 顧客 高リスクまたは低リスクのカテゴリーに分類します。
この情報がモデル抽出プログラムまたはその他の手段によって生成された場合は、DW に保存し、静的レポート、スプレッドシート、テーブル、オンライン分析処理 (OLAP) などのアクセス ツールを使用して誰でもアクセスできるようにする必要があります。 。

ただし、現在、この種の情報の多くはサイロ化されたままになっています。 与えます 分析を作成する個人または部門の名前。組織全体として、理解のための可視性はほとんどありません。この種の情報コンテンツをエンタープライズ DW に組み込むことによってのみ、情報サイロを排除し、DW 環境を向上させることができます。
BI 組織の開発には 2 つの大きな障害があります。
まず、組織自体とその規律の問題があります。
私たちは組織のポリシーの変更を支援することはできませんが、組織の BI のコンポーネント、そのアーキテクチャ、および IBM テクノロジーがその開発をどのように促進するかを理解することはできます。
克服すべき 2 番目の障壁は、単なる小さなコンポーネントではなく BI 空間全体に対応する方法に関する統合されたテクノロジと知識が不足していることです。

IBM は統合テクノロジーの変化に直面しつつあります。思慮深いデザインを提供するのはあなたの責任です。このアーキテクチャは、制約のない統合用に選択されたテクノロジ、または少なくともオープン スタンダードに準拠したテクノロジを使用して開発する必要があります。さらに、会社の経営者は、BI への取り組みが計画どおりに実行され、利己的なアジェンダや目的から生じる情報のサイロ化を許可しないようにする必要があります。
これは、BI 環境がさまざまなユーザーのさまざまなニーズや要件に敏感に反応しないということではありません。代わりに、これらの個別のニーズと要件の実装は、BI 組織全体の利益のために行われることを意味します。
BI 組織のアーキテクチャの説明は、図 9 の 1.1 ページにあります。このアーキテクチャは、テクノロジとテクニックの豊富な組み合わせを示しています。
従来の見方では、アーキテクチャには次の倉庫コンポーネントが含まれます。

原子層。

これは DW 全体の基礎であり、したがって戦略的レポートの中心です。
I 与えます ここに保存されるものは、歴史的な完全性、関係を保持します。 与えます 派生メトリクスが含まれるだけでなく、モデル抽出を使用してクリーンアップ、統合、保存されます。
これらのその後のすべての使用 与えます 関連情報はこの構造から得られます。これは採掘のための優れた情報源です 与えます 構造化 SQL クエリを含むレポートの場合

の運用拠点 与えます またはそれに基づくレポート 与えます(運用データ ストア (ODS) またはレポート データベース.)

これは次のような構造です。 与えます 特に技術レポート用に設計されています。

I 与えます これらの構造上で保存および報告された情報は、最終的にはステージング エリアを介して倉庫に伝播し、そこで戦略的な信号伝達に使用される可能性があります。

ステージングエリア。

ほとんどの人にとって最初の目的地 与えます 倉庫環境を対象としたゾーンが組織ゾーンです。
ここで私は 与えます それらは統合され、浄化され、次のように変換されます。 与えます 利益が倉庫構造に反映される

データマート。

アーキテクチャのこの部分は、次の構造を表します。 与えます 特に OLAP に使用されます。データマートの存在 (ある場合) 与えます 重複するスター スキーマに保存されます 与えます リレーショナル環境またはファイル内の多次元 与えます DB2 OLAP サーバーなどの特定の OLAP テクノロジーで使用される機密情報は関係ありません。

唯一の制約は、アーキテクチャが 与えます 多次元。
このアーキテクチャには、次のような重要な Bi テクノロジーとテクニックも含まれています。

空間分析

スペースはアナリストにとって棚ぼた的な情報であり、解決を完了するために非常に重要です。空間は、特定の場所に住んでいる人々に関する情報だけでなく、その場所が世界の他の部分と物理的に相対的にどの位置にあるかに関する情報を表すことができます。

この分析を実行するには、情報を緯度と経度の座標に結び付けることから始める必要があります。これは「ジオコーディング」と呼ばれ、ウェアハウスのアトミック レベルでの抽出、変換、読み込み (ETL) プロセスの一部である必要があります。

データマイニング。

の抽出 与えます 私たちの会社は、 顧客、販売傾向を予測し、顧客との関係を管理できるようにします。 顧客 (CRM)などの BI への取り組み。

の抽出 与えます したがって、それはの構造と統合されなければなりません。 与えます Dwhouse の管理と倉庫プロセスによってサポートされ、関連するテクノロジとテクニックの効果的かつ効率的な使用が保証されます。

BI アーキテクチャで示されているように、Dwhouse およびデータマートのアトミック レベルは、優れた情報源です。 与えます 抽出用に。最も幅広い利用者が確実に利用できるようにするには、これらの同じ施設が抽出結果の受信者となる必要があります。

エージェント。

企業のオペレーティング システムや dw 自体など、あらゆる点でクライアントを調査するさまざまな「エージェント」が存在します。これらのエージェントは、販売促進に基づく将来の製品需要や、状況に反応するルールベースのエンジンなど、各時点での傾向を学習するように訓練された高度なニューラル ネットワークにすることができます。 だと 一連の状況、または例外を「経営幹部」に報告する単純なエージェントでさえも。これらのプロセスは通常リアルタイムで発生するため、その動きと密接に連携する必要があります。 与えます。これらすべての構造は、 与えます、テクノロジとテクニックにより、BI の組織の生成に一晩を費やす必要がなくなることが保証されます。

このアクティビティは、小さなポイントについて段階的に開発されます。
各ステップは独立したプロジェクト作業であり、DW または BI イニシアチブではイテレーションと呼ばれます。反復には、新しい技術の実装、新しい技術の開始、新しい構造の追加が含まれる場合があります。 与えます 、私を読み込んでいます 与えます 追加、または環境の分析を拡張します。この段落については、第 3 章でさらに詳しく説明します。

従来の DW 構造と BI ツールに加えて、BI 組織には次のような設計が必要な機能があります。

顧客タッチポイント(顧客タッチ) ポイント)。

現代の組織と同様に、顧客とのタッチポイントは数多くあり、どのようにして顧客にポジティブなエクスペリエンスを提供するかを示しています。 顧客。小売業者、交換手、ダイレクト メール、マルチメディア、印刷広告などの従来のチャネルだけでなく、電子メールや Web などの最新のチャネルもあります。 与えます 何らかの接触点がある製品は、入手、輸送、洗浄、処理されてから施設に設置される必要があります 与えます BIの。

の基本 与えます 運用とユーザーの関連付け (運用

データベースとユーザーコミュニティ)。
お問い合わせ窓口の最後に、 顧客 の基礎が見つかりました 与えます 会社のアプリケーションおよびユーザーコミュニティの。ザ 与えます 既存のものは 与えます 伝統的なものを集め、融合させる必要があります。 与えます 必要な情報を満たすために窓口から流れてくるもの。

アナリスト。 (アナリスト)

BI 環境の主な受益者はアナリストです。現在の抽出から利益を得るのは彼です 与えます 運用可能であり、さまざまなソースと統合されている 与えます 、地理分析 (ジオコーディング) などの機能が強化され、抽出、OLAP、高度な SQL レポート、地理分析を可能にする BI テクノロジで提供されます。レポート環境の主要なアナリスト インターフェイスは BI ポータルです。

ただし、BI アーキテクチャの恩恵を受けるのはアナリストだけではありません。
管理者、大規模なユーザー団体、さらにはメンバー、サプライヤー、 顧客 彼らはエンタープライズ BI のメリットを享受できるはずです。

バックフィードループ。

BI アーキテクチャは学習環境です。開発の特徴的な原則は、永続的な構造を可能にすることです。 与えます 使用される BI テクノロジおよびユーザーが実行するアクションによって更新されます。例としては、顧客スコアリングがあります。

営業部門が新しいサービスを使用するために顧客スコアをモデル化する場合、そのサービスから恩恵を受けるグループは営業部門だけであってはなりません。

代わりに、モデル抽出は企業内のデータ フローの自然な部分として実行されるべきであり、顧客スコアはウェアハウス情報コンテキストの統合された部分となり、すべてのユーザーに表示される必要があります。 DB2 UDB、DB2 OLAP サーバーを含む Bi-bI 中心の IBM スイートには、図 1.1 で定義されている主要なテクノロジー コンポーネントのほとんどが含まれています。

この本の図に示されているアーキテクチャを使用して、継続性のレベルを提供し、各 IBM 製品が全体的な BI スキームにどのように適合するかを示します。

情報提供内容(提供内容) 情報内容)

BI 環境の設計、開発、実装は困難な作業です。設計は現在と将来のビジネス要件の両方を考慮する必要があります。建築図面は、設計段階で見つかったすべての結論を含めて完全である必要があります。実行は、設計で正式に提示され、ビジネス要件に基づいた BI アーキテクチャを開発するという 1 つの目的に忠実であり続ける必要があります。

規律が相対的な成功を確実にするかどうかを議論するのは特に困難です。
BI 環境を一度に開発するのではなく、時間をかけて少しずつ開発するので、これは簡単です。

ただし、アーキテクチャの BI コンポーネントを特定することは、次の 2 つの理由から重要です。後続のすべての技術的なアーキテクチャの決定をガイドすることになります。
たとえ数か月間そのテクノロジーを再度必要とすることがなかったとしても、テクノロジーの特定の使用法を意識的に計画できるようになります。

ビジネス要件を十分に理解することは、アーキテクチャ用に購入する製品の種類に影響します。
アーキテクチャを設計および開発すると、倉庫が確実に安定した状態になります。

偶然の出来事ではなく、慎重に構築された「よく考えられた」出来事です。 オペラ 混合テクノロジーのモザイクとしての芸術。

情報コンテンツをデザインする

すべての初期設計では、現在および将来、環境全体で必要となる主要な BI コンポーネントに焦点を当て、特定する必要があります。
ビジネス要件を知ることは重要です。

正式な設計が開始される前であっても、プロジェクト プランナーは多くの場合、1 つまたは 2 つのコンポーネントをすぐに特定できます。
ただし、アーキテクチャに必要なコンポーネントのバランスを見つけるのは簡単ではありません。設計段階では、アーキテクチャの主要部分がアプリケーション開発 (JAD) セッションを結びつけ、ビジネス要件を特定します。

場合によっては、これらの要件をクエリおよびレポート ツールに委ねることができます。
たとえば、ユーザーは、現在のレポートを自動化したい場合は、2 つの現在のレポートを統合し、それらの組み合わせから得られる計算を追加することにより、レポートを手動で生成する必要があると述べています。 与えます.
この要件は単純ですが、組織のレポート ツールを購入するときに含める必要がある特定の機能を定義します。

設計者は、全体像を把握するために追加の要件も追求する必要があります。ユーザーはこのレポートを購読したいですか?
レポートのサブセットが生成され、さまざまなユーザーに電子メールで送信されますか?このレポートを企業ポータルで見たいですか?これらすべての要件は、ユーザーの要求に応じて手動レポートを置き換えるという単純なニーズの一部です。この種の要件の利点は、ユーザーとデザイナーの全員がレポートの概念を理解できることです。

ただし、計画する必要がある他の種類のビジネスもあります。ビジネス要件が戦略的なビジネス質問の形式で記述されている場合、専門の設計者は尺度/事実および次元の要件を簡単に識別できます。

JAD ユーザーがビジネス上の問題の形で要件を表現する方法がわからない場合、設計者は多くの場合、要件収集セッションを開始するための例を提供します。
専門のデザイナーは、ユーザーが戦略的な取引だけでなく、その形成方法についても理解できるように支援します。
要件収集アプローチについては第 3 章で説明します。今のところ、あらゆるタイプの BI 要件に合わせて設計する必要があることだけを指摘したいと思います。

戦略的なビジネス上の問題は、ビジネス要件であるだけでなく、設計の手がかりでもあります。多次元の質問に答えなければならない場合は、暗記して提示する必要があります。 与えます 次元を保存する必要がある場合は、 与えます 多次元の場合、どのような種類のテクノロジーまたは手法を使用するかを決定する必要があります。

予約済みのキューブ スター スキーマ、またはその両方を実装しますか?ご覧のとおり、単純なビジネス上の問題でも設計に大きな影響を与える可能性があります。しかし、この種のビジネス要件は一般的であり、少なくともプロジェクト経験のあるデザイナーやプランナーには理解されています。

OLAP テクノロジとサポートについては十分な議論が行われており、幅広いソリューションが利用可能です。これまで、シンプルなレポートをビジネスの次元要件と統合する必要性と、これらの要件が技術的なアーキテクチャ上の決定にどのような影響を与えるかについて述べてきました。

しかし、ユーザーや Dw チームが容易に理解できない要件は何でしょうか?空間分析が必要になることはありますか?
の抽出モデル 与えます それらはあなたの将来に必要な一部になりますか?知るか?

これらの種類のテクノロジは、一般のユーザー コミュニティや Dw チームのメンバーにはあまり知られていないことに注意することが重要です。これは、これらのテクノロジが通常、一部の社内またはサードパーティの技術専門家によって扱われることが原因の 1 つである可能性があります。これは、この種のテクノロジーが引き起こす問題の極端な例です。ユーザーがビジネス要件を説明したり、設計者にガイダンスを提供できる方法で要件を構成したりできない場合、気づかれないか、さらに悪いことに、単に無視される可能性があります。

さらに問題となるのは、設計者や開発者がこれらの高度ではあるが重要なテクノロジの 1 つのアプリケーションを認識できない場合です。
デザイナーがこう言うのをよく耳にします。 「彼らは本当に優先順位に興味があるのでしょうか、それとも単に理解できない要件を避けているだけなのでしょうか?おそらくこれが最後の仮説です。図 1.3 に示すように、営業チームがビジネス要件を伝達したとします。ご覧のとおり、要件はビジネス上の問題の形式で構成されています。この問題と典型的な次元問題の違いは距離です。この場合、営業チームは、製品、倉庫、倉庫からの総売上高を月次で知りたいと考えています。 顧客 購入した倉庫から 5 マイル以内に住んでいる人。

悲しいことに、デザイナーや建築家は、「私たちには顧客がいて、製品があり、 与えます 預金の。次の反復まで距離を保っておきましょう。

"間違った答え。この種のビジネス上の問題はすべて BI に関係します。これは当社のビジネスをより深く理解し、当社のアナリストにとって堅牢な分析スペースを提供します。 BI は、単純なクエリや標準レポート、さらには OLAP を超えています。これらのテクノロジーが BI にとって重要ではないというわけではありませんが、それらだけでは BI 環境を表すものではありません。

情報コンテキストに合わせたデザイン (情報コンテンツのデザイン)

さまざまな基本コンポーネントを区別するビジネス要件を特定したので、それらを全体的なアーキテクチャ設計に含める必要があります。 BI コンポーネントの一部は初期の取り組みの一部ですが、実装されるまでに数か月かかるものもあります。

ただし、既知の要件はすべて設計に反映されているため、特定のテクノロジを実装する必要がある場合には、すぐに実装できるようになります。このプロジェクトには伝統的な考え方が反映されている部分があります。

このセットは、 与えます 以降の使用をサポートするために使用されます。 与えます 私たちが特定したビジネス上の問題によって導かれる次元です。追加のドキュメントが生成されると、たとえば、 与えます、私たちは私がどのようにするかを形式化し始めます 与えます それらは環境中に広がります。 i を表す必要があることを確認しました。 与えます 次元的な方法で、それらを (特定の特定のニーズに従って) データ マートに分割します。

次に答えるべき質問は、これらのデータ マートはどのように構築されるのかということです。
立方体を支えるために星を構築しますか、それとも立方体だけですか、それとも星だけですか? (または正しい立方体、または正しい星)。すべてのデータ マートにアトミック レイヤーを必要とする依存データ マートのアーキテクチャを生成する 与えます 取得した?独立したデータマートが i を取得できるようにする 与えます オペレーティング システムから直接?

どの Cube Technology を標準化しようとしていますか?

大量の 与えます 次元分析に必要ですか、それとも全国の営業部隊から毎週、あるいはその両方でキューブが必要ですか?財務用の DB2 OLAP Server や販売組織用の Cognos PowerPlay キューブ、あるいはその両方と同じくらい強力なものを構築していますか?これらは、今後の BI 環境に影響を与える重要なアーキテクチャ設計上の決定です。はい、OLAP の必要性が確立されました。では、そのような技術や技術をどのように実行していくのでしょうか?

最先端のテクノロジーはあなたのデザインにどのような影響を与えますか?組織内で必要なスペースを特定したと仮定します。数か月間空間コンポーネントを作成する予定がない場合でも、建築図面の版を思い出す必要があります。建築家は、必要なものに基づいて今日の設計を行う必要があります。を生成、保存、実行し、アクセスを提供する空間分析の必要性を予測します。 与えます 空間的な。これは、現在検討できるソフトウェア テクノロジの種類とプラットフォーム仕様に関する制約として機能します。たとえば、次のような管理システムがあります。 データベース アトミック レイヤーに対して実行するリレーショナル レイヤー (RDBMS) には、利用可能な堅牢な空間範囲が必要です。これにより、分析アプリケーションでジオメトリと空間オブジェクトを使用するときに最大のパフォーマンスが保証されます。 RDBMS が処理できない場合は、 与えます (空間中心) なので、内部的に データベース (空間中心)外部。これにより、問題の管理が複雑になり、全体的なパフォーマンスが低下します。また、DBA はおそらく DBA の基本について最低限しか理解していないため、追加の問題が発生することは言うまでもありません。 与えます 空間的にも。一方、RDMBS エンジンがすべての空間コンポーネントを処理し、そのオプティマイザーが空間オブジェクトの特別なニーズ (インデックス作成など) を認識している場合、DBA は問題の管理を容易に処理でき、パフォーマンスを最大化できます。

さらに、ステージング領域とアトミック環境レイヤーを調整して、アドレスのクリーンアップ (

空間解析の重要な要素)、およびその後の空間オブジェクトの保存。明確な方向性の概念を導入した今も、一連の描画エディションが続いています。まず、このアプリケーションは、ETL の取り組みに必要なソフトウェアの種類を決定します。

クリーンなアドレスを提供するために Trillium のような製品が必要ですか、それともその機能を提供するために選択した ETL ベンダーが必要ですか?
ここでは、ウェアハウスの実装を開始する前に完了する必要がある設計のレベルを理解することが重要です。上記の例は、特定のビジネス要件の特定に従わなければならない多数の設計上の決定を示しています。これらの設計上の決定が正しく行われれば、環境の物理構造、使用されるテクノロジーの選択、および情報コンテンツの伝播の流れの間の相互依存性が促進されます。この従来の BI アーキテクチャがなければ、組織は既存のテクノロジが無秩序に混在することになり、せいぜい見かけの安定性を提供するために緩くつなぎ合わされることになります。

情報コンテンツを維持する

情報の価値を組織にもたらすのは非常に困難な作業です。十分な理解と経験、または適切な計画と設計がなければ、たとえ最高のチームであっても失敗します。一方で、優れた直感と詳細な計画を持っていても、実行するための規律がなければ、努力は失敗する運命にあるため、お金と時間を無駄にしているだけです。メッセージは明確である必要があります。これらのスキル、理解/経験、計画/設計、実装規律の 1 つ以上が欠けている場合、BI 組織の構築が機能不全に陥るか、破壊されてしまいます。

あなたのチームは十分な準備をしていますか? BI チームの中に、BI 環境で利用できる膨大な分析環境と、その環境を維持するために必要な手法やテクノロジを理解している人はいますか?あなたのチームに、高度なアプリケーションと高度なアプリケーションの違いを認識できる人はいますか?

静的レポートと OLAP、あるいは ROLAP と OLAP の違いは何ですか?チーム メンバーの 1 人は、抽出方法とそれがウェアハウスにどのような影響を与える可能性があるか、またはウェアハウスが抽出パフォーマンスをどのようにサポートできるかを明確に認識していますか?チームメンバーは次の価値を理解しています 与えます 宇宙またはエージェントベースのテクノロジー? ETL ツールとメッセージ ブローカー テクノロジのユニークなアプリケーションを評価する人はいますか?持っていない場合は、入手してください。 BI は、正規化されたアトミック レイヤー、OLAP、スター スキーマ、ODS よりもはるかに大きいです。

BI 要件とそのソリューションを認識するための理解と経験を持つことは、ユーザーのニーズを適切に形式化し、ソリューションを設計および実装する能力に不可欠です。ユーザー コミュニティが要件を説明するのが難しい場合、その理解を提供するのがウェアハウス チームの仕事です。しかし、倉庫チームが

BI の特定のアプリケーション (データ マイニングなど) を認識していない場合、BI 環境がパッシブ リポジトリに限定されることが多いのは最良のことではありません。ただし、これらのテクノロジーを無視しても、その重要性が減り、組織のビジネス インテリジェンス機能の出現や、育成する予定の情報環境に与える影響が減ることはありません。

計画には図面の概念が含まれている必要があり、どちらも有能な人材が必要です。さらに、設計にはチーム ウェアハウスの哲学と標準への準拠が必要です。たとえば、会社が標準プラットフォームを確立している場合、またはプラットフォーム全体で標準化したい特定の RDBMS を特定している場合、それらの標準を遵守する責任はチームの全員にあります。一般に、チームは標準化の必要性を (ユーザー コミュニティに) 明らかにしますが、チーム自体は、社内の他の領域や、場合によっては同様の企業内でも確立されている標準に従うことに消極的です。これは偽善的なだけでなく、会社が既存のリソースや投資を活用できないことを証明します。これは、標準化されていないプラットフォームやテクノロジーを正当化する状況がないという意味ではありません。ただし、倉庫作業

ビジネス要件によって別のことが指示されるまで、企業の標準を熱心に守る必要があります。

BI 組織を構築するために必要な 3 番目の重要な要素は規律です。
それは全体として、個人と環境に等しく依存します。プロジェクト プランナー、スポンサー、アーキテクト、ユーザーは、企業の情報環境を構築するために必要な規律を認識する必要があります。デザイナーは、社会で必要な他の努力を補完するような方法でデザインの努力を方向付けなければなりません。

たとえば、あなたの会社が倉庫コンポーネントを備えた ERP アプリケーションを構築しているとします。
したがって、すでに開始されている作業と競合したり重複したりしないように、倉庫環境チームと協力するのが ERP 設計者の責任です。

規律も組織全体で取り組まなければならないテーマであり、通常は確立され、幹部レベルに委ねられます。
マネージャーは計画されたアプローチに従うつもりですか?最終的には企業のあらゆる分野に価値をもたらす情報コンテンツを作成することを約束するアプローチですが、おそらく個人または部門の課題を損なう可能性がありますか? 「一つのことだけを考えるよりも、すべてを考えることが大切」という格言を思い出してください。この格言は BI 組織にも当てはまります。

残念なことに、多くのウェアハウスは、組織全体をほとんど考慮せず、特定の部門や特定のユーザーをターゲットにして価値をもたらそうとすることに重点を置いています。経営者が倉庫チームに支援を要求したとします。チームは、マネージャーが定義した通知要件を提供するだけでなく、すべての通知が確実に行われるようにすることを含む 90 日間の取り組みで対応します。 与えます 塩基は、提案されているキューブ技術に導入される前に原子レベルで混合されます。
このエンジニアリングの追加により、倉庫企業は次のようなメリットを確実に得ることができます。 与えます 経営者にとって必要なもの。
しかし、同幹部は外部のコンサルティング会社と相談し、4週間以内に納品できる同様のアプリケーションを提案した。

社内の倉庫チームが有能であれば、経営陣には選択の余地があります。情報資産企業を育成するために必要な追加のエンジニアリング分野をサポートできる人、または独自のソリューションを迅速に構築することを選択できる人。後者はあまりにも頻繁に選択されるようで、少数または個人のみに利益をもたらす情報のコンテナを作成するためにのみ機能します。

短期および長期の目標

アーキテクトとプロジェクト設計者は、アーキテクチャ全体の長期ビジョンと BI 組織の成長計画を正式に策定する必要があります。この短期的な利益と長期的な計画の組み合わせは、BI の取り組みの 2 つの側面を表しています。短期的な利益は、ウェアハウスの反復に関連する BI の側面です。

ここでは、プランナー、建築家、スポンサーが特定の商業要件を満たすことに重点を置いています。物理的な構造が構築され、テクノロジーが購入され、技術が実装されるのはこのレベルです。これらは、特定のユーザー コミュニティによって定義された特定の要件に対処するために作られたものではありません。すべては、特定のコミュニティによって定義された特定の要件に対処するために行われます。
ただし、長期計画は BI の別の側面です。ここでは、計画と設計により、あらゆる物理的構造が確実に構築され、テクノロジーが選択され、企業を念頭に置いて実装された技術が導入されます。短期的な利益から確実にビジネス上の利益を生み出すために必要な一貫性を提供するのは、長期的な計画です。

BI への取り組みを正当化する

Un データウェアハウス それ自体には固有の価値はありません。言い換えれば、ウェアハウステクノロジーと実装テクノロジーの間には固有の価値はありません。

倉庫作業の価値は、倉庫環境と時間の経過とともに培われた情報コンテンツの結果として実行されるアクションに見出されます。これは、Wherehouse の取り組みの価値を見積もる前に理解しておくべき重要な点です。

建築家や設計者は、倉庫の物理的および技術的コンポーネントに価値を適用しようとすることがよくありますが、実際にはその価値は、倉庫と十分に取得された情報によってプラスの影響を受けるビジネス プロセスに基づいています。

ここに BI を確立する際の課題があります。投資をどのように正当化するかということです。ウェアハウス自体に本質的な価値がない場合、プロジェクト設計者は、特定のビジネス プロセスや保護された情報の価値、あるいはその両方を改善するためにウェアハウスを使用する個人によって達成されるメリットを調査、定義し、形式化する必要があります。

さらに問題を複雑にしているのは、倉庫保管の取り組みによって影響を受けるビジネス プロセスは、「かなりの」または「わずかな」利益をもたらす可能性があることです。大きなメリットにより、投資収益率 (ROI) を測定するための具体的な指標が提供されます。たとえば、特定の期間に在庫をさらに回転させることができたり、出荷ごとの輸送コストが削減されたりすることができます。情報へのアクセスの向上など、目に見える価値の観点から微妙な利点を定義するのは困難です。

プロジェクトを接続して、 業務上のご要望

プロジェクト プランナーは、倉庫の価値を不定形な企業目標に結び付けようとすることがよくあります。 「倉庫の価値は、戦略的要求を満たす能力に基づいている」と宣言することで、議論を楽しく始めます。しかし、それだけでは在庫への投資が意味があるかどうかを判断するのに十分ではありません。倉庫の反復を特定の既知のビジネス需要と結び付けることが最善です。

ROIの測定

倉庫環境における ROI の計算は特に難しい場合があります。利点がある場合は特に困難です

特定の繰り返しの原理は、目に見えない、または測定するのが簡単ではないものです。ある調査によると、ユーザーは BI イニシアチブの主な利点を 2 つ認識していることがわかりました。

  • ▪ 意思決定を下す能力を生み出す
  • ▪ 情報へのアクセスを作成する
    これらの利点はソフト (またはマイルド) 利点です。交通費の削減などのハード (または主要) メリットに基づいて ROI を計算する方法は簡単にわかりますが、より適切な意思決定を行う能力はどのように測定すればよいでしょうか?
    これは、プロジェクト プランナーが企業に特定の倉庫への取り組みへの投資を説得しようとする場合、間違いなく困難です。売上の増加やコストの削減は、もはや BI 環境を推進する中心的なテーマではありません。
    代わりに、特定の部門がより迅速な意思決定を行えるように、情報へのアクセスを改善するというビジネス リクエストに注目しています。これらは、企業にとって同様に重要である戦略的推進要因ですが、より曖昧で、具体的な指標で特徴付けるのが困難です。この場合、ROI の計算は、無関係ではないにしても、誤解を招く可能性があります。
    プロジェクト プランナーは、経営幹部が特定のイテレーションへの投資に価値があるかどうかを判断できるように、具体的な価値を実証できなければなりません。ただし、ROIの新たな算出方法を提案したり、賛否を主張したりするつもりはありません。
    ROI の計算の基本について説明した記事や書籍は数多くあります。 Gartner などのグループが提供する、Value on Investment (VOI) など、調査できる特別な価値提案があります。代わりに、ROI やその他の考慮すべき価値提案の中核となる側面に焦点を当てます。 ROIの適用 BI の取り組みに関連する「ハード」のメリットと「ソフト」のメリットに関する議論以外にも、ROI を適用する際に考慮すべき問題があります。例えば:

いずれにせよ、DW の取り組みによる節約が多すぎると考える
あなたの会社がメインフレーム アーキテクチャから分散 UNIX 環境に移行したとします。したがって、その努力によって実現される可能性がある (または実現されないかもしれない) 節約は、たとえあったとしても (?) 倉庫のみに起因するものではありません。

すべてを考慮しないとコストがかかります。そして、考慮すべきことがたくさんあります。次のリストを考慮してください。

  •  実現可能性を含む初期費用。
  • ▪ 関連するストレージおよび通信を含む専用ハードウェアのコスト
  • ▪ 管理を含むソフトウェアのコスト 与えます クライアント/サーバー拡張機能、ETL ソフトウェア、DSS テクノロジー、視覚化ツール、スケジューリングおよびワークフロー アプリケーション、監視ソフトウェアなど。
  • ▪ 構造設計コスト 与えますの作成と最適化により、
  • ▪ BI の取り組みに直接関連するソフトウェア開発コスト
  • ▪ ソフトウェアのバージョン管理やヘルプ操作を含むパフォーマンスの最適化を含むオンサイト サポートのコスト 「ビッグバン」ROI を適用します。 単一の巨大な取り組みとして倉庫を構築することは失敗する運命にあるため、大企業の取り組みの ROI を計算することすらできません。この提案は驚くべきものであり、プランナーは取り組み全体の価値を見積もるために弱々しい試みを続けています。特定の繰り返しを見積もることが難しいことが広く知られ、受け入れられているのに、プランナーはなぜビジネス イニシアチブに金銭的価値を付けようとするのでしょうか?どのようにしてそれが可能でしょうか?一部を除き不可能です。やめてください。 ROI を計算する際にすべきでないことを確認したところで、BI の取り組みの価値を見積もるための信頼できるプロセスを確立するのに役立ついくつかのポイントを紹介します。

ROI のコンセンサスの取得。 BI の取り組みの価値を見積もるための手法の選択に関係なく、プロジェクト設計者、スポンサー、経営幹部を含むすべての関係者の合意が必要です。

ROI を識別可能な部分に縮小します。 ROI を合理的に計算するために必要な手順は、その計算を特定のプロジェクトに焦点を当てることです。これにより、満たされる特定のビジネス要件に基づいて値を見積もることができます。

コストを定義します。前述したように、多くのコストを考慮する必要があります。さらに、コストには、単一の反復に関連するコストだけでなく、企業標準への準拠の確保に関連するコストも含める必要があります。

メリットを定義します。 ROI を特定のビジネス要件に明確に結びつけることで、要件を満たすことにつながるメリットを特定できるはずです。

コストを削減し、差し迫った利益を得ることができます。これは、将来の収益の将来価値を予測するのではなく、正味現在価値 (NPV) に基づいて評価を行う最良の方法です。

ROI を分割するタイミングは最小限に抑えてください。 ROI に長期間使用されてきたことが十分に文書化されています。

複数の ROI 式を使用します。 ROI を予測するには多数の方法があり、正味現在価値、内部収益率 (IRR)、回収率など、1 つまたは複数の方法を使用するかどうかを計画する必要があります。

反復可能なプロセスを定義します。これは長期的な価値を計算するために非常に重要です。単一の反復可能なプロセスは、その後のすべてのプロジェクトのサブシーケンスについて文書化する必要があります。

リストされている問題は、倉庫環境の専門家によって定義された最も一般的な問題です。 「ビッグバン」ROI を実現するという経営陣の主張は、非常に方向感覚を失わせます。すべての ROI の計算を、識別可能な具体的な部分に分割して開始すると、正確な ROI 評価を推定できる可能性が高くなります。

ROI のメリットに関する質問

ソフトであれハードであれ、メリットが何であれ、いくつかの基本的な質問を使用してその価値を判断できます。たとえば、1 から 10 までの単純なスケーリング システムを使用すると、次の質問を使用してあらゆる取り組みの影響を測定できます。

  • の理解度をどのように評価しますか 与えます あなたの会社のこのプロジェクトをフォローしていますか?
  • このプロジェクトの結果としてのプロセスの改善はどのように見積もられますか?
  • この反復によって利用可能になった新しい洞察と推論の影響をどのように測定しますか
  • 学んだことの結果として、新しくてパフォーマンスの高いコンピューティング環境はどのような影響を及ぼしましたか?これらの質問に対する答えがほとんどない場合、その会社には投資に値しない可能性があります。高得点の質問は、大きな価値の向上を示しており、さらなる調査のガイドとして機能するはずです。たとえば、プロセス改善のスコアが高いと、設計者はプロセスがどのように改善されたかを検討するようになります。得られた利益の一部またはすべてが目に見えるものであるため、金銭的価値を容易に適用できることがわかるかもしれません。 最初のイテレーションを最大限に活用する 倉庫 企業努力の最大の成果は、多くの場合、最初の数回の反復で得られます。これらの初期の取り組みは伝統的に、一般向けに最も有用な情報コンテンツを確立し、その後の BI アプリケーションの技術基盤の確立に役立ちます。通常、後続のすべてのサブシーケンス 与えます 倉庫プロジェクトの割合は、企業全体にもたらす付加価値がますます少なくなっています。これは、反復によって新しいトピックが追加されない場合や、新しいユーザー コミュニティのニーズを満たさない場合に特に当てはまります。

このストレージ機能は、増加するスタックにも適用されます。 与えます 歴史家。その後の取り組みにはさらに多くのことが必要になるため、 与えます そしてさらになんと 与えます 時間の経過とともに倉庫に流し込まれますが、そのほとんどは 与えます 使用される分析との関連性が低くなります。これら 与えます 彼らはよく呼ばれます 与えます それらは休眠状態にあり、ほとんど使用されないため、保管するには常に費用がかかります。

これはプロジェクトのスポンサーにとって何を意味しますか?基本的に、初期のスポンサーは投資にかかる費用以上のものを共有します。これが主な理由は、それらが倉庫の広範なテクノロジーとオーガニックを含む資源環境層を確立するための原動力となるからです。

しかし、これらの最初のステップは最高の価値をもたらすため、プロジェクト設計者は多くの場合、投資を正当化する必要があります。
BI イニシアチブの後に行われたプロジェクトは、(最初と比較して) 直接コストが低くなりますが、会社にもたらす価値は低くなります。

そして、組織のオーナーは蓄積されたものを捨てることを検討し始める必要があります。 与えます 関連性の低いテクノロジーも含まれます。

データマイニング: 抽出 与える

多くのアーキテクチャ コンポーネントには、さまざまなデータ マイニング テクノロジとテクニックが必要です。
たとえば、関心のあるポイントを調査するためのさまざまな「エージェント」。 顧客、会社のオペレーティング システム、および dw 自体用です。これらのエージェントは、販売促進に基づく将来の製品需要など、POT トレンドについてトレーニングされた高度なニューラル ネットワークです。セットに反応するルールベースのエンジン だと 状況の説明、たとえば、医学的診断や治療の推奨。あるいは、トップエグゼクティブに例外を報告する役割を持つ単純なエージェントさえも含まれます。一般的にこれらの抽出プロセスは 与えます si

リアルタイムで検証します。したがって、それらは、の動きと完全に一体化しなければなりません。 与えます stessi。

オンライン分析処理 処理

オンライン分析

スライス、ダイス、ロール、ドリルダウン、および分析を実行する機能
「もしも​​」は、IBM テクノロジー スイートの範囲内であり、焦点です。たとえば、DB2 にはオンライン分析処理 (OLAP) 機能があり、ソフトウェア エンジンに次元分析を組み込みます。 データベース 同じ 。

これらの関数は、DB2 の自然な部分である利点をすべて活用しながら、SQL に多次元のユーティリティを追加します。 OLAP 統合のもう 2 つの例は、抽出ツールである DB2 OLAP Server Analyzer です。このテクノロジーにより、DBXNUMX OLAP Server キューブを迅速かつ自動的に分析して、値を見つけてレポートできるようになります。 与えます ビジネス アナリストにとって、キューブ全体にわたって異常または予期しないものです。最後に、DW Center 機能は、特に、ETL プロセスの自然な部分として DB2 OLAP サーバー キューブのプロファイルを制御する手段をアーキテクトに提供します。

空間分析 空間分析

スペースは、パノラマに必要な分析アンカー (リード) の半分を表します。
広範な分析(時間は残りの半分を表します)。図 1.1 に示す倉庫の原子レベルには、時間と空間の両方の基本が含まれています。タイムスタンプは時間による分析をアンカーし、アドレス情報は空間による分析をアンカーします。タイムスタンプは時間で分析し、アドレス情報は空間で分析します。この図は、ジオコーディング (距離や内部/外部などの概念を分析に使用できるように、住所を地図上の XNUMX つまたは複数の空間内の点に変換するプロセス) を原子レベルで実行し、空間分析を利用できるようにすることを示しています。アナリスト。 IBM は、環境システム研究所 (ESRI) と共同で開発した空間拡張機能を提供しています。 データベース DB2 の通常の部分としてスペース オブジェクトを格納できるようにする データベース 関連した。 DB2

Spatial Extender は、空間分析を利用するためのすべての SQL 拡張機能も提供します。たとえば、クエリを実行する SQL 拡張子
住所間の距離、または点が定義された多角形エリアの内側か外側かは、Spatial Extender の分析標準です。詳細については、第 16 章を参照してください。

データベース-常駐ツールツール データベース-居住者

DB2 には、分析アクションを支援する BI 常駐 SQL 機能が多数あります。これらには次のものが含まれます。

  • 「すべての可能な飛行経路を見つける」などの分析を実行するための再帰関数 サンフランシスコ a ニューヨーク"。
  • 通常は OLAP テクノロジでのみ発生するタスクを容易にする、ランキング、累積関数、キューブ、ロールアップなどの分析関数が、エンジンの自然な部分になりました。 データベース
  • 結果を含むテーブルを作成する機能
    の売り手 データベース リーダーは、BI 機能をさらに多くの機能に組み込んでいます。 データベース そのもの。
    主なサプライヤー データベース 彼らは、より多くの BI 機能を データベース そのもの。
    これにより、BI ソリューションのパフォーマンスが向上し、より多くの実行オプションが提供されます。
    DB2 V8 の特徴と機能については、次の章で詳しく説明します。
    技術アーキテクチャとデータ管理基盤 (第 5 章)
  • DB2 BI の基礎 (第 6 章)
  • DB2 マテリアライズドクエリテーブル (第 7 章)
  • DB2 OLAP 関数 (第 13 章)
  • DB2 拡張 BI の機能 (第 15 章) 簡易データ配信システム の配送システム 与えます 簡略化

図 1.1 に示されているアーキテクチャには、多数の構造が含まれています 与えます 物理的な。一つは倉庫です 与えます オペレーティング。一般に、ODS は主題指向の、統合された最新のオブジェクトです。たとえば、営業所をサポートするために ODS を構築します。 ODSの売上が補完する 与えます 多数の異なるシステムから保存されますが、たとえば今日のトランザクションのみが保持されます。 ODS は 1 日に何度でも更新できます。同時に、プロセスは 与えます 他のアプリケーションに統合されています。この構造は、統合するために特別に設計されています。 与えます 現在かつ動的であり、サービス エージェントへの提供など、リアルタイム分析をサポートする候補となる可能性があります。 顧客 倉庫自体から販売傾向情報を抽出することで、顧客の現在の販売情報を取得します。図 1.1 に示す別の構造は、dw の正式な状態です。ここは必要な統合を実行する場所であるだけでなく、 与えます、および変換の 与えます 入荷倉庫としてだけでなく、信頼性の高い一時保管場所としても機能します。 与えます リアルタイム分析で使用できる複製。 ODS またはステージング領域を使用することに決めた場合、これらの構造を設定するための最良のツールの 1 つ 与えます 異なる操作ソースを使用することは、DB2 の異種分散クエリです。この機能は、DB2 Relational Connect (クエリのみ) と呼ばれるオプションの DB2 機能によって、また DB2 DataJoiner (異種分散 RDBMS にクエリ、挿入、更新、および削除の機能を提供する別の製品) を通じて提供されます。

このテクノロジーにより、建築家は次のことが可能になります。 与えます 結ぶ 与えます 分析プロセスを使用した生産。このテクノロジーは、リアルタイム分析で発生する可能性のあるほぼすべてのレプリケーション要求に適応できるだけでなく、さまざまなデータベースに接続することもできます。 与えます DB2、Oracle、Sybase、SQL Server、Informix など、最も一般的なものです。 DB2 DataJoiner を使用して構造体にデータを取り込むことができます。 与えます ODS として正式なテーブル、あるいはインスタント アップデートや販売用の迅速なリカバリのために設計されたウェアハウスに表示される永続テーブルです。もちろん、これらと同じ構造です 与えます を使用して設定できます

の複製のために設計されたもう 1 つの重要なテクノロジー 与えます、IBM DataPropagator Relational。 (DataPropagator は中央システム用の別個の製品です。DB2 UNIX、Linux、Windows、および OS/2 にはデータ複製サービスが含まれています 与えます 標準機能として)。
別の移動方法 与えます 企業全体で動作しているのは、メッセージ ブローカーとしても知られるエンタープライズ アプリケーション インテグレーターです。この独自のテクノロジにより、ターゲティングと移動の比類のない制御が可能になります。 与えます 会社の周り。 IBM には、最も広く使用されているメッセージ ブローカーである MQSeries、または次の要件を含む製品のバリエーションがあります。 eコマース、IBM WebSphere MQ。
MQ を活用してウェアハウスと BI 環境をサポートする方法について詳しくは、次の Web サイトを参照してください。 ウェブサイト 本の。現時点では、このテクノロジは (MQSeries Integrator を使用して) キャプチャおよび変換するための優れた手段であると言えば十分です。 与えます BI ソリューションのために採用された中心的な (対象を絞った) オペレーター。 MQ テクノロジーは UDB V8 に統合され、パッケージ化されています。つまり、メッセージ キューを DB2 テーブルであるかのように管理できるようになりました。キューに入れられたメッセージとその世界を融合するという概念 データベース リレーショナルは、強力な配信環境を目指しています。 与えます.

ゼロレイテンシー ゼロレイテンシー

IBM の最終的な戦略目標は、ゼロ遅延分析です。定義どおり
Gartner 氏によると、BI システムはオンデマンドで情報を推論、同化してアナリストに提供できなければなりません。もちろん、課題はどうやって混ぜるかです 与えます 現在およびリアルタイムで、必要な履歴情報を提供します。 与えます 関連するパターン/傾向、または顧客プロファイリングなどの抽出された理解。

このような情報には、たとえば、次のような情報が含まれます。 顧客 リスクが高いか低いか、どの製品を使用するか 顧客 すでにショッピング カートにチーズが入っていれば、おそらく購入するでしょう。

ゼロ遅延の達成は、実際には次の 2 つの基本的なメカニズムに依存しています。

  • の完全な結合 与えます BI によって作成された確立された技術とツールを使用して分析されます
  • の配送システム 与えます リアルタイム分析が真に利用可能であることを確実にするための効率性 ゼロ遅延のこれらの前提条件は、IBM が設定し、上で説明した 2 つの目標と何ら変わりません。の密接な交配 与えます これは、IBM のシームレスな統合プログラムの一部です。そして、 与えます 効率は、配信プロセスを簡素化する利用可能なテクノロジーに完全に依存しています。 与えます。結果として、IBM の 3 つの目標のうち 2 つは、3 つ目の目標を実現するために重要です。 IBM は、倉庫作業においてゼロ遅延を確実に実現するために、意識的にテクノロジーを進化させています。 要約/総合 BI 組織は、環境を構築するためのロードマップを提供します
    繰り返して。現在および将来のビジネスのニーズを反映するように調整する必要があります。広範なアーキテクチャのビジョンがなければ、ウェアハウスの反復は中央ウェアハウスの無計画な実装に過ぎず、広範で有益な企業を生み出すにはほとんど役に立ちません。プロジェクト マネージャーにとっての最初のハードルは、BI 組織の開発に必要な投資をどのように正当化するかということです。 ROI 計算は依然として倉庫実装の中心ですが、正確に予測することはますます困難になってきています。これにより、お金の価値があるかどうかを判断するための別の方法が登場しました。たとえば、投資価値 2 (VOI) がソリューションとして推進されています。それは建築家の義務です 与えます およびプロジェクト プランナーは、ユーザー団体に単にサービスを提供するのではなく、意図的に情報を生成してユーザー団体に提供します。 与えます。両者の間には大きな違いがあります。情報は意思決定と有効性に違いをもたらすものです。比較的、私は 与えます それらは、その情報を導き出すための構成要素です。

たとえ私が情報源を批判していたとしても 与えます ビジネスの要求に応えるには、情報コンテンツの作成において BI 環境がより大きな役割を果たす必要があります。ユーザーが操作できる情報コンテンツをクレンジング、統合、変換、または作成するための追加の手順を実行し、合理的な場合にはそれらの操作と決定が BI 環境に反映されるようにする必要があります。倉庫を次のサービスのみに限定すると、 与えます、ユーザーの関連付けにより、アクションを実行するために必要な情報コンテンツが作成されることが保証されます。これにより、コミュニティはより適切な意思決定を行うことができるようになりますが、企業は使用した知識が不足していることに悩まされます。 ダト アーキテクトとプロジェクト プランナーは、BI 環境で特定のプロジェクトを開始する際、企業全体に対する責任を負い続けます。 BI 反復のこの両面の特性の簡単な例は、ソースにあります。 与えます。 全ての 与えます 特定のビジネス リクエストに対して受信したリクエストは、最初のアトミック層に入力する必要があります。これにより、企業情報資産の開発と管理が、繰り返しで定義された特定のユーザー要求に確実に対応できるようになります。

データウェアハウスとは何ですか?

データウェアハウス 1990 年以来、情報システム アーキテクチャの中心となっており、堅牢な統合プラットフォームを提供することで情報プロセスをサポートしています。 与えます 後続の分析の基礎として取得される履歴データ。ザ データウェアハウス 互換性のないアプリケーション システムの世界でも統合が容易になります。 データウェアハウス トレンドへと進化してきました。 データウェアハウス 私を整理して保管する 与えます 長い歴史的時間的観点に基づいた情報および分析プロセスに必要です。これらすべてには、建設とメンテナンスにおける多大な継続的な取り組みが必要です。 データウェアハウス.

それで、とは何ですか データウェアハウス? A データウェアハウス です:

  • ▪ 主題指向
  • ▪ 統合システム
  • ▪ バリアントタイム
  • ▪ 不揮発性 (消去不可)

のコレクション 与えます プロセスの実装における管理上の意思決定をサポートするために使用されます。
I 与えます に挿入された データウェアハウス ほとんどの場合、それらは運用環境に由来します。の データウェアハウス これは、システムの残りの部分から物理的に分離されたストレージ ユニットによって作成されます。 与えます 以前は、動作環境から得られる情報に基づいて動作するアプリケーションによって変換されていました。

の文字通りの定義 データウェアハウス 倉庫の特徴を説明する重要な動機と根底にある意味があるため、詳細な説明に値します。

被写体の向き 向き テーマ別

の最初の特徴は、 データウェアハウス それは、企業内の主要なプレーヤーを対象としているということです。試練を乗り越えるガイド 与えます これは、プロセスと機能に対するアプリケーションの方向性を含む、より古典的な方法とは対照的です。この方法は、最近のほとんどの管理システムで主に共有されています。

運用世界は、金融機関のローン、貯蓄、バンクカード、信託などのアプリケーションと機能を中心に設計されています。 dw の世界は、顧客、販売者、製品、アクティビティなどの主要な主題を中心に構成されています。トピックの調整は、の設計と実装に影響します。 与えます dwで見つかりました。さらに重要なのは、メイン トピックがキー構造の最も重要な部分に影響を与えるということです。

アプリケーションの世界は、データベースの設計とプロセス設計の両方の影響を受けます。 dw の世界はモデリングのみに焦点を当てています 与えます そしてそのデザインについて データベース。プロセス設計 (従来の形式) は、dw 環境の一部ではありません。

プロセス・機能適用の選択と対象の選択の違いは、内容の違いとしても表れます。 与えます 細かいレベルで。ザ 与えます dw には i は含まれません 与えます これは、アプリケーションの実行中に DSS プロセスには使用されません。

運用指向 与えます 私を含む 与えます DSS アナリストにとって用途があるかどうかに関係なく、機能/処理要件を即座に満たすことができます。
運用指向のアプリケーションを実現するもう 1 つの重要な方法 与えます 異なり 与えます DWのはデイレポートにあります 与えます。 私は 与えます 操作は、アクティブなビジネス ルールに基づいて 2 つ以上のテーブル間の継続的な関係を維持します。ザ 与えます dw は時間のスペクトルを横断しており、dw 内には多くの関係が見られます。多くの取引ルール (およびそれに応じて、取引ルールの多くの関係) 与えます ) の倉庫に表示されます。 与えます 2 つ以上のテーブルの間。

(両者の関係について詳しく説明すると、 与えます DW で処理される場合は、その問題に関する技術トピックを参照してください。)
機能/プロセス アプリケーションの選択と主題の選択との根本的な違いという観点以外に、オペレーティング システムとサブジェクトの選択の間には、より大きな違いがあるのでしょうか。 与えます そしてDW。

統合 統合

dw 環境の最も重要な側面は、 与えます dw 内にあるものは簡単に統合できます。いつも。例外なく。 dw 環境の本質は次のとおりです。 与えます 倉庫の制限内に含まれるすべてのものが統合されます。

統合は、一貫した特定の規則、一貫した変数の測定、一貫したコード化された構造、オブジェクトの物理的属性など、さまざまな方法でそれ自体を明らかにします。 与えます 一貫性があるなど。

長年にわたり、さまざまなアプリケーションの設計者は、アプリケーションをどのように開発するかについて多くの決定を行ってきました。設計者のアプリケーションのスタイルと個別の設計決定は、コーディング、キー構造、物理的特性、識別規則などの違いで、さまざまな形で明らかになります。一貫性のないアプリケーションを作成する多くのアプリケーション設計者の総合的な能力は伝説的です。図 3 は、アプリケーションの設計方法における最も重要な違いのいくつかを示しています。

エンコーディング: エンコーディング:

アプリケーション設計者は、さまざまな方法でフィールド (性別) のエンコーディングを選択しました。デザイナーは性別を「m」と「f」で表現します。別のデザイナーは性別を「1」と「0」で表現しています。別のデザイナーは性別を「x」と「y」で表します。別のデザイナーは性別を「男性」と「女性」で表現しています。 DW に性別がどのように含まれるかはあまり重要ではありません。 「M」と「F」はおそらく劇全体と同じくらい優れています。

重要なのは、セックスフィールドがどのような起源から派生したとしても、そのフィールドは一貫して統合された状態でDWに到着するということです。したがって、フィールドが「M」および「F」の形式で表されているアプリケーションから DW にロードされると、 与えます DW 形式に変換する必要があります。

属性の測定: の測定 属性:

アプリケーション設計者は、長年にわたってさまざまな方法でパイプラインを測定することを選択してきました。デザイナーが保管するのは、 与えます パイプラインの長さをセンチメートル単位で示します。別のアプリケーション設計者が 与えます パイプラインのインチ単位。別のアプリケーション設計者が 与えます 1 秒あたり 100 万立方フィートのパイプライン。また、別の設計者はパイプライン情報をヤード単位で保存します。ソースが何であれ、パイプライン情報が DW に到着したら、同じ方法で測定する必要があります。

図 3 の兆候によると、統合の問題はプロジェクトのほぼすべての側面、つまりプロジェクトの物理的特性に影響を与えます。 与えます、複数の情報源を持つことのジレンマ 与えます、一貫性のない識別されたサンプルの問題、フォーマット 与えます 矛盾しているなど。

デザインのトピックが何であれ、結果は同じです。 与えます 基盤となるオペレーティング システムが異なる方法で保存する場合でも、単一かつグローバルに受け入れられる方法で DW に保存する必要があります。 与えます.

DSS アナリストが DW を調べるとき、アナリストの目標は、DW を活用することである必要があります。 与えます 倉庫にあるものは、

信頼性や一貫性について疑問を抱くのではなく、 与えます.

時間の変動

すべて 与えます DW では、ある時点までは正確です。この基本的な特徴は、 与えます DWではそれとは大きく異なります 与えます 動作環境で見つかりました。ザ 与えます 動作環境の情報は、アクセスした時点と同じくらい正確です。つまり、ドライブにアクセスする際の動作環境において、 与えます、アクセス時の正確な値が反映されることが期待されます。なぜなら私は 与えます DW では、ある時点 (つまり、「今」ではない) として正確ですが、i と言われます。 与えます DW に含まれるのは「時間分散」です。
の時間変動 与えます by DW はさまざまな方法で参照されます。
最も簡単な方法は、私が 与えます DW を表す 与えます 5年から10年という長い期間にわたって。動作環境で表される期間は、今日の現在の値よりもはるかに短く、最大 690 年です。
適切に機能し、トランザクション処理に使用できる必要があるアプリケーションは、最小限の量のデータを保持する必要があります。 与えます ある程度の柔軟性が認められるのであれば。したがって、運用アプリケーションの期間は、オーディオ アプリケーションの設計トピックと同様に短期間です。
DW に「時間の差異」が現れる 2 番目の方法は、キー構造にあります。 DW 内の各キー構造には、暗黙的または明示的に、日、週、月などの時間要素が含まれています。 time 要素は、ほとんどの場合、DW で見つかった連結キーの一番下にあります。このような場合、月または四半期の終わりにファイル全体が複製される場合など、時間要素が暗黙的に存在します。
時間分散を表示する 3 番目の方法は、 与えます DW は、一度正しく登録されると更新できません。ザ 与えます DW の実際的な目的は、長い一連のスナップショットです。もちろん、スナップショットが間違って作成された場合は、スナップショットを変更できます。ただし、スナップショットが正しく取得されていると仮定すると、スナップショットは取得後すぐには変更されません。一部では

場合によっては、DW 内のスナップショットを変更することが非倫理的であるか、無効である場合もあります。ザ 与えます アクセスした時点で正確に動作し、必要に応じて更新できます。

不揮発性

DW の 4 番目の重要な特性は、不揮発性であることです。
更新、挿入、削除、および変更は、レコードごとに運用環境に対して定期的に行われます。しかし、その基本的な操作は、 与えます DW で必要な処理ははるかに簡単です。 DW で発生する操作は 2 種類のみです - の初期ロードです。 与えます そして、へのアクセス 与えます。の更新はありません 与えます (更新という一般的な意味で) 通常の処理操作として DW で実行されます。運用処理と DW 処理の間のこの基本的な違いにより、非常に強力な影響がいくつかあります。設計レベルでは、異常な更新に注意する必要は DW の要素ではありません。 与えます は実施されない。これは、物理設計レベルで自由にアクセスを最適化できることを意味します。 与えます、特に物理的な正規化と非正規化のトピックを扱います。 DW 操作の簡素化のもう 1 つの影響は、DW 環境を実行するために使用される基盤となるテクノロジにあります。インラインのレコードごとの更新をサポートする必要があるため (運用処理ではよくあることですが)、テクノロジには、見かけの単純さの裏に非常に複雑な基盤が必要です。
バックアップとリカバリ、トランザクションと整合性をサポートするテクノロジー 与えます また、デッドロック状態の検出と修復は非常に複雑であり、DW 処理には必要ありません。 DWの特徴、設計の方向性、統合 与えます DW 内での時間変動、管理の簡素化 与えます、それはすべて、従来の動作環境とは非常に異なる環境につながります。ほぼすべてのソース 与えます DWの動作環境です。大規模な冗長性があると考えたくなります。 与えます 2 つの環境の間で。
実際、多くの人が抱く第一印象は、非常に冗長性が高いというものです。 与えます 動作環境と環境の間

D.W.このような解釈は表面的であり、DW で何が起こっているのかを理解していないことを示しています。
実際には最小限の冗長性があります 与えます 動作環境とiの間 与えます DWの。次の点を考慮してください。 与えます 彼らはフィルタリングされています だと オペレーティング環境から DW 環境への切り替え。多くの 与えます 動作環境の外に出ることはありません。それを除いて、私は 与えます DSS 処理に必要な要素が環境内で方向性を見つける

▪ 時間軸 与えます それは環境によって大きく異なります。ザ 与えます 動作環境では非常に新鮮です。ザ 与えます DWでは彼らはずっと年上です。時間軸の観点からのみ、運用環境と DW の間に重複する部分はほとんどありません。

▪ DW には以下が含まれます 与えます 環境内で決して見つからない概要

▪ 私は 与えます 図 3 に移行すると、根本的な変化が起こります。 与えます 選択して DW に移動すると、大幅に変更されます。別の言い方をすると、ほとんどの場合、 与えます DW に移動されると、物理的かつ根本的に変更されます。統合の観点から見ると、それらは同じではありません 与えます 動作環境に存在するもの。これらの要因を考慮すると、 与えます 1 つの環境間で冗長性が生じることはまれであり、XNUMX つの環境間の冗長性は XNUMX% 未満になります。 倉庫の構造 DW は独特の構造を持っています。 DW を区別するさまざまなレベルの概要と詳細があります。
DW のさまざまなコンポーネントは次のとおりです。

これまでのところ主な懸念は、 与えます 現在の詳細。これが主な懸念事項である理由は次のとおりです。

  • I 与えます 現在の詳細は、常に大きな関心を集めている最新の出来事を反映しています。
  • i 与えます 現在の詳細は最低レベルの粒度で保存されるため、膨大な量になります。
  • i 与えます 現在の詳細はほとんどの場合ディスク メモリに保存されているため、すぐにアクセスできますが、使用するには高価で複雑です 与えます 年齢が高くなるほど詳細がわかる 与えます 何らかのメモリに保存されているもの マッサ。散発的にアクセスされ、以下と互換性のある詳細レベルで保存されます。 与えます 現在の詳細。代替記憶媒体に保存することは必須ではありませんが、大量のデータが存在するため、 与えます 散発的なアクセスと組み合わせると、 与えます、メモリサポート 与えます 通常、古い詳細データはディスクに保存されません。ザ 与えます 少し要約すると、 与えます これらは、見つかった低詳細レベルから現在の詳細レベルまで抽出されます。このレベルの DW は、ほとんどの場合、ディスク ストレージに保存されます。建築家が直面する設計の問題 与えます このレベルの DW の構築には次のものがあります。
  • 上でまとめた時間の単位は何ですか
  • どのコンテンツ、属性がコンテンツの内容を少し要約するか 与えます 次のレベルの 与えます DW で見つかったのは、 与えます 高度に要約されています。ザ 与えます 高度に要約されており、コンパクトで簡単にアクセスできます。ザ 与えます 高度に要約されたものは DW 環境で見つかることもありますが、他の場合には 与えます 高度に要約されたものは、DW を収容するテクノロジーのすぐ外にあります。 (いずれにせよ、私は 与えます 高度に要約されたものは、どこにアクセスしても DW の一部です。 与えます 物理的に収容されています)。 DW の最後のコンポーネントはメタデータです。多くの点で、メタデータは他のデータとは異なる次元にあります 与えます メタデータには何も含まれていないため、DW の だと 動作環境から直接取得されます。メタデータは、DW において特別かつ非常に重要な役割を果たします。メタデータは次のように使用されます。
  • DSS アナリストが DW のコンテンツを見つけるのに役立つディレクトリ、
  • をマッピングするためのガイド 与えます 私がどうやって 与えます 運用環境からDW環境に移行し、
  • 間の要約に使用されるアルゴリズムのガイド 与えます 現在の詳細 ei 与えます 少し要約すると、私は 与えます 高度に要約されたメタデータは、DW 環境では運用環境よりもはるかに大きな役割を果たしています。 古い詳細記憶媒体 磁気テープはそのようなものを保存するのに使用できます 与えます。実際、古いストレージとして考慮すべきストレージ メディアは多岐にわたります。 与えます 詳細の。の量に応じて、 与えます、アクセスの頻度、ツールのコスト、およびアクセスの種類を考慮すると、他のツールが DW の古いレベルの詳細を必要とする可能性は十分にあります。 データの流れ 正常かつ予測可能な流れがあります。 与えます DWの中。
    I 与えます 彼らは動作環境から DW に入ります。 (注: このルールには非常に興味深い例外がいくつかあります。ただし、ほとんどすべての 与えます 動作環境から DW に入ります)。 ダト その 与えます 動作環境から DW に入ると、前述のように変換されます。 DWに入る条件で、i 与えます 図に示すように、現在の詳細レベルを入力します。これはそこに常駐し、次の 3 つのイベントのいずれかが発生するまで使用されます。
  • 浄化され、
  • 要約されている、および/または ▪è DW 内の廃止されたプロセスが i に移動する 与えます 現在の詳細 与えます 年齢に基づいた古い詳細の 与えます。プロセス

概要では詳細を使用します 与えます 私を計算するには 与えます わずかに要約されたレベルと高度に要約されたレベル 与えます。示されているフローにはいくつかの例外があります (後で説明します)。ただし、通常、大多数の場合、 与えます DW 内で見つかった、のフロー 与えます それは描かれているとおりです。

データウェアハウスの使用

驚くことではないが、さまざまなレベルの 与えます DW 内では、さまざまなレベルの使用は行われません。原則として、要約のレベルが高くなるほど、より多くの情報が得られます。 与えます それらは使用されています。
多くの用途が発生します 与えます 非常に要約されていますが、古いものは 与えます 詳細はほとんど使用されません。組織をリソース活用パラダイムに移行させるには十分な理由があります。もっと要約すると、 与えますに到達するのがより速く、より効率的になります。 与えます. もし ショップ DW の詳細レベルで多くのプロセスを実行すると、それに対応して大量のマシン リソースが消費されることがわかります。できるだけ早く高レベルの要約を処理することが誰にとっても最善の利益になります。

多くのショップでは、DW 以前の環境の DSS アナリストが 与えます 詳細レベルで。多くの点で、 与えます 他のレベルの概要が利用可能な場合でも、詳細な概要はセキュリティブランケットに似ています。建築家の活動の一つ 与えます DSS ユーザーを継続的な使用から遠ざけることです。 与えます 最も低い詳細レベルで。アーキテクトには 2 つの動機があります。 与えます:

  • エンドユーザーが消費したリソースの料金を支払うチャージバック システムをインストールすることで、
  • これは、i を使用した動作時に非常に良好な応答時間が達成できることを示しています。 与えます は高度な要約レベルにありますが、応答時間の低下は、 与えます 低いレベルで その他の考慮事項 他にも DW の構築と管理に関する考慮事項がいくつかあります。
    最初に考慮するのはインデックスです。ザ 与えます より高いレベルの要約では、自由にインデックスを付けることができますが、 与えます

より低い詳細レベルでは、それらは非常に嵩張るため、倹約的にインデックスを作成することができます。同じことから、私は 与えます 高度な詳細レベルでは比較的簡単に再構築できますが、 与えます 低いレベルでは非常に大きいので、 与えます 簡単に改修することはできません。したがって、のモデルは、 与えます そして、設計によって行われた正式な作業は、現在の詳細レベルにほぼ独占的に適用される DW の基礎を築きます。つまり、モデル活動は、 与えます ほとんどの場合、要約レベルには適用されません。もう 1 つの構造上の考慮事項は、 与えます DW著。

パーティションは 2 つのレベルで実行できます。 DBMS そしてアプリケーションレベルでも。レベルの部門では DBMSDBMS 部門についての情報が提供され、それに応じて部門を管理します。アプリケーションレベルでの分割の場合、プログラマのみが分割について知らされ、その管理の責任はプログラマに任されます。

レベル以下 DBMS、多くの作業が自動的に行われます。部門の自動管理には多くの柔軟性の欠如があります。アプリケーションレベルでの分割の場合 与えます インクルード データウェアハウス、プログラマには多くの作業がのしかかりますが、最終的には、管理における柔軟性が得られます。 与えますデータウェアハウス

アルトレ・アノマリー

一方、のコンポーネントは、 データウェアハウス ほぼすべての場合で説明どおりに機能します 与えます、いくつかの便利な例外について説明する必要があります。例外は、 与えます 公開された概要データ。これらは 与えます から計算された要約 データウェアハウス しかし、それらは社会によって利用されます。ザ 与えます 公開概要は次の場所に保存および管理されます。 データウェアハウスただし、前述したように、それらは計算されます。会計士はそのような四半期ごとの発行に取り組んでいます 与えます 収入、四半期の支出、四半期の利益など。会計士が行う仕事は社外のものです データウェアハウス。 しかし、私は 与えます 社内で「内部」で使用されます。 マーケティング、販売など。もう一つの異常は、議論されませんが、 与えます 外部。

もう一つの例外的な種類の 与えます で見つけることができます データウェアハウス 永続的な詳細データのデータです。これらにより、 与えます 倫理的または法的な理由から詳細レベルで。企業が従業員を危険な物質にさらしている場合、次の措置を講じる必要があります。 与えます 詳細かつ永続的。企業が飛行機の部品など、公共の安全に関わる製品を製造する場合、 与えます 永続的な詳細だけでなく、企業が危険な契約を結んだかどうかも確認できます。

今後数年間に訴訟、リコール、争点となっている構造上の欠陥などが発生した場合に、同社は細部を見逃すわけにはいかない。企業のエクスポージャーは大きくなる可能性がある。その結果、独特の種類のものが生まれます 与えます 永続的な詳細データとして知られています。

概要

Un データウェアハウス オブジェクト指向で、統合された、時間変化のある、次のコレクションです。 与えます 不揮発性であり、行政の意思決定のニーズをサポートします。の主要な機能のそれぞれ データウェアハウス にはその意味合いがあります。さらに、次の 4 つのレベルがあります。 与えます インクルード データウェアハウス:

  • 古い詳細
  • 現在の詳細
  • 与える 少し要約した
  • 与える 高度に要約されたメタデータも重要な部分です。 データウェアハウス. 抽象的な ストレージの概念 与えます 最近注目を集め、90年代のトレンドにもなりました。 データウェアハウス 意思決定支援システム (DSS) や経営情報システム (EIS) などの管理支援システムの限界を克服するため。という概念があっても、 データウェアハウス 期待できそうなので実装してみます データウェアハウス 大規模な倉庫保管プロセスにより問題が発生する可能性があります。倉庫プロジェクトの複雑さにもかかわらず 与えます、多くのサプライヤーとコンサルタントが在庫を持っています 与えます 彼らは、 与えます 電流は問題を引き起こしません。しかし、この研究プロジェクトの開始時点では、独立した厳密で体系的な研究はほとんど行われていませんでした。したがって、それらが構築されるときに業界で実際に何が起こるかを言うのは困難です データウェアハウス。この研究では、倉庫保管の実践について調査しました。 与えます オーストラリアの実践についてより豊かな理解を深めていくことを目的とした現代人向けのプログラムです。文献レビューにより、実証研究の背景と基礎が提供されました。この研究からは多くの発見があります。まず、この研究により、開発中に発生した活動が明らかになりました。 データウェアハウス。多くの分野で、私は 与えます 集まった人々は、文献で報告されている実践を確認した。第二に、開発に影響を与える可能性のある問題と問題。 データウェアハウス この研究によって特定された。最後に、オーストラリアの組織が以下の使用に関連して得た利点 データウェアハウス が明らかになった。

第1章

研究の背景

データ ウェアハウジングの概念は広く知られるようになり、90 年代に新たなトレンドとなりました (McFadden 1996、TDWI 1996、Shah および Milstein 1997、Shah et al. 1997、Eckerson 1998、Adelman and Oates 2000)。これは、業界出版物におけるデータ ウェアハウジングに関する記事の数が増えていることからもわかります (Little and Gibson 1999)。多くの論文(たとえば、Fisher 1995、Hackathorn 1995、Morris 1995a、Brmblett and King 1996、Graham et al. 1996、Sakaguchi and Frolick 1996、Alvarez 1997、Brousell 1997、Clarke 1997、McCarthy 1997、O' Donnell 1997、 Edwards 1998、TDWI 1999) は、i を導入する組織によって得られる大きな利益を報告しています。 データウェアハウス。彼らは、成功した実装の事例証拠、高い投資収益率 (ROI) の数値によって、また、開発のためのガイドラインや方法論を提供することによって、自分たちの理論を支持しました。 データウェアハウス

(Shanks et al. 1997、Seddon と Benjamin 1998、Little と Gibson 1999)。極端なケースでは、Graham ら。 (1996) は、401 年間の投資の平均収益率が XNUMX% であると報告しました。

しかし、現在の文献の多くは、そのようなプロジェクトの実施に伴う複雑さを見逃しています。のプロジェクト データウェアハウス これらは通常複雑で大規模であるため、慎重に制御しないと失敗する可能性が高くなります (Shah および Milstein 1997、Eckerson 1997、Foley 1997b、Zimmer 1997、Bort 1998、Gibbs および Clymer 1998、Rao 1998)。それらを構築するには、膨大な人的資源と財政的資源、そして時間と労力が必要です (Hill 1998、Crofts 1998)。必要とされる典型的な時間と経済的手段は、それぞれ約 1995 年と 1997 万から 1998 万ドルです (Braly 1999、Foley 1995b、Bort 1998、Humphries et al. XNUMX)。データ ウェアハウスのさまざまな側面を管理し統合するには、時間と財政的手段が必要です (Cafasso XNUMX、Hill XNUMX)。ハードウェアとソフトウェアの考慮事項に加えて、抽出とは異なるその他の機能も考慮します。 与えます のロードプロセスに 与えます、アップデートとメタを管理するためのメモリ容量 与えます ユーザートレーニングのために考慮する必要があります。

この研究プロジェクトが開始された時点では、特にオーストラリアでは、データ ウェアハウジングの分野で学術研究がほとんど行われていませんでした。これは、当時の雑誌やその他の学術論文からデータ ウェアハウジングに関する論文が出版されていなかったことからも明らかでした。入手可能な学術文書の多くは米国の経験について説明しています。データ ウェアハウジングの分野における学術研究が不足しているため、厳密な研究と実証研究が求められています (McFadden 1996、Shanks et al. 1997、Little and Gibson 1999)。特に、その実施プロセスに関する調査研究 データウェアハウス の実装に関する一般知識を広めるために実施する必要がある データウェアハウス そして、将来の調査研究の基礎として役立つでしょう (Shanks et al. 1997、Little and Gibson 1999)。

したがって、この研究の目的は、組織が以下のことを実行および使用するときに実際に何が起こるかを研究することです。 データウェアハウス オーストラリアで。具体的には、この研究には、開発プロセス全体の分析が含まれます。 データウェアハウス開始と計画から始まり、設計と実装、その後のオーストラリアの組織内での使用までを行います。さらに、この研究は、実践をさらに改善し、非効率やリスクを最小限に抑えたり回避できる領域を特定することで、現在の実践にも貢献します。さらに、それは他の研究の基礎としても役立ちます。 データウェアハウス オーストラリアでは、文献に現在存在するギャップを埋めることになるでしょう。

研究の質問

この研究の目的は、の実装に含まれる活動を研究することです。 データウェアハウス およびオーストラリアの組織によるそれらの使用。特に、プロジェクトの計画、開発、運用、使用、およびそれに伴うリスクに関する要素が調査されます。したがって、この研究の疑問は次のとおりです。

「現在行われているのはどのようなものか データウェアハウス オーストラリアで?"

この質問に効果的に答えるには、いくつかの補助的な調査質問が必要です。特に、この研究プロジェクトを導くために、文献から 2 つのサブ質問が特定されました。これは第 XNUMX 章に示されています。 データウェアハウス オーストラリアの組織から?どのような問題に遭遇しましたか?

体験したメリットは何ですか?
これらの質問に答えるために、アンケートを使用した探索的研究デザインが使用されました。探索的研究としては、上記の質問に対する答えは完全ではありません (Shanks et al. 1993、Denscombe 1998)。この場合、これらの質問に対する答えを改善するには、三角測量が必要です。しかし、この調査は、これらの疑問を検討する将来の作業のための強固な基盤を提供するでしょう。研究方法の正当性と設計に関する詳細な説明は、第 3 章で説明されています。

研究プロジェクトの構造

この研究プロジェクトは、データ ウェアハウジングの概念の文脈的研究と実証的研究 (図 1.1 を参照) の XNUMX つの部分に分かれており、それぞれについて以下で説明します。

パート I: 文脈の研究

研究の最初の部分は、意思決定支援システム (DSS)、経営情報システム (EIS)、データ ウェアハウスのケーススタディなど、さまざまなタイプのデータ ウェアハウジングに関する現在の文献をレビューすることで構成されています。 データウェアハウス と概念 データウェアハウス。さらに、フォーラムの結果は、 データウェアハウス モナシュ DSS 研究チームが率いる専門家と実践者の会議グループは、実践に関する洞察を得ることが目的の研究のこの段階に貢献しました。 データウェアハウス そしてその導入に伴うリスクを特定します。この状況に応じた研究期間中に、問題領域の理解が確立され、その後の実証的調査のための背景知識が提供されました。ただし、これは調査研究の実施中に進行中のプロセスでした。

パート II: 実証研究

特にオーストラリアでは、データ ウェアハウジングの比較的新しい概念により、ユーザー エクスペリエンスの全体像を把握するための調査の必要性が生じています。この部分は、広範な文献レビューを通じて問題領域が確立された後に実行されました。文脈調査段階で形成されたデータウェアハウスの概念は、この調査の最初のアンケートの入力として使用されました。この後、アンケート調査を行った。あなたは次の専門家です データウェアハウス テストに参加しました。最初のアンケートをテストする目的は、質問の完全性と正確性を確認することでした。テスト結果に基づいてアンケートを修正し、修正版を調査参加者に送付しました。返されたアンケートは次に、次の点について分析されました。 与えます 表、図、その他の形式で。ザ

の分析結果 与えます これらはオーストラリアにおけるデータ ウェアハウジングの実践のスナップショットを形成します。

データ ウェアハウスの概要

データ ウェアハウジングの概念は、コンピューター技術の向上とともに進化してきました。
これは、意思決定支援システム (DSS) や経営情報システム (EIS) などのアプリケーション サポート グループが直面する問題を克服することを目的としています。

これまで、これらのアプリケーションの最大の障害は、これらのアプリケーションが データベース 分析に必要なもの。
これは主に管理者の仕事の性質によって引き起こされます。企業経営者の関心は、対象となる分野によって常に異なります。だらか、私 与えます これらの用途の基本は、処理する部品に応じて素早く変更できる必要があることです。
つまり、私は 与えます 要求された分析に適切な形式で利用できる必要があります。実際、アプリケーション サポート グループはこれまで、情報を収集して統合することが非常に困難であると感じていました。 与えます 複雑で多様なソースから。

このセクションの残りの部分では、データ ウェアハウジングの概念の概要を示し、データ ウェアハウジングの概念を説明します。 データウェアハウス アプリケーション サポート グループの問題を解決できます。
用語 "データウェアハウス」は 1990 年にウィリアム・インモンによって広められました。彼の頻繁に引用される定義では、 データウェアハウス のコレクションとして 与えます 経営上の意思決定をサポートする、主題指向、統合、不揮発性、時間の経過とともに変化するもの。

この定義を使用すると、Inmon は次のことを強調します。 与えます に住んでいる データウェアハウス 次の 4 つの特性を備えている必要があります。

  • ▪ 主題指向
  • ▪ 統合された
  • ▪ 不揮発性
  • ▪ 時間の経過とともに変化する 主題指向の印門とは、 与えますデータウェアハウス これまでの最大の組織領域で

モデルで定義された 与えます。たとえば全部 与えます 私について 顧客 主題領域に含まれています 顧客。皆も同様に 与えます 製品に関する内容は、PRODUCTS サブジェクト領域に含まれます。

統合された印門とは、私が意味するものです。 与えます さまざまなプラットフォーム、システム、場所からのデータが結合され、1 か所に保存されます。結果として 与えます 類似したものは、簡単に追加して比較できるように、一貫した形式に変換する必要があります。
たとえば、男性と女性の性別は、あるシステムでは文字 M と F で表され、別のシステムでは 1 と 0 で表されます。これらを適切に統合するには、1 つの形式が同じになるように一方または両方の形式を変換する必要があります。この場合、M を 0 に、F を XNUMX に、またはその逆に変更できます。主題指向と統合は、 データウェアハウス の機能的かつ横断的なビジョンを提供するように設計されています。 与えます 会社から。

不揮発性とは、次のことを意味します。 与えますデータウェアハウス 一貫性を維持し、更新する 与えます それは必要はありません。その代わりに、あらゆる変化が 与えます オリジナルが追加されます データベース インクルード データウェアハウス。これは、歴史的なデイを意味します。 与えます に含まれています データウェアハウス.

時間を持つ変数の場合、Inmon は次のことを示します。 与えますデータウェアハウス 常に ei 時間インジケーターが含まれます 与えます 通常、それらは特定の時間軸を越えます。たとえば、
データウェアハウス 5 年分の履歴値を含めることができます 顧客 1993 年から 1997 年までの歴史と時系列の入手可能性 与えます 傾向を分析できます。

Un データウェアハウス 彼は自分のものを集めることができる 与えます OLTP システムから; ソースから 与えます 組織外部および/または他の特別なキャプチャ システム プロジェクトによる 与えます.
I 与えます 抽出物は洗浄プロセスを経ることができます。この場合、 与えます に保存される前に変換および統合されます。 データベース インクルード データウェアハウス。その後私は 与えます

内の住民 データベース インクルード データウェアハウス エンド ユーザーのログインと回復ツールで利用できるようになります。これらのツールを使用すると、エンド ユーザーは組織の統合ビューにアクセスできます。 与えます.

I 与えます 内の住民 データベース インクルード データウェアハウス 詳細形式と概要形式の両方で保存されます。
要約のレベルは、要約の性質によって異なる場合があります。 与えます。 私は 与えます 詳細は以下で構成されます 与えます 現在および 与えます 歴史家
I 与えます ロイヤルティは含まれていません データウェアハウス 私まで 与えますデータウェアハウス が更新されます。
保管するだけでなく、 与えます 彼ら自身、 データウェアハウス 別の種類のものも保存できます だと METADATA と呼ばれる、 与えます 彼の家の住人 データベース.
メタデータには、開発メタデータと分析メタデータの 2 種類があります。
開発メタデータは、 与えますデータウェアハウス.
開発メタデータに含まれる情報には、オペレーティング システムの詳細、抽出される要素の詳細、モデルが含まれる場合があります。 与えます インクルード データウェアハウス および変換のためのビジネス ルール 与えます.

2 番目のタイプのメタデータは分析メタデータと呼ばれ、エンド ユーザーがメタデータのコンテンツを探索できるようにします。 データウェアハウス を見つけるために 与えます 利用可能であり、その意味を明確な非専門用語で説明します。

したがって、分析メタデータは、 データウェアハウス およびエンドユーザーアプリケーション。このメタデータには、ビジネス モデル、ビジネス モデルの説明を含めることができます。 与えます ビジネス モデル、事前定義されたクエリとレポート、ユーザー アクセスに関する情報、およびインデックスに対応します。

適切に機能するには、分析および開発メタデータを単一の統合された包含メタデータに結合する必要があります。

残念ながら、既存のツールの多くは独自のメタデータを持っており、現時点ではそのための既存の標準はありません。

データ ウェアハウジング ツールがこのメタデータを統合できるようにします。この状況を改善するために、主要なデータ ウェアハウス ツールの多くのトレーダーが、後にメタ データ連合となるメタ データ評議会を結成しました。

この連携の目標は、さまざまなデータ ウェアハウス ツールがメタデータを変換できるようにする標準メタデータ セットを構築することです。
彼らの努力の結果、Microsoft アーカイブと関連する MDIS ファイル間の情報交換を可能にするメタ データ交換仕様 (MDIS) が誕生しました。

の存在 与えます 要約/インデックス付きと詳細の両方により、ユーザーは DRILL DROWN (ドリル) を実行できるようになります。 与えます 詳細なインデックスにインデックス付けされたり、その逆も同様です。の存在 与えます 詳細な履歴により、長期にわたる傾向分析を作成できます。さらに、分析メタデータは、次のディレクトリとして使用できます。 データベース インクルード データウェアハウス エンドユーザーが 与えます 必要。

OLTP システムと比較して、分析をサポートする機能により、 与えます そして報告、 データウェアハウス クエリの作成と応答、レポートの作成などの情報プロセスに適したシステムとみなされています。次のセクションでは、2 つのシステムの違いを詳しく説明します。

データウェアハウス OLTP システムに対して

組織内の情報システムの多くは、日常業務をサポートすることを目的としています。 OLTP SYSTEMS として知られるこれらのシステムは、継続的に更新される毎日のトランザクションをキャプチャします。

I 与えます これらのシステム内では、変更、追加、削除されることがよくあります。たとえば、顧客がある場所から別の場所に移動すると、住所が変わります。この場合、住所フィールドを変更することで新しい住所が登録されます。 データベース。これらのシステムの主な目的は、取引コストを削減し、同時に処理時間を短縮することです。 OLTP システムの例には、注文入力、給与計算、請求書、製造、顧客サービスなどの重要なアクションが含まれます。 顧客.

トランザクションベースおよびイベントベースのプロセス用に作成された OLTP システムとは異なり、 データウェアハウス 分析ベースのプロセスのサポートを提供するために作成されました 与えます そして意思決定プロセス。

これは通常、i を積分することによって達成されます。 与えます 単一の「コンテナ」内のさまざまな OLTP および外部システムから 与えます前のセクションで説明したように。

Monash データ ウェアハウジング プロセス モデル

のプロセスモデル データウェアハウス Monash は、Monash DSS Research Group の研究者によって開発され、文献に基づいています。 データウェアハウス、システム分野の開発支援の経験について、アプリケーションベンダーとのディスカッションについて データウェアハウス、の使用に関する専門家グループについて データウェアハウス.

フェーズは、開始、計画、開発、運用、説明です。この図は、開発の反復的または進化的な性質を説明しています。 データウェアハウス 異なるフェーズ間に配置された双方向矢印を使用してプロセスを実行します。この文脈において、「反復的」および「進化的」とは、プロセスの各ステップで、実装アクティビティが常に前のフェーズに向かって逆方向に伝播できることを意味します。これはプロジェクトの性質によるものです データウェアハウス エンドユーザーからの追加リクエストはいつでも発生します。たとえば、プロセスの開発段階で データウェアハウス、元の計画の一部ではなかった新しいディメンションまたはサブジェクト領域がエンド ユーザーによって要求された場合、これをシステムに追加する必要があります。これにより、プロジェクトに変更が生じます。その結果、設計チームは、設計段階でこれまでに作成したドキュメントの要件を変更する必要があります。多くの場合、プロジェクトの現在の状態は、新しい要件を追加して文書化する必要がある設計フェーズに戻る必要があります。エンドユーザーは、レビューされた特定のドキュメントと開発段階で行われた変更を確認できる必要があります。この開発サイクルの終わりには、プロジェクトは開発チームとユーザー チームの両方から優れたフィードバックを得る必要があります。フィードバックは将来のプロジェクトを改善するために再利用されます。

キャパシティプランニング
Dw は、次のような量の結果として、サイズが非常に大きくなり、非常に急速に成長する傾向があります (Best 1995、Rudin 1997a)。 与えます 存続期間中から保持される履歴。成長は以下によっても引き起こされる可能性があります 与えます の価値を高めるためにユーザーが要求した追加 与えます 彼らはすでに持っているものです。したがって、ストレージ要件は、 与えます 大幅に強化することができます (Eckerson 1997)。したがって、キャパシティ プランニングを実施することにより、構築中のシステムがニーズの増大に応じて拡張できるようにすることが重要です (Best 1995、LaPlante 1996、Lang 1997、Eckerson 1997、Rudin 1997a、Foley 1997a)。
データベースのスケーラビリティを計画する際には、ウェアハウスのサイズの予想される増加、実行される可能性のあるクエリの種類、サポートされるエンド ユーザーの数を把握しておく必要があります (Best 1995、Rudin 1997b、Foley 1997a)。スケーラブルなアプリケーションを構築するには、スケーラブルなサーバー テクノロジとスケーラブルなアプリケーション設計テクニック (Best 1995、Rudin 1997b) の組み合わせが必要です。高度にスケーラブルなアプリケーションを構築するには、両方が必要です。スケーラブルなサーバ テクノロジを使用すると、ストレージ、メモリ、CPU を性能を低下させることなく簡単かつ有利に追加できます。パフォーマンス (ラング 1997、テレフォニー 1997)。

スケーラブルなサーバー テクノロジには、対称型多重処理 (SMP) と超並列処理 (MPP) の 1997 つがあります (IDC 1999、Humphries et al. 1997)。 SMP サーバーには通常、メモリ、システム バス、その他のリソースを共有する複数のプロセッサがあります (IDC 1999、Humphries et al. XNUMX)。追加のプロセッサを追加して、処理能力を向上させることができます。 ポテンツァ 計算的な。増やすもう一つの方法は、 ポテンツァ SMP サーバーの構成は、多数の SMP マシンを組み合わせることです。この技術はクラスタリングとして知られています (Humphries et al. 1999)。一方、MPP サーバーには複数のプロセッサがあり、それぞれが独自のメモリ、バス システム、その他のリソースを備えています (IDC 1997、Humphries et al. 1999)。各プロセッサはノードと呼ばれます。増加 ポテンツァ 計算的には達成できる

MPP サーバーにノードを追加する (Humphries et al. 1999)。

SMP サーバーの弱点は、入出力 (I/O) 操作が多すぎるとシステム バスが混雑する可能性があることです (IDC 1997)。各プロセッサには独自のバス システムがあるため、MPP サーバー内ではこの問題は発生しません。ただし、各ノード間の相互接続は一般に SMP バス システムよりもはるかに低速です。さらに、MPP サーバーは、アプリケーション開発者にとってさらに複雑なレベルを追加する可能性があります (IDC 1997)。したがって、SMP サーバーと MPP サーバーの選択は、アプリケーションの複雑さ、価格性能比、必要な処理能力、妨げられる DW アプリケーション、サーバーのサイズの増加など、多くの要因の影響を受ける可能性があります。 データベース dw の数とエンド ユーザーの数。

キャパシティ プランニングには、数多くのスケーラブルなアプリケーション設計手法を使用できます。日、週、月、年などのさまざまな通知期間を使用します。さまざまな通知期間があり、 データベース それは、管理しやすいようにグループ化された部分に分割することができます (Inmon et al. 1997)。もう XNUMX つの手法は、以下を要約して作成される要約テーブルを使用することです。 与えます da 与えます 詳しい。それで、私は 与えます 概要は詳細よりもコンパクトであり、必要なメモリ容量が少なくなります。それで、 与えます 詳細情報をより安価なストレージ ユニットに保存できるため、さらに多くのストレージを節約できます。サマリー テーブルを使用するとメモリ領域を節約できますが、サマリー テーブルをビジネス ニーズに合わせて最新の状態に保つには多大な労力が必要です。ただし、この手法は広く使用されており、以前の手法と組み合わせて使用​​されることもよくあります (Best 1995、Inmon 1996a、Chauduri および Dayal)
1997)。

定義 データウェアハウス 技術アーキテクチャ dw アーキテクチャ技術の定義

データ ウェアハウジングの初期導入者は、主に、すべての 与えます、私も含めて 与えます 外部、単一に統合され、
物理的ストレージ (Inmon 1996a、Bresnahan 1996、Peacock 1998)。

このアプローチの主な利点は、エンド ユーザーが企業全体のビューにアクセスできることです。 与えます 組織的 (Ovum 1998)。もう XNUMX つの利点は、標準化が提供されることです。 与えます これは、dw リポジトリ (メタデータ) で使用される各用語のバージョンまたは定義が 1997 つだけであることを意味します (Flanagan and Safdie 1998、Ovum 1997)。一方、このアプローチの欠点は、高価で構築が難しいことです (Flanagan および Safdie 1998、Ovum 1998、Inmon et al. XNUMX)。ストレージ アーキテクチャが登場してから間もなく 与えます 集中化が普及し、進化したデータのより小さなサブセットを抽出するという概念が普及しました。 与えます 特定のアプリケーションのニーズをサポートするため (Varney 1996、IDC 1997、Berson and Smith 1997、peacock 1998)。これらの小さなシステムは、より大きなシステムから派生したものです データウェアハウス 集中化された。彼らは名前が付けられています データウェアハウス 依存する部門または依存するデータ マート。依存型データ マート アーキテクチャは 3 層アーキテクチャとして知られており、最初の層は データウェアハウス 集中化されたもの、2 つ目は以下の預金から構成されます。 与えます 3 番目は部門へのアクセスで構成されます。 与えます および分析ツールによる(Demarest 1994、Inmon et al. 1997)。

データ マートは通常、 データウェアハウス 集中型は、特定のユニットのニーズを満たすために構築されました (White 1995、Varney 1996)。
データマートには、 与えます 特定の単位に関連して非常に適切です (Inmon et al. 1997、Inmon et al. 1998、IA 1998)。

この方法の利点は、 だと 統合されていない、そして私は 与えます データ マート内の冗長性はすべて低くなります。 与えます 彼らは倉庫から来た 与えます 統合された。もう 1 つの利点は、各データ マートとそのソース間の接続がほとんどないことです。 与えます 各データ マートにはソースが 1 つだけあるため、 与えます。さらに、このアーキテクチャが導入されていても、エンドユーザーは依然として次の概要にアクセスできます。 与えます

企業組織。この方法はトップダウン方法として知られており、データ マートは データウェアハウス (ピーコック 1998、ゴフ 1998)。
結果を早期に示す必要性が高まっているため、一部の組織は独立したデータ マートを構築し始めています (Flanagan と Safdie 1997、White 2000)。この場合、データ マートは独自の 与えます 基本からまっすぐに 与えます 集中化された統合倉庫からではなく OLTP を使用するため、現場に中央倉庫を置く必要がなくなります。

各データ マートには、そのソースへのリンクが少なくとも 1 つ必要です 与えます。各データ マートに複数の接続がある場合の欠点は、前の 2 つのアーキテクチャと比較して、接続が過剰になることです。 与えます 大幅に増加します。

各データ マートには、すべてのデータを保存する必要があります。 与えます OLTP システムに影響を及ぼさないようにローカルで必要です。これにより、私は 与えます それらは異なるデータ マートに保存されます (Inmon et al. 1997)。このアーキテクチャのもう XNUMX つの欠点は、データ マートとそのデータ ソースの間に複雑な相互接続が作成されることです。 与えます これは実行と制御が困難です (Inmon et al. 1997)。

もう 1 つの欠点は、エンド ユーザーが企業情報の概要にアクセスできないことです。 与えます 異なるデータ マートの一部は統合されていません (Ovum 1998)。
さらにもう 1 つの欠点は、データ マートで使用される用語ごとに複数の定義があり、不一致が生じる可能性があることです。 与えます 組織内 (Ovum 1998)。
上で説明した欠点にもかかわらず、独立したデータ マートは依然として多くの組織の関心を集めています (IDC 1997)。それらを魅力的なものにする要因の 1996 つは、開発が迅速で、必要な時間とリソースが少ないことです (Bresnahan 1997、Berson と Smith 1998、Ovum 1995)。したがって、それらは主に、プロジェクトの利点や欠点を迅速に特定するために使用できるテスト プロジェクトとして機能します (Parsaye 1995、Braly 1996、Newing 1996)。この場合、パイロットプロジェクトで実施される部分は小規模である必要がありますが、組織にとって重要なものでなければなりません(Newing 1996、Mansell-Lewis XNUMX)。

プロトタイプを調べることで、エンドユーザーと管理者はプロジェクトを継続するか停止するかを決定できます (Flanagan and Safdie 1997)。
この決定を継続する場合は、他の業界向けのデータ マートを一度に 1998 つずつ構築する必要があります。独立したデータ マトリックスを構築する際のエンド ユーザーのニーズに基づいて、統合/連合と非統合の XNUMX つのオプションがあります (Ovum XNUMX)

最初の方法では、新しいデータ マートはそれぞれ、現在のデータ マートとモデルに基づいて構築する必要があります。 与えます 同社で使用されています (Varney 1996、Berson and Smith 1997、Peacock 1998)。モデルを使用する必要性 与えます これは、さまざまなデータ マートを組み合わせて企業情報の概要を提供できるようにするためでもあります (Bresnahan 1996)。この方法はボトムアップと呼ばれ、経済的手段と時間に制限がある場合に最適です (Flanagan and Safdie 1997、Ovum 1998、Peacock 1998、Goff 1998)。 XNUMX 番目の方法では、構築されたデータ マートは特定のユニットのニーズのみを満たすことができます。フェデレーテッド データ マートの変形例は、 データウェアハウス が配布されています。 データベース Hub サーバー ミドルウェアは、多くのデータ マートを 1 つのリポジトリにマージするために使用されます。 与えます 配布されました(White 1995)。この場合、私は 与えます 企業は複数のデータ マートに分散しています。エンドユーザーのリクエストは次の宛先に転送されます。 データベース サーバー ハブ ミドルウェア。 与えます データ マートによって要求され、結果をエンドユーザー アプリケーションに返します。この方法では、エンド ユーザーにビジネス情報が提供されます。しかし、独立したデータマートの問題は依然として解消されていません。と呼ばれる使用できる別のアーキテクチャがあります。 データウェアハウス バーチャル (White 1995)。ただし、図 2.9 で説明されているこのアーキテクチャは、データ ストレージ アーキテクチャではありません。 与えます OLTP システムからロードを移動しないため、実数になります。 データウェアハウス (デマレスト、1994)。

実際、お客様からのご要望は、 与えます エンド ユーザーからのデータは OLTP システムに渡され、ユーザーの要求を処理した後に結果が返されます。このアーキテクチャでは、エンド ユーザーがレポートを生成してリクエストを行うことはできますが、

与えます as iとしての会社情報の沿革と概要をご紹介します。 与えます 異なる OLTP システムからのデータは統合されません。したがって、このアーキテクチャは次の分析を満たすことができません。 与えます 予測などの複雑な情報。

アクセスおよび回復アプリケーションの選択 与えます

を構築する目的 データウェアハウス エンドユーザーに情報を伝えることである(Inmon et al. 1997、Poe 1996、McFadden 1996、Shanks et al. 1997、Hammergren 1998)。 XNUMX つ以上のアクセスおよび回復アプリケーション 与えます 提供されなければなりません。現在まで、ユーザーが選択できるこれらのアプリケーションは多岐にわたります (Hammergren 1998、Humphries et al. 1999)。選択したアプリケーションが倉庫保管作業の成功を左右します。 与えます アプリケーションは組織内で最も目に見える部分であるため、 データウェアハウス エンドユーザーに提供します (Inmon et al. 1997、Poe 1996)。成功するには データウェアハウスの分析活動をサポートできなければなりません。 与えます エンドユーザーの(Poe 1996、Seddon と Benjamin 1998、Eckerson 1999)。したがって、エンドユーザーが望むものの「レベル」を特定する必要があります (Poe 1996、Mattison 1996、Inmon et al. 1997、Humphries et al. 1999)。

一般に、エンド ユーザーは、エグゼクティブ ユーザー、ビジネス アナリスト、パワー ユーザーの 1996 つのカテゴリに分類できます (Poe 1999、Humphries et al. 1999)。幹部ユーザーは、事前に定義されたレポートのセットに簡単にアクセスできる必要があります (Humphries et al. 1996)。これらの比率には、メニュー ナビゲーションを使用して簡単にアクセスできます (Poe 1999)。さらに、レポートでは、情報を迅速に伝えるために、表やテンプレートなどのグラフィック表現を使用して情報を提示する必要があります (Humphries et al. 1996)。ビジネス アナリストは、自分でゼロからレポートを作成する技術的能力を持たない可能性があるため、特定のニーズに合わせて現在のレポートを変更できる必要があります (Poe 1999、Humphries et al. 1996)。一方、パワー ユーザーは、リクエストやレポートを最初から生成して作成できるタイプのエンド ユーザーです (Poe 1999、Humphries et al. XNUMX)。彼らこそが、

彼らは他のタイプのユーザー向けのレポートを開発しています (Poe 1996、Humphries et al. 1999)。

エンド ユーザーの要件が決定したら、アクセス アプリケーションとリカバリ アプリケーションを選択する必要があります。 与えます 利用可能なすべての情報の中で (Poe 1996、Inmon et al. 1997)。
へのアクセス 与えます 取得ツールは、OLAP ツール、EIS/DSS ツール、クエリおよびレポート ツール、データ マイニング ツールの 4 つのタイプに分類できます。

OLAP ツールを使用すると、ユーザーはアドホック クエリだけでなく、 データベース インクルード データウェアハウス。さらに、これらの製品を使用すると、ユーザーは以下からドリルダウンできます。 与えます 一般的なものから細かいものまで。

EIS/DSS ツールは、「what if」分析などのエグゼクティブ レポートやメニュー駆動レポートへのアクセスを提供します。ナビゲーションを容易にするために、レポートを事前定義し、メニューと統合する必要があります。
クエリおよびレポート ツールを使用すると、ユーザーは事前定義された特定のレポートを作成できます。

データ マイニング ツールは、忘れ去られた業務に新たな光を当てる可能性のある関係を特定するために使用されます。 与えます データウェアハウスの。

それぞれのタイプのユーザーの要件を最適化することに加えて、選択されるツールは直観的で効率的で使いやすいものでなければなりません。また、アーキテクチャの他の部分と互換性があり、既存のシステムと連携できる必要もあります。また、手頃な価格とパフォーマンスのデータ アクセスおよび取得ツールを選択することをお勧めします。考慮すべきその他の基準には、製品のサポートに対するツール ベンダーの取り組みや、将来のリリースでの開発方法などが含まれます。データ ウェアハウスの使用に対するユーザーの関与を確保するために、開発チームはツールの選択プロセスにユーザーを参加させます。この場合、実際のユーザー評価を実行する必要があります。

データ ウェアハウスの価値を高めるために、開発チームはデータ ウェアハウスへの Web アクセスを提供することもできます。 Web 対応のデータ ウェアハウスにより、ユーザーは 与えます 離れた場所や旅行先からでも。さらに情報は、

トレーニング費用の削減により、より低コストで提供できます。

2.4.3 データウェアハウス 運用フェーズ

このフェーズは、データ更新戦略の定義、データ ウェアハウス アクティビティの制御、データ ウェアハウス セキュリティの管理という 3 つのアクティビティで構成されます。

データ更新戦略の定義

初期ロード後、私は 与えますデータベース データ ウェアハウスに加えられた変更を再現するには、データ ウェアハウスを定期的に更新する必要があります 与えます オリジナル。したがって、いつ更新するか、更新をスケジュールする頻度、およびデータを更新する方法を決定する必要があります。 与えます。リフレッシュすることをお勧めします 与えます システムをオフラインにできるとき。更新頻度は、ユーザーの要件に基づいて開発チームによって決定されます。データ ウェアハウスを更新するには、完全な更新と変更の継続的な読み込みという 2 つのアプローチがあります。

最初のアプローチである完全リフレッシュでは、すべてをリロードする必要があります。 与えます ゼロから。これは、すべてが 与えます 必要なファイルを抽出、クリーンアップ、変換し、各更新に統合する必要があります。このアプローチは多くの時間とリソースを必要とするため、できる限り避けるべきです。

別のアプローチは、変更を継続的にアップロードすることです。これで私は追加されます 与えます これらは、最後のデータ ウェアハウス更新サイクル以降に変更されました。新しいレコードまたは変更されたレコードを特定すると、データ量が大幅に削減されます。 与えます これらのみであるため、更新のたびにデータ ウェアハウスに伝播する必要があります。 与えます に追加されます データベース データウェアハウスの。

i を引き出すために使用できるアプローチは少なくとも 5 つあります。 与えます 新しいか変更されたか。効率的なデータ更新戦略を取得するには 与えます システム内のすべての変更を捕捉するこれらのアプローチを組み合わせた方法が役立つ場合があります。

タイムスタンプを使用する最初のアプローチでは、すべてが割り当てられていることを前提としています。 与えます すべてを簡単に識別できるようにタイムスタンプを編集および更新しました 与えます 変更されたものと新しいもの。ただし、このアプローチは、今日のほとんどのオペレーティング システムでは広く使用されていません。
2 番目のアプローチは、アプリケーションによって生成された、変更内容のみを含むデルタ ファイルを使用することです。 与えます。このファイルを使用すると、更新サイクルも長くなります。ただし、この方法も多くのアプリケーションでは使用されていません。
3 番目の方法は、基本的にデルタ ファイルと同様の情報が含まれるログ ファイルをスキャンすることです。唯一の違いは、回復プロセスのためにログ ファイルが作成され、理解しにくい場合があることです。
4 番目のアプローチは、アプリケーション コードを変更することです。ただし、ほとんどのアプリケーション コードは古くて脆弱です。したがって、この手法は避けるべきです。
最後のアプローチは、 与えます メインの dei ファイルを含むソース 与えます.

データ ウェアハウスのアクティビティの制御

データ ウェアハウスがユーザーにリリースされた後は、時間をかけて監視する必要があります。この場合、データ ウェアハウス管理者は 1 つ以上の管理および制御ツールを使用して、データ ウェアハウスの使用状況を監視できます。特に、人々とその人々がデータ ウェアハウスにアクセスした時間に関する情報を収集できます。来て 与えます 収集すると、実行された作業のプロファイルを作成して、ユーザーのチャージバック実装への入力として使用できます。チャージバックにより、ユーザーはデータ ウェアハウスの処理コストについて知ることができます。

さらに、データ ウェアハウス監査を使用して、クエリの種類、そのサイズ、1 日あたりのクエリ数、クエリの反応時間、到達したセクター、およびクエリの量を特定することもできます。 与えます 加工された。データ ウェアハウス監査を行うもう 1 つの目的は、 与えます 使用されていないもの。これら 与えます 時間を短縮するためにデータ ウェアハウスから削除できます

クエリ実行応答の増加を監視し、 与えます 内に存在する データベース データウェアハウスの。

データウェアハウスのセキュリティ管理

データ ウェアハウスには以下が含まれます 与えます 簡単にアクセスできる、統合された、重要で、機密性の高いもの。このため、権限のないユーザーから保護する必要があります。セキュリティを実装する 1 つの方法は、del 関数を使用することです。 DBMS 異なるタイプのユーザーに異なる権限を割り当てます。このように、ユーザーのタイプごとにアクセス プロファイルを維持する必要があります。データ ウェアハウスを保護するもう 1 つの方法は、 データベース データウェアハウスの。へのアクセス 与えます そして、取得ツールは、 与えます ユーザーに結果を提示する前に。

2.4.4 データウェアハウス 展開フェーズ

これは、データ ウェアハウス実装サイクルの最後のフェーズです。このフェーズで実行されるアクティビティには、データ ウェアハウスを使用するためのユーザーのトレーニングと、データ ウェアハウスのレビューの実行が含まれます。

ユーザートレーニング

ユーザートレーニングは、にアクセスする前に行う必要があります。 与えます データ ウェアハウスと検索ツールの使用。通常、セッションはストレージの概念の紹介から始める必要があります。 与えます、データ ウェアハウスのコンテンツ、メタ 与えます およびツールの基本的な機能。その後、より上級のユーザーは、データ アクセスおよび取得ツールの物理テーブルとユーザー機能を研究することもできます。

ユーザートレーニングを行うにはさまざまなアプローチがあります。その 1 つは、リーダーシップとコミュニケーション スキルに基づいて、一連のユーザーから選ばれた多数のユーザーまたはアナリストの選択に関係します。彼らは、システムに慣れるために知っておくべきことすべてについて個別にトレーニングを受けています。トレーニングが終了すると、彼らは仕事に戻り、他のユーザーにシステムの使用方法を教え始めます。で

学んだことに基づいて、他のユーザーはデータ ウェアハウスの探索を開始できます。
もう 1 つのアプローチは、まるで座学コースを受講しているかのように、多くのユーザーを同時にトレーニングすることです。この方法は、同時にトレーニングする必要があるユーザーが多数いる場合に適しています。さらに別の方法は、各ユーザーを 1 人ずつ個別にトレーニングすることです。この方法は、ユーザーが少ない場合に適しています。

ユーザー トレーニングの目的は、ユーザーにアクセス方法に慣れてもらうことです。 与えます 検索ツールとデータ ウェアハウスのコンテンツ。ただし、一部のユーザーは、トレーニング セッション中に提供される情報の量に圧倒される場合があります。したがって、継続的な支援と特定の質問に答えるために、一定の回数の再教育セッションを実行する必要があります。場合によっては、この種のサポートを提供するためにユーザー グループが結成されることがあります。

フィードバックの収集

データ ウェアハウスが展開されると、ユーザーは次のようなデータ ウェアハウスを使用できるようになります。 与えます さまざまな目的でデータ ウェアハウスに常駐します。ほとんどの場合、アナリストまたはユーザーは i を使用します。 与えます データ ウェアハウス内:

  1. 1 企業の傾向を特定する
  2. 2 の購買プロファイルを分析する 顧客
  3. 3 除算 i 顧客
  4. 4 最高のサービスを提供する 顧客 – サービスのカスタマイズ
  5. 5 戦略の策定 マーケティング
  6. 6 コスト分析のための競争力のある見積もりを提供し、管理を支援します
  7. 7 戦略的意思決定のサポート
  8. 8 目立つ機会を特定する
  9. 9 現在のビジネスプロセスの品質を向上させる
  10. 10 利益を確認する

データ ウェアハウスの開発方向に従って、システムに対して一連のレビューを実施してフィードバックを得ることができます。

開発チームとエンドユーザーコミュニティの両方から。
得られた結果は、次の開発サイクルで考慮に入れることができます。

データ ウェアハウスは漸進的なアプローチを採用しているため、以前の開発の成功と失敗から学ぶことが重要です。

2.5 概要

この章では、文献に存在するアプローチについて説明しました。セクション 1 では、データ ウェアハウスの概念と意思決定科学におけるその役割について説明しました。セクション 2 では、データ ウェアハウスと OLTP システムの主な違いについて説明しました。セクション 3 では、データ ウェアハウスの開発プロセスに含まれるアクティビティを説明するためにセクション 4 で使用した Monash データ ウェアハウス モデルについて説明しましたが、これらの論文は厳密な調査に基づいたものではありません。実際に起こっていることは文献で報告されている内容とは大きく異なる可能性がありますが、これらの結果は、この研究のデータ ウェアハウスの概念を強調する基本的な背景を作成するために使用できます。

第3章

研究と設計の方法

この章では、この研究の調査および設計方法について説明します。最初の部分では、情報検索に利用できる研究方法の一般的な見方を示し、さらに、特定の研究に最適な方法を選択するための基準について説明します。セクション 2 では、先ほど公開した基準に従って選択された 3 つの方法について説明します。これらのうち 4 つが選択され、セクション 5 に記載されている理由とともに採用されます。セクション XNUMX では、他の基準を除外する理由も記載されています。セクション XNUMX では研究計画を示し、セクション XNUMX では結論を示します。

3.1 情報システムの研究

情報システムの研究は、単に技術的な領域に限定されるのではなく、行動や組織の目的も含めて拡張する必要があります。
私たちはこれを、社会科学から自然科学に至るまでのさまざまな分野の論文のおかげです。このため、情報システムに使用される定量的および定性的方法を含む、特定の範囲の調査方法が必要になります。
利用可能な研究方法はすべて重要であり、実際、Jenkins (1985)、Nunamaker et al. などの研究者もいます。 (1991) および Galliers (1992) は、情報システムのさまざまな分野で研究を実施するための特定の普遍的な方法は存在しないと主張しています。実際、ある方法は特定の研究には適していても、他の研究には適していない可能性があります。このため、特定の研究プロジェクトに適した方法を選択する必要があります。この選択については、Benbasat et al. (1987) 研究の性質と目的を考慮する必要があると述べています。

3.1.1 研究の性質

研究の性質に基づくさまざまな方法は、情報科学で広く知られている 3 つの伝統、実証主義研究、解釈研究、批判研究に分類できます。

3.1.1.1 実証主義的研究

実証主義的研究は、科学的研究または実証的研究としても知られています。それは、「社会を構成する要素間の規則性と因果関係を調べることによって、社会世界で何が起こるかを説明し、予測する」ことを目指しています(Shanks et al 1993)。

実証主義研究は、再現性、単純化、反駁も特徴とします。さらに、実証主義研究は、研究された現象間にアプリオリな関係が存在することを認めています。
Galliers (1992) によれば、分類学は実証主義パラダイムに含まれる研究手法ですが、これに限定されるものではなく、実際には室内実験、野外実験、ケーススタディ、定理の実証、予測、シミュレーションなどが存在します。これらの方法を使用することにより、研究者は、研究されている現象を客観的かつ厳密に観察できることを認めています。

3.1.1.2 解釈研究

現象学または反実証主義と呼ばれることが多い解釈研究は、ノイマン (1994) によって次のように説明されています。人々が社会世界をどのように構築し、維持するかについての解釈につながります。」解釈研究は、観察された現象が客観的に観察できるという仮定を拒否します。実際、それらは主観的な解釈に基づいています。さらに、解釈研究者は、研究する現象にアプリオリな意味を押し付けません。

この方法には、主観的/論証的研究、行動研究、記述的/解釈的研究、将来の研究、およびロールプレイングが含まれます。これらの調査に加えて、複雑な現実世界の状況における個人または組織の研究に関する調査やケーススタディもこのアプローチに含めることができます。

3.1.1.3 重要な研究

批判的探究は社会科学では最も知られていないアプローチですが、最近情報システム研究者の間で注目を集めています。社会的現実は歴史的に人々によって、また人々の行動や相互作用を伴う社会システムによって生成され再生産されるという哲学的仮定。ただし、彼らの能力は、多くの社会的、文化的、政治的考慮事項によって決まります。

解釈的研究と同様に、批判的研究は実証主義的研究は社会的文脈とは何の関係もなく、人間の行動に対する社会的文脈の影響を無視していると主張します。
一方、批判的研究は、解釈研究が主観的すぎる、人々の生活を改善することを目的としていないとして批判します。批判的研究と他の 2 つのアプローチの最大の違いは、その評価の側面です。実証主義と解釈の伝統の客観性は現状または社会現実を予測または説明することですが、批判的研究は研究対象の社会現実を批判的に評価し、変革することを目的としています。

批判的な研究者は通常、社会的差異を解消し、社会状況を改善するために現状に反対します。批判的研究は、対象となる現象をプロセス的に捉えることに重点を置いているため、通常は長期的な研究となります。研究方法の例としては、長期の歴史研究や民族誌的研究が挙げられます。しかし、クリティカルリサーチは情報システム研究ではあまり活用されていません。

3.1.2 研究の目的

研究の性質とともに、その目的は、研究者が特定の研究方法を選択する際の指針として使用できます。研究プロジェクトの目的は、理論構築、理論検証、理論改良の 3 つのフェーズで構成される研究サイクルにおける研究の位置と密接に関係しています。したがって、研究サイクルのタイミングに基づいて、研究プロジェクトには説明的、記述的、探索的、または予測的な目的を持つことができます。

3.1.2.1 探索的研究

探索的研究は、まったく新しいトピックを調査し、将来の研究のための疑問や仮説を立てることを目的としています。このタイプの研究は、新しい分野での最初の参考資料を得るために理論構築に使用されます。通常、ケーススタディや現象学的研究などの定性的研究手法が使用されます。

ただし、探索的調査や実験などの定量的手法を使用することもできます。

3.1.3.3 記述的研究

記述的研究は、特定の組織の状況や実践を分析し、詳細に説明することを目的としています。これは理論を構築するのに適しており、仮説を確認したり異議を唱えるためにも使用できます。記述的調査には通常、測定値とサンプルの使用が含まれます。最も適切な研究方法には、先行例の調査と分析が含まれます。

3.1.2.3 説明的研究

説明的研究では、なぜ物事が起こるのかを説明しようとします。それはすでに研究された事実に基づいて構築されており、これらの事実の理由を見つけようとします。
したがって、説明的研究は通常、探索的または記述的研究に基づいて構築され、理論のテストと洗練を補助するものです。説明的調査では、通常、ケーススタディまたはアンケートに基づく調査方法が使用されます。

3.1.2.4 予防研究

予防研究は、研究対象となっている観察下の出来事や行動を予測することを目的としています(Marshall and Rossman 1995)。予測は標準的な科学的真実のテストです。この種の研究では通常、以下の調査または分析が使用されます。 与えます 歴史家。 (イン 1989)

上記の説明は、特定の研究で使用できる多数の研究手法があることを示しています。ただし、特定の種類の研究プロジェクトには、他の方法よりも適した特定の方法が 1987 つ存在する必要があります。 (Galliers 1989、Yin 1991、De Vaus 1985)。したがって、各研究者は、さまざまな手法の長所と短所を慎重に評価し、研究プロジェクトに適合した最適な研究手法を採用する必要があります。 (ジェンキンス 1992、パーヴァンとクラス 1985、ボノミア 1989、イン 1992、ヒミルトンとアイブス XNUMX)。

3.2.考えられる調査方法

このプロジェクトの目的は、オーストラリアの組織における経験を研究することでした。 与えます の開発とともに保存される データウェアハウス. ダト 現在、オーストラリアではデータ ウェアハウジングの分野における研究が不足していますが、この研究プロジェクトはまだ研究サイクルの理論段階にあり、探索的な目的を持っています。データ ウェアハウジングを導入しているオーストラリアの組織の経験を調査するには、現実社会を解釈する必要があります。したがって、研究プロジェクトの基礎となる哲学的仮定は伝統的な解釈に従います。

利用可能な方法を厳密に検討した結果、探索的研究に使用できるアンケートとケーススタディという 1993 つの可能な研究方法が特定されました (Shanks et al. 1992)。 Galliers (XNUMX) は、改訂された分類法の中で、これら XNUMX つの方法が理論構築に適していると述べ、この特定の研究に対するこれら XNUMX つの方法の適合性を主張しています。次の XNUMX つのサブセクションでは、各方法について詳しく説明します。

3.2.1 調査研究方法

調査研究法は古代の国勢調査法に由来します。国勢調査は、人口全体から情報を収集することで構成されます。この方法は高価であり、特に人口が多い場合には非現実的です。したがって、国勢調査と比較して、調査は通常、人口の代表者の少数またはサンプルに関する情報を収集することに焦点を当てます(Fowler 1988、Neuman 1994)。サンプルは、使用されるサンプルの構造、サイズ、および選択方法に応じて、さまざまなレベルの精度で抽出元の母集団を反映します (Fowler 1988、Babbie 1982、Neuman 1994)。

調査方法は、「アンケートやインタビューを使用して行われた、特定の時点での実践、状況、または見解のスナップショットであり、そこから推測できるもの」と定義されています。
(Galliers 1992:153) [アンケートやインタビューを使用して実施された、特定の時点での実践、状況、見解のスナップショット。そこから推論が可能]。調査は、一定数の参加者から質問することによって、研究のある側面に関する情報を収集することを扱います (Fowler 1988)。対面での電話インタビューや構造化されたインタビューを含むこれらのアンケートやインタビューは、情報収集手法でもあります。 与えます 調査で最も一般的に使用されるもの (Blalock 1970、Nachmias and Nachmias 1976、Fowler 1988)、観察と分析を使用することもできます (Gable 1994)。これらすべての収集方法のうち、 与えます、アンケートの使用は、最も一般的な手法です。 与えます

収集されたデータは構造化されフォーマットされているため、情報の分類が容易になります (Hwang 1987、de Vaus 1991)。

私を分析するとき 与えます、調査戦略では統計分析などの定量的手法がよく使用されますが、定性的手法も使用できます (Galliers 1992、Pervan)

およびクラス 1992、ゲーブル 1994)。通常、私は 与えます 収集されたデータは、関連性の分布とパターンを分析するために使用されます (Fowler 1988)。

アンケートは一般に、「何を?」という質問を扱う調査に適しています。 (何を)、またはそこから派生して、「いくら」や「いくつ」など、「なぜ」という質問を通じて尋ねることができます(Sonquist and Dunkelberg 1977、ying 1989)。 Sonquist と Dunkelberg (1977) によると、調査研究は、仮説に挑戦し、プログラムを評価し、集団を記述し、人間の行動のモデルを開発することを目的としています。さらに、調査は、特定の集団の意見、状況、意見、特徴、期待、さらには過去または現在の行動を研究するために使用できます(Neuman 1994)。

調査により、研究者は集団間の関係を発見することができ、その結果は通常、他の方法よりも一般的です (Sonquist and Dunkelberg 1977、Gable 1994)。調査により、研究者はより広い地理的領域をカバーし、多くの回答者に到達することができます (Blalock 1970、Sonquist と Dunkelberg 1977、Hwang と Lin 1987、Gable 1994、Neuman 1994)。最後に、調査は、他の場所では入手できない情報、または分析に必要な形式で入手できない情報を提供できます (Fowler 1988)。

ただし、調査の実施にはいくつかの制限があります。欠点は、研究者が研究対象について多くの情報を得ることができないことです。これは、調査が特定の時期にのみ実施されるため、調査者が調査できる変数や人の数が限られているためです。

研究(イン 1989、デ ヴォー 1991、ゲイブル 1994、デンスコム 1998)。もう 1988 つの欠点は、調査の実施には、特に対面インタビューが含まれる場合、時間とリソースの点で非常にコストがかかることです (Fowler XNUMX)。

3.2.2.調査研究方法

調査研究手法には、研究者側の介入なしに、定義された期間にわたって現実世界の状況内の特定の状況を徹底的に研究することが含まれます (Shanks & C. 1993、Eisenhardt 1989、Jenkins 1985)。主に、この方法は、特定の状況で研究されている変数間の関係を記述するために使用されます (Galliers 1992)。調査には、分析された現象に応じて、単一または複数のケースが含まれる場合があります (Franz and Robey 1987、Eisenhardt 1989、ying 1989)。

調査研究手法は、「人々、グループ、組織などの 1989 つまたは複数のエンティティから収集された複数の情報源を使用して、実際の文脈の中で現代現象を研究する実証的調査」と定義されています (ying 1989)。現象とその状況の間に明確な分離はなく、変数の実験的な制御や操作もありません (ying 1987、Benbasat et al. XNUMX)。

収集にはさまざまなテクニックがありますが、 与えます これは、直接観察、アーカイブ記録のレビュー、アンケート、文書レビュー、構造化インタビューなどの調査方法に採用できます。多様な収穫技術を持っている 与えます、調査により、研究者は両方に対処できるようになります。 与えます 定性的かつ定量的である (Bonoma 1985、Eisenhardt 1989、ying 1989、Gable 1994)。調査方法の場合と同様、調査研究者は観察者または研究者としての役割を果たし、調査対象の組織の積極的な参加者としての役割を果たしません。

Benbasat et al. (1987) は、調査方法は、研究上の疑問から始まり、教育へと続く研究理論の構築に特に適していると主張しています。

収集過程における理論の説明 与えます。舞台にも似合う

理論構築に関して、Franz と Robey (1987) は、探究法が複雑な理論段階にも使用できることを示唆しています。この場合、収集された証拠に基づいて、特定の理論または仮説が検証または反駁されます。さらに、この調査は、「どのように」または「なぜ」という質問を扱う研究にも適しています (ying 1989)。

他の方法と比較して、調査により研究者は重要な情報をより詳細に収集することができます (Galliers 1992、Shanks et al. 1993)。さらに、調査により、研究者は研究されたプロセスの性質と複雑さを理解することができます (Benbasat et al. 1987)。

この調査方法には主に 1989 つの欠点があります。 1994つ目は、管理された控除の欠如です。研究者の主観によって、研究の結果と結論が変わる可能性があります (ying 1989)。 1992 番目の欠点は、管理された観察ができないことです。実験的方法とは異なり、調査研究者は、自然な文脈で調査される現象を制御することはできません (Gable 1993)。 1989 番目の欠点は、複製可能性の欠如です。これは、研究者が同じ事象を観察する可能性は低く、特定の研究の結果を検証できないためです (Lee XNUMX)。最後に、非再現性の結果として、XNUMX つまたは複数の調査から得られた結果を一般化することは困難です (Galliers XNUMX、Shanks et al XNUMX)。しかし、これらすべての問題は克服できないわけではなく、実際、研究者が適切な措置を講じることによって最小限に抑えることができます (Lee XNUMX)。

3.3.研究方法を正当化する 採用

本研究では 2 つの調査方法が考えられますが、この調査方法が最も適切であると考えられます。関連事項を慎重に検討した結果、調査は破棄されました

長所と短所。この研究における各方法の適切性または不適切性については、以下で説明します。

3.3.1.調査方法の不適切さ 捜査の

調査方法では、1989 つまたは複数の組織内の特定の状況について、一定期間にわたる詳細な調査が必要です (Eisenhardt 1989)。この場合、その期間はこの調査に与えられた期間を超える可能性があります。この調査方法を採用しないもう 1989 つの理由は、結果が厳密性に欠ける可能性があることです (ying 1992)。研究者の主観が結果と結論に影響を与える可能性があります。もう 1993 つの理由は、この研究の研究質問は「何を」タイプであるのに対し、この方法は「どのように」または「なぜ」タイプの質問に関する研究により適しているということです (イン XNUMX)。最後に重要なことですが、たった XNUMX つまたはいくつかの調査からの結果を一般化することは困難です (Galliers XNUMX、Shanks et al. XNUMX)。このような根拠に基づき、調査研究手法は本研究には不適切であるため、選択されませんでした。

3.3.2.検索方法の便利さ 調査

この調査が実施された時点では、データ ウェアハウスの実践はオーストラリアの組織で広く採用されていませんでした。そのため、オーストラリアの組織内での導入に関する情報はあまりありませんでした。入手可能な情報は、 データウェアハウス。この場合、他の場所では入手できない情報や、分析に必要な形式で情報を入手できるため、調査研究方法が最も適しています (Fowler 1988)。さらに、調査研究方法により、研究者は特定の時点での実践、状況、または見解について優れた洞察を得ることができます (Galliers 1992、Denscombe 1998)。オーストラリアのデータ ウェアハウジングの経験についての知識を高めるために、概要を理解する必要がありました。

さらに、Sonquist と Dunkelberg (1977) は、調査研究の結果は他の方法よりも一般的であると述べています。

3.4.調査研究デザイン

データ ウェアハウスの実践に関する調査は 1999 年に実施されました。対象者は、データ ウェアハウスの研究に関心のあるオーストラリアの組織によって形成されました。おそらく、彼らはすでにこのことについて知らされていたからです。 与えます それらは保存しているため、この研究に役立つ情報を提供できる可能性があります。対象者は、データ ウェアハウジング協会 (Tdwi-aap) のオーストラリアの全メンバーを対象とした初期調査を通じて特定されました。このセクションでは、この研究の実証研究段階の設計について説明します。

3.4.1.収穫技術 与えます

調査研究で一般的に使用される 1976 つの手法 (郵便アンケート、電話インタビュー、個人インタビュー) (Nachmias 1988、Fowler 1991、de Vaus 1970) のうち、この研究では郵便アンケートが採用されました。後者を採用する第一の理由は、地理的に分散した集団に到達できるということである(Blalock 1976、Nachmias and Nachmias 1987、Hwang and Lin 1991、de Vaus 1994、Gable 1988)。第二に、郵送によるアンケートは高学歴の参加者に適しています (Fowler 1994)。この調査の郵送アンケートは、データ ウェアハウジング プロジェクトのスポンサー、ディレクター、および/またはプロジェクト マネージャーに宛てられました。第三に、安全なメーリングリストが利用可能な場合には、郵送によるアンケートが適しています (Sarant and Dilman 1988)。この場合、信頼できるデータ ウェアハウス協会である TDWI が、オーストラリアのメンバーのメーリング リストを提供しています。電話アンケートや個人面接と比較した郵送アンケートのもう XNUMX つの利点は、特に回答者がメモを参照したり他の人と質問を話し合う必要がある場合に、回答者がより正確に回答できることです (Fowler XNUMX)。

潜在的なデメリットとしては、郵送によるアンケートの実施に時間がかかることが考えられます。通常、郵送調査は、手紙を郵送し、回答を待ち、確認を送信するという順序で実施されます (Fowler 1988、Bainbridge 1989)。したがって、合計時間は個人面接や電話面接に必要な時間よりも長くなる可能性があります。ただし、合計時間は事前に知ることができます (Fowler 1988、Denscombe 1998)。個人面接の実施に費やされる時間は、面接ごとに異なるため、事前に知ることはできません (Fowler 1988)。電話によるインタビューは、郵送によるアンケートや個人的なインタビューよりも迅速に行うことができますが、一部の人が対応できないため、無回答率が高くなる可能性があります (Fowler 1988)。さらに、電話インタビューは通常、比較的短い質問リストに限定されます (Bainbridge 1989)。

郵送アンケートのもう 1988 つの弱点は、無回答率が高いことです (Fowler 1989、Bainbridge 1994、Neuman 1989)。しかし、この研究を信頼できるデータ保管機関(TDWI)と結びつけることで対策が講じられており(Bainbridge 1994、Neuman 1988)、回答しなかった人には1994通の督促状が送付され(Fowler 1994、Neuman XNUMX)、追加の手紙も含まれている。研究の目的を説明している(Neuman XNUMX)。

3.4.2.分析単位

この調査の目的は、オーストラリアの組織内でのデータ ウェアハウジングの実装とその使用に関する情報を入手することです。対象者は、以下を実施している、または実施中のオーストラリアのすべての組織で構成されます。 データウェアハウス。その後、個々の組織がその名前で登録されます。アンケートは、導入に関心のある組織に郵送で送信されました。 データウェアハウス。この方法により、各参加組織の最適なリソースから情報が収集されることが保証されます。

3.4.3.調査サンプル

調査参加者の「メーリング リスト」は TDWI から入手しました。このリストから、オーストラリアの 3000 の組織がサンプリングの基礎として選択されました。プロジェクトと調査の目的を説明する追加の手紙が、回答用紙と記入済みのアンケートを返送するためのプリペイド封筒とともにサンプルに送られました。 3000の組織のうち、198が研究への参加に同意した。このような少数の回答は予想されていました だと 当時、組織内でデータ ウェアハウジング戦略を採用していた、または導入していたオーストラリアの多数の組織。したがって、この研究の対象集団は 198 組織のみです。

3.4.4.アンケート内容

アンケートの構造は、Monash データ ウェアハウジング モデル (パート 2.3 で前述) に基づいていました。アンケートの内容は、第 2 章で示した文献分析に基づいています。アンケート参加者に送信されたアンケートのコピーは、付録 B にあります。アンケートは、対象となるモデルのフェーズに従う XNUMX つのセクションで構成されています。次の XNUMX つの段落では、各セクションの内容を簡単に要約します。

セクション A: 組織に関する基本情報
このセクションには、参加組織のプロフィールに関する質問が含まれています。さらに、質問の一部は、参加者のデータ ウェアハウジング プロジェクトのステータスに関連しています。調査分析では組織名などの機密情報は明らかにされなかった。

セクション B: 始まり
このセクションの質問は、データ ウェアハウジングを開始するタスクに関連しています。プロジェクトの開始者、保証人、必要なスキルと知識、データ ウェアハウジングの開発目標、エンド ユーザーの期待に関する質問が行われました。

セクション C: デザイン
このセクションには、アクティビティの計画に関する質問が含まれています データウェアハウス。特に質問は、実行範囲、プロジェクトの期間、プロジェクトのコスト、および費用対効果の分析に関するものでした。

セクション D: 開発
開発セクションには、開発活動に関する質問があります。 データウェアハウス: エンドユーザー要件のコレクション、ソース 与えます、の論理モデル 与えます、プロトタイプ、キャパシティ プランニング、技術アーキテクチャ、およびデータ ウェアハウジング開発ツールの選択。

セクション E: 操作
の操作と拡張性に関連する操作上の質問 データウェアハウス、開発の次の段階でどのように進化するか。そこには データ品質、のリフレッシュ戦略 与えます、粒度 与えます、スケーラビリティ データウェアハウス そしてセキュリティ上の問題 データウェアハウス といった質問があった。

セクション F: 開発
このセクションには、 データウェアハウス エンドユーザーによる。研究者は、その目的と有用性に興味を持っていました。 データウェアハウス、採用されたレビューおよびトレーニング戦略、および管理戦略 データウェアハウス 採用。

3.4.5.回答率

郵送調査は回答率が低いと批判されていますが、回答率を高めるための対策が講じられています (パート 3.4.1 で前述したように)。 「回答率」という用語は、特定の調査サンプルの中でアンケートに回答した人の割合を指します (Denscombe 1998)。この研究の応答率を計算するには、次の式が使用されました。

回答した人の数
回答率 = —————————————————————————– X 100 アンケート送信総数

3.4.6.パイロットテスト

Luck と Rubin (1987)、Jackson (1988)、および de Vaus (1991) によって提案されているように、アンケートがサンプルに送信される前に、パイロット テストを実行することによって質問が検査されました。パイロット テストの目的は、解釈が困難なぎこちなくあいまいな表現や質問を明らかにし、使用されている定義や用語を明確にし、アンケートを完了するのに必要なおおよその時間を特定することです (Warwick and Liner 1975、Jackson 1988、Salant)およびディルマン 1994)。パイロットテストは、Davis e 氏が提案したように、最終被験者と同様の特性を持つ被験者を選択して実施されました。 コゼンツァ (1993年)。この研究では、データ ウェアハウスの専門家 XNUMX 名がパイロット対象者として選ばれました。各パイロット テストの後、必要な修正が行われました。実施されたパイロットテストから、参加者はアンケートの最終バージョンの再構成と再設定に貢献しました。

3.4.7.分析方法 与える

I 与えます クローズドアンケートから収集された調査のうち、SPSS と呼ばれる統計プログラム パッケージを使用して分析されました。回答の多くは記述統計を使用して分析されました。多数のアンケートが未記入のまま返送されました。これらは細心の注意を払って扱われ、確実に 与えます 欠落しているのは、データ入力エラーの結果ではなく、質問が登録者に適していないか、登録者が 1 つ以上の特定の質問に回答しないことにしたためです。これらの欠落した応答は分析中に無視されました 与えます 分析プロセスから確実に除外するために、「-9」としてコード化されました。

アンケートを作成する際、クローズド質問は各選択肢に番号を割り当てることで事前にコード化されていました。その後、その番号を使用して、 与えます 分析中 (Denscombe 1998、Sapsford および Jupp 1996)。たとえば、セクション B の質問 1 には、取締役会、上級管理職、IT 部門、事業部門、コンサルタントなど XNUMX つの選択肢がありました。のファイルに 与えます SPSS では、「プロジェクトの開始者」を示す変数が 1 つの値ラベル (「取締役会」を表す「2」、「上級役員」を表す「1」など) で生成されました。クローズド質問の一部でリッケルティンスケールを使用すると、SPSS に入力された対応する数値を使用することで、簡単に識別することもできました。相互に排他的ではない非網羅的な回答を持つ質問の場合、各オプションは 2 つの値ラベル (「マーク付き」を表す「XNUMX」と「マークなし」を表す「XNUMX」) を持つ単一の変数として扱われました。

オープンクエスチョンはクローズドクエスチョンとは異なって扱われました。これらの質問に対する回答は SPSS に入力されていません。代わりに、手作業で分析されました。このタイプの質問を使用すると、回答者が自由に表現したアイデアや個人的な経験に関する情報を得ることができます (Bainbridge 1989、Denscombe 1998)。可能な場合には、回答の分類が行われました。

の分析のために 与えます、応答頻度、平均、標準偏差、中央値などの単純な統計分析手法が使用されます (Argyrous 1996、Denscombe 1998)。
ガンマ テストは、 与えます 序数 (Norusis 1983、Argyrous 1996)。使用された順序尺度には多くのカテゴリがなく、表に表示できるため、これらのテストは適切でした (Norusis 1983)。

3.5 概要

この章では、この研究に採用された研究方法とデザインについて説明しました。

特定の研究に最適な研究方法を選択するには、次のことを考慮します。
研究の性質と種類、考えられる各方法の長所と短所を含む多くの規則の考慮 (Jenkins 1985、Benbasat et al. 1097、Galliers and Land 1987、yin 1989、Hamilton and ives 1992、Galliers) 1992 年、ノイマン 1994 年)。オーストラリアにおけるデータ ウェアハウジングの導入に関する既存の知識と理論が不足していることを考慮すると、この調査研究には、オーストラリアの組織の経験を調査する探索能力を備えた解釈的な調査方法が必要です。選択された調査方法は、オーストラリアの組織によるデータ ウェアハウジングの概念の採用に関する情報を収集するために選択されました。収集手法として郵送アンケートが選択されました 与えます。調査方法と収集手法の正当化 与えます 選択された内容については、この章で説明します。さらに、分析単位、使用サンプル、回答率、アンケート内容、アンケートの事前テスト、アンケートの分析方法などについて議論が行われました。 与えます.

の設計 データウェアハウス:

エンティティ関係と次元モデリングの組み合わせ

抽象
iを保存する 与えます は多くの組織にとって現在の主要な問題です。コンピュータストレージの開発における重要な問題 与えます それは彼のデザインです。
設計は、概念の検出をサポートする必要があります。 データウェアハウス レガシー システムやその他のソースへの 与えます また、実装における理解しやすさと効率性も向上します。 データウェアハウス.
ストレージに関する文献の多くは、 与えます の設計を表すためにエンティティ関係モデリングまたは次元モデリングの使用を推奨します。 データウェアハウス.
このペーパーでは、描画のための 1 つのアプローチで両方の表現をどのように組み合わせることができるかを示します。 データウェアハウス。使用されるアプローチは体系的です

ケーススタディで検討され、実務家に多くの重要な影響を与えることが確認されています。

データウェアハウス

Un データウェアハウス それは通常、「経営陣の意思決定をサポートする、主題指向で、統合され、時間変化があり、不揮発性のデータの収集」と定義されます (Inmon および Hackathorn、1994)。主題指向と統合は、 データウェアハウス Legaci システムの機能境界を越えて、統合された視点を提供するように設計されています。 与えます.
時変性は、歴史的または時系列的な性質に影響を与えます。 与えますデータウェアハウス、傾向を分析できるようになります。不揮発性とは、 データウェアハウス のように継続的に更新されるわけではありません データベース OLTPの。むしろ、定期的に更新されます。 与えます 内部および外部のソースから来ています。の データウェアハウス これは、更新の整合性や操作パフォーマンスではなく、検索に特化して設計されています。
iを保存するというアイデア 与えます それは新しいことではなく、管理目的の 1 つでした。 与えます 1982 年代以降 (The Martin、XNUMX)。
I データウェアハウス 彼らはインフラを提供する 与えます 経営支援システム向け。管理支援システムには、意思決定支援システム (DSS) と経営情報システム (EIS) が含まれます。 DSS は、人間の意思決定を改善するために設計されたコンピューターベースの情報システムです。 EIS は通常、次の配信システムです。 与えます これにより、ビジネス リーダーは、次のビューに簡単にアクセスできるようになります。 与えます.
の一般的なアーキテクチャ データウェアハウス ~の役割を強調する データウェアハウス 経営サポートで。インフラを提供するだけでなく、 与えます EIS および DSS については、 データウェアハウス クエリを通じて直接アクセスできます。ザ 与えます に含まれています データウェアハウス これらは、管理情報要件の分析に基づいており、内部レガシー システム、特殊目的のデータ キャプチャ システム、外部データ ソースの 3 つのソースから取得されます。ザ 与えます 社内のレガシー システムでは、冗長で一貫性が低く、品質が低く、異なる形式で保存されていることが多いため、システムにロードする前に調整してクリーンアップする必要があります。

データウェアハウス (Inmon、1992; McFadden、1996)。ザ 与えます ストレージ システムからのもの 与えます アドホックおよびソースから 与えます 外部は、i を拡張 (更新、置換) するためによく使用されます。 与えます レガシーシステムから。

を開発する説得力のある理由はたくさんあります。 データウェアハウスこれには、より多くの情報を効果的に使用することによる意思決定の改善 (Ives 1995)、取引全体への焦点のサポート (Graham 1996)、および取引の削減が含まれます。 与えます EIS および DSS の場合 (Graham 1996、McFadden 1996)。

最近の実証研究によると、平均して次のような投資収益率が得られます。 データウェアハウス 401 年後には 1996% 増加しました (Graham、XNUMX)。しかし、他の実証研究では、 データウェアハウス 利益の測定と割り当ての難しさ、明確な目的の欠如、利益を蓄積するプロセスの目的と複雑さの過小評価などの重大な問題を発見しました。 与えます、特に発生源と清潔さに関しては、 与えます。 iを保存する 与えます 経営課題の解決策として考えられる 与えます 組織間。の操作 与えます 社会資源として、それは長年にわたって世界中の情報システムを管理する上で重要な問題の 1996 つであり続けています (Brancheau et al. 1994、Galliers et al. 1990、Niederman et al. 1993、Pervan XNUMX)。

一般的な管理アプローチ 与えます 80年代にはモデルの開発が行われました 与えます 社交。モデル 与えます ソーシャルは、新しいアプリケーション システムの開発に安定した基盤を提供するように設計されています。 データベース レガシー システムの再構築と統合 (Brancheau et al.

1989 年、Goodhue ら。 1988:1992、キムとエベレスト 1994)。しかし、このアプローチには多くの問題があり、特に各タスクの複雑さとコスト、具体的な結果を生み出すまでに長い時間がかかる(Beynon-Davies 1994、Earl 1993、Goodhue et al. 1992、Periasamy 1994、Shanks 1997) )。

Il データウェアハウス これは、レガシー データベースを置き換えるのではなく、共存する別個のデータベースです。したがって、管理を指示することができます。 与えます コストのかかるレガシー システムの再構築を回避できます。

データ設計に対する既存のアプローチ

倉庫

を構築し完成させるプロセス データウェアハウス これは、従来のシステムの開発ライフサイクルではなく、進化のプロセスとして理解されるべきです (デージオ、1995年、シャンクス、オドネル、アーノット、1997a)。プロジェクトには多くのプロセスが含まれます データウェアハウス 初期化、計画など。企業の経営者に求められた要件から取得した情報。ソース、変換、クリーニング 与えます レガシー システムやその他のソースからの同期 与えます;開発中の配信システム。の監視 データウェアハウス;そして進化の過程と構造の無意味さ データウェアハウス (Stinchi、O'Donnell、Arnott 1997b)。この日記では、その描き方に焦点を当てます。 与えます これらの他のプロセスのコンテキストに保存されます。アーキテクチャに対しては数多くのアプローチが提案されています データウェアハウス 文学博士 (Inmon 1994、Ives 1995、Kimball 1994、McFadden 1996)。これらの各方法論には、長所と短所の分析を含む簡単なレビューが含まれています。

Inmon 氏 (1994) のアプローチ データウェアハウス 設計

Inmon (1994) は、 データウェアハウス (図 2 を参照)。最初のステップはテンプレートをデザインすることです 与えます 私がどのように理解しているかを社会的に理解する 与えます 部門を分割することで、組織内の機能領域全体を統合できます。 与えます エリアに保管します。モデル 与えます 保管用に作られています 与えます 意思決定に関連するものを含む 与えます 歴史家も含めて 与えます 推定して集計したもの。 2 番目のステップは、実装する対象領域を特定することです。これらは、特定の組織によって決定された優先順位に基づいています。 3 番目のステップでは、 データベース 対象領域については、適切なレベルの粒度を含めることに特に注意してください。 Inmon 氏は、エンティティとリレーションシップ モデルを使用することをお勧めします。 4 番目のステップは、ソース システムを特定することです。 与えます i をキャプチャ、クリーンアップ、フォーマットするための変換プロセスが必要であり、開発します。 与えます.

Inmon のアプローチの強みは、モデルが 与えます ソーシャルは統合の基盤を提供します 与えます 組織内での反復的な開発のためのサポートの計画 データウェアハウス。欠点はモデルの設計が難しくコストがかかること 与えます 社会的、両方のモデルで使用されるエンティティと関係のモデルを理解することの難しさ、 与えます 社会的なこと 与えます 主題分野ごとに保存され、その適切性 与えます の図面の データウェアハウス の実現のために データベース 関係的ですが、目的ではありません データベース 多次元。

アイヴズ (1995) のアプローチ データウェアハウス 設計

Ives (1995) は、情報システムを設計するための XNUMX 段階のアプローチを提案しています。これは、 データウェアハウス (図 3 を参照)。このアプローチは、情報システム開発のための情報工学に大きく基づいています (Martin 1990)。最初のステップは、目標、重要な成功要因、主要な業績評価指標を決定することです。主要なビジネスプロセスと必要な情報をモデル化し、モデルを導き出します。 与えます 社交。 2 番目のステップには、定義するアーキテクチャの開発が含まれます。 与えます エリアごとに保存され、 データベース di データウェアハウス、必要なテクノロジーコンポーネント、実装および運用に必要な一連の組織サポート データウェアハウス。 3 番目のステップには、必要なソフトウェア パッケージとツールの選択が含まれます。 4 番目のステップは、詳細な設計と構築です。 データウェアハウス。アイヴスは次のように述べています。 与えます それは制約された反復プロセスです。

アイヴスのアプローチの長所は、情報要件を決定するための特定の手法の使用と、情報の統合をサポートするための構造化されたプロセスの使用です。 データウェアハウス、適切なハードウェアとソフトウェアの選択、および複数の表現手法の使用。 データウェアハウス。複雑さには欠陥がつきものです。他には、多くのレベルの開発が困難であることが含まれます。 データベース 内の データウェアハウス 妥当な時間とコストで。

Kimball 氏 (1994) のアプローチ データウェアハウス 設計

Kimball (1994) は、 データウェアハウス (図 4 を参照)。彼のアプローチは特にソロのデザインに特化しています。 データウェアハウス また、エンティティ モデルや関係モデルよりも次元モデルを優先して使用することについても説明します。キンボール氏がこれらの次元モデルを分析するのは、ビジネス リーダーがビジネスを理解しやすく、複雑な相談に対処する際に効率的であるためです。 データベース 物理的な方が効率的です (Kimball 1994)。キンボールは、 データウェアハウス それは反復的であり、 データウェアハウス 別々のテーブルを共通の寸法のテーブルに分割することで統合できます。

最初のステップは、完成させるべき特定の主題領域を特定することです。 2 番目と 3 番目のステップは、次元モデリングに関するものです。 2 番目のステップでは、メジャーによって対象領域内で関心のある事項が特定され、ファクト テーブルにグループ化されます。たとえば、販売主題領域では、関心のある測定値には、販売された商品の量と販売通貨としてのドルが含まれる場合があります。 3 番目のステップでは、ファクトをグループ化する方法であるディメンションを特定します。販売主題領域では、関連するディメンションには品目、場所、期間が含まれる場合があります。ファクト テーブルには、各ディメンション テーブルにリンクするためのマルチパート キーがあり、通常は非常に多くのファクトが含まれます。対照的に、ディメンション テーブルには、ファクトをグループ化するために使用できるディメンションおよびその他の属性に関する説明情報が含まれています。関連する提案されたファクトおよびディメンション テーブルは、その形状からいわゆるスター スキーマを形成します。 4 番目のステップでは、 データベース 多次元で星のパターンを完成させます。最後のステップはソース システムを特定することです 与えます i をキャプチャ、クリーンアップ、フォーマットするための変換プロセスが必要であり、開発します。 与えます.

Kimball のアプローチの長所には、次元モデルを使用して表現することが含まれます。 与えます 保存されるため、理解しやすくなり、効率的な物理設計につながります。両方のシステムを容易に使用できる次元モデル。 データベース リレーショナルまたはシステムを完成させることができます データベース 多次元。その欠陥には、多くのスター パターンの計画や統合を容易にするいくつかのテクニックが欠如していることが含まれます。 データウェアハウス そして、極端な非正規化構造から次元モデルに設計することの難しさ。 与えます レガシーシステムでは。

マクファデン氏 (1996) のデータへのアプローチ 倉庫の設計

McFadden (1996) は、システムを設計するための XNUMX 段階のアプローチを提案しています。 データウェアハウス (図 5 を参照)。
彼のアプローチは文献からのアイデアの統合に基づいており、単一のデザインに焦点を当てています。 データウェアハウス。最初のステップには要件分析が含まれます。技術仕様は規定されていないが、マクファデン氏のメモでは実体が特定されている 与えます 仕様とその属性を参照し、要件の把握については読者 Watson と Frolick (1993) を参照してください。
2 番目のステップでは、エンティティ関係モデルが設計されます。 データウェアハウス そしてビジネスリーダーによって検証されました。 3 番目のステップには、レガシー システムと外部ソースからのマッピングの決定が含まれます。 データウェアハウス。 4 番目のステップには、開発、展開、同期のプロセスが含まれます。 与えますデータウェアハウス。最後のステップでは、ユーザー インターフェイスに特に重点を置いてシステム配信が開発されます。マクファデン氏は、描画プロセスは一般に反復的であると指摘しています。

マクファデンのアプローチの強みは、要件の決定にビジネス リーダーが参加することと、リソースの重要性を示していることです。 与えます、彼らの掃除と収集。その欠点としては、大規模なプロジェクトを分解するプロセスが欠如していることが挙げられます。 データウェアハウス 多くの統合された段階で、

の設計に使用されるエンティティおよび関係モデルを理解するのが難しい データウェアハウス.

私たちを選ぶのは、私たちの近くにいる人だけではありません。

    0/5 (レビュー 0 件)
    0/5 (レビュー 0 件)
    0/5 (レビュー 0 件)

    オンライン Web 代理店の詳細については、こちらをご覧ください。

    最新の記事を電子メールで受け取るには購読してください。

    作者のアバター
    管理人 最高経営責任者
    👍オンライン Web 代理店 |デジタルマーケティングとSEOのWebエージェンシーの専門家。 Web代理店オンラインはWeb代理店です。 Agenzia Web Online のデジタル変革における成功は、Iron SEO バージョン 3 の基礎に基づいています。専門分野: システム統合、エンタープライズ アプリケーション統合、サービス指向アーキテクチャ、クラウド コンピューティング、データ ウェアハウス、ビジネス インテリジェンス、ビッグ データ、ポータル、イントラネット、Web アプリケーションリレーショナル データベースと多次元データベースの設計と管理 デジタル メディアのインターフェイスの設計: ユーザビリティとグラフィックス。オンライン Web エージェンシーは企業に次のサービスを提供します。 - Google、Amazon、Bing、Yandex での SEO。 -ウェブ分析: Google アナリティクス、Google タグ マネージャー、Yandex Metrica; - ユーザーコンバージョン: Google Analytics、Microsoft Clarity、Yandex Metrica; - Google、Bing、Amazon 広告の SEM。 - ソーシャル メディア マーケティング (Facebook、Linkedin、Youtube、Instagram)。
    私のアジャイル プライバシー
    このサイトでは、テクニカル Cookie とプロファイリング Cookie を使用しています。 [同意する] をクリックすると、すべてのプロファイリング Cookie が承認されます。 拒否または X をクリックすると、すべてのプロファイリング Cookie が拒否されます。 カスタマイズをクリックすると、有効にするプロファイリング Cookie を選択できます。
    このサイトは、25 年 2020 月 2016 日のスイス連邦法であるデータ保護法 (LPD)、および個人データの保護およびかかるデータの自由な移動に関する GDPR、EU 規則 679/XNUMX に準拠しています。