fbpx

データウェアハウスとERP | 中央データアーカイブ:歴史と進化

アーカイブ DATA 中央: 歴史と進化


90 年代の企業テクノロジーの XNUMX つの主要なテーマは次のとおりです。
私はこう述べています データウェアハウス そしてERP。長い間この二人は強力だった
現在は企業 IT の一部となっていますが、
交差点。まるで物質と反物質であるかのようでした。しかし
両方の現象が成長すると、必然的に 1 つの現象が生じます。
彼らの交差点。今日、企業は次の問題に直面しています。
ERPをどうするか データウェアハウス。この記事では説明します
何が問題なのか、そして企業はそれらにどのように対処するのか。
開始時…
初めに、 データウェアハウス. データウェアハウス のために生まれました
トランザクション処理アプリケーション システムに対抗します。
初期の頃の暗記は、 与えます そうなるはずだった
コンピュータ処理アプリケーションの単なる対極にすぎない
取引。しかし現在では、より洗練された考え方が存在しています。
なんと データウェアハウス。今日の世界では、
データウェアハウス 可能な構造内に挿入されます。
企業情報ファクトリーと呼ばれます。
企業情報ファクトリー
(CIF)
Corporate Information Factory にはアーキテクチャ コンポーネントがあります
標準: コード変換と統合のレベル
私を統合するもの 与えます 私は 与えます 彼らは環境から移動します
の環境に向けたアプリケーション データウェアハウス 会社の。ある
データウェアハウス がいる会社の 与えます
詳細かつ統合された履歴。の データウェアハウス 会社の
他のすべての部品をその上に構築できる基礎
環境の データウェアハウス;オペレーショナル データ ストア (ODS)。
ODS は、データのいくつかの側面を含むハイブリッド構造です。
倉庫およびOLTP環境のその他の側面。データマート、私は
異なる部門が独自のバージョンのデータを持っている場合があります
倉庫;ある データウェアハウス 私が行っている探検の
会社の「哲学者」は質問を送信できます
72時間は有害な影響を与えません データウェアハウス;そして思い出
ニアライン、どこ 与えます 古くて 与えます 一括詳細を行うことができます
安く保管されています。
ERP が LA と提携する場所
企業情報ファクトリー
ERP は 2 か所で Corporate Information Factory と統合されます。
まず、基本的なアプリケーション (ベースライン) として、
与えます へのアプリケーションの データウェアハウス。 この場合、私は 与えます,
トランザクションプロセスの副産物として生成され、
に統合されてロードされます。 データウェアハウス 会社の。の
ERP、CIF、ODS 間の結合の 2 番目のポイント。実際、多くの
ERP がクラシック ODS として使用される環境。
ERP がコア アプリケーションとして使用されている場合、
同じ ERP を CIF で ODS として使用することもできます。で
いずれにせよ、ERP が両方の役割で使用される場合、
2 つのエンティティの間には明確な区別が必要です。言い換えると、
ERP が基本アプリケーションと ODS の役割を果たす場合、
2 つのアーキテクチャ上のエンティティは別個のものである必要があります。シングルなら
ERP の導入は両方の役割を果たそうとします
同時に、必然的に問題が発生します
この構造の設計と実装。
個別のODSと基本アプリケーション
コンポーネントの分割にはさまざまな理由があります
建築的な。おそらく、問題を区別するための最も雄弁な質問は、
アーキテクチャのさまざまなコンポーネントとは、それぞれのコンポーネントが
建築には独自の視点があります。ベースラインアプリケーションが必要です
ODS とは別の目的で使用されます。重ねてみる
ODS の世界に関するベースライン アプリケーション ビュー、またはその逆
それは正しい働き方ではありません。
したがって、CIF における ERP の最初の問題は、
ベースライン アプリケーションと
オッズ
企業内のデータモデル
情報工場
異なるコンポーネント間の一体性を実現するには
CIF アーキテクチャのモデルが存在する必要があります。 与えます。 私は
のモデル 与えます さまざまなコンポーネント間のリンクとして機能します。
ベースライン アプリケーションや ODS などのアーキテクチャの。ザ
のモデル 与えます を実現するための「知的ロードマップ」となる
CIF のさまざまなアーキテクチャ コンポーネントからの正しい意味です。
この概念と連携して、次のような考えがあります。
~の素晴らしくてユニークなモデルになる 与えます。もちろん彼はそうしなければなりません
ロールモデルになる 与えます 各コンポーネントとそこにも
異なるモデルを接続する合理的なパスでなければなりません。
アーキテクチャの各コンポーネント - ODS、ベースライン アプリケーション、
データウェアハウス 会社のなど。 – 独自のものが必要です
のモデル 与えます。したがって、正確な定義が必要です。
これらのモデルのように 与えます それらは相互にインターフェイスします。
ムーブI DATA ERP の日付
倉庫
の起源であれば、 与えます ベースライン アプリケーションおよび/または ODS である場合、
ERP は i を挿入します 与えますデータウェアハウス、この挿入は必ず
最低レベルの「粒度」で発生します。要約または
単純に私を集計します 与えます 彼らが出てくると
ERP ベースライン アプリケーションまたは ERP ODS からのものは、
正しいこと。ザ 与えます データには詳細が必要です
DSS プロセスの基礎を形成する倉庫。そのような 与えます
データマートと探索によってさまざまな方法で再形成されるでしょう
インクルード データウェアハウス.
の変位 与えます ベースラインのアプリケーション環境から
ERPの環境への影響 データウェアハウス 会社の業務は
適度にリラックスした態度。その変化はその後に起こります
ERP での更新または作成から約 24 時間。という事実
~の「怠惰な」動きをする 与えますデータウェアハウス
会社の許可する 与えます ERPから「入金」されます。
一度 与えます ベースライン アプリケーションに保存されます。
そうすれば安全に移動できます 与えます ERPの
会社で。動きのおかげで達成できるもう一つの目標
「怠惰な」神々 与えます 運用プロセスと運用プロセスの間の明確な境界線です。
DSS。 「速い」動きで、 与えます 分割線
DSS と運用の境界は依然として曖昧です。
の動き 与えます ERP ODS から データウェアハウス
会社の評価は通常定期的に行われます
毎週または毎月。この場合の動きは、
与えます それは古いものを「掃除」する必要性に基づいています 与えます 歴史家。
もちろん、ODS には i が含まれています。 与えます それはもっと最近のことです
と比較して 与えます で見つかった歴史家 データウェアハウス.
の変位 与えますデータウェアハウス それはほとんど行われない
「卸売」(卸売業者の言い方で)。テーブルをコピーする
ERP環境から データウェアハウス それは意味がありません。 1 つのアプローチ
選択したユニットの動きはより現実的です。 与えます.
唯一の 与えます 前回のデータ更新以降に変更された内容
ウェアハウスはデータに移動する必要があるものです
倉庫。どちらかを知るための 1 つの方法 与えます それらは変更されました
前回の更新ではタイムスタンプを確認することになっているため、 与えます
ERP環境で見つかります。デザイナーがすべての変更を選択します
前回の更新以降に表示されたもの。別のアプローチ
変更取得テクニックを使用することです 与えます。 ととも​​に
これらの技術は、ログとジャーナルテープを分析して、
どちらかを決定する 与えます ERP 環境からに移行する必要がある
それの データウェアハウス。これらのテクニックが最も得意とするのは、
ERP ファイルから読み取れるログとジャーナル テープの量
他の ERP リソースにさらなる影響を与えることはありません。
その他の合併症
CIF の ERP の問題の 1 つは、他の ERP に何が起こるかということです。
アプリケーションソースまたはAI 与えます 貢献しなければならないODSのうち
データウェアハウス ただし、これらは ERP 環境の一部ではありません。与えられた
ERP、特に SAP の閉鎖的な性質、
外部ソースからのキー 与えます とともに 与えます ERPから来るものは、
私が移動する時間です 与えますデータウェアハウス、それは大きな挑戦です。
そして、私がそうなる確率は正確には何ですか? 与えます アプリケーションの、または
ERP環境外のODSはデータに統合されます
倉庫?実際、その確率は非常に高いです。
探す DATA ERP からの履歴
私に関する別の問題 与えます ERP の結果は次のとおりです。
持つ必要性から 与えます 内部の歴史家 データウェアハウス.
通常、 データウェアハウス 彼は必要です 与えます 歴史家。そして
ERP テクノロジーは通常、これらを保存しません 与えます
歴史的、少なくともデータで必要な点までは
倉庫。大量にあるときは、 与えます 歴史家たちはそうし始める
ERP 環境に追加するには、この環境を
クリーンアップ。たとえば、 データウェアハウス しなければならない
5年間の負荷がかかる 与えます ERP が履歴を保持している間、
そのうち最大6か月 与えます。会社が満足する限り
のセットを集める 与えます 歴史家たちは時が経つにつれて、
その場合、ERP をソースとして使用しても問題はありません。
データウェアハウス。しかし、 データウェアハウス 行かなければならない
過去に戻って神を連れて行く 与えます そうでなかった歴史家
以前に ERP によって収集および保存され、その後 ERP 環境に保存されました
非効率的になります。
ERP とメタデータ
ERP に関して考慮すべきもう 1 つの考慮事項 データウェアハウス それは
ERP 環境の既存のメタデータに関する。メタデータだけでなく
ERP環境からIT環境への移行 データウェアハウス
メタデータも同じ方法で移動する必要があります。さらに、私は
メタデータは形式と構造を変換する必要がある
~のインフラストラクチャに必要な データウェアハウス。大きいのがあるよ
運用メタデータと DSS メタデータの違い。メタデータ
運用は主に開発者と
プログラマー。 DSS メタデータは主にユーザー向けです
最終。 ERP アプリケーションまたは ODS 内の既存のメタデータ
変換する必要がありますが、この変換は必ずしも簡単ではありません
そして直接。
ERP データの入手
ERP をプロバイダーとして使用する場合 与えます 以下のために データウェアハウス ci
私を動かす堅牢なインターフェースである必要があります 与えます 環境から
ERPから環境へ データウェアハウス。インターフェイスは次のことを行う必要があります。
▪ 使いやすいこと
▪ へのアクセスを許可する 与えます ERPの
▪ の意味を理解する 与えます 移動しようとしているもの
データウェアハウス
▪ 状況によって生じる可能性のある ERP の制限を理解する。
アクセスがあった瞬間 与えます ERP の:
▪ 参照整合性
▪ 階層関係
▪ 暗黙的な論理関係
▪ アプリケーション規約
▪ のすべての構造 与えます ERP によるサポートなど…
▪ 効率的にアクセスする 与えます、以下を提供することで、
▪ 直接移動 与えます
▪ おつりの取得 与えます
▪ タイムリーなアクセスをサポート 与えます
▪ の形式を理解する 与えます、 等々…
SAP とのインターフェース
インターフェイスには、自社製または商用の 2 つのタイプがあります。
主要な取引インターフェイスには次のようなものがあります。
▪ SAS
▪ プリムズソリューション
▪ D2k など…
複数のERPテクノロジー
ERP 環境を単一のテクノロジーであるかのように扱うことは、
大ミス。 ERP テクノロジーは数多くあり、それぞれに独自の特徴があります。
強み。市場で最もよく知られているベンダーは次のとおりです。
▪ SAP
▪ オラクルの財務
▪ ピープルソフト
▪ JD エドワーズ
▪ バーン
SAP
SAP は最大かつ最も完全な ERP ソフトウェアです。アプリケーション
SAP には、さまざまな分野のさまざまな種類のアプリケーションが含まれています。 SAP は
存在するという評判:
▪ 非常に大きい
▪ 導入は非常に困難で費用がかかる
▪ 多くの人材とコンサルタントが必要
実装
▪ 導入には専門の人材が必要
▪ 実装には長い時間がかかる
さらに、SAP は独自のデータを保存することで定評があります。 与えます 非常に
慎重に、アクセスを困難にする
SAP エリアの外部の人。 SAP の強みは、
大量のデータを捕捉して保存することができます。 与えます.
最近 SAP は、
その応用例 データウェアハウス。メリットもデメリットもたくさんあります
SAP をサプライヤーとして使用する場合 データウェアハウス.
利点は、SAP がすでにインストールされており、ほとんどの
コンサルタントはすでに SAP を知っています。
SAP をサプライヤーとして使用する場合の欠点 データウェアハウス 彼らは
多くの場合: SAP には、次のような世界における経験がありません。 データウェアハウス
SAP がサプライヤーの場合 データウェアハウス、「取り出す」必要があります。
i 与えます SAP から データウェアハウス. ダト SAP の実績
クローズド システムであるため、SAP から
それ (???)。 SAP を強化するレガシー環境は数多くありますが、
IMS、VSAM、ADABAS、ORACLE、DB2 など。
SAP は「ここで発明されたものではない」アプローチを主張しています。 SAPはそれを望んでいません
他のベンダーと協力して、 データウェアハウス.
SAP はすべてのソフトウェアを自社で生成することにこだわっています。
SAP は大規模で強力な企業ですが、
ELT、OLAP、管理のテクノロジーを書き直す試み
システムとそのコアコードさえも DBMS それはただクレイジーです。
サプライヤーに対して協力的な態度をとる代わりに
di データウェアハウス SAP は長年にわたり、次のようなアプローチを採用してきました。
彼らは「よく知っている」のです。この姿勢は成功を遅らせる
SAP は次の分野に取り組む可能性があります。 データウェアハウス.
SAP は外部ベンダーのアクセス許可を拒否
迅速かつ丁寧に彼らに 与えます。使い方の本質
un データウェアハウス に簡単にアクセスできます 与えます。 SAP の全容は次のとおりです。
アクセスを困難にすることに基づく 与えます.
SAP には大量のデータを処理する経験が不足しています。 与えます;
の分野で データウェアハウス のボリュームがあります 与えます それ以来見たことがない
SAP とこれらの大量の 与えます 1つ持っている必要があります
適切な技術。 SAP はこのことを知らされていないようです
データ分野への参入に存在する技術的障壁
倉庫。
SAP の企業文化: SAP はビジネスを創造しました
私を得るにあたって 与えます システムから。しかし、これを行うには次のものが必要です
異なる精神性。従来、ソフトウェア会社は、
データを環境に取り込むのが得意であるが、苦手である
データを別の方向に取得します。 SAP がこのようなことができれば、
スイッチはこれを行う最初の企業となる。
要するに、企業が選択すべきかどうかは疑問です。
サプライヤーとしてのSAP データウェアハウス。非常に深刻なリスクがあります
一方では報酬はほとんどありません。しかし、もう一つあります
データサプライヤーとして SAP を選択することを妨げる理由
倉庫。どの会社も同じ日付にする必要があるため
他の会社の倉庫ですか?の データウェアハウス それは心です
競争上の優位性。すべての企業が同じものを採用した場合
データウェアハウス 不可能ではないにしても、難しいでしょうが、
競争上の優位性を達成します。 SAP は次のように考えているようです。
データウェアハウス クッキーとして見ることができます。
「データを取得する」というアプリケーションの考え方のさらなる兆候
に"。
SAP ほど支配的な ERP ベンダーは他にありません。
SAP と同じ道をたどる企業が現れることは間違いありません。
彼らのために データウェアハウス おそらくこれらの日付
SAP ウェアハウスは大規模で高価かつ要求が厳しいものになる
創造の時間です。
これらの環境には、銀行窓口での処理、
航空会社の予約プロセス、苦情プロセス
保険など。トランザクション システムのパフォーマンスが向上しました。
さらに明白なのは、運用とプロセスを分離する必要があるということでした。
DSS (意思決定支援システム)。ただし、リソース システムでは、
人間的で個人的なものであるため、大量の情報に直面することはありません。
取引。そしてもちろん、人が雇われるときは、
または会社を辞めた場合、これは取引の記録です。
しかし、他の制度や人事制度と比較すると、
個人的な取引はあまり多くありません。したがって、
人事および人事システムが存在することは完全に明らかではありません。
データウェアハウスが必要です。多くの点で、これらのシステムは
DSS システムの統合を表します。
しかし、それを行う必要がある場合には、考慮しなければならない別の要素があります
データ ウェアハウスと PeopleSoft を使用します。多くの環境では、私は 与えます
人的資源や個人的資源の活用はビジネスにとって二の次です
主管者(社長。ほとんどの企業が実施している
製造、販売、サービスの提供など。ザ
人事および人事システムは通常、二次的なものです。
サポート)を会社の主な事業分野に追加します。したがって、それは
曖昧で不便 データウェアハウス のために別個に
人的および個人的リソースのサポート。
この点において、PeopleSoft は SAP とは大きく異なります。 SAP では、
があることは必須です データウェアハウス。 PeopleSoft ではそうではありません。
それからとてもクリアです。 PeopleSoft ではデータ ウェアハウスはオプションです。
私にとって言える最善のことは 与えます PeopleSoft はそのデータです
倉庫をアーカイブするために使用できます。 与えます に関連する
古い人的資源や個人的資源。 2つ目の理由は、
企業が使いたいのはどれですか データウェアハウス a
PeopleSoft 環境に悪影響を与えるのは、アクセスとアクセスを許可することです。
分析ツール、AIへの無料アクセス 与えます PeopleSoft による。しかし
これらの理由以外にも、使用しない方がよい場合もあります。
~のためのデータウェアハウスを持っている 与えます PeopleSoft。
要約すると
データの構築に関してはさまざまなアイデアがあります
ERP ソフトウェア内の倉庫。
その一部は次のとおりです。
▪ を持つことは理にかなっています。 データウェアハウス どれに似ているか
業界で他に何かありますか?
▪ ERP の柔軟性の高さ データウェアハウス ソフトウェアですか?
▪ ERP データウェアハウス ソフトウェアは次の量を処理できます
与えます にありますデータウェアハウス アリーナ"?
▪ ERP ベンダーが行うトレース ログとは何ですか
時間の点で簡単かつ安価な AI に直面している 与えます? (何
ERP ベンダーの低価格での提供実績です。
時間、データへのアクセスが簡単ですか?)
▪ DSS アーキテクチャと
ERPベンダーによる「企業情報工場」?
▪ ERP ベンダーは、次のことを達成する方法を理解しています。 与えます 以内
しかし、それらをエクスポートする方法も理解しているのでしょうか?
▪ ERP ベンダーはデータ ツールに対してどの程度オープンか
倉庫?
決定する際には、これらすべてを考慮する必要があります。
どこに置くか データウェアハウス 私をホストするのは 与えます ERPなどの
与えます。一般的には、よほどの理由がない限り、
それ以外の場合は、ビルドすることをお勧めします データウェアハウス アウト
ERP ベンダーの環境から。
第1章
BI組織の概要
キーポイント:
情報リポジトリは逆に機能します
ビジネス インテリジェンス (BI) アーキテクチャへ:
企業文化とITが成功を制限する可能性がある
BI 組織の構築。
テクノロジーはもはや BI 組織にとって制限要因ではありません。の
建築家やプロジェクトプランナーにとっての問題は、
テクノロジーは存在しますが、効果的に実装できれば、
利用可能なテクノロジー。
多くの企業にとって、 データウェアハウス それは倉庫にすぎません
私を分配するパッシブ 与えます 必要とするユーザーへ。ザ 与えます
これらはソース システムから抽出され、ターゲット構造に移入されます。
di データウェアハウス。 私は 与えます すべてのツールで掃除することもできます。
運。ただし付加価値も何もない
によって収集されました 与えます このプロセス中に。
基本的に、パッシブ Dw は、せいぜい、
私だけ 与えます ユーザー協会にとってクリーンで運用可能なもの。そこには
情報の創造と分析的理解は依存します
完全にユーザーによるものです。 DW(データウェアハウス
成功は主観的なものです。成功を判断するなら
iを効率的に収集、統合、クリーンアップする能力 与えます
予測可能なベースで企業としての成功を収めているのであれば、はい、DW は成功しています。
一方、回収、統合、保管に目を向けると、
組織全体で情報を悪用し、
DWは失敗です。 DW はほとんど価値を提供しません
情報。その結果、ユーザーはその場しのぎを強いられ、
したがって、情報サイロが形成されます。この章では、
BI (ビジネス) のアーキテクチャを要約する完全なビジョン
インテリジェンス)。 BI e の説明から始めましょう
その後、デザインに関するディスカッションに移ります。
単に情報を提供するのではなく、情報を開発する 与えます
ユーザーへ。その後、議論は次の計算に焦点を当てます。
BI の取り組みの価値。最後に、IBM がどのように機能するかを定義します。
組織の BI アーキテクチャ要件に対応します。
のアーキテクチャの説明
BI組織
強力なトランザクション指向の情報システムは現在、
あらゆる大規模な事業において、レベルを上げながら議題に上る
事実上、世界中の企業にとっての競争の場となります。
しかし、競争力を維持するには、システムを分析的に分析する必要があります
を再発見することで会社の能力に革命を起こすことができる方向に向けて
彼らがすでに持っている情報を使用します。これらのシステム
分析は、豊富な知識から得られるものです。 与えます
利用可能。 BI はあらゆる情報のパフォーマンスを向上させることができます
会社の。企業は顧客間の関係を改善できる
サプライヤー、製品とサービスの利益を向上させ、
新しくてより良いオファー、リスクの管理など
収益により支出が大幅に削減されました。 BI をあなたのものに
ついに顧客情報の利用を開始
という目的を持つアプリケーションのおかげで競争力のある商品として
市場。
適切なビジネス手段を持つということは、次のことに対する最終的な答えを持つことを意味します。
次のような重要な質問:
▪ 私たちのどちらですか 顧客 彼らは私たちにもっと稼がせるか、あるいは私たちを
彼らは損をしているのか?
▪ 私たちの優秀な人材が住む場所 顧客 に関して ショップ/
彼らが頻繁に利用する倉庫は?
▪ 当社の製品とサービスのうち、より多く売れるものはどれか
誰に対して効果的に?
▪ どの製品を誰に最も効果的に販売できるか?
▪ 最も成功した販売キャンペーンとその理由は何ですか?
▪ どの販売チャネルがどの製品にとって最も効果的か?
▪ 最高の人材との関係を改善するにはどうすればよいか 顧客?
ほとんどの企業は、 与えます 答えにくい
これらの質問。
運用システムは大量の製品を生成します。
顧客との 与えます 販売時点からの市場、予約、
カスタマーサービスとテクニカルサポートシステムによる。課題は
この情報を抽出して悪用します。
多くの企業は利益のほんの一部からしか利益を得ていません 与えます
戦略分析用。
I 与えます 残り、多くの場合 i と結合します 与えます などの外部ソースから生じる
「政府報告書」やその他の購入情報もその 1 つです。
金鉱山は探検されるのを待っている、そして私は 与えます しなければならない
自分の情報コンテキスト内でのみ洗練される
組織。
この知識はさまざまな方法で応用できます。
企業全体の戦略策定から
コールセンターを通じたサプライヤーとの個人的なコミュニケーション、
請求書発行、 インターネット などの点。今日のビジネス環境が決定する
DW および関連する BI ソリューションが進化すること
伝統的な構造の施工 与えます 私は 与えます に正規化される
原子レベルおよび「スター/キューブ ファーム」。
競争力を維持するために必要なのは、
伝統的かつ先進的な技術を駆使して、
広大な分析環境。
結論として、一般的な環境は知識を向上させる必要があります。
会社全体の責任を果たし、確実に実行される行動を保証します。
実施された分析の結果として、誰もが
利点。
たとえば、自分のものを分類するとします。 顧客 カテゴリー内で
リスクが高いか低いか。
この情報が抽出モデルから生成された場合、または
他の手段を Dw に配置し、アクセスできるようにする必要があります。
私などのアクセスツールを使用して、誰でも
静的レポート、スプレッドシート、テーブル、または分析処理
行 (OLAP)。
しかし、現在、この種の情報は多くあります。
サイロに残る 与えます 彼らが生み出した個人や部門の
解析。組織全体として、可視性がほとんどまたはまったくない
理解のために。この種のコンテンツを混ぜるだけで
社内 DW 内の情報のサイロ化を排除できます。
情報を収集し、DW 環境を向上させます。
組織の発展には2つの大きな障害がある
BIの。
まず、組織自体の問題があります
関連する分野の。
たとえ政策変更に協力できなかったとしても
組織のコンポーネントを理解するのに役立ちます。
BI 組織、そのアーキテクチャ、およびその方法
IBM テクノロジーにより開発が容易になります。
乗り越えるべき第二の壁はテクノロジーの欠如です
統合された空間と空間全体を想起させる手法の知識
単なる小さなコンポーネントではなく、BI の重要な要素です。
IBMはテクノロジーの変化に直面しつつある
統合されたもの。デザインを提供するのはあなたの責任です
自己意識的。このアーキテクチャは以下を使用して開発する必要があります
制約なしで、または少なくとも制約なしで統合するために選択されたテクノロジー
オープンスタンダードに準拠したテクノロジー。さらに、あなたの
企業経営者は、Bi 企業が安全であることを保証しなければなりません。
プログラムに従って実行され、それを許可しない
利己的な行為から生じる情報サイロの発展
アジェンダ、または目標。
これは、BI 環境が影響を受けにくいということではありません。
さまざまなユーザーのさまざまなニーズや要件に対応します。代わりに、それは意味します
それらの個別のニーズと要件の実装は、
BI 組織全体の利益のために行われます。
BI 組織のアーキテクチャを説明すると、次のようになります。
9 ページの図 1.1 を参照してください。アーキテクチャは次のとおりです。
テクノロジーとテクニックの豊かな融合。
従来の見方では、アーキテクチャには次のコンポーネントが含まれます。
倉庫の
原子層。
これは Dw 全体の基礎であり中心であり、したがって
戦略的なレポート。
I 与えます ここに保存されるものは、歴史的な完全性、関係を保持します。
与えます 派生メトリクスが含まれており、クリーンであるだけでなく、
抽出モデルを使用して統合され、保存されます。
これらのその後のすべての使用 与えます そして関連情報は
この構造から導き出されたものです。これは優れた情報源です
の抽出 与えます 構造化 SQL クエリを含むレポートの場合
の運用拠点 与えます またはそれに基づくレポート
与えます(運用データ ストア (ODS) またはレポート
データベース.)
これは次のような構造です。 与えます のために特別に設計された
技術的なレポート。
I 与えます これらの構造を介して保存および報告されると、最終的には
組織ゾーン (ステージング) を介して倉庫に伝播します。
エリア)、戦略的な信号伝達に使用できる可能性があります。
ステージングエリア。
ほとんどの人にとって最初の目的地 与えます 環境を目的とした
倉庫は組織エリアです。
ここで私は 与えます それらは統合され、浄化され、次のように変換されます。 与えます 役に立った
倉庫構造にデータを追加します
データマート。
アーキテクチャのこの部分は、次の構造を表します。 与えます 中古
特にOLAPの場合。データマートの存在 (ある場合) 与えます 彼らは
重複するスター スキーマに保存される 与えます
リレーショナル環境またはファイリングキャビネット内での多次元
di 与えます 特定の OLAP テクノロジーで使用される機密情報。
DB2 OLAP サーバーは関係ありません。
唯一の制約は、アーキテクチャが 与えます
多次元。
このアーキテクチャには、重要な BI テクノロジーとテクニックも含まれています
これらは次のように区別されます。
空間分析
宇宙はアナリストにとって棚ぼた的な情報であり、
解決を完了するためには重要です。スペースカン
特定の場所に住んでいる人々に関する情報を表す
場所、およびその場所がどこにあるかに関する情報
物理的に世界の他の地域と比べて。
この分析を実行するには、独自のデータを結び付けることから始める必要があります。
緯度と経度の座標に関する情報。何を意味します
これは「ジオコーディング」と呼ばれ、抽出の一部である必要があります。
変換、およびレベルでの読み込みプロセス (ETL)
倉庫のアトミック。
データマイニング。
の抽出 与えます 私たちの会社の成長を可能にします
の数 顧客、販売傾向を予測し、
私との関係を管理する 顧客 (CRM)、他のイニシアチブの中でも
BI。
の抽出 与えます したがって、それはの構造と統合されなければなりません。
与えます Dwhouse の倉庫プロセスによってサポートされています。
テクノロジーの効果的かつ効率的な使用を保証し、
関連するテクニック。
BI アーキテクチャで示されているように、
Dwhouse は、データマートと同様に、優れた情報源です。 与えます
抽出用に。それらと同じ構造もまた、
抽出結果の受信者が確実に利用できるようにするため、
最大の視聴者 (最も幅広い視聴者)。
エージェント。
顧客をあらゆる点で検査するためのさまざまな「エージェント」がいます。
会社のオペレーティング システムと同じ dw。これらのエージェントは、
~について学習するように訓練された高度なニューラルネットワークであること
製品の今後の需要など各地点の動向をベースに
販売促進、それに反応するルールベースのエンジン
un だと 一連の状況、または単純なエージェントでさえ、
彼らは例外を「経営幹部」に報告します。これらのプロセスはい
一般にリアルタイムで表示されるため、
彼らの動きと密接に結びついている 与えます.
これらすべての構造は、 与えます、技術と技術を保証します。
一晩かけて組織を作る必要はありません
あなたのBI。
このアクティビティは段階的に小さなステップで開発されます
ポイント。
各ステップは独立したプロジェクトの取り組みであり、報告されます。
DW または BI イニシアチブの反復として。反復
新しいテクノロジーの実装が含まれる場合があります。たとえば、
新しい技術から始めて、新しい構造を追加する 与えます ,
私をロード中 与えます 補足的、または分析の拡張を伴う
あなたの環境。この段落についてはさらに詳しく説明します
第 3 章で詳しく説明します。
DW ツールと BI ツールの従来の構造に加えて、他の構造もあります。
BI 組織の中で果たさなければならない機能
次のようなデザイン:
顧客タッチポイント(顧客タッチ)
ポイント)。
すべての現代の組織と同様に、多くの組織が存在します。
エクスペリエンスを体験する方法を示す顧客タッチポイント
あなたにとってポジティブな 顧客。 i などの従来のチャネルがあります。
小売業者、交換手、ダイレクト メール、マルチメディア、印刷
広告だけでなく、電子メールやウェブなどの最新のチャネルも、 与えます
何らかのタッチポイントのある商品を獲得する必要があるため、
輸送、洗浄、処理された後、施設に設置されます 与えます
BI。
の基本 与えます 運用とユーザーの関連付け (運用
データベースとユーザーコミュニティ)。
お問い合わせ窓口の最後に、 顧客 の基礎が見つかりました 与えます
会社のアプリケーションおよびユーザーコミュニティの。ザ 与えます 既存
彼らは 与えます 伝統的なものを集め、融合させる必要があります。 与えます その
必要を満たすために接点からの流れ
情報。
アナリスト。 (アナリスト)
BI 環境の主な受益者はアナリストです。彼こそが、
現在の抽出による利点 与えます 運用可能、統合されている
さまざまな情報源 与えます 、分析などの機能が強化されています
地理的 (ジオコーディング) であり、BI テクノロジーで表現されます。
抽出、OLAP、高度な SQL レポートおよび分析が可能
地理的な。アナリストが環境にアクセスするための主要なインターフェイス
レポートは BI ポータルです。
ただし、このアーキテクチャの恩恵を受けるのはアナリストだけではありません。
BI。
管理者、大規模なユーザー団体、さらにはメンバー、サプライヤー、
顧客 彼らはエンタープライズ BI のメリットを享受できるはずです。
バックフィードループ。
BI アーキテクチャは学習環境です。原則
開発の特徴は、永続的な構造を可能にすることです。 与えます
使用されている BI テクノロジーを使用し、アクションを通じて更新される
ユーザーの取り組み。例としては、
顧客 (顧客スコアリング)。
営業部門がマイニングモデルを実施する場合
新しいサービスの利用に関する顧客のスコア、
営業部門だけが受益者グループであってはなりません
サービスの
代わりに、モデルの抽出は一部として実行する必要があります。
社内の自然なデータの流れと顧客のスコア
の情報コンテキストの統合された部分になる必要があります。
倉庫、すべてのユーザーに表示されます。 Bi-bI 中心の IBM スイート
DB2 UDB、DB2 OLAP Server を含むほとんどのものが含まれます。
図で定義されている重要なテクノロジーコンポーネントの一部
1.1.
この図に示されているアーキテクチャを本に記載されているとおりに使用します。
継続性のレベルを示し、各製品がどのように機能するかを示します
IBM は一般的な BI フレームワークに適合します。
情報提供内容(提供内容)
情報内容)
BI 環境の設計、開発、実装は次のとおりです。
困難な手術。デザインは両方を包含する必要があります
現在および将来のビジネス要件。建築のデザイン
見つかったすべての結論を含めて完全にする必要があります
設計段階で。死刑執行は残らなければならない
BI アーキテクチャの開発という 1 つの目的に専念する
図面に正式に提示され、要件に基づいて
ビジネス。
規律によって確実に安全性が確保されると主張するのは特に難しい。
相対的な成功。
BI 環境全体を開発するわけではないので、これは簡単です
突然ですが、時間をかけて少しずつ行われます。
ただし、アーキテクチャの BI コンポーネントを特定するのは困難です。
2 つの理由で重要です: その後のすべての決定を導くのはあなた自身です
建築技術。
テクノロジーの特定の使用法を意識的に計画できるようになります
必要なリピートは得られないかもしれませんが、
数か月にわたる技術。
ビジネス要件を十分に理解することがタイプに影響します
あなたのアーキテクチャのために購入する製品のリスト。
アーキテクチャの設計と開発により、
あなたの倉庫は
偶然の出来事ではなく、むしろ「よく考えられた」出来事であり、
慎重に構成された広告 オペラ モザイクのような芸術
混合技術。
情報コンテンツをデザインする
すべての初期計画では、次の点に焦点を当てて特定する必要があります。
環境で必要となる主要な BI コンポーネント
現在と将来の一般的なもの。
ビジネス要件を知ることは重要です。
従来の計画がすべて始まる前であっても、
プロジェクト プランナーは、多くの場合、1 つまたは 2 つを特定できます。
コンポーネントをすぐに。
必要とされる成分のバランス
ただし、あなたのアーキテクチャは簡単には見つかりません。
設計段階では、アーキテクチャの主要部分
アプリケーション開発 (JAD) セッションを検索に結び付ける
ビジネス要件を特定するため。
場合によっては、これらの要件をツールに任せることもできます
クエリとレポート。
たとえば、ユーザーは自動化したい場合は次のように述べます。
現在、レポートは統合して手動で生成する必要があります
2 つの流動比率と、以下から導出される計算を加算します。
の組み合わせ 与えます.
この要件は単純ですが、特定の事項を定義します。
いつ含める必要がある機能の機能
組織用のレポート ツールを購入します。
設計者は、次の追加要件も追求する必要があります。
全体像を把握します。ユーザーが購読を希望している
このレポート?
レポートのサブセットが生成され、電子メールでさまざまな宛先に送信されます。
ユーザーは?このレポートを企業ポータルで見たいですか?
これらすべての要件は、単純なニーズの一部です。
ユーザーの要求に応じて手動レポートを置き換えます。利益
この種の要件は、ユーザーもデザイナーも全員が持っているものです。
レポートの概念を理解する。
ただし、計画する必要がある他の種類のビジネスもあります。
ビジネス要件が次の形式で記述されている場合
ビジネス戦略に関する質問は、専門のデザイナーにとっては簡単です
測定/事実および寸法要件を識別します。
図 1.2 は、測定コンポーネントと寸法コンポーネントを示しています。
ビジネス上の問題。
JAD ユーザーが要件を表現する方法がわからない場合
ビジネス上の問題の形で、デザイナーは多くの場合、
収集セッションをスキップスタートするためのいくつかの例
要件。
専門のデザイナーは、ユーザーが理解できるよう支援するだけでなく、
戦略的貿易だけでなく、それをどのように形成するかについても。
要件収集アプローチについては第 3 章で説明します。のために
ここで私たちは、すべての人のためにデザインする必要性を指摘したいと思います。
BI 要件の種類
戦略的なビジネス上の問題は単なる要件ではありません
ビジネスだけでなく、デザインのヒントにもなります。答えなければならない場合
多次元の質問に対しては、暗記する必要があります。
私をプレゼントします 与えます 次元を保存する必要がある場合は、
与えます 多次元の場合は、どのような種類のテクノロジーを使用するかを決定する必要があります。
あなたが採用しようとしているテクニック。
予約済みのキューブ スター スキーマ、またはその両方を実装しますか?
ご覧のとおり、単純なビジネス上の問題であっても、
デザインに大きな影響を与える可能性があります。しかし
この種のビジネス要件は、少なくとも一般的であり、理解できるものです。
プロジェクト経験のあるデザイナーとプランナーが担当。
のテクノロジーとサポートについては十分な議論が行われてきました。
OLAPなど幅広いソリューションをご利用いただけます。今まで
簡単なレポートをまとめる必要があると述べました。
ビジネスの次元の要件と、これらの要件がどのように実現されるか
技術的なアーキテクチャ上の決定に影響を与えます。
しかし、すぐに理解できない要件は何ですか
ユーザーによるものですか、それとも DW チームによるものですか?アナリティクスが必要になることはありますか
空間(空間分析)?
の抽出モデル 与えます それらはあなたの必要な一部となるでしょう
未来?知るか?
この種のテクノロジーはあまり実用的ではないことに注意することが重要です。
一般ユーザーやチームメンバーのコミュニティで知られる
Dw、これは部分的には、彼らが通常、
社内またはサードパーティの技術専門家が対応します。それは
この種のテクノロジーが引き起こす問題の極端な例。自己
ユーザーはビジネス要件を説明したり、枠組みを構成したりすることができない
デザイナーにガイドラインを提供するために、これらは
気づかれないか、さらに悪いことに、単に無視されます。
設計者と開発者が一致しない場合、さらに問題が発生します。
これらの高度なアプリケーションのいずれかを認識できますが、
重要なテクノロジー。
デザイナーがこう言うのをよく耳にします。
別のものを手に入れるまで、それを脇に置いておきませんか?
「彼らは優先順位に本当に興味があるのか​​、それとも単に優先順位を避けているだけなのか
彼らが理解していない要件は何ですか?おそらくこれが最後の仮説です。
営業チームが要件を伝えたとします。
図 1.3 に示すように、ビジネスの
要件はビジネス上の問題の形で組み立てられます。そこには
この問題と典型的な次元問題の違いは次のとおりです。
距離。この場合、営業チームが知りたいのは、
月次ベースで、製品、倉庫、および倉庫からの総売上高
顧客 倉庫から5マイル以内に住んでいる人
彼らは買います。
残念なことに、デザイナーや建築家は単に次のことを行うことができます。
「私たちには顧客がいます。
製品と私 与えます 預金の。それまで距離を置きましょう
別の繰り返し。
"間違った答え。この種のビジネス上の問題に関する懸念事項
完全にBI。についてのより深い理解を表します。
私たちのビジネスとアナリストのための堅牢な分析スペース。
BI は、単純なクエリや標準的なレポートを超えています。
OLAPでも。これらのテクノロジーが機能しないというわけではありません。
これらは BI にとって重要ですが、それ自体では BI を表すものではありません
BI環境。
情報コンテキストに合わせたデザイン
(情報コンテンツのデザイン)
目立ったビジネス要件を特定したので、
さまざまな基本コンポーネントを図面に含める必要がある
一般的な建築。 BI のコンポーネントの一部は、
初期の取り組みのうち、一部は実装されないものもあります
数ヶ月。
ただし、既知の要件はすべて設計に反映されているため、
特定のテクノロジーを実装する必要があるとき、私たちは
それをする準備をしてください。プロジェクトの何かがその考えを反映するでしょう
伝統。
たとえば、この章の冒頭にある図 1.1 は、データを示しています。
私を保つマート 与えます 次元的な。
このセットは、 与えます 以降の使用をサポートするために使用されます。
与えます ビジネス上の問題によって引き起こされる次元の次元
私たちは特定しました。追加書類としては、
のデザイン開発など、 与えます、 我々
私のやり方を形式化していきます 与えます それらは環境中に広がります。
i を表す必要があることを確認しました。 与えます だから
(特定のニーズに応じて)次元を細分化し、
決定済み)データマート上で。
次に答えるべき質問は、どのように構築されるかです。
これらのデータマートは?
立方体を支えるために星を構築しますか、それとも立方体だけですか、それとも星だけですか?
(または正しい立方体、または正しい星)。データ アーキテクチャを生成する
すべてのアトミック層を必要とする依存マート 与えます
取得した?独立したデータマートが i を取得できるようにする 与えます
オペレーティング システムから直接?
どの Cube Technology を標準化しようとしていますか?
大量の 与えます 寸法解析に必要な
または、全国の営業部隊のキューブが必要です
毎週、それとも両方ですか?強力なアイテムを作成する
財務用 DB2 OLAP サーバーや Cognos キューブなど
あなたの販売組織またはその両方に PowerPlay を導入しますか?
これらは、アーキテクチャ設計における重要な決定事項です。
今後、BI 環境に影響を及ぼします。はい、
OLAP の必要性が確立されました。さて、それをどのように実行しますか
技術や技術の種類は?
最先端のテクノロジーがあなたの環境にどのような影響を与えるか
図面?ニーズを特定したと仮定します
組織内のスペース。今、あなたは思い出さなければなりません
計画外であっても建築図面の問題
宇宙コンポーネントを数か月間実行します。建築家はこうしなければなりません
必要なものに基づいて今すぐデザインしましょう。 ~の必要性を予測する
生成、保存、実行、提供する空間分析
へのアクセス 与えます 空間的な。これは次のように機能します。
技術の種類と仕様に関する制約
現在検討できるソフトウェア プラットフォーム。のために
たとえば、の管理システム データベース リレーショナル
アトミック レイヤーに対して実行する (RDBMS) には、
堅牢な空間拡張が可能です。これにより、
ジオメトリとオブジェクトを使用する際の最大のパフォーマンス
分析アプリケーションのスペースを確保します。 RDBMS がそうでない場合は、
私は大丈夫です 与えます (空間中心) 内部的には、次のことを行う必要があります。
安定したウナ データベース (空間中心)外部。これにより、状況が複雑になります。
問題管理が難しくなり、全体的なパフォーマンスが低下します。
あなたのために作成された追加の問題は言うまでもありません
DBA はおそらく最低限の知識しか持っていない
の拠点の 与えます 空間的にも。一方、エンジンが
RDMBS はすべての空間コンポーネントと関連するコンポーネントを処理します。
オプティマイザーは特別なニーズを認識します (たとえば、
空間オブジェクトのインデックス作成) を実行すると、DBA がそれらを処理できるようになります。
問題をすぐに管理し、問題を昇格させることができます
パフォーマンス。
さらに、ステージング領域とレイヤーを調整する必要があります。
アドレスクリーンアップを含むアトミック環境の変更 (
空間分析の重要な要素)、および以下の
スペースオブジェクトを節約します。版の連続
クリーニングの概念を導入したので、描画は続きます
住所。まず、このアプリケーションは次のタイプを決定します。
ETL の取り組みに必要なソフトウェア。
住所を取得するには Trillium などの製品が必要です
クリーン、またはそれを提供するために選択した ETL プロバイダー
機能性?
現時点では、デザインのレベルを理解することが重要です
演奏を開始する前に完了する必要があります
環境(倉庫)。上記の例は、
従わなければならない設計上の多数の決定事項を実証する
特定のビジネス要件の特定。完了したら
正しくは、これらの設計上の決定は前進します
環境の物理構造間の相互依存性、
使用する技術の選定と普及の流れ
情報コンテンツ。この従来のアーキテクチャがなければ
BI の影響を受けると、組織は混合の影響を受けることになります
既存のテクノロジーが混沌としており、せいぜいある意味で統一されている
見た目の安定性を提供するほど正確ではありません。
情報コンテンツを維持する
情報の価値を組織にもたらすには、
非常に難しい手術。十分な理解がないと
経験や適切な計画と図面、
より優れたチームは失敗するでしょう。一方、大きなサイズがある場合は、
直感と詳細な計画はあるが、規律が無い
実行、あなたはお金と時間を無駄にしただけです
なぜなら、あなたの努力は失敗する運命にあるからです。メッセージは、
明確にしてください: これらのうち 1 つ以上が欠けている場合は、
スキル、理解/経験、または計画/描画、または
実装規律を守ると、麻痺したり、
BI 組織の構築を破壊します。
あなたのチームは十分な準備をしていますか?あなたのところに誰かがいます
利用可能な膨大な分析環境を理解している BI チーム
BI 環境で必要な技術とテクノロジ
その風景を実現するには?あなたのチームに誰かがいます
高度なアプリケーションの違いを認識できる
静的レポートと OLAP、あるいは ROLAP と OLAP の違いは何ですか?の1つ
チームのメンバーは、次の方法を明確に認識しています。
抽出とそれが倉庫にどのような影響を与えるか、またはどのように影響するか
倉庫はマイニングのパフォーマンスを維持できますか?メンバー
チームのメンバーが~の価値を理解している 与えます 宇宙とかテクノロジーとか
エージェントベース?ユニークなアプリケーションを評価する人はいますか
ETL ツールとブローカー テクノロジーの比較
メッセージ?持っていない場合は、入手してください。 BI はさらに優れています
正規化された原子層、OLAP、スキームの大きな
スターとODS。
要件を認識するための理解と経験がある
BI とそのソリューションの知識は、次の能力を発揮するために不可欠です。
ユーザーのニーズとデザインを正しく形式化する
そしてそのソリューションを実装します。ユーザーコミュニティが
要件を説明するのは難しい、それはチームの仕事である
倉庫はその理解を提供します。しかし、もしチームが
倉庫
BI の特定のアプリケーション (データなど) を認識しない
マイニング - BI 環境が行う最善のこととは言えません
多くの場合、パッシブ預金に限定されます。ただし、これらは無視してください
テクノロジーはその重要性とその効果を弱めるものではありません
ビジネスインテリジェンスの可能性の出現について
組織、および設計した情報構造
促進する。
計画には図面の概念を含める必要があります。
どちらも有能な人材を必要とします。さらに、企画
チームウェアハウスの哲学と観察が必要です
規格の。たとえば、あなたの会社が
標準プラットフォーム、または特定の RDBMS を識別した場合
プラットフォーム全体で標準化したいのであれば、それが私たちの義務です
チームの全員がその基準を遵守しています。一般的には 1 つ
チームは正規化の必要性を(ユーザーに)明らかにする
コミュニテス)、しかしチーム自体は参加する気はない
社内の他の分野、あるいは場合によっては社内でも基準が確立されています。
同様の会社。これは偽善的なだけでなく、会社が次のようなことをしないことを保証します。
既存のリソースと投資を活用できます。そんな意味じゃない
プラットフォームや
標準化されていない技術。ただし、倉庫作業
彼らは会社の基準を熱心に守るべきです
ビジネス要件がそれ以外のことを指示するものではないこと。
BI の構築に必要な 3 番目の主要コンポーネント
組織とは規律です。
それは全体として、個人と環境に等しく依存します。
プロジェクト プランナー、スポンサー、アーキテクト、ユーザーは、
企業の情報構造を構築するために必要な規律。
デザイナーは、次のような方法でデザイン作業を指示する必要があります。
その他必要な社会的努力を行う。
たとえば、あなたの会社が
倉庫コンポーネントを備えた ERP アプリケーション。
したがって、ERP 設計者には、
倉庫環境チームが競合しないようにするか、
すでに開始されている作業を複製します。
規律も気を配る必要があるテーマです
組織全体によって設立され、通常は組織に委託されます。
幹部レベル。
マネージャーは計画されたアプローチに従うつもりですか?あ
情報コンテンツを作成することを約束するアプローチ
終わりは会社のあらゆる分野に価値をもたらすでしょうが、おそらく
個人または部門のアジェンダを侵害することはありますか?ことわざを思い出してください
「一つのことだけを考えるよりも、すべてを考えることが大切です。」
この格言は BI 組織にも当てはまります。
残念なことに、多くの倉庫が力を注いでいます
特定の部門をターゲットにして価値をもたらそうとする、または
組織とはほとんど関係なく、特定のユーザー
一般的な。マネージャーがチームに支援を要求したとします。
倉庫。チームは 90 日間続く仕事で応答します。
これには、によって定義された通知要件の配信だけでなく、
マネージャーですが、すべてのことを保証します 与えます ベースが層に混合されます
キューブテクノロジーに導入される前のアトミック
提案。
このエンジニアリングの追加により、以下の取り組みが確実になります。
倉庫は次のような恩恵を受けるでしょう 与えます 経営者にとって必要なもの。
しかし、同幹部は外部のコンサルティング会社と次のように話した。
4 日以内に納品される同様のアプリケーションを提案しました
数週間。
社内の倉庫チームが有能であると仮定すると、
マネージャーには選択権があります。誰が規律をサポートできるか
資産を拡大するには追加のエンジニアリングが必要
有益なビジネスを提供することも、独自のビジネスを作成することもできます
すぐに解決します。最後は本当に選ばれたようだ
あまりにも頻繁に行われ、情報コンテナを作成するだけの役割を果たします。
それは少数の人または個人だけを利益します。
短期および長期の目標
建築家とプロジェクト設計者は、
全体的なアーキテクチャと計画の長期ビジョン
BI 組織で成長します。この組み合わせは、
短期的な利益と長期的な計画
BI の取り組みの 2 つの側面を表しています。短期的な利益
期限は、作業の反復に関連する BI の側面です。
あなたの倉庫。
プランナー、建築家、スポンサーが注目するのはここです
特定のビジネス要件を満たします。このレベルでは、
物理的な構造が構築され、テクノロジーが購入され、
テクニックが実装されています。彼らはまったく対処するように作られていません
特定のユーザーコミュニティによって定義された特定の要件。
すべては特定の定義された要件に対処するために行われます
特定のコミュニティから。
ただし、長期計画は別の側面です
BIの。これは計画とプロジェクトによって確実に実現された場所です
あらゆる物理的構造、選択されたテクノロジー、および
企業を見据えて生み出された技術。そしてその
一貫性をもたらす長期計画
ビジネス上の利益がすべての人に確実に得られるようにするために必要
短期的な利益が見つかりました。
BI への取り組みを正当化する
Un データウェアハウス それ自体には固有の価値はありません。その他では
言葉で言えば、技術間に固有の価値はありません。
ウェアハウスおよび実装テクニック。
倉庫作業の価値はアクションに表れます
倉庫環境と内容に従って実行されます
時間をかけて培われた情報。これは理解すべき重要なポイントです
何らかの取り組みの価値を見積もろうとする前に、
どこの家。
建築家やデザイナーは、多くの場合、価値を適用しようとします。
倉庫の物理的および技術的コンポーネントの実際の価値は
によってプラスの影響を受けるビジネスプロセスに基づいています。
倉庫とよく入手した情報。
ここに BI を確立する際の課題があります。投資をどのように正当化するかということです。
場所自体に本質的な価値がない場合、場所の設計者は、
プロジェクトはメリットを調査、定義し、公式化する必要があります
倉庫を使用する個人によって達成されます。
特定のビジネスプロセスや価値を向上させる
保護された情報、またはその両方。
問題を複雑にするのは、あらゆるビジネスプロセスです
倉庫作業の影響を受けると利益が得られる可能性がある
「かなり」とか「わずか」とか。かなりの利点が提供されます。
投資収益率 (ROI) を測定するための具体的な指標 – 例:
たとえば、期間中に追加の在庫回転を行うなどです。
特定の、または出荷あたりのより低い送料を求めてください。それ以上です
へのアクセスの向上など、わずかな利点を定義するのは困難です。
目に見える価値という意味での情報。
プロジェクトを接続して、
業務上のご要望
プロジェクト設計者は、価値を結びつけようとすることが多すぎます。
不定形な会社目標を持つ倉庫の管理。そう宣言する
「倉庫の価値は、私たちの能力に基づいています。
戦略的要求に応えます」と喜んでオープンします。
スピーチ。しかし、それだけでは判断するのに十分ではありません。
倉庫への投資は合理的です。繰り返しをつなげた方が良い
特定の既知のビジネス リクエストを持つ倉庫の管理。
ROIの測定
倉庫設定での ROI の計算は次のとおりです。
特に難しい。利点がある場合は特に困難です
特定の繰り返しの主要な要素は、無形のものであるか、
測定が簡単です。調査によると、ユーザーは次のように認識しています
BI イニシアチブの主な利点は次の 2 つです。
▪ 意思決定を下す能力を生み出す
▪ 情報へのアクセスを作成する
これらの利点はソフト (またはマイルド) 利点です。見やすいです
確実なリード(または
より大きい)輸送コストの削減など、しかしどのように
より良い意思決定を下す能力を測定しているでしょうか?
これはプロジェクト設計者にとって間違いなく課題です。
彼らは企業に特定の企業に投資するよう説得しようとしている
倉庫の努力。売上の増加またはコストの削減
これらはもはや BI 環境を推進する中心的なテーマではありません。
代わりに、ビジネスからのアクセス要求を調べています。
特定の部門ができるように情報を提供するのが最善です。
より迅速な意思決定を行うことができます。これらは戦略的な推進力であり、
これらはたまたまビジネスにとっても同様に重要ですが、
より曖昧で、具体的な指標で特徴付けることがより困難になります。
この場合、ROI の計算は、無関係ではないにしても、誤解を招く可能性があります。
プロジェクト設計者は価値を実証できなければなりません
経営者が投資するかどうかを決定できるように具体的なものにする
特定の繰り返しが適用されます。ただし、新たな提案は行いません
ROI の計算方法についても議論しません。
それに対して。
の基本について説明した記事や書籍が数多くあります。
ROIを計算します。価値として特別な価値提案がある
Gartner などのグループが提供する、Investing (VOI) では、
研究すること。代わりに、あらゆるものの核となる側面に焦点を当てます。
ROI または考慮する必要があるその他の価値提案。
ROIの適用
「ハード」ベネフィットと「ソフト」ベネフィットの議論を超えて
BI の取り組みに関連して、考慮すべき他の問題がある
ROIを適用するとき。例えば:
今後の DW の取り組みによる節約効果が多すぎると考える
しかしながら
あなたの会社が次のようなアーキテクチャから生まれたとします。
メインフレームから分散 UNIX 環境へ。それで、どれでも
その努力によって実現されるかもしれない(または実現できないかもしれない)節約
たとえあったとしても(?)、排他的に起因すると考えるべきではありません。
倉庫。
すべてを考慮しないとコストがかかります。そして、やるべきことはたくさんあります
考慮する。次のリストを考慮してください。
 実現可能性を含む初期費用。
▪ 専用ハードウェアと関連ストレージのコスト e
コミュニケーション
▪ 管理を含むソフトウェアのコスト 与えます エド・エステニ
クライアント/サーバー、ETL ソフトウェア、DSS テクノロジー、ツール
視覚化、プログラミング、フローアプリケーション
作業および監視ソフトウェア。
▪ 構造設計コスト 与えます、実現とともに、そして
の最適化
▪ ソフトウェア開発コストは労力に直接関係します
BI
▪ 在宅サポートのコスト(最適化を含む)
ソフトウェアのバージョン管理を含むパフォーマンス
ヘルプ操作
「ビッグバン」ROI を適用します。
単一かつ巨大な取り組みとしての倉庫の構築
必ず失敗するため、取り組みの ROI も計算します
大企業のオファーは驚くべきものであり、デザイナーは
全体の価値を見積もろうとする弱い試みを続ける
努力。
デザイナーは金銭的な価値を与えようとするからです
それが広く知られ、受け入れられている場合は、ビジネス上のイニシアチブに基づいて
特定の担当者の見積もりは難しいですか?どのようにしてそれが可能でしょうか?そうではない
いくつかの例外を除いて可能です。やめてください。
計算時にやってはいけないことが決まったので、
ROI、定義する際に役立ついくつかのポイントがあります
BI の取り組みの価値を見積もるための信頼できるプロセスです。
ROI のコンセンサスの取得。あなたのこととは関係なく
BI の取り組みの価値を見積もるための手法を選択する必要があります。
プロジェクト設計者を含むすべての関係者が同意する必要があります。
スポンサーや企業幹部。
ROI を識別可能な部分に縮小します。に向けて必要な一歩
ROI の合理的な計算とは、その計算を次の点に焦点を当てることです。
特定のプロジェクト。これにより、値を推定できるようになります
満たされた特定のビジネス要件に基づいて
コストを定義します。前述したように、多くのコストが発生する必要があります。
考慮された。さらに、コストには関連コストだけを含める必要があります
単一の反復だけでなく関連コストも考慮
社内基準へのコンプライアンスを確保します。
メリットを定義します。 ROI と要件を明確に結び付ける
特定のビジネスを特定できるはずです。
要件を満たすことにつながる利点。
コストを削減し、差し迫った利益を得ることができます。それが方法です
正味現在価値に基づいて評価するのが最善です
(NPV) の将来の価値を予測しようとするのではなく、
将来の収入。
ROI を分割するタイミングは最小限に抑えてください。そして'
あなたの環境で長期間にわたって使用されてきたことが十分に文書化されています
ROI
複数の ROI 式を使用します。多くの方法があります
ROI を予測し、どちらかを使用するかを計画する必要があります。
プラス、正味現在価値、収益の内部速度を含む
(IRR) と回復。
反復可能なプロセスを定義します。これは計算する上で重要です
長期的な値。それは文書化する必要があります
すべてのプロジェクトのサブシーケンスに対して単一の反復可能なプロセス
フォローしてください。
リストされている問題は、専門家によって定義された最も一般的な問題です。
倉庫環境の様子。運営側のこだわりは、
「ビッグバン」ROI を実現するのは非常に混乱します。全てを始めれば、
ROI の計算を識別可能かつ具体的な部分に縮小することで、
正確な ROI 評価を見積もる良い機会です。
ROI のメリットに関する質問
ソフトでもハードでも、メリットが何であれ、活用できます
価値を判断するためのいくつかの基本的な質問。に
たとえば、1 から 10 までの単純なスケーリング システムを使用すると、
以下を使用して、あらゆる取り組みの影響を追跡できます。
質問:
▪ 理解度をどのように評価しますか 与えます これに続いて
あなたの会社のプロジェクトですか?
▪ 結果としてのプロセスの改善をどのように見積もりますか
このプロジェクト?
▪ 新しい洞察と推論の影響を今どのように測定しますか
この反復によって利用可能になる
▪ 新しいコンピュータ環境の影響は何ですか?
学んだことの結果としてパフォーマンスを発揮していますか?
これらの質問に対する答えが少ない場合は、次のことが考えられます。
その会社には投資に見合う価値がない。高い質問
スコアは大幅な価値の向上を示しており、
さらなる調査のためのガイドとして役立ちます。
たとえば、プロセス改善の高いスコア
設計者がプロセスがどのようなものであるかを検討できるようにする必要があります。
改善されました。得られる利益の一部またはすべてが見つかるかもしれません
それらは有形であるため、金銭的価値を容易に得ることができます。
適用済み。
最初のイテレーションを最大限に活用する
倉庫
ビジネス努力の最大の成果は、多くの場合、
最初の数回の繰り返し。これらの最初の取り組みは伝統的に
公衆にとって最も有益な情報コンテンツを確立し、
後続の技術のための技術基盤援助を確立する
BI アプリケーション。
通常、後続のすべてのサブシーケンス 与えます プロジェクトの
倉庫が会社にもたらす付加価値はますます少なくなっています
一般的な。これは、反復しない場合に特に当てはまります
新しいトピックを追加するか、新しいトピックのニーズを満たさない
ユーザーのコミュニティ。
この保存機能はバッテリーにも当てはまります
の成長 与えます 歴史家。その後の取り組みにはさらに多くのことが必要になるため、
与えます そしてさらになんと 与えます 時間の経過とともに倉庫に流し込まれますが、そのほとんどは
与えます 使用される分析との関連性が低くなります。これら 与えます 彼らは
よく呼ばれる 与えます 休眠状態であり、維持するには常に費用がかかるため、
それらはほとんど使用されません。
これはプロジェクトのスポンサーにとって何を意味しますか?本質的に、私は
最初のスポンサーは、投資にかかる費用以上の金額を共有します。
これは、レイヤーを設立するための原動力となるため、重要です。
幅広い技術環境と倉庫リソース、
オーガニックも含めて。
しかし、これらの最初のステップが最も高い価値をもたらすため、デザイナーは
多くの場合、プロジェクトの投資を正当化する必要があります。
BI への取り組み後に完了したプロジェクトにはコストがかかる場合があります
(最初のものと比較して)劣っていて直接的ですが、価値は低くなります
会社に。
そして、組織の所有者は検討を開始する必要があります
~の蓄積を捨てる 与えます 関連性の低いテクノロジーも含まれます。
データマイニング: 抽出 与える
多くのアーキテクチャ コンポーネントには、さまざまなバリエーションが必要です。
データマイニングのテクノロジーとテクニック—
たとえば、関心のあるポイントを調査するためのさまざまな「エージェント」。
顧客、会社のオペレーティング システム、および dw 自体用です。これら
エージェントは、高度なニューラル ネットワークをトレーニングすることができます。
ポットトレンド(将来の製品需要など)
販売促進。ルールベースのエンジン
セットに反応する だと 診断などの状況の説明
医療および治療の推奨事項。または単純なエージェントでも
上級管理者(トップ)に例外を報告する役割を担う
エグゼクティブ)。一般的にこれらの抽出プロセスは 与えます si
リアルタイムで検証します。したがって、彼らは団結しなければなりません
完全に動きに合わせて 与えます stessi。
オンライン分析処理 処理
オンライン分析
スライス、ダイス、ロール、ドリルダウンする機能
そして分析を実行する
what-if、スイートの範囲内、目的内である
IBMのテクノロジー。例えば、分析処理機能
DB2 にはオンライン (OLAP) が存在し、ディメンション分析を導入します。
のエンジン データベース 同じ 。
関数は SQL に次元の有用性を追加しますが、
これらは、DB2 の自然な一部であることの利点をすべて活用します。別の
OLAP 統合の例は、抽出ツール DB2 です。
OLAP サーバー アナライザー。この技術により、次のような立方体が可能になります。
DB2 OLAP サーバーを迅速かつ自動的に実行
の値を特定してレポートするために分析されます。 与えます 珍しい、または予想外の
キューブ全体をビジネス アナリストに伝えます。そして最後に、の機能
DW センターは、建築家が以下の事項をチェックする手段を提供します。
その他、一部としての DB2 OLAP サーバー キューブのプロファイル
ETL プロセスの自然な性質。
空間分析 空間分析
スペースは分析アンカー (リード) の半分を表します。
パノラマ撮影に必要な
広範な分析(時間は残りの半分を表します)。原子レベル
倉庫の(原子レベル)。図 1.1 に示されています。
時間と空間の両方の基礎が含まれます。録音
時間とアドレス情報のタイムアンカー分析
宇宙からのアンカー分析。タイムスタンプ
彼らは時間通りに分析を実施し、方向性情報が導き出します。
空間による分析。図はジオコーディングのプロセスを示しています
住所を地図上の点または空間内の点に変換する
距離や内外といった概念を表現できるように
原子レベルで行われる分析と空間分析に使用されます。
これはアナリストが利用できるようになります。 IBM は拡張機能を提供します
環境システム研究所(ESRI)と共同開発した宇宙、
al データベース DB2 では、スペース オブジェクトを
~の通常の一部として保存される データベース 関連した。 DB2
Spatial Extender は、次のすべての SQL 拡張機能も提供します。
空間分析を活用します。たとえば、次の SQL 拡張機能
についての質問
住所間の距離、またはポイントがエリアの内側か外側か
定義された多角形は、空間解析の標準です。
エクステンダー。詳細については、第 16 章を参照してください。
データベース-常駐ツールツール データベース-
レジデント
DB2 には、BI 常駐 SQL 機能が多数あり、
分析アクションで。これらには次のものが含まれます。
▪ 分析を実行するための再帰関数 (「検索」など)
~からの考えられるすべての飛行経路 サンフランシスコ a ニューヨーク"。
▪ ランキング、累積関数、キューブの分析関数
通常発生するタスクを容易にするためのロールアップ
OLAP テクノロジーを使用することでのみ、それらは今や自然な一部となっています。
のエンジン データベース
▪ 結果を含むテーブルを作成する機能
の売り手 データベース リーダーは BI 機能以上のものを組み合わせる
データベース そのもの。
主なサプライヤー データベース 彼らは以上のものを混ぜています
BI 機能 データベース そのもの。
これにより、パフォーマンスが向上し、より多くの実行オプションが提供されます。
BI ソリューション。
DB2 V8 の特徴と機能について説明します。
詳細については、次の章で説明します。
技術アーキテクチャとデータ管理の基盤
(第5章)
▪ DB2 BI の基礎 (第 6 章)
▪ DB2 マテリアライズド クエリ テーブル
表) (第 7 章)
▪ DB2 OLAP 関数 (第 13 章)
▪ DB2 Enhanced BI の特徴と機能 (Enhanced BI
特徴と機能) (第 15 章)
簡易データ配信システム
の配送システム 与えます 簡略化
図 1.1 に示されているアーキテクチャには、多数の機能が含まれています。
構造 与えます 物理的な。一つは倉庫です 与えます 運用可能。
一般に、ODS はオブジェクト指向です。
統合され、最新の状態になります。サポートする ODS を構築しますか?
たとえば、営業所。 ODSの売上が補完する 与えます
多数の異なるシステムから来ていますが、保持されるだけです。
たとえば、今日の取引。 ODSは更新可能です
一日に何度も。同時に、プロセス
彼らはそれを押します 与えます 他のアプリケーションに統合されています。この構造は、
統合するために特別に設計された 与えます 現在および動的電子
リアルタイム分析をサポートする可能性が高い候補となるでしょう。
サービスエージェントの提供方法 顧客 販売情報
売上動向情報を抽出して顧客の現状動向を把握
倉庫自体から。図 1.1 に示す別の構造は次のとおりです。
dw の正式なステータス。ここは次の場所だけではありません
必要な統合の実行、品質 与えます、および
の変換の 与えます 近々入荷予定ですが、
信頼性の高い一時的な保管場所 与えます そう答える
リアルタイム分析に使用できます。そう決めたら
ODS またはステージング領域を使用します。
これらの構造にデータを追加するための最適なツール 与えます 使用して
さまざまな操作ソースは、DB2 の異種分散クエリです。
この機能は、DB2 のオプション機能によって提供されます。
DB2 Relational Connect (クエリのみ) と DB2 経由の呼び出し
DataJoiner (アプリケーションを提供する別の製品、
挿入、更新、削除の可能性
異種分散 RDBMS)。
このテクノロジーにより、建築家は次のことが可能になります。 与えます 結ぶ 与えます di
分析プロセスを使用した生産。テクノロジーだけでなく、
事実上、あらゆるレプリケーション リクエストに適応します。
リアルタイム分析で現れるかもしれませんが、
さまざまな拠点にも接続できます 与えます より多くの
DB2、Oracle、Sybase、SQL Server、
インフォミックスなど。 DB2 DataJoiner を使用してデータを入力できます。
構造 与えます ODS やテーブルなどの形式的なもの
修復用に設計された倉庫に永久に保管されます
すぐに更新したり販売したりできます。当然、
これらと同じ構造 与えます を使用して設定できます
の複製のために設計されたもう 1 つの重要なテクノロジー 与えます、IBM
DataPropagator リレーショナル。 (DataPropagatorは別製品です)
中央システム向け。 DB2 UNIX、Linux、Windows、および OS/2 が含まれます。
レプリケーションサービス 与えます 標準機能として)。
別の移動方法 与えます 周りで活動している
to enterprise はエンタープライズ アプリケーション インテグレーター、それ以外の場合
メッセージブローカーとして知られています。これは
独自のテクノロジーにより、比類のないセンタリング制御を実現
(ターゲティング)そして移動 与えます 会社の周り。 IBMには仲介者がいる
最も広く使用されているメッセージ、MQSeries、またはそのバリエーション
の要件を含む製品の eコマース、IBM
WebSphere MQ。
MQ を活用してサポートする方法について詳しくは、
ウェアハウスと BI 環境については、こちらをご覧ください。 ウェブサイト 本の。今のところ、それは
このテクノロジーは、
キャプチャと変換 (MQSeries Integrator を使用) 与えます
BI ソリューションのために採用された中心的な (対象を絞った) オペレーター。そこには
MQ テクノロジーは UDB V8 に統合およびパッケージ化されています。
メッセージキューを管理できるようになったということです
あたかも DB2 テーブルであるかのように。溶接の概念
キューに入れられたメッセージとその世界 データベース 関係性が指示される
の強力な配信環境に向けて 与えます.
ゼロレイテンシー ゼロレイテンシー
IBM の最終的な戦略目標は、ゼロ レイテンシー (ゼロレイテンシー) 分析です。
定義どおり
Gartner、BI システムは推論、同化できなければなりません
要求に応じてアナリストに情報を提供します。チャレンジ、
もちろん混ぜ方にもありますが 与えます 現在およびリアルタイムで
必要な履歴情報 (i など) 与えます 関連モデル。
傾向、または抽出された理解を、
顧客。
このような情報には、たとえば、次のような情報が含まれます。 顧客 ad
リスクが高いか低いか、どの製品を使用するか 顧客 彼らはたくさん買うでしょう
おそらく、すでにカートにチーズが入っている場合
買収。
レイテンシをゼロにするには、実際には次の 2 つの要素に依存します。
基本的なメカニズム:
▪ の完全な結合 与えます で分析されます
BI によって作成された確立された技術とツール
▪ の配送システム 与えます それを確実にするために効率的です
リアルタイム分析が真に利用可能
ゼロ遅延のこれらの前提条件は、2 つの前提条件と変わりません。
IBM によって確立され、上記で説明した目標。
の密接な交配 与えます の一部です
IBM が手配したシームレスな統合。そしてシステムを作る
の配達の 与えます 効率は完全に依存しています
配送プロセスを簡素化する利用可能なテクノロジー
与えます。結果として、IBM の 3 つの目標のうち 2 つは重要です
3番目を作るために。 IBMは意識的に独自の開発を行っています
ユーザーにとってゼロ遅延を確実に実現するテクノロジー
倉庫の取り組み。
要約/総合
BI 組織は、次のロードマップを提供します。
自分の環境を作る
繰り返して。のニーズを反映するように調整する必要があります。
現在と未来の両方であなたのビジネスをサポートします。建築的なビジョンがなければ
幅が広く、倉庫の繰り返しはわずかに過ぎません
ほとんど効果のないランダムな中央倉庫の実装
幅広い情報を提供する企業を作成します。
プロジェクト マネージャーにとっての最初の障害は、そのプロジェクトをどのように正当化するかということです。
BI組織の発展に必要な投資。
ROI 計算は依然として重要なサポートとなっていますが、
倉庫の実績はますます困難になってきています
正確に予測します。これにより、他の方法が開発されました。
お金の価値があるかどうかを判断します。の
たとえば、投資額2 (VOI) が調達されます。
解決策として。
それは建築家の義務です 与えます とプロジェクトプランナー
意図的に情報を生成し、協会に提供する
ユーザーにサービスを提供するだけではなく、 与えます。があります
2つの間の大きな違い。情報は人が行うものです
意思決定プロセスと有効性の違い。比較的、私は
与えます それらは、その情報を導き出すための構成要素です。
たとえ私が情報源を批判していたとしても 与えます リクエストに対応するため
商用の BI 環境がより大きな役割を果たす必要がある
情報コンテンツの作成において。私たちは取らなければなりません
浄化、統合、変革、または
それ以外の場合は、それに応じて情報コンテンツを作成します。
ユーザーはアクションを起こすことができるので、それらが確実に行われるようにする必要があります。
合理的な場合には、行動と決定が支持される
BI 環境で。倉庫を次のサービスのみに限定すると、 与えます,
ユーザー協会がコンテンツを作成することが保証されています
行動を起こすために必要な情報。これにより、
コミュニティはより適切な意思決定を行えるようになりますが、企業は
彼らは利用した知識の不足に苦しんでいます。
ダト 建築家とプロジェクトプランナーがプロジェクトを開始すること
BI 環境に特有のものであるため、企業に対して引き続き責任を負います
概して。この 2 つの機能の簡単な例
BI 反復の面がソース内に見つかります 与えます。 全ての
与えます 特定の商業的要求のために受け取ったものでなければなりません
最初の原子層に存在します。これにより、次のような開発が確実に行われます。
企業情報の資産を管理、管理するとともに、
反復で定義されたユーザー固有のリクエスト。

データ ウェアハウスとは何ですか?
データウェアハウス それは情報システムアーキテクチャの中心です
1990年の創業以来、確かなサービスで情報プロセスをサポート
統合プラットフォーム 与えます 歴史家はその後の歴史の基礎として採用された
分析。ザ データウェアハウス への統合が容易になります。
相互に互換性のないアプリケーション システムの世界。日付
ウェアハウスはトレンドへと進化しました。 データウェアハウス
私を整理して保管する 与えます 情報処理に必要な
長い歴史的時間的観点に基づいた分析。全て
これには、建設と
のメンテナンス中 データウェアハウス.
それで、とは何ですか データウェアハウス? A データウェアハウス です:
▪ 主題指向
▪ 統合システム
▪ バリアントタイム
▪ 不揮発性 (消去不可)
のコレクション 与えます 経営上の意思決定をサポートするために使用されます
プロセスの実装。
I 与えます に挿入された データウェアハウス ほとんどの場合に発生します
運用環境からのケース。の データウェアハウス それは一人で作られています
残りの部分から物理的に分離されたストレージユニット
システム、これには以下が含まれます 与えます 以前に変換された
環境から得られる情報を操作するアプリケーション
運用可能。
の文字通りの定義 データウェアハウス 徹底的な研究に値する
重要な動機と意味があるので説明します。
倉庫の特徴を説明する背景。
被写体の向き 向き
テーマ別
の最初の特徴は、 データウェアハウス に向けられているということです
企業の主要なプレーヤー。試練を乗り越えるガイド
与えます これは、提供されるより古典的な方法とは対照的です。
プロセスと機能に対するアプリケーションの方向性、
ほとんどの人が共有する方法
古い管理システム。
運用世界はアプリケーションと機能を中心に設計されています
ローン、貯蓄、銀行カード、機関の信託など
金融。 dw の世界は主題に基づいて構成されています
顧客、販売者、製品、ビジネスなどの主体。
トピックの調整はデザインに影響を与え、
の実現について 与えます dwで見つかりました。さらに重要なことには、
メイントピックはその最も重要な部分に影響を与えます
キー構造。
アプリケーションの世界は、データの設計の両方の影響を受けます。
プロセス設計に基づいています。の世界
dw はモデリングのみに焦点を当てています。 与えます と上
の図面 データベース。プロセスの設計(その形式)
classic) は dw 環境の一部ではありません。
プロセス/機能の選択とアプリケーションの違い
科目による選択も内容の違いとして現れる
与えます 細かいレベルで。ザ 与えます dw には i は含まれません 与えます その
アプリケーションの実行中は DSS プロセスには使用されません。
運用指向 与えます 私を含む 与えます 満たすため
機能/処理要件をすぐに実現できます。
DSS アナリストの用途はほとんどありません。
運用指向アプリケーションのもう 1 つの重要な方法
ai 与えます 異なり 与えます DWのはデイレポートにあります 与えます。 私は 与えます
運用上、2 つ以上のテーブル間の継続的な関係を維持します。
アクティブなビジネス ルールに基づいて。ザ 与えます 作者: dw
それらは時間の範囲にまたがっており、dw で見られる関係は次のとおりです。
多くの。多くの取引ルール (およびそれに応じて多くの取引ルール)
の報告 与えます ) の倉庫に表示されます。 与えます 二人の間で
複数のテーブル。
(両者の関係について詳しく説明すると、 与えます 彼らは
DW で処理される場合は、その技術トピックを参照してください。
質問。)
差異という観点以外にない
機能/プロセスアプリケーションの選択と
主題の選択により、システム間の差異が大きくなります
運用上のEI 与えます そしてDW。
統合 統合
dw 環境の最も重要な側面は、 与えます 見つかった
dw 内では簡単に統合できます。いつも。それなし
例外。 dw 環境の本質は次のとおりです。 与えます
倉庫の制限内に含まれるすべてのものが統合されます。
統合はさまざまな方法で、つまり慣習的に明らかになります。
一貫性のある変数の測定において、一貫性があると特定される
物理的属性で構成される成文化された構造。 与えます
一貫性があるなど。
長年にわたり、さまざまなアプリケーションの設計者はそうしてきました。
アプリケーションがどうあるべきかについて多くの決定権を持っている
開発される。個別のスタイルとデザインの決定
デザイナーのアプリケーションは、さまざまな方法で自分自身を明らかにします。
コーディングの違い、キーの構造、物理的特性、
規約の特定など。多くの人々の総合的な能力
アプリケーション設計者が一貫性のないアプリケーションを作成する
それは伝説的です。図 3 は、その他の相違点のいくつかを示しています
アプリケーションの設計方法において重要です。
エンコーディング: エンコーディング:
アプリケーション設計者はフィールドコーディングを選択しました –
セックス - さまざまな方法で。デザイナーはセックスを次のように表現します
「m」と「f」。別のデザイナーは性別を「1」で表現
そして「0」。別のデザイナーは性別を「x」で表現し、
「よ」。別のデザイナーは性別を「男性」として表現し、
"女性"。 DW に性別がどのように含まれるかはあまり重要ではありません。彼ら"
と「F」はおそらくすべてと同じくらい優れています
表現。
重要なのは、セックスの分野がどのような起源から来たのかということです。
そのフィールドは、一貫した統合状態で DW に到着します。から
フィールドが DW に読み込まれるときの結果
形式で表現されたアプリケーション
「M」と「F」、私 与えます DW 形式に変換する必要があります。
属性の測定: の測定
属性:
アプリケーション設計者は、パイプラインを測定することを選択しました。
コースではさまざまな方法で
何年か。デザイナーが保管するのは、 与えます のパイプラインの
センチメートル。別のアプリケーション設計者が 与えます
パイプラインのインチ単位。もう一人のデザイナーは、
アプリケーションストアi 与えます パイプラインの単位: 100 万立方フィート
毎秒。そして別のデザイナーがその情報を保存します
ヤード単位のパイプライン。ソースが何であれ、
パイプライン情報は DW に到着します。
同じように測定します。
図 3 の兆候によると、統合の問題は次のとおりです。
それらはプロジェクトのほぼすべての側面、つまり機能に影響を与えます。
物質的な神々 与えます、複数の情報源を持つことのジレンマ 与えます
一貫性のない識別されたサンプルの問題、フォーマット 与えます
矛盾しているなど。
デザインのテーマが何であれ、結果は同じです –
i 与えます 単数形の e で DW に保存する必要があります。
システムが動作している場合でも、世界的に受け入れられる方法
一番下の部分では保存方法が異なります。 与えます.
DSS アナリストが DW に注目するとき、アナリストの目的は
それは搾取であるべきだ 与えます 倉庫にあるものは、
信頼性や一貫性について疑問を抱くのではなく、
与えます.
時間の変動
すべて 与えます DW では、ある時点までは正確です。
この基本的な特徴は、 与えます DWではそれとは大きく異なります 与えます
動作環境で見つかりました。ザ 与えます 動作環境は
アクセスした瞬間と同じくらい正確です。言い換えると、
動作環境でのドライブアクセス時 与えますだけでなく、
アクセス時の正確な値が反映されるまで待ちます。
なぜ私 与えます DW 内の精度は、ある時点と同じくらい正確です。
時間(つまり、「今」ではない)、私はと言われます 与えます DWで見つけた
それは「時間の差異」です。
の時間変動 与えます by DW はさまざまな方法で参照されます。
最も簡単な方法は、私が 与えます DW を表す 与えます
長い期間 - 5 年から 10 年。地平線
動作環境で表される時間枠ははるかに短い
▪ 今日の現在の値から最大 690 まで
適切に動作する必要があり、適切に動作する必要があるアプリケーション
トランザクション処理に利用できるものは、
最低数量の 与えます 彼らがある程度のことを認めるなら
柔軟性。したがって、運用アプリケーションには将来性がある
短いタイムスケール、設計トピックとして
オーディオアプリケーション。
DW に「時間分散」が現れる 2 番目の方法は、
キー構造。 DW 内の各キー構造には次のものが含まれます。
暗黙的または明示的に、次のような時間の要素
日、週、月など。時間の要素はほとんど常に存在します
DW で見つかった連結キーの下部にあります。これらの中で
機会、時間の要素は偶然のように暗黙的に存在します。
月または四半期の終わりにファイル全体が複製される場合。
時間分散を表示する 3 番目の方法は、 与えます インクルード
DW は、正しく登録されてもすぐには登録できません。
更新しました。ザ 与えます DW の部分は実際には長いものです
一連のスナップショット。もちろん、スナップショットがある場合は、
間違って撮影された場合、スナップショットは
変更されました。ただし、スナップショットが取得されていると仮定すると、
正しくは、作成後すぐに変更されるわけではありません。一部では
場合によっては、スナップショットを
DWは修正されています。ザ 与えます 操作可能、次のように正確である
ログインの瞬間、随時更新可能
必要なもの。
不揮発性
DW の 4 番目の重要な特性は、不揮発性であることです。
更新、挿入、削除、変更が行われる
レコードごとの運用環境に対して定期的に実行します。しかし
基本的な操作 与えます DW で必要とされるものはさらに多くあります
単純。で発生する操作は 2 種類だけです。
DW – の初期ロード 与えます そして、へのアクセス 与えます。 存在しない
の更新はありません 与えます (一般的な意味で
update) を通常の処理操作として DW で実行します。
この違いには非常に強力な影響がいくつかあります
運用処理と DW 処理の間の基礎。レベルで
仕様上、アップグレードには注意が必要です
の更新以来、異常は DW の要因ではありません。 与えます そうではない
実施した。これは、物理設計レベルで、
へのアクセスを最適化するために自由が取られる場合があります。 与えます,
特に標準化や
物理的な非正規化。シンプルさがもたらすもう一つの結果
DW の業務の大半は、以下に使用される基盤テクノロジーにあります。
DW環境を実行します。アップデートをサポートする必要がある
インラインでレコードごとに (よくあることですが)
演算処理)技術には、ある程度の技術が必要です。
見た目のシンプルさの下に、非常に複雑な基盤が存在します。
バックアップとリカバリ、トランザクションをサポートするテクノロジー
と誠実さ 与えます デッドロック状態の検出と修復は、
非常に複雑であり、DW 処理には必要ありません。
DWの特徴、デザインの方向性、
の統合 与えます DW 内、時間の変化、シンプルさ
の管理の 与えます、すべてが非常に非常に優れた環境につながります。
従来の動作環境とは異なります。ほぼすべてのソース
与えます DWの動作環境です。考えたくなります
大規模な冗長性があること 与えます 2 つの環境の間で。
実際、多くの人が抱く第一印象は、
大きな冗長性 与えます 動作環境と環境の間
D.W.このような解釈は表面的であり、次のことを示しています。
DW で何が起こっているかを理解していない。
実際には最小限の冗長性があります 与えます 動作環境間
与えます DWの。次のことを考えてみましょう。
▪ 私は 与えます 彼らはフィルタリングされています だと 動作環境から伝わるもの
DW環境へ。多くの 与えます 彼らは決して外を通らない
動作環境から。それを除いて、私は 与えます に必要なもの
DSS 処理は環境内での方向性を見つけます
▪ 時間軸 与えます 環境とは大きく異なります
もう一方へ。ザ 与えます 動作環境では非常に新鮮です。ザ 与えます
DWでは彼らはずっと年上です。ただの視点から
時間軸上、重複する部分はほとんどありません
動作環境とDWの間。
▪ DW には以下が含まれます 与えます 決して見つからない要約
環境中の
▪ 私は 与えます ~から根本的な変革を受ける
図 3 に移行した瞬間に、ほとんどのことがわかります。
一部の 与えます 著しく状態が変化している
を選択して DW に移動します。別の言い方をすると、
たいていの 与えます 物理的に改造されていて、
それが DW にどのように移動されるかについて根本的に説明します。観点から見ると
統合の違いは同じではありません 与えます 誰が住んでいますか
動作環境では。
これらの要因を考慮すると、 与えます 2 つの環境の間にあるのは
まれなイベントであり、1 つの間の冗長性は XNUMX% 未満になります
環境。
倉庫の構造
DW は独特の構造を持っています。要約にはさまざまなレベルがあり、
DW を区切る詳細。
DW のさまざまなコンポーネントは次のとおりです。
▪ メタデータ
与える 現在の詳細
与える 古い詳細の
与える 少しまとめた
与える 高度に要約された
これまでのところ主な懸念は、 与えます 細部の
流れ。これが主な懸念事項である理由は次のとおりです。
▪ 私は 与えます 現在の詳細は最新の出来事を反映しています。
それらは常に大きな関心を集めており、
▪ 私は 与えます 現在の詳細はボリュームがあるため、
最低レベルの粒度で保存されます。
▪ 私は 与えます 現在の詳細はほとんどの場合次の場所に保存されます。
ディスク ストレージ。アクセスは簡単ですが、高価で、
からのコンプレックス
I 与えます 年齢が高くなるほど詳細がわかる 与えます に保存されているもの
のいくつかの記憶 マッサ. アクセスは散発的であり、
~と互換性のある詳細レベルで保存される 与えます 詳しいです
流れ。媒体に保存することは必須ではありませんが、
大量のデータが存在するため、代替ストレージ 与えます と団結した
散発的なアクセス 与えます、メモリサポート 与えます di
通常、古い詳細はディスクに保存されません。
I 与えます 少し要約すると、 与えます 底から蒸留されるもの
現在の詳細レベルで見つかった詳細レベル。これ
DW レベルは、ほとんどの場合、ディスク ストレージに保存されます。ザ
建築家に生じる設計上の問題 与えます
このレベルの DW の構築には次のものがあります。
▪ 上記の要約はどのような時間単位で行われますか
▪ どのコンテンツ、属性が内容を少し要約するか
の内容 与えます
次のレベルの 与えます DW で見つかったのは、 与えます 高く
概要。ザ 与えます 高度に要約されたものはコンパクトで簡単です
アクセス可能。ザ 与えます 高度に要約されたものが時々見つかる
DW 環境や他の場合には 与えます 高度に要約されたものは、
DW を収容するテクノロジーのすぐ外にあります。
(いずれにせよ、私は 与えます 高度に要約されたものは DW の一部です
私がどこにいても 与えます 物理的に収容されています)。
DW の最後のコンポーネントはメタデータです。多くの点で
メタデータは他のメタデータとは異なる次元に存在します 与えます
メタデータには何も含まれていないため、DW の だと 直接に
動作環境から取得。メタデータには特別な役割があります。
DWでは非常に重要です。メタデータは次のように使用されます。
▪ DSS アナリストが
DWの内容、
▪ マッピングのガイド 与えます 私がどうやって 与えます あった
運用環境からDW環境への移行、
▪ 間の要約に使用されるアルゴリズムのガイド 与えます di
現在の詳細 与えます 少し要約すると、私は 与えます 高く
要約、
メタデータは DW 環境でより大きな役割を果たします
これまでの運用環境よりも
古い詳細記憶媒体
磁気テープはそのようなものを保存するのに使用できます
与えます。実際には、さまざまなストレージツールがあります。
古いものを保存するために考慮されるべきです 与えます di
詳細。
の量に応じて、 与えます、アクセス頻度、コスト
ツールとアクセスの種類を考慮すると、その可能性は十分にあります。
他のツールには古いレベルの詳細が必要になること
DWで。
データの流れ
正常かつ予測可能な流れがあります。 与えます DWの中。
I 与えます 彼らは動作環境から DW に入ります。 (注:
このルールには非常に興味深い例外がいくつかあります。ただし、ほぼ
tutti i 与えます 動作環境から DW に入ります)。 ダト その 与えます
動作環境から DW に入ると、そのまま変換されます。
前に説明した。 DWに入る条件で、i 与えます 彼らはそこに入ります
示されているように、現在の詳細レベル。そこに存在し、使用されます
3 つのイベントのいずれかが発生するまで:
▪ 浄化され、
▪ 要約されている、および/または
▪ は
DW 内の廃止されたプロセスが移動します 与えます 現在の詳細
a 与えます 年齢に基づいた古い詳細の 与えます。プロセス
概要では詳細を使用します 与えます 私を計算するには 与えます
わずかに要約されたレベルと高度に要約されたレベル 与えます。 がある
示されているフローにはいくつかの例外があります (後で説明します)。
ただし、通常、大多数の場合、 与えます 見つかった
DW内では、 与えます それは描かれているとおりです。
データウェアハウスの使用
驚くことではないが、さまざまなレベルの 与えます DW内ではない
さまざまなレベルの使用を受けます。原則としてレベルが高くなるほど、
要約と私 与えます それらは使用されています。
多くの用途が発生します 与えます 非常に要約されていますが、古いものは
与えます 詳細はほとんど使用されません。それには十分な理由があります
組織をリソース活用のパラダイムに移行します。彼が持っているものが多ければ多いほど、
要約i 与えますに到達するのがより速く、より効率的になります。 与えます。 自分自身
un ショップ DW 詳細レベルで多くの処理を実行していることがわかります。
対応する大量のマシン リソース
消費される。起訴することが全員の最善の利益となる
できるだけ早く高レベルの要約を作成します。
多くのショップでは、DW 以前の環境の DSS アナリストが
与えます 詳細レベルで。多くの点で、 与えます 詳しいです
利用可能な場合でも、それはセキュリティブランケットに似ています
他のレベルの概要。建築家の活動の一つ 与えます è
DSS ユーザーを継続的な使用から遠ざける 与えます 最高レベルで
詳細が低い。考えられる理由は 2 つあります
の建築家の 与えます:
▪ エンドユーザーが料金を支払うチャージバック システムを導入する。
消費されるリソース
▪ 応答時間が非常に優れていることを示します。
i との動作のときに取得されます 与えます それは高いレベルにある
要約すると、応答時間が遅いのは、
の行動 与えます 低いレベルで
その他の考慮事項
他にも建設および管理に関する考慮事項がいくつかあります
DW。
最初に考慮するのはインデックスです。ザ 与えます 最高レベルの
要約には自由にインデックスを付けることができますが、 与えます
より低い詳細レベルでは、可能な限りかさばります
倹約的にインデックスされています。同じことから、私は 与えます 高いレベルで
細部は比較的簡単に改修できますが、
一方、のボリューム 与えます 低いレベルでは非常に大きいので、 与えます 更新不
簡単に改修できます。したがって、モデルは
与えます そして、デザインポーズによって行われる正式な作業は、
ほぼレベルのみに適用される DW の基礎
現在の詳細。つまり、モデル活動は、
与えます ほとんどの場合、要約レベルには適用されません。
もう 1 つの構造上の考慮事項は、
与えます DW著。
パーティションは 2 つのレベルで実行できます。 DBMS
アプリケーションレベル。レベルの部門では DBMSDBMS è
部門に通知され、それに応じて監視されます。の場合
アプリケーションレベルでの分割、プログラマのみが担当
部門とその責任について知らされる
行政は彼に任されている
レベル以下 DBMS、多くの作業が自動的に行われます。がある
の自動管理に伴う多くの柔軟性の低下
部門。アプリケーションレベルでの分割の場合 与えます インクルード
データウェアハウス、プログラマーには多くの仕事がのしかかりますが、
最終的な結果は、管理における柔軟性です。 与えます デートの中で
倉庫
アルトレ・アノマリー
一方、のコンポーネントは、 データウェアハウス 説明どおりに機能します
ほぼすべての人にとって 与えます、いくつかの便利な例外があります。
議論されるだろう。例外は、 与えます 公開概要
(公開概要データ)。これらは 与えます だった要約
から計算される データウェアハウス しかし、それらは社会によって利用されます。ザ 与えます
公開概要は次の場所に保存および管理されます。 データウェアハウス,
ただし、前述したように、それらは計算されます。ザ
会計士はこれらを四半期ごとに作成するよう努めています 与えます として
収入、四半期の支出、四半期の利益など。作品
会計士が行うことは社外である データウェアハウス。 しかし、私は 与えます 彼らは
社内で「内部」で使用される – から マーケティング、販売など。
もう一つの異常は、議論されませんが、 与えます 外部。
もう一つの例外的な種類の 与えます それは与えられた場所で見つけることができます
ウェアハウスは永続的な詳細データのウェアハウスです。これらが原因で、
私を永久に保存する必要がある 与えます あるレベルで
倫理的または法的理由から詳細が説明されています。企業が出展している場合
危険物質に関連する労働者には、 与えます
詳細かつ永続的。企業が次のような製品を製造した場合、
公安に関係すること、飛行機のどの部分に関係すること、
の必要性 与えます 詳細な永久、および会社の場合
危険な契約を結ぶ。
社会は細部を見逃すわけにはいかない。
今後数年間に、訴訟、リコール、
施工上の瑕疵問題など会社の露出
それは大きいかもしれない。その結果、独特の種類のものが生まれます 与えます
永続的な詳細データとして知られています。
概要
Un データウェアハウス オブジェクト指向で統合された、の変形です。
時間、コレクション 与えます のニーズをサポートする不揮発性
行政の決定。それぞれの重要な機能は、
un データウェアハウス にはその意味合いがあります。さらに4つあります
のレベル 与えます インクルード データウェアハウス:
▪ 古い詳細
▪ 現在の詳細
与える 少し要約した
与える 高度に要約された
メタデータも重要な部分です。 データウェアハウス.
抽象的な
ストレージの概念 与えます 最近受け取った
非常に注目を集め、90年代のトレンドとなりました。
の容量により、 データウェアハウス それらを克服するために
i などの管理支援システムの制限
意思決定支援システム (DSS) と情報システム
エグゼクティブ (EIS)。
という概念があっても、 データウェアハウス 有望に見えますが、
私を実装します データウェアハウス ~によって問題が生じる可能性がある
大規模な倉庫保管プロセスの。かかわらず
倉庫プロジェクトの複雑さ 与えます、多くのサプライヤー
および倉庫コンサルタント 与えます 彼らはそれを主張します
の保管 与えます 電流は問題を引き起こしません。
しかし、この研究プロジェクトの開始時点では、ほとんど誰も
独立した、厳密かつ体系的な研究が実施されました。から
したがって、実際に何が起こるかを言うのは難しい
製造時に業界で データウェアハウス.
この研究では、倉庫保管の実践について調査しました。 与えます
より豊かな理解を目指す現代人
オーストラリアの実践の様子。文献分析により、
実証研究の背景と基礎。
この研究からは多くの発見があります。初め
この研究により、発生した活動が明らかになりました。
の開発中に データウェアハウス。多くの分野で、私は 与えます 集まった
文献で報告されている実践を確認しました。第二に
サイト、問題に影響を与える可能性のある問題
開発 データウェアハウス この研究によって特定された。
最後に、オーストラリアの組織から得られる利益は、
の使用 データウェアハウス が明らかになった。
第1章
研究の背景
データ ウェアハウジングの概念は広く認識されています
露出が増加し、新たなトレンドとなっています。
90年代 (マクファーデン 1996、TDWI 1996、シャーとミルシュタイン 1997、
シャンクスら1997 年、エッカーソン 1998 年、アデルマンとオーツ 2000 年)。あれは
データに関する記事の数が増えていることからもわかります
業界出版物の倉庫保管 (Little and Gibson 1999)。
多くの論文 (例: Fisher 1995、Hackathorn 1995、
モリス 1995a、ブランブレットとキング 1996、グラハムら。 1996年
坂口とフロリック 1996 年、アルバレス 1997 年、ブルセル 1997 年、クラーク
1997、マッカーシー 1997、オドネル 1997、エドワーズ 1998、TDWI
1999) は、組織から得られる大きな利益を報告しています。
それは私を実装します データウェアハウス。彼らは自分たちの理論を支持した
導入が成功したという逸話的な証拠により、高い収益が得られます。
投資数値 (ROI) に関する情報とガイダンスの提供
開発のための参考文献や方法論 データウェアハウス
(Shanks et al. 1997、Seddon と Benjamin 1998、Little と Gibson
1999年)。極端なケースでは、Graham ら。 (1996) 持っています
は、401 年間の投資に対する平均収益率が XNUMX% であると報告しました。
しかし、現在の文献の多くは、
このようなプロジェクトの実施に伴う複雑さ。のプロジェクト
データウェアハウス 通常、それらは複雑かつ大規模であり、
したがって、そうでない場合は失敗する可能性が高いことを意味します。
注意深く管理されている (Shah および Milstein 1997、Eckerson 1997、
フォーリー 1997b、ジマー 1997、ボルト 1998、ギブスとクライマー 1998、ラオ
1998)。膨大な人材とリソースが必要です
財政的、そしてそれらを構築するための時間と労力 (Hill 1998、Crofts 1998)。の
通常の時間と必要な経済的手段はそれぞれ
約 1995 年と XNUMX ~ XNUMX 万ドル (Braly XNUMX、Foley)
1997b、Bort 1998、Humphries et al. 1999年)。この時代と手段
金融機関は多くの側面を管理し、統合することが求められています
データウェアハウジングの違い (Cafasso 1995、Hill 1998)。側面上
ハードウェアとソフトウェアの考慮事項、その他の機能(さまざまな)
の抽出から 与えます のロードプロセスに 与えます、から
アップデートとメタデータを管理するためのメモリ容量 与えます
ユーザートレーニングのために考慮する必要があります。
この研究プロジェクトが始まった時点では、ほとんど何もありませんでした。
データウェアハウジングの分野で行われる学術研究、
特にオーストラリアでは。それは物資の不足からも明らかだった
新聞またはその他の著作物によってデータ ウェアハウスに掲載される
当時の学者。学術論文の多くは
米国の経験を説明した情報が入手可能です。の欠如
sl データ ウェアハウジングが原因となった分野の学術研究
厳密な調査と実証的研究を求める (McFadden 1996,
シャンクスら1997 年、リトルとギブソン 1999 年)。特に、研究は、
の実施プロセスに関する研究 データウェアハウス
知識を広げるために実行する必要がある
の実装に関する一般的な データウェアハウス e
将来の研究研究の基礎として機能します(シャンクス編)
その他。 1997 年、リトルとギブソン 1999 年)。
したがって、この研究の目的は、実際に何が起こるかを研究することです。
組織がデータを維持および使用するときに発生します
オーストラリアの倉庫。具体的には、この研究には以下が含まれます:
開発プロセス全体の分析 データウェアハウス,
開始と計画から始まり、デザインと
組織内での導入とその後の使用
オーストラリア人。さらに、この研究は現在の実践にも貢献します
実践をさらに発展させることができる領域を特定する
改善され、非効率性とリスクが最小限に抑えられるか、
避ける。さらに、それは他の研究の基礎としても役立ちます。 データウェアハウス in
オーストラリアは、文献に現在存在するギャップを埋めるでしょう。
研究の質問
この研究の目的は、関連する活動を研究することです。
の実装において データウェアハウス およびそれらの使用
オーストラリアの組織。特に要素が研究されています
プロジェクトの企画、開発に関して、
操作、使用、およびそれに伴うリスク。それで質問は
この研究の内容は次のとおりです。
「現在行われているのはどのようなものか データウェアハウス オーストラリアで?"
この問題に効果的に対応するには、
一定数の補助的な研究質問。特に3つ
副次的な質問が文献から特定されています。
この研究プロジェクトをガイドするために、第 2 章で説明されています。
それらがどのように実装されるか データウェアハウス 組織による
オーストラリア人?どのような問題に遭遇しましたか?
体験したメリットは何ですか?
これらの質問に答えるために、図面が使用されました
アンケートを利用した探索的研究。私の勉強方法
探索的なものであり、上記の質問に対する答えは完全ではありません
(Shanks et al. 1993、Denscombe 1998)。この場合、それは、
これらへの応答を改善するには、三角測量が必要です
リクエスト。しかし、この調査は強固な基盤を提供することになるだろう。
これらの疑問については今後の課題として検討していきます。詳しいもの
研究方法の正当性と設計についての議論
第3章で紹介されています。
研究プロジェクトの構造
この研究プロジェクトは 2 つの部分に分かれています: 文脈研究
データ ウェアハウジングの概念と実証的研究 (を参照)
図 1.1)、それぞれについては以下で説明します。
パート I: 文脈の研究
研究の最初の部分は、
さまざまなタイプのデータ ウェアハウジングに関する最新の文献
意思決定支援システム (DSS)、情報システム
エグゼクティブ (EIS)、のケーススタディ データウェアハウス そして日付の概念
倉庫。さらに、フォーラムの結果は、 データウェアハウス
のグループによって開催される専門家および専門家のための会議グループ
Monash DSS 研究、研究のこの段階に貢献
データの実践に関する情報を取得することを目的としたもの
倉庫を管理し、その導入に伴うリスクを特定します。
この文脈学習の期間中、理解
問題領域の知識を提供するために確立されました。
その後の実証的調査の基礎となる。ただし、これは
それは研究が行われている間進行中のプロセスでした
研究。
パート II: 実証研究
データ ウェアハウジングの比較的新しい概念、特に
オーストラリアでは、調査を実施する必要性が生じました。
使用体験の全体像を把握します。これ
問題のドメインが解決されてから部分が実行されました。
広範な文献調査を通じて確立されました。コンセプト
コンテキスト調査フェーズ中に形成されたデータ ウェアハウジングの割合は、
この研究の最初のアンケートの入力として使用されました。
この後、アンケート調査を行った。あなたはデートの専門家です
倉庫はテストに参加しました。試験の目的
最初のアンケートは完全性と正確性を確認するためのものでした
いくつかの質問。テスト結果に基づいて、アンケートは次のとおりです。
が変更され、変更されたバージョンが送信されました。
調査参加者。その時に返されたアンケートは、
私のために分析されました 与えます 表、図、その他の形式で。ザ
の分析結果 与えます ~のインスタント写真を形成する
オーストラリアにおけるデータウェアハウスの実践。
データ ウェアハウスの概要
データ ウェアハウジングの概念は改良を加えて進化しました
コンピューター技術のこと。
グループが遭遇する問題を克服することを目的としています。
意思決定支援システム (DSS) などのアプリケーション サポート
経営情報システム (EIS)。
これまで、これらのアプリケーションの主な障害は次のとおりでした。
これらのアプリケーションは、 データベース
分析に必要なもの。
これは主に仕事の性質によって引き起こされます
管理。企業経営者の関心はさまざまです
常に治療領域に応じて異なります。だらか、私 与えます
これらのアプリケーションの基本的な機能は、次のことができる必要があります。
施術部位に応じて素早く切り替えます。
つまり、私は 与えます 形式で利用できる必要があります
必要な分析には十分です。実際、その支援団体は、
アプリケーションの収集はこれまで非常に困難でした
統合 与えます 複雑で多様なソースから。
このセクションの残りの部分では、概念の概要を説明します。
データ ウェアハウジングとその方法を扱います。 データウェアハウス を克服できる
アプリケーション サポート グループの問題。
用語 "データウェアハウス』は1990年にウィリアム・インモンによってリリースされました。
彼の頻繁に引用される定義によれば、 データウェアハウス 来ます
コレクション 与えます 主題指向、統合型、不揮発性、可変型
長期にわたり、経営上の意思決定をサポートします。
この定義を使用すると、Inmon は次のことを強調します。 与えます 住民
データウェアハウス 以下の4つを備えている必要があります
caratteristiche:
▪ 主題指向
▪ 統合された
▪ 不揮発性
▪ 時間の経過とともに変化する
主題指向の印門とは、私が 与えます デートの中で
これまでで最大の組織領域にある倉庫
モデルで定義された 与えます。たとえば全部 与えます 私について 顧客
主題領域に含まれています 顧客。皆も同様に
与えます 製品に関する内容が主題領域に含まれている
製品。
統合された印門とは、私が意味するものです。 与えます 違うところから来ている
プラットフォーム、システム、場所が結合され、保存されます。
単一の場所。結果として 与えます 同様のものは変換する必要があります
一貫した形式で追加および比較できるようにする
簡単に。
たとえば、男性と女性の性別が表現されます。
あるシステムでは文字 M と F で表され、別のシステムでは 1 と 0 で表されます。のために
それらを正しい方法で統合するには、一方または両方のフォーマットが必要です
2 つの形式が同じになるように変換する必要があります。この中で
この場合、M を 1 に、F を 0 に、またはその逆に変更できます。に向けて
subject と Integrated は、 データウェアハウス のために設計されています
~の機能的かつ横断的なビジョンを提供する 与えます さておき
会社。
不揮発性とは、次のことを意味します。 与えますデータウェアハウス 残ります
一貫性と更新性 与えます それは必要はありません。代わりに、すべての
変化する 与えます オリジナルが追加されます データベース 日付の
倉庫。これは、歴史的なデイを意味します。 与えます に含まれています
データウェアハウス.
時間を持つ変数の場合、Inmon は次のことを示します。 与えますデータウェアハウス
常に ei 時間インジケーターが含まれます 与えます 通常は
ある時間軸を越える。たとえば、
データウェアハウス 5 年分の履歴値を含めることができます 顧客 XNUMX月
1993 年から 1997 年までの歴史と時系列の入手可能性
与えます 傾向を分析できます。
Un データウェアハウス 彼は自分のものを集めることができる 与えます システムから
OLTP;起源から 与えます 組織外部および/または他の専門家による
システムプロジェクトのキャプチャ 与えます.
I 与えます 抽出物は洗浄プロセスを経ることができます。
この場合私は 与えます それらは変換され、統合されてから、
に保存されている データベース インクルード データウェアハウス。その後私は 与えます
内の住民 データベース インクルード データウェアハウス 利用可能になります
エンドユーザーのアクセスおよび回復ツールに。使用する
エンドユーザーが統合ビューにアクセスできるこれらのツール
の組織の 与えます.
I 与えます 内の住民 データベース インクルード データウェアハウス 彼らは
詳細形式と概要形式の両方で保存されます。
要約のレベルは、要約の性質によって異なる場合があります。 与えます。 私は 与えます
詳細は以下で構成されます 与えます 現在および 与えます 歴史家
I 与えます ロイヤルティは含まれていません データウェアハウス 私まで 与えます
データウェアハウス が更新されます。
保管するだけでなく、 与えます 彼ら自身、 データウェアハウス こともできます
別の種類の~を保管する だと METADATAと呼ばれる
私を説明してください 与えます 彼の家の住人 データベース.
メタデータには、開発メタデータと開発メタデータの 2 種類があります。
分析。
開発メタデータは、
抽出、クリーニング、マッピング、ロードのプロセス 与えます
データウェアハウス.
開発メタデータに含まれる情報には次のものが含まれます。
オペレーティング システムの詳細、抽出する要素の詳細、
モデル 与えます インクルード データウェアハウス と社内規定
コンバージョンエ・デイ 与えます.
2 番目のタイプのメタデータは、分析メタデータと呼ばれます
エンドユーザーがデータのコンテンツを探索できるようにします
を見つけるための倉庫 与えます 利用可能とその意味
明確で非技術的。
したがって、分析メタデータはデータ間のブリッジとして機能します。
倉庫およびエンドユーザーのアプリケーション。このメタデータは、
ビジネスモデル、説明が含まれます 与えます 特派員
ビジネス モデル、事前定義されたクエリとレポート、
ユーザーログインとインデックスに関する情報。
分析メタデータと開発メタデータを 1 つに結合する必要がある
統合されたメタデータの封じ込めが適切に機能するようにします。
残念ながら、既存のツールの多くには独自のツールがあります。
メタデータであり、現在、それを可能にする既存の標準はありません。
データ ウェアハウジング ツールでこれらを統合できるようにする
メタデータ。この状況を改善するために、多くのトレーダーは
主要なデータ ウェアハウジング ツールはメタデータを形成しています
後にメタデータ連合となった評議会。
この連携の目的は、メタデータ セットを構築することです。
さまざまなデータ ウェアハウジング ツールを可能にする標準
メタデータを変換する
彼らの努力の結果、メタが誕生しました。
交換を可能にするデータ交換仕様 (MDIS)
Microsoft アーカイブと関連する MDIS ファイル間の情報の統合。
の存在 与えます 要約/インデックス付きと詳細の両方が得られます
ユーザーは DRILL DROWN を実行する可能性
(掘削)さあ 与えます 詳細なインデックスにインデックス付けされたり、その逆も同様です。
の存在 与えます 詳細な履歴により、
長期にわたる傾向分析。さらに、分析メタデータは、
のディレクトリとして使用されます データベース インクルード データウェアハウス 以下のために
エンドユーザーが私を見つけるのを助ける 与えます 必要。
OLTPシステムと比較して、サポート能力が高い
の分析 与えます そして報告、 データウェアハウス それはシステムとして見られます
作成や作成などの情報プロセスにより適しています。
クエリに応答し、レポートを作成します。次のセクション
2 つのシステムの違いを詳しく説明します。
データウェアハウス OLTP システムに対して
組織内の情報システムの多くは
これらは日常業務をサポートすることを目的としています。これら
OLTP SYSTEMS として知られるシステム、トランザクションのキャプチャ
毎日継続的に更新されます。
I 与えます これらのシステム内では、変更、追加、または変更が頻繁に行われます。
削除されました。たとえば、顧客の住所はほとんど変わりません。
彼はある場所から別の場所へ移動します。この場合、新しい住所は
のアドレスフィールドを変更することで登録されます。 データベース.
これらのシステムの主な目的はコストを削減することです
トランザクションを短縮し、同時に処理時間を短縮します。
OLTP システムの例には、書き込みなどの重要なアクションが含まれます
受注会計、給与計算、請求書、製造、AIサービス 顧客.
プロセスごとに作成される OLTP システムとは異なります。
トランザクションとイベントに基づいて、私は データウェアハウス 作成されました
分析ベースのプロセスにサポートを提供する 与えます との
意思決定プロセス。
これは通常、i を積分することによって達成されます。 与えます さまざまなシステムから
単一の「コンテナ」内の OLTP と外部。 与えます、説明したように
前のセクションで。
Monash データ ウェアハウジング プロセス モデル
のプロセスモデル データウェアハウス モナシュを開発したのは、
Monash DSS Research Group の研究者らは、以下に基づいています。
の文献 データウェアハウスをサポートした経験について、
システム分野の開発、ベンダーとの協議について
で使用するアプリケーション データウェアハウス、専門家グループについて
の使用において データウェアハウス.
フェーズは次のとおりです: 開始、計画、開発、運用
説明。この図は反復の性質を説明しています。
の進化的発達 データウェアハウス を使用して処理する
異なるフェーズの間に配置された双方向矢印。この中で
「反復的」および「進化的」コンテキストは、それぞれの時点で次のことを意味します。
プロセスのステップでは、実装活動を行うことができます
常に前のステージに逆方向に伝播します。これは
プロジェクトの性質上、 データウェアハウス ネル・クェール
追加のリクエストはいつでも発生します
エンドユーザーの。たとえば、開発段階では、
過程 データウェアハウス、1 つはエンド ユーザーによって要求されます
これまでに属していなかった新しい次元または主題領域
元の計画では、これをシステムに追加する必要があります。これ
プロジェクトに変化をもたらします。その結果、チームは
設計では、これまでに作成されたドキュメントの要件を変更する必要があります
設計段階で。多くの場合、現在の状態は、
プロジェクトは設計段階に戻る必要があります。
新しいリクエストを追加して文書化する必要があります。ユーザー
最終的には、レビューされた特定のドキュメントを参照できる必要があります。
開発段階で行われた変更。の終わりに
この開発サイクルでは、プロジェクトは優れたフィードバックを得る必要があります
開発チームとユーザーチームの両方のチーム。ザ
フィードバックは将来のプロジェクトを改善するために再利用されます。
キャパシティプランニング
Dw はサイズが非常に大きくなり、成長する傾向があります
非常に早く (Best 1995、Rudin 1997a)
数の 与えます 存続期間中から保持される履歴。そこには
成長は以下によっても引き起こされる可能性があります 与えます からリクエストされた追加アイテム
ユーザーの価値を高めるために 与えます 彼らはすでに持っているものです。から
したがって、ストレージ要件は、 与えます
大幅に強化される(Eckerson 1997)。そうです
を計画することにより確実に確保することが不可欠です。
構築するシステムが拡張できる容量
ニーズの成長 (ベスト 1995、ラプランテ 1996、ラング 1997、
Eckerson 1997、Rudin 1997a、Foley 1997a)。
DW のスケーラビリティを計画する際には、次のことを理解しておく必要があります。
予想される在庫サイズの増加、質問の種類
実行される可能性が高く、サポートされるエンド ユーザーの数 (最高
1995、ルーディン 1997b、フォーリー 1997a)。スケーラブルなアプリケーションを構築する
スケーラブルなサーバーテクノロジーとテクニックの組み合わせが必要です
スケーラブルなアプリケーション設計の功績 (Best 1995、Rudin 1997b.
アプリケーションを作成する場合は両方が必要です
非常に拡張性が高い。スケーラブルなサーバー テクノロジは、
ストレージ、メモリ、および
パフォーマンスを低下させない CPU (Lang 1997、Telephony 1997)。
スケーラブルなサーバー テクノロジには主に 2 つあります。
対称多重化 (SMP) と大規模な処理
パラレル (MPP) ) (IDC 1997、Humphries et al. 1999)。サーバー
SMP は通常、複数のプロセッサが 1 つのメモリを共有します。
バス システムおよびその他のリソース (IDC 1997、Humphries et al. 1999)。
拡張のためにプロセッサを追加可能
その ポテンツァ 計算的な。増やすもう一つの方法は、
ポテンツァ SMP サーバーの計算能力は、多数のサーバーを組み合わせることです。
SMPマシン。この技術はクラスタリングとして知られています(ハンフリーズ)
他。 1999年)。一方、MPP サーバーにはそれぞれ複数のプロセッサが搭載されています。
独自のメモリ、バス システム、およびその他のリソースを備えた (IDC 1997、
ハンフリーズら。 1999年)。各プロセッサはノードと呼ばれます。あ
オーメント・デッラ ポテンツァ 計算的には達成できる
MPP サーバーにノードを追加する (Humphries et al.
1999)。
SMP サーバーの弱点は、入出力操作が多すぎることです。
(I/O) はバス システムを輻輳させる可能性があります (IDC 1997)。これ
MPP サーバー内では問題は発生しません。
プロセッサには独自のバス システムがあります。ただし、相互接続
各ノード間の速度は一般にバス システムよりもはるかに遅くなります。
SMPの。さらに、MPP サーバーはレイヤーを追加できます。
アプリケーション開発者にとってはさらに複雑になります (IDC
1997)。したがって、SMP サーバーと MPP サーバーの選択は影響を受ける可能性があります。
質問の複雑さ、人間関係など、多くの要因によって決まります。
価格とパフォーマンス、必要な処理能力、
dw アプリケーションとサイズの増大を防止 データベース
dw の数とエンド ユーザーの数。
数多くのスケーラブルなアプリケーション設計手法
容量計画に使用できます。 1つ
日、週、月、年などのさまざまな通知期間を使用します。
さまざまな通知期間があり、 データベース に分けることができます
ピースを簡単にグループ化できます (Inmon et al. 1997)。もう一つ
この手法は、作成された要約テーブルを使用することです。
まとめ 与えます da 与えます 詳しい。それで、私は 与えます 概要は以上です
詳細よりもコンパクトなので、必要なメモリ容量が少なくなります。
だから 与えます 詳細をドライブに保存できる
ストレージが安くなり、さらに多くのストレージを節約できます。
サマリーテーブルを使用するとスペースを節約できますが、
メモリを最新の状態に保つには多大な労力が必要です。
商業的なニーズに沿って。ただし、このテクニックは、
広く使用されており、テクニックと組み合わせてよく使用されます
前(ベスト1995、インモン1996a、チョドゥリとダヤル)
1997)。
定義 データウェアハウス 技術的
アーキテクチャ テクニックの定義
DWアーキテクチャ
データ ウェアハウジングの初期導入者が主に考案したのは、
dw の集中実装。 与えます包括的な
i 与えます 外部、単一に統合され、
物理的ストレージ (Inmon 1996a、Bresnahan 1996、Peacock 1998)。
このアプローチの主な利点は、エンド ユーザーが
起業家的な規模でビューにアクセスできる
(全社的なビュー) デイ 与えます 組織的 (Ovum 1998)。別の
利点は、標準化が提供されることです。 与えます 介して
組織、つまりバージョンが 1 つしかない、または
DW デポジットで使用される各用語の定義
(リポジトリ) メタデータ (Flanagan および Safdie 1997、Ovum 1998)。の
一方、このアプローチの欠点は、費用がかかり、難しいことです。
(Flanagan と Safdie 1997、Ovum 1998、Inmon et al.
1998)。ストレージ アーキテクチャが登場してから間もなく 与えます
集中化が普及し、抽出の概念が進化
の最小のサブセットのうち、 与えます のニーズをサポートする
特定のアプリケーション (Varney 1996、IDC 1997、Berson および Smith)
1997年、ピーコック1998年)。これらの小さなシステムは、より多くのものか​​ら派生しています。
素晴らしい データウェアハウス 集中化された。それらはデートと呼ばれます
依存する部門別の倉庫または依存するデータ マート。
依存型データ マート アーキテクチャは次のように知られています。
最初の層がデータで構成される 3 層アーキテクチャ
集中倉庫、2 つ目は倉庫で構成されます 与えます
3 番目は部門へのアクセスで構成されます。 与えます そしてツールから
分析(Demarest 1994、Inmon et al. 1997)。
データ マートは通常、 データウェアハウス
集中型は、次のニーズを満たすために構築されました。
特定の単位 (White 1995、Varney 1996)。
データマートには、 与えます 細部に関連する非常に関連性の高い
統一性(Inmon et al. 1997、Inmon et al. 1998、IA 1998)。
この方法の利点は、 だと 更新不
統合されていて、私は 与えます データ内の冗長性が低くなります
ずっとマート 与えます 彼らは倉庫から来た 与えます 統合されました。
もう 1 つの利点は、それぞれの間の接続がほとんどないことです。
データマートと関連ソース 与えます 各データマートには
の情報源 与えます。さらに、このアーキテクチャを導入すると、ユーザーは
決勝戦でも引き続き概要にアクセスできます 与えます
企業組織。この方法はとして知られています
トップダウン方式。データの後にデータ マートが構築されます。
倉庫 (ピーコック 1998、ゴフ 1998)。
早期に結果を示す必要性が高まっており、一部の
組織は独立したデータマートを構築し始めています
(フラナガンとサフディ 1997、ホワイト 2000)。この場合、データマートは、
彼らは自分たちのものを受け取ります 与えます 基本からまっすぐに 与えます OLTP ではなく
集中化された統合ストレージにより、
敷地内に中央保管庫を設置。
各データ マートには、そのソースへのリンクが少なくとも 1 つ必要です
di 与えます。各日付に複数のリンクがあることの欠点の 1 つは、
重要なのは、前の 2 つのアーキテクチャと比較して、
過剰な 与えます 大幅に増加します。
各データ マートには、すべてのデータを保存する必要があります。 与えます 現地でリクエストされた
OLTP システムには影響しません。これにより、私は 与えます
それらは異なるデータ マートに保存されます (Inmon et al. 1997)。
このアーキテクチャのもう 1 つの欠点は、
データ マートとそのデータ マート間の複雑な相互接続の作成
の情報源 与えます これは実行と制御が困難です(Inmon 編)
その他。 1997)。
もう 1 つの欠点は、エンドユーザーが電力を供給できないことです。
私として会社情報の概要にアクセスします 与えます
異なるデータ マートの一部は統合されていません (Ovum 1998)。
さらに別の欠点は、複数の可能性があることです。
生成されるデータ マートで使用される各用語の定義
の矛盾 与えます 組織内 (Ovum 1998)。
上で説明した欠点にもかかわらず、独立したデータ マート
これらは今でも多くの組織の関心を集めています (IDC 1997)。
それらを魅力的なものにする要因の 1 つは、開発が早いことです。
必要な時間とリソースが少なくなります (Bresnahan 1996, Berson e
Smith 1997、Ovum 1998)。したがって、彼らは主にサービスを提供します
を特定するために使用できるテストプロジェクトとして
プロジェクトの利点や欠点をすぐに指摘 (Parsaye
1995年、ブレイリー1995年、ニューイング1996年)。この場合、からの部分は、
パイロットプロジェクトでの実装は小規模である必要がありますが、重要である必要があります
組織のために (Newing 1996、Mansell-Lewis 1996)。
プロトタイプを調べることで、エンドユーザーと管理者は次のことができます。
プロジェクトを継続するか中止するかを決定する (フラナガンとサフディ)
1997)。
決定を継続する場合は、他のセクターのデータマートが必要になる
一度に 1 つずつ構築する必要があります。には 2 つのオプションがあります
データ構築におけるエンドユーザーのニーズに基づく
独立したマット: 統合/連合および非統合 (Ovum)
1998)
最初の方法では、新しいデータ マートをそれぞれ構築する必要があります。
現在のデータマートとモデルに基づく 与えます 中古
同社による(Varney 1996、Berson and Smith 1997、Peacock 1998)。
モデルを使用する必要性 与えます 会社が必要とする
各用語の定義が 1 つだけであることを確認する
これは、データ マートを通じて使用されるデータを確実にするためでもあります。
さまざまなマートを統合して、概要を把握できます。
企業情報 (Bresnahan 1996)。この方法は
ボトムアップと呼ばれ、制約がある場合に最適です。
経済的手段と時間 (Flanagan と Safdie 1997、Ovum 1998、
ピーコック 1998、ゴフ 1998)。 XNUMX 番目の方法では、データ マート
構築されたユニットは特定のユニットのニーズのみを満たすことができます。
フェデレーテッド データ マートの変形例は、 データウェアハウス 分散
その中で データベース ハブサーバーミドルウェアは、多くのサーバーに参加するために使用されます
単一リポジトリ内のデータ マート 与えます 配布されました(White 1995)。で
この場合、私は 与えます 企業は複数のデータ マートに分散しています。
エンドユーザーのリクエストは次の宛先に転送されます。 データベース
サーバー ハブ ミドルウェア。 与えます データによって要求された
を実行し、結果をエンド ユーザー アプリケーションに返します。これ
ビジネス情報をエンドユーザーに提供するメソッドです。しかし、
データマートの問題はいまだ解消されていない
独立した。使用できる別のアーキテクチャがあります。
に電話する データウェアハウス バーチャル (White 1995)。ただし、これは
図 2.9 で説明されているアーキテクチャはアーキテクチャではありません
ストレージの 与えます 負荷を移動させないので本物です
OLTP システムから データウェアハウス (デマレスト、1994)。
実際、お客様からのご要望は、 与えます エンドユーザーが引き継いだもの
処理後に結果を返す OLTP システム
ユーザーのリクエスト。このアーキテクチャでは、ユーザーは
最終的にはレポートを作成し、リクエストを作成するため、i を提供することはできません。
与えます as iとしての会社情報の沿革と概要をご紹介します。 与えます
異なる OLTP システムからのデータは統合されません。それで、これ
アーキテクチャは分析を満足できません 与えます などの複雑な
予測例。
アクセスとアクセスアプリケーションの選択
の回復 与えます
を構築する目的 データウェアハウス 伝えることです
エンドユーザーへの情報 (Inmon et al 1997、Poe 1996、
McFadden 1996、Shanks et al 1997、Hammergren 1998)。 XNUMXつまたは
複数のアクセスおよび回復アプリケーション 与えます 提供されなければなりません。に
現在、ユーザーが選択できるこれらのアプリケーションは多岐にわたります。
を選択してください (Hammergren 1998、Humphries et al. 1999)。の
選択されたアプリケーションが取り組みの成功を左右します
ストレージの 与えます 組織内では、
アプリケーションは最も目に見える部分です データウェアハウス ユーザーへ
最終(Inmon et al. 1997、Poe 1996)。デートを成功させるには
倉庫の分析活動をサポートできなければなりません。 与えます
エンドユーザーの (Poe 1996、Seddon と Benjamin 1998、Eckerson)
1999年)。したがって、エンドユーザーが望むものの「レベル」は次のとおりである必要があります。
特定された(Poe 1996、Mattison 1996、Inmon et al 1997、
ハンフリーズら、1999)。
一般的に、エンドユーザーは 3 つに分類できます。
カテゴリ: エグゼクティブ ユーザー、ビジネス アナリスト、パワー ユーザー (Poe
1996、Humphries et al. 1999)。エグゼクティブユーザーが必要とするのは、
事前定義されたレポートのセットに簡単にアクセス (Humphries 編)
その他 1999)。これらのレポートは、次のコマンドを使用して簡単に実行できます。
メニューナビゲーション (Poe 1996)。さらに、レポートは次のようにする必要があります。
グラフィック表現を使用して情報を提示する
テーブルやテンプレートなどを素早く転送
情報 (Humphries et al. 1999)。そうでないビジネスアナリスト
彼らは関係を築く技術的な可能性を持っているかもしれません
自分たちでゼロにする場合は、現在の関係を次のように変更できる必要があります。
彼らの特定のニーズを満たす (Poe 1996、Humphries et al
1999年)。一方、パワー ユーザーは、次のようなタイプのエンド ユーザーです。
からのリクエストとレポートを生成および作成する機能を備えています。
ゼロ (Poe 1996、Humphries et al. 1999)。彼らこそが、
他のタイプのユーザー向けのレポートを作成する (Poe 1996、Humphries
他 1999)。
決定したら、エンドユーザーの要件を満たさなければなりません
アクセスおよび回復アプリケーションの選択 与えます とりわけ
それらは入手可能である(Poe 1996、Inmon et al. 1997)。
へのアクセス 与えます 検索ツールは次のとおりです。
OLAPツール、EIS/DSSツール、クエリツール、
レポートおよびデータ マイニング ツール。
OLAP ツールを使用すると、ユーザーはアドホック クエリを作成できるだけでなく、
に作られたもの データベース インクルード データウェアハウス。さらにこんな商品も
ユーザーがドリルダウンできるようにする 与えます そういう人たちに一般的な
詳しい。
EIS/DSS ツールは、「what if」分析としてエグゼクティブ レポートを提供します
メニュー構成のレポートへのアクセス。レポートは次のとおりである必要があります
事前に定義されており、メニューと統合されているため、ナビゲーションが容易になります。
クエリおよびレポート ツールにより、ユーザーはレポートを作成できます
事前に定義されており、具体的です。
データ マイニング ツールは、次のような関係を特定するために使用されます。
忘れ去られていた活動に新たな光を当てることができるかもしれない 与えます インクルード
データウェアハウス。
それぞれのタイプのユーザーの要件を最適化するとともに、
選択したツールは直感的で効率的で使いやすいものでなければなりません。
また、アーキテクチャの他の部分とも互換性がなければなりません。
既存のシステムと連携可能。また、次のようにすることも提案されています。
価格とパフォーマンスに合わせてデータ アクセスおよび取得ツールを選択する
合理的。考慮すべきその他の基準には、
自社の製品とその開発をサポートするツールのベンダー
将来のリリースでも同様になります。ユーザーエンゲージメントを確実にするために
データ ウェアハウスを使用する場合、開発チームには次のことが関与します。
ツール選択プロセスにおけるユーザー。この場合
実際のユーザー評価を実行する必要があります。
データ ウェアハウスの価値を向上させるために、開発チームは次のことを行うことができます。
データ ウェアハウスへの Web アクセスも提供します。あ
Web 対応のデータ ウェアハウスにより、ユーザーは 与えます
離れた場所や旅行先からでも。さらに情報は、
コストダウンにより低コストでご提供可能
トレーニングです。
2.4.3 データウェアハウス 運用フェーズ
このフェーズは 3 つのアクティビティで構成されます。 日付戦略の定義
更新、データ ウェアハウス アクティビティの制御、および管理
データウェアハウスのセキュリティ。
データ更新戦略の定義
初期ロード後、私は 与えますデータベース データウェアハウスの
を再生するには定期的に更新する必要があります
に加えられた変更 与えます オリジナル。したがって、私たちは決断しなければなりません
いつ、どのくらいの頻度で更新するか
リフレッシュとその方法 与えます。を行うことが推奨されています
リフレッシュデイ 与えます システムをオフラインにできるとき。そこには
リフレッシュ レートは開発チームによって決定されます。
ユーザーの要件に基づいて。リフレッシュするには 2 つのアプローチがあります
データ ウェアハウス: 完全な更新と継続的な読み込み
変化します。
最初のアプローチである完全リフレッシュでは、リロードが必要です
tutti i 与えます ゼロから。これは、すべてが 与えます 必須
更新のたびに、抽出、クリーニング、変換、統合が行われます。これ
このアプローチは可能な限り避けるべきです。
多くの時間とリソースが必要です。
別のアプローチは、i を継続的にロードすることです。
変化します。これで私は追加されます 与えます 変更されたもの
最後のデータ ウェアハウス更新サイクル以降。の識別
新しいレコードまたは変更されたレコードにより、データ量が大幅に削減されます。
与えます これは、それぞれのデータ ウェアハウスに伝播する必要があります。
これらだけなので更新します 与えます に追加されます データベース
データウェアハウスの。
撤退するために使用できるアプローチは少なくとも 5 つあります
i 与えます 新しいか変更されたか。効率的な戦略を立てるには
リフレッシュデイ 与えます これらのアプローチを組み合わせると役立つ場合があります
システム内のすべての変更を取得します。
タイムスタンプを使用する最初のアプローチでは、次のことが想定されます。
全員に割り当てられた 与えます タイムスタンプを編集および更新しましたので、
すべてを簡単に識別できるようにする 与えます 変更されたものと新しいもの。
ただし、このアプローチはほとんどの分野では広く使用されていません。
今日のオペレーティング システムの一部です。
2 番目のアプローチは、によって生成されたデルタ ファイルを使用することです。
に加えられた変更のみを含むアプリケーション 与えます.
このファイルを使用すると、更新サイクルも長くなります。
ただし、この方法でも多くの場合には使用されていません。
アプリケーション。
3 番目の方法は、ログ ファイルをスキャンすることです。
基本的にはデルタ ファイルと同様の情報が含まれます。唯一の人
違いは、回復プロセス用にログ ファイルが作成されることと、
理解するのが難しいかもしれません。
4 番目のアプローチは、アプリケーション コードを変更することです。
ただし、アプリケーション コードのほとんどは古く、
壊れやすい;したがって、この手法は避けるべきです。
最後のアプローチは、 与えます ファイルのあるソース
メインの 与えます.
データ ウェアハウスのアクティビティの制御
データ ウェアハウスがユーザーにリリースされると、
時間をかけて監視することが必要です。この場合、管理者は、
データ ウェアハウスでは 1 つ以上の管理ツールを使用でき、
データ ウェアハウスの使用を監視するための制御。特に
人物や天気などの情報を収集できる
データ ウェアハウスにアクセスします。来て 与えます 作物を作ることができる
入力として使用できる、実行された作業のプロファイル
ユーザーチャージバックの実装において。チャージバック
ユーザーは、処理にかかるコストについて知ることができます。
データウェアハウス。
さらに、データウェアハウス制御は次の目的にも使用できます。
クエリの種類、サイズ、クエリごとの数を特定する
日、クエリに対する応答時間、到達したセクター、および数量
di 与えます 加工された。チェックを行うもう一つの目的は、
データ ウェアハウスは、 与えます 使用されていないもの。これら 与えます
時間を短縮するためにデータ ウェアハウスから削除できます
クエリ実行応答の増加を監視し、
与えます 内に存在する データベース データウェアハウスの。
データウェアハウスのセキュリティ管理
データ ウェアハウスには以下が含まれます 与えます 統合された、重要な、敏感な
簡単に到達できます。このため、
権限のないユーザーから保護されます。一つの方法
セキュリティを実装するには del 関数を使用します DBMS
異なるタイプのユーザーに異なる権限を割り当てます。この中で
つまり、ユーザーのタイプごとにプロファイルを維持する必要がある
アクセス。データ ウェアハウスを保護するもう 1 つの方法は、データ ウェアハウスを暗号化することです
に書かれているように データベース データウェアハウスの。へのアクセス
与えます そして、取得ツールは、 与えます 提出する前に私は
結果をユーザーに届けます。
2.4.4 データウェアハウス 展開フェーズ
これは、データ ウェアハウス実装サイクルの最後のフェーズです。の
この段階で実行される活動には、
ユーザーはデータウェアハウスを使用してレビューを作成できます
データウェアハウスの。
ユーザートレーニング
ユーザートレーニングを最初に行う必要があります
へのアクセスの 与えます データ ウェアハウスとツールの使用
検索。通常、セッションは次のように開始する必要があります。
ストレージの概念の紹介 与えます、へ
データウェアハウスのコンテンツ、AIメタ 与えます そして基本的な機能
ツールの。そうすれば、より上級のユーザーも学ぶことができます。
物理テーブルとデータ アクセスとツールのユーザー機能
検索。
ユーザートレーニングを行うにはさまざまなアプローチがあります。の一つ
これには、専門家によって選ばれた多数のユーザーまたはアナリストが含まれます。
ユーザーのリーダーシップと能力に基づいたユーザーのグループ
コミュニケーション。彼らは個人的な能力で訓練されています
に慣れるために知っておくべきすべてのこと
システム。研修が終わると、彼らは仕事に戻り、
彼らは他のユーザーにシステムの使い方を教え始めます。で
学んだことに基づいて、他のユーザーも始めることができます
データ ウェアハウスを探索します。
もう 1 つのアプローチは、多くのユーザーを同じトレーニングでトレーニングすることです。
まるで座学コースを受けているかのような時間。この方法
トレーニングが必要なユーザーが多い場合に適しています
同時に。さらに別の方法はトレーニングです
各ユーザーは個別に、1 人ずつ。この方法は
ユーザーが少ない場合に適しています。
ユーザー トレーニングの目的は、ユーザーに慣れることです
にアクセスできる 与えます 検索ツールとそのコンテンツ
データウェアハウス。ただし、一部のユーザーは圧倒される可能性があります
セッション中に提供される情報の量によって
トレーニング。したがって、一定の数のことを行う必要があります
継続的なサポートと対応のための更新セッション
具体的な質問に。グループが結成される場合もある
ユーザーがこの種のサポートを提供できるようになります。
フィードバックの収集
データ ウェアハウスが展開されると、ユーザーは次のことが可能になります。
私を使ってください 与えます さまざまな目的でデータ ウェアハウスに常駐します。
ほとんどの場合、アナリストまたはユーザーは i を使用します。 与えます
データ ウェアハウス:
1 企業の傾向を特定する
2 の購買プロファイルを分析する 顧客
3 除算 i 顧客
4 最高のサービスを提供する 顧客 – サービスのカスタマイズ
5 戦略の策定 マーケティング
6 コスト分析とサポートのための競争力のある見積もりを提供します
コントロール
7 戦略的意思決定のサポート
8 目立つ機会を特定する
9 現在のビジネスプロセスの品質を向上させる
10 利益を確認する
データ ウェアハウスの開発方向に従って、次のことが可能になります。
一連のシステムレビューを実施してフィードバックを得る
開発チームとコミュニティの両方から
利用者。
得られた結果は、
次の開発サイクル。
データ ウェアハウスは増分アプローチを採用しているため、
過去の成功と失敗から学ぶことが不可欠です
開発。
2.5 概要
この章では、に存在するアプローチについて説明しました。
文学。セクション 1 では、 の概念について説明しました。
データ ウェアハウスと意思決定科学におけるその役割。の中に
セクション 2 の主な違い
データ ウェアハウスと OLTP システム。セクション 3 では、
使用された Monash データ ウェアハウス モデル
セクション 4 では、プロセスに含まれるアクティビティについて説明します。
データ ウェアハウスの開発、これらの論文は基づいていません
厳密な研究。現実に何が起こるかというと、
文献で報告されているものとは大きく異なりますが、
結果を使用して、基本的なバゲッジを作成できます。
この研究ではデータ ウェアハウスの概念を強調します。
第3章
研究と設計の方法
この章では、
この研究。最初の部分では、メソッドの一般的なビューを示します。
情報を検索するために利用できる研究の割合、さらに
最適な方法を選択するための基準が議論される
特別な勉強。次に 2 つの方法についてセクション XNUMX で説明します。
先ほど設定した基準に従って選択されます。この中から選ばれ、
セクション 3 に記載されている理由を備えたものを採用しました。
他の基準を除外する理由も説明されています。そこには
セクション 4 では研究計画が示され、セクション 5 ではそれが示されます。
結論。
3.1 情報システムの研究
情報システムの研究は単純に限定されるものではありません
技術分野まで拡張する必要がありますが、
行動と組織に関する目標。
私たちはこれを、以下に至るまでのさまざまな分野の論文のおかげです。
社会科学から自然科学へ。これにより、
定量的手法を含む特定範囲の研究手法
情報システムに使用される定性的なもの。
利用可能な調査方法はすべて重要ですが、実際にはいくつかの方法があります。
Jenkins (1985)、Nunamaker et al. などの研究者。 (1991)、およびガリエ
(1992) 特定の普遍的な方法は存在しないと主張
情報システムのさまざまな分野の研究を行う。確かに
方法は特定の研究には適しているかもしれないが、そうではない
ほかの人のため。このため、次のような方法を選択する必要があります。
私たちの特定の研究プロジェクトに適しています。
Benbasat et al.の選択(1987) それらは考慮されるべきであると述べています
研究の性質と目的。
3.1.1 研究の性質
研究の性質に応じてさまざまな方法が考えられます。
科学で広く知られている 3 つの伝統に分類される
情報の:実証主義的、解釈的、批判的な研究。
3.1.1.1 実証主義的研究
実証主義的研究は、科学的研究または科学的研究とも呼ばれます。
経験的な。それは次のことを試みます:「世界で何が起こるかを説明し、予測する」
規則性や因果関係に注目して社会世界を理解する
それを構成する要素の中で」(Shanks et al 1993)。
実証主義研究には再現性という特徴もあります。
単純化と反論。さらに、実証主義的研究は次のように認めています。
研究された現象間にアプリオリな関係が存在すること。
Galliers (1992) によると、分類法は研究方法です。
実証主義パラダイムに含まれますが、これに限定されません。
実際には、実験室での実験や野外実験があり、
ケーススタディ、定理の証明、予測、シミュレーション。
これらの方法を使用して、研究者は現象を認めています
研究結果を客観的かつ厳密に観察することができます。
3.1.1.2 解釈研究
解釈的研究。現象学または現象学と呼ばれることがよくあります。
反実証主義は、Neuman (1994) によって「分析」として説明されています。
行動の社会的意味を直接的かつ体系的に理解する
自然な状況下で人々を詳細に観察し、順番に
どのようにして理解と解釈に到達するか
人々は自分たちの社会世界を作り、維持しています。」研究
解釈方法は、観察された現象が次のとおりであるという仮定を拒否します。
客観的に観察できる。実際、それらはベースになっています
主観的な解釈について。さらに、解釈研究者は、
彼らは研究する現象にアプリオリな意味を課します。
この方法には、主観的/論証的な研究、行動が含まれます。
研究、記述/解釈研究、将来の研究とゲーム
役割。これらの調査や事例研究に加えて、
の研究に関するものであるため、このアプローチに含まれます。
複雑な状況にある個人または組織
現実世界の。
3.1.1.3 重要な研究
批判的探究は科学分野で最も知られていないアプローチである
社会的ですが、最近研究者から注目を集めています
情報システムの分野で。という哲学的仮定は、
社会的現実は歴史的に人々によって生産され再生産され、
社会システムとその動作や相互作用も同様です。彼らの
ただし、能力は一定の考慮によって媒介されます
社会的、文化的、政治的。
解釈研究と同様に、批判研究でも次のことが主張されています。
実証主義的な研究は社会的背景とは何の関係もなく、それを無視します
人間の行動への影響。
一方、批判的研究は解釈研究を批判します。
あまりにも主観的であり、助けることを目的としていないため
人々は自分たちの生活を改善するために。最大の違いは、
批判的研究と他の 2 つのアプローチは評価の側面です。
実証主義と解釈の伝統の客観性は、
現状や社会的現実を予測または説明する、批判的な研究
根底にある社会現実を批判的に評価し、変革することを目的としています
スタジオ。
批判的な研究者は通常、次の目的で現状に反対します。
社会的差異を解消し、社会条件を改善する。そこには
批判的研究には、プロセス的な視点が重視されます。
関心のある現象は、したがって通常は縦方向です。
研究方法の例としては、長期にわたる歴史的研究や
民族誌的研究。しかし、批判的な研究はまだ行われていない。
情報システム研究で広く使用されています
3.1.2 研究の目的
検索の性質に加えて、その目的も使用できます。
研究者が特定の方法を選択する際のガイドとなる
研究。研究プロジェクトの目的は密接に関連しています
からなる検索サイクルに対する相対的な検索位置
3 つのフェーズ: 理論構築、理論テスト、理論改良
理論。したがって、検索サイクルに関する勢いに基づいて、
研究プロジェクトには、説明的、記述的な目的を持たせることができます
探索的または予測的。
3.1.2.1 探索的研究
探索的研究は、トピックを調査することを目的としています
全く新しい、研究上の疑問や仮説を立てる
未来。このタイプの研究は、
新しい分野で最初の参考文献を取得するための理論。
通常、事例などの定性的調査手法が使用されます。
研究または現象学的研究の。
ただし、次のような定量的な手法を使用することもできます。
探索的な調査や実験。
3.1.3.3 記述的研究
記述的研究は、主に分析と説明を目的としています。
特定の状況や組織の慣行を詳しく説明します。これ
理論構築に適しており、次の目的にも使用できます。
仮説を確認したり反論したりする。通常、記述的研究
これには、測定値とサンプルの使用が含まれます。最適な調査方法
前例の調査と分析が含まれます。
3.1.2.3 説明的研究
説明的研究では、なぜ物事が起こるのかを説明しようとします。
それはすでに研究された事実に基づいて構築されており、発見しようとしています
これらの事実の理由。
したがって、説明的な研究は通常、研究に基づいて構築されます
探索的または記述的であり、テストと改良に付随するもの
理論。説明的な研究では通常、ケーススタディが使用されます
またはアンケートに基づいた調査方法。
3.1.2.4 予防研究
予防研究は、出来事や行動を予測することを目的としています
研究されている観察中(マーシャルとロスマン)
1995)。予測は標準的な科学的真実のテストです。
この種の研究では通常、以下の調査または分析が使用されます。
与えます 歴史家。 (イン 1989)
上記の議論は、いくつかの点があることを示しています。
研究で使用できる可能な研究方法
特定の。ただし、より適切な具体的な方法があるはずです
特定の種類の研究プロジェクトに関する他のもの。 (ギャリアーズ
1987 年、イン 1989 年、デ・ヴォー 1991 年)。したがって、すべての研究者は、
~の長所と短所を慎重に評価する必要がある
さまざまな方法を検討し、最適な調査方法を採用します。
研究プロジェクトと互換性があります。 (ジェンキンス 1985、パーヴァンとクラス
1992 年、ボノミア 1985 年、イン 1989 年、ヒミルトンとアイブス 1992 年)。
3.2.考えられる調査方法
このプロジェクトの目標は、での経験を研究することでした。
i を持つオーストラリアの組織 与えます 1つで保管されている
開発 データウェアハウス. ダト 現時点では 1 つあります
オーストラリアではデータウェアハウス分野における研究が不足しており、
この研究プロジェクトはまだサイクルの理論段階にあります
研究しており、探索的な目的を持っています。での経験を探る
データ ウェアハウジングを導入しているオーストラリアの組織
現実社会の解釈が必要です。したがって、
研究プロジェクトの根底にある哲学的仮定は次のとおりです
伝統的な解釈。
利用可能な方法を厳密に検査した結果、それらの方法が特定されました。
考えられる 2 つの調査方法: アンケートとケーススタディ
研究に使用できる(ケーススタディ)
探索的 (Shanks et al. 1993)。 Galliers (1992) は次のように主張しています。
この特定の研究に対するこれら 2 つの方法の適合性
建設に適していると改訂された分類法
理論的。次の 2 つのサブセクションでは、次の各方法について説明します。
詳細。
3.2.1 調査研究方法
調査研究手法は、古くから伝わる手法に由来しています。
国勢調査。国勢調査は、次からの情報を収集することで構成されます。
人口全体。この方法は高価で非現実的です
特に人口が多い場合。したがって、比較すると、
国勢調査では通常、調査は次のことに焦点を当てます。
少数またはサンプルの情報を収集する
人口の代表者(Fowler 1988、Neuman 1994)。あ
サンプルは抽出元の母集団を反映していますが、
サンプル構造に応じた精度レベル、
使用したサイズと選択方法 (Fowler 1988、Babbie)
1982 年、ノイマン 1994 年)。
調査方法は「実践のスナップショット、
特定の時点での状況や見解。
アンケートやインタビュー、そこから推測される可能性のあるもの
(Galliers 1992:153) [実践のインスタント写真、
特定の時点での状況や見解。
アンケートやインタビューから推測できる]。の
調査は特定の側面に関する情報の収集を扱います
一定数の参加者による研究の結果、
質問 (Fowler 1988)。こうしたアンケートやインタビューでも、
対面での電話面接や構造化された面接が含まれます。
の収集テクニックです。 与えます 最も一般的に使用されるのは
調査 (Blalock 1970、Nachmias and Nachmias 1976、Fowler)
1988)、観察と分析を使用できます (Gable
1994年)。これらすべての収集方法のうち、 与えます、 の用法
アンケートは、最も一般的な手法です。 与えます
収集されたデータは構造化され、フォーマットされているため、
情報の分類 (Hwang 1987、de Vaus 1991)。
私を分析するとき 与えます、調査戦略では多くの場合、
統計分析などの定量的手法を使用できますが、
定性的手法も使用されます (Galliers 1992、Pervan
およびクラス 1992、ゲーブル 1994)。通常、私は 与えます 集められたのは
関連性の分布とパターンを分析するために使用されます
(ファウラー、1988)。
アンケートは一般に研究に適していますが、
「何?」という質問を扱うものです。 (何) またはそこから
「いくら」や「いくつ」などを導き出します。
「なぜ」という質問を通じて尋ねることができます (Sonquist と
ダンケルベルク 1977、イン 1989)。ソンクイストとダンケルベルクによると
(1977)、研究調査は困難な仮説を目的としており、
評価、母集団の説明とモデルの開発
人間の行動。さらに、アンケートも利用できます
人口や状況についての特定の意見を研究するため
意見、特徴、期待、さらには過去の行動まで
または現在 (Neuman 1994)。
調査により、研究者は次のような関係を発見することができます。
母集団とその結果は通常、
他の方法 (Sonquist および Dunkelberg 1977、Gable 1994)。の
調査により、研究者は地理的領域をカバーできるようになります
より広く、多くの宣言者に届くようにするため(Blalock 1970、
Sonquist と Dunkelberg 1977、Hwang と Lin 1987、Gable 1994、
ニューマン 1994)。最後に、アンケートから情報を得ることができます。
他では入手できないもの、または分析に必要な形式で入手できないもの
(ファウラー、1988)。
ただし、調査の実施にはいくつかの制限があります。 1つ
欠点は、研究者が多くの情報を入手できないことです
研究対象に関して。これは、
調査は特定の時期にのみ実行されるため、
研究者が調査できる変数や人の数には限りがある
研究(イン 1989、デ ヴォー 1991、ゲイブル 1994、デンスコム 1998)。
もう 1 つの欠点は、アンケートを実行すると何が起こるかということです
特に次の場合、時間とリソースの点で非常に高価です。
対面インタビューが含まれます (Fowler 1988)。
3.2.2.調査研究方法
調査研究手法では、以下のことを徹底的に調査します。
実際の状況における特定の状況
定められた期間、側の介入なしで、
研究者 (Shanks & C. 1993、Eisenhardt 1989、Jenkins 1985)。
主にこの方法は、次の関係を記述するために使用されます。
特定の状況で研究されている変数
(Galliers 1992)。捜査には個別の事件や事件が含まれる場合があります。
分析された現象に応じて複数 (Franz and Robey 1987,
アイゼンハルト 1989、イン 1989)。
調査研究手法は「調査研究」と定義されています。
現代社会における現象を研究する実証的研究
1 つまたは複数のソースから収集された複数のソースを使用した相対的な実際のコンテキスト
人、グループ、組織などの複数のエンティティ」(イン 1989)。
現象とその文脈の間に明確な分離はありません。
変数の制御や実験的な操作はありません (陰
1989、Benbasat et al. 1987)。
収集にはさまざまなテクニックがありますが、 与えます 彼らができること
照会方法で採用されるものには、以下が含まれます。
直接の観察、アーカイブ記録のレビュー、アンケート、
文書のレビューと構造化されたインタビュー。持っている
多様な収穫技術 与えます、調査
研究者が両方に対処できるようにする 与えます 定性的なもの
同時に量を測定 (Bonoma 1985、Eisenhardt 1989、Yin)
1989 年、ゲーブル 1994 年)。調査方法と同様に、
調査研究者は観察者または研究者として行動するのではなく、
研究対象の組織の積極的な参加者として。
Benbasat et al. (1987) は、調査方法は次のとおりであると主張しています。
特に理論構築の研究に適しています。
リサーチクエスチョンから始めてトレーニングを続ける
収集過程における理論の説明 与えます。 ビーイング
ステージにも合う
理論構築に関して、Franz と Robey (1987) は次のように示唆しています。
問い合わせ方法は複雑な場合にも使用できます
理論段階。この場合、集められた証拠に基づいて、
与えられた理論や仮説が検証または反駁されます。さらに、その調査は、
「どのように」または「どのように」という質問を扱う研究にも適しています
「なぜ」(イン 1989)。
他の方法と比較して、調査では研究者が次のことを行うことができます。
重要な情報をより詳細に取得します (Galliers
1992、シャンクスら、1993)。さらに、調査により、
研究者は、研究されているプロセスの性質と複雑さを理解することができます。
(Benbasat et al. 1987)。
この方法には主に 4 つの欠点があります
調査。 1つ目は、管理された控除の欠如です。そこには
研究者の主観によって結果や結論が変わる可能性がある
研究の結果(イン 1989)。 XNUMXつ目のデメリットは、
管理された観察。実験的な方法とは異なり、
探求研究者は研究された現象を制御できない
それらが自然な文脈で検討されるとき(Gable 1994)。の
3 番目の欠点は、複製可能性の欠如です。これは事実によるものです
研究者が同じ現象を観察する可能性は低い、そして
特定の研究の結果を検証することはできません (Lee 1989)。
最後に、再現性がないため、それは困難です。
1 つ以上の調査から得られた結果を一般化する (Galliers
1992、シャンクスら、1993)。しかし、これらすべての問題はそうではありません
克服することは不可能であり、実際には次の方法で最小限に抑えることができます。
研究者は適切な行動をとります (Lee 1989)。
3.3.研究方法を正当化する
採用
この研究では 2 つの可能な調査方法のうち、次の方法が考えられます。
調査が最適と考えられます。捜査のそれは、
関連するものを慎重に検討した結果、破棄されました
長所と短所。それぞれの都合の良し悪し
この研究の方法については以下で説明します。
3.3.1.調査方法の不適切さ
捜査の
調査方法には、1 つの点について詳細な検討が必要です。
1 つ以上の組織内の特定の状況
(アイゼンハルト 1989)。この場合、期間は
この研究に与えられた期間を超えてしまう場合。別の
調査方法を採用しない理由は、結果が
彼らは厳密さの欠如に苦しむ可能性があります(ying 1989)。主観
研究者の意見が結果と結論に影響を与える可能性があります。別の
その理由は、この方法が疑問に関する研究により適しているためです。
「どのように」または「なぜ」タイプの質問 (ying 1989)、リサーチクエスチョン
この研究では、それは「何を」タイプです。最後になりましたが、重要なことです
重要なのは、1 つまたは複数の結果から得られた結果を一般化することは困難であるということです。
調査はほとんど行われていない(Galliers 1992、Shanks et al 1993)。をベースに
この合理的な説明は、調査研究方法ではありません。
この研究にはふさわしくないため選ばれました。
3.3.2.検索方法の便利さ
調査
この調査が実施された時点では、データ ウェアハウスの実践
によっては広く採用されていなかった
オーストラリアの組織。ということで、あまり情報がありませんでした
内での実装に関しては、
オーストラリアの組織。入手可能な情報が来ました
データを実装または使用した組織からの
倉庫。この場合、アンケート調査の手法が最も効果的です。
そうでない情報を得ることができるため、適しています。
他の場所で、または分析に必要な形式で入手可能です (Fowler 1988)。
さらに、調査研究手法により、研究者は次のことが可能になります。
慣行、状況、または状況についての優れた洞察を得る
特定の時期に見られた(Galliers 1992、Denscombe 1998)。
を高めるためには全体的な視点が必要でした
オーストラリアのデータ ウェアハウジングの経験に関する知識。
繰り返しになりますが、Sonquist と Dunkelberg (1977) は次のように述べています。
アンケート調査は他の方法よりも一般的です。
3.4.調査研究デザイン
データ ウェアハウスの実践に関する調査は 1999 年に実施されました。

対象となる組織は次のとおりです。
データ ウェアハウジングの研究に興味を持つオーストラリア人
おそらく私についてはすでに通知されているでしょう 与えます 彼らが保管しているものと、
したがって、この研究に役立つ情報が提供される可能性があります。そこには
対象集団は、最初の調査で特定されました。
「The Data Warehousing Institute」(Tdwiaap) のオーストラリアのメンバー全員。
このセクションでは、調査フェーズの設計について説明します。
この研究の経験的証拠。
3.4.1.収穫技術 与えます
アンケート調査でよく使われる3つの手法から
(郵送によるアンケート、電話によるインタビュー、インタビューなど)
個人) (Nachmias 1976、Fowler 1988、de Vaus 1991)、
この研究では郵送アンケートを採用した。最初
後者を採用する理由は、
地理的に分散した人口 (Blalock 1970、Nachmias e
Nachmias 1976、Hwang と Lin 1987、de Vaus 1991、Gable 1994)。
第二に、郵送アンケートは参加者に適しています。
高学歴である (Fowler 1988)。こちらのメールアンケートは
研究はデータ ウェアハウジング プロジェクトのスポンサーに向けて行われました。
ディレクターやプロジェクトマネージャー。第三に、アンケートの廃止
メールは、安全なリストがある場合に適しています。
アドレス (サラントとディルマン 1994)。 TDWI、この場合は XNUMX つ
信頼できるデータウェアハウス協会がアドレスリストを提供
オーストラリアのメンバーの。アンケートのもう一つのメリット
郵送と電話によるアンケートまたはインタビュー
個人的なことは、登録者がより多くの応答を行えるようにすることです
特に登​​録者が相談する必要がある場合の正確性
メモしたり、他の人に質問を話し合ったりします (ファウラー
1988)。
潜在的な欠点は、処理に時間がかかることです。
郵送によるアンケートを実施します。通常、アンケートは離れています
メールは次の順序で行われます。手紙を送信し、到着を待ちます。
応答と送信確認 (Fowler 1988、Bainbridge 1989)。
したがって、合計時間は所要時間よりも長くなる可能性があります。
個人面接や電話面接など。しかし
合計時間は事前に知ることができます (Fowler 1988,
デンスコム 1998)。インタビューに費やした時間
個人データは状況によって異なるため、事前に知ることはできません。
あるインタビューから別のインタビューへ (Fowler 1988)。電話インタビュー
郵送によるアンケートよりも早く回答できる可能性があり、
個人面接はあるが欠席率が高い
一部の人が不在であるため、対応できなかった (Fowler 1988)。
さらに、電話インタビューは通常、次のリストに限定されます。
比較的短い質問 (Bainbridge 1989)。
郵送アンケートのもう 1 つの弱点は、回答率が高いことです。
応答の欠如 (Fowler 1988、Bainbridge 1989、Neuman
1994年)。ただし、対策は講じられており、
この研究はデータ分野の信頼できる機関と共同で行われました
倉庫保管 (TDWI) (Bainbridge 1989、Neuman 1994)、
応答しなかった人に 2 通の督促状を送信します
(Fowler 1988、Neuman 1994) と手紙も含まれています
研究の目的を説明する補足 (Neuman 1994)。
3.4.2.分析単位
この研究の目的は、次の情報を入手することです。
データウェアハウジングの実装とその使用
オーストラリアの組織内で。対象者
オーストラリアのすべての組織で構成されています。
実装されているか、実装されています。 データウェアハウス。 に
その後、個々の組織が登録されます。アンケート
養子縁組に興味のある団体に郵送で送られました
di データウェアハウス。この方法により、情報が確実に
各組織の最適なリソースから収集されたもの
参加者。
3.4.3.調査サンプル
調査参加者の「メーリングリスト」は以下から入手しました。
TDWI。このリストから、オーストラリアの 3000 の組織が
サンプリングの基準として選択されました。あ
追加の手紙ではプロジェクトと調査の目的が説明されていました。
解答用紙とプリペイド封筒も一緒に
サンプルに送信された記入済みのアンケートを返送してください。
3000 の組織のうち、198 の組織が参加に同意しました。
勉強。このような少数の回答は予想されていました だと il
彼らが当時持っていたオーストラリアの多数の組織
デート戦略を採用している、または採用していた
組織内での倉庫保管。それで、
この研究の対象集団はわずか 198 人です
組織。
3.4.4.アンケート内容
アンケートの構造は日付モデルに基づいていました
モナシュ倉庫 (パート 2.3 で前述)。の
アンケートの内容は、
第 2 章に記載されている文献。アンケートのコピー
アンケート参加者に送信されたメッセージを確認できます
アンケートは 6 つのセクションで構成されています。
説明するモデルのフェーズは次のとおりです。次の6つの段落
各セクションの内容を簡単に要約します。
セクション A: 組織に関する基本情報
このセクションには、プロフィールに関する質問が含まれています
参加団体。さらに、いくつかの質問は、
データウェアハウスプロジェクトの状況に関する
参加者。お名前などの機密情報
組織の実態は調査分析では明らかにされなかった。
セクション B: 始まり
このセクションの質問は、アクティビティの開始に関連しています。
データウェアハウス。質問はどれくらいの長さで行われました
プロジェクトの開始者、保証人、スキルと知識に関するもの
リクエスト、データ ウェアハウジング開発の目的、
エンドユーザーの期待。
セクション C: デザイン
このセクションには、の活動に関する質問が含まれています。
の計画 データウェアハウス。特に、質問は次のとおりです。
実行範囲、プロジェクトの期間、費用についての記載
プロジェクトと費用対効果の分析。
セクション D: 開発
開発セクションには、の活動に関する質問があります。
開発 データウェアハウス: ユーザー要件の収集
最後に、ソース 与えます、の論理モデル 与えます、プロトタイプ、
キャパシティプランニング、技術アーキテクチャ、および選択
データ ウェアハウジング開発ツール。
セクション E: 操作
操作に関する質問
の拡張性に データウェアハウス、どのように進化するか
開発の次の段階。そこには データ品質、の戦略
リフレッシュデイ 与えます、粒度 与えます、データのスケーラビリティ
倉庫とセキュリティ問題 データウェアハウス 彼らは間にいた
尋ねられる質問の種類。
セクション F: 開発
このセクションにはデータ使用に関する質問が含まれています
エンドユーザーによる倉庫。研究者は興味を持った
の目的と有用性に対して データウェアハウス、レビューと攻略法
採用されたトレーニングとデータ管理戦略の
倉庫を採用しました。
3.4.5.回答率
郵送調査は、次のような割合であると批判されていますが、
応答性が低いため、応答性を高めるための対策が講じられています。
収益率(部分的には前述したとおり)
3.4.1)。 「応答率」という用語は、
特定の調査サンプルに回答した人々
アンケート (Denscombe 1998)。以下が使用されました
この研究の応答率を計算する式は次のとおりです。
回答した人の数
応答率 =
—————————————————————————– X 100
送信されたアンケートの総数
3.4.6.パイロットテスト
アンケートがサンプルに送信される前に、質問は次のとおりです。
Luck が示唆したように、パイロット テストを実施することで検討されました。
ルービン (1987 年)、ジャクソン (1988 年)、およびデ・ヴォー (1991 年)。の目的
パイロットテストは、すべてのぎこちない表現、曖昧な表現を明らかにすることです
解釈が難しい質問を明確にするために
使用される定義と用語、およびおおよその時間を特定するための情報
アンケートへの回答が必要です (Warwick と Liner 1975、
ジャクソン 1988、サラントとディルマン 1994)。パイロットテストは次のとおりでした。
類似の特性を持つ被験者を選択して実施
Davis e が示唆したように、最終主題の コゼンツァ (1993)。 に
この調査では、データ ウェアハウスの専門家 6 名が調査を受けました。
パイロット被験者として選ばれました。各パイロット テストの後、次のようになります。
必要な修正が加えられています。実施されたパイロットテストから、私は
参加者は、再構築とリセットを支援しました。
質問票の最終版。
3.4.7.分析方法 与える
I 与えます クローズド・クエスチョン・アンケートから収集された調査のうち、
統計ソフトウェアパッケージを使用して分析されました
SPSSと呼ばれます。回答の多くは分析されました
記述統計を使用します。一定数のアンケート
彼らは不完全な状態で戻ってきました。これらはより大きな扱いを受けました
私がそれを確認するように注意してください 与えます 行方不明者は一人もいなかった
データ入力エラーの結果であるが、質問が反映されないのはなぜですか
申告者に適しているか、申告者が適さないと判断した
1 つ以上の具体的な質問に答えます。これらの答え
欠落しているものは分析中に無視されました 与えます とされています
プロセスから確実に除外するために「-9」としてコード化されます。
分析。
アンケート作成中、質問は締め切られました
各オプションに番号を割り当てることによって事前にコード化されます。人数、個数、総数
それからそれは私を準備するために使用されました 与えます 分析中に
(Denscombe 1998、Sapsford および Jupp 1996)。たとえば、次のようなものがありました。
セクション B の質問 1 にリストされている XNUMX つの選択肢: アドバイス
取締役会、上級幹部、IT 部門、部門
ビジネス、コンサルタントなど。のファイルに 与えます SPSSの、
「プロジェクトの開始者」を示す変数が生成されました。
1 つの値ラベル: 「2」は「取締役会」、「XNUMX」は「取締役会」を表す
「上級幹部」など。リッケルティンスケールの使用
非公開の質問の一部では許可されていました
値を使用するための労力を必要としない識別
SPSS に入力された対応する番号。に関する質問については、
相互に排他的ではない非網羅的な回答、
各オプションは 2 つの変数を持つ単一の変数として扱われました。
値ラベル: 「マーク付き」の場合は「1」、「マークなし」の場合は「2」。
自由回答形式の質問は質問とは異なる扱いを受けました
閉まっている。これらの質問に対する答えはまだ入力されていません
SPSS。代わりに、手作業で分析されました。これの使用
質問の種類により、アイデアに関する情報を得ることができます
自由に表現された内容と回答者の個人的な経験
(Bainbridge 1989、Denscombe 1998)。可能な場合にはそれが行われています
回答の分類。
の分析のために 与えます、簡単な統計分析手法が使用され、
応答頻度、平均、標準偏差など
平均値と中央値 (Argyrous 1996、Denscombe 1998)。
ガンマテストは定量的な測定値を得るのに効果的でした
間の関連性の 与えます 序数 (Norusis 1983、Argyrous 1996)。
使用された順序スケールが適切ではなかったため、これらのテストは適切でした。
多くのカテゴリがあり、表に表示できました
(ノルシス 1983)。
3.5 概要
この章では、調査方法と
この研究に採用されたデザイン。
目的に最適な調査方法を選択する
特定の研究は
性質や種類を含む多くのルールの考慮
研究の利点と、考えられるそれぞれの長所と短所
方法 (Jenkins 1985、Benbasat et al. 1097、Galliers and Land 1987、
yin 1989、Hamilton and ives 1992、Galliers 1992、neuman 1994)。ビュー
それに関する既存の知識と理論の欠如
オーストラリアにおけるデータ ウェアハウジングの導入に関する調査、この調査は
研究にはスキルを備えた解釈的な研究方法が必要です
組織の経験を調査するための探索的
オーストラリア人。選ばれた調査手法は、
日付概念の採用に関する情報を収集する
オーストラリアの組織による倉庫保管。あ
収集手法として郵送アンケートが選択されました 与えます。 ザ
研究方法と収集技術の正当化 与えます
選択された内容については、この章で説明します。またそうでした
分析単位であるサンプルに関するディスカッションを発表しました。
使用、回答率、アンケートの内容、
アンケートの事前テストと分析方法 与えます.

の設計 データウェアハウス:
エンティティ関係と次元モデリングの組み合わせ
抽象
iを保存する 与えます それは多くの人にとって現在の大きな問題です
組織。開発における重要な問題
の保管の 与えます それは彼のデザインです。
設計はデータ内の概念の検出をサポートする必要があります
ウェアハウスからレガシー システムやその他のソースへの 与えます そしてまた一つ
理解しやすさとデータ導入の効率化
倉庫。
ストレージに関する文献の多くは、 与えます 推奨
エンティティ関係モデリングまたは次元モデリングの使用
のデザインを表現する データウェアハウス.
この文書では、両方の方法がどのように行われるかを示します。
表現を 1 つのアプローチに組み合わせることができます。
の図面 データウェアハウス。使用されるアプローチは体系的です
ケーススタディで検討され、多くの点で特定されています。
専門家にとって重要な意味があります。
データウェアハウス
Un データウェアハウス 通常、「主題指向、
統合された、時変性のある不揮発性のデータ収集をサポート
経営陣の決定について」(Inmon および Hackathorn、1994 年)。
主題指向と統合は、 データウェアハウス è
レガシー システムの機能境界を越えるように設計されています。
~の統合的な視点を提供する 与えます.
時変性は、歴史的または時系列的な性質に影響を与えます。 与えます in
un データウェアハウス、傾向を分析できるようになります。
不揮発性とは、 データウェアハウス 継続的ではありません
として更新されました データベース OLTPの。むしろ更新されてる
定期的に、 与えます 内部および外部のソースから来ています。の
データウェアハウス 研究用に特別に設計されています
アップデートの整合性やパフォーマンスのためではなく、
オペレーション。
iを保存するというアイデア 与えます それは新しいことではありません、それは目的の一つでした
の管理の 与えます 1982 年代以降 (The Martin、XNUMX)。
I データウェアハウス 彼らはインフラを提供する 与えます 管理用
サポートシステム。意思決定を含む経営支援システム
サポート システム (DSS) と経営情報システム (EIS) です。
DSS は、コンピュータベースの情報システムです。
プロセスを改善し、結果としてグリップ力を向上させるように設計されています。
人間の決断。 EIS は通常、次の配信システムです。
与えます これにより、経営者はビューに簡単にアクセスできるようになります。
与えます.
の一般的なアーキテクチャ データウェアハウス ~の役割を強調する
データウェアハウス 経営サポートで。提供することに加えて、
インフラストラクチャ 与えます EIS および DSS については、 データウェアハウス それは可能ですか
クエリを通じて直接アクセスします。ザ 与えます デートに含まれる
ウェアハウスは情報要件の分析に基づいています
これらは 3 つのソースから取得されます。社内のレガシー システム、
特殊用途のデータ キャプチャ システムと外部データ ソース。ザ
与えます 社内のレガシー システムでは冗長であることが多く、
一貫性がなく、低品質で、異なる形式で保存されている
したがって、それらをロードする前に調整してクリーンアップする必要があります。
データウェアハウス (Inmon、1992; McFadden、1996)。ザ 与えます から
ストレージ システムから 与えます アドホックおよびソースから 与えます
外部は、i を拡張 (更新、置換) するためによく使用されます。
与えます レガシーシステムから。
を開発する説得力のある理由はたくさんあります。 データウェアハウス,
これには、使用によるより良い意思決定が含まれます
効果的な詳細情報 (Ives 1995)、焦点のサポート
完全なビジネスに関するもの (Graham 1996)、およびコストの削減
の提供 与えます EIS および DSS 用 (Graham 1996、McFadden)
1996)。
最近の実証研究では、平均して次のような利益が得られることがわかりました。
私のための投資 データウェアハウス 401 年後には XNUMX% 増加 (Graham,
1996)。しかし、他の実証研究では、 データウェアハウス 持っている
EDの測定の難しさを含む重大な問題が見つかった
利益の割り当て、明確な目的の欠如、それを過小評価する
i を保存するプロセスの目的と複雑さ 与えます
特にソースとその清潔さに関しては、 与えます.
iを保存する 与えます 解決策として考えられるのは
の管理の問題に 与えます 組織間。そこには
の操作 与えます 社会資源として、それは依然として
情報システムを管理する上で重要な問題
(Brancheau et al. 1996、Galliers et al. 1994、
ニーダーマンら。 1990 年、ペルヴァン 1993 年)。
一般的な管理アプローチ 与えます 80年代にはそうでした
モデルの開発 与えます 社交。モデル 与えます 社会的だった
新しいシステム開発のための安定した基盤を提供するように設計されています
アプリケーション データベース レガシーの再構築と統合
システム (Brancheau et al.
1989 年、Goodhue ら。 1988:1992、キムとエベレスト 1994)。
ただし、このアプローチには多くの問題があります。
特に、各タスクの複雑さとコスト、そして長い時間
目に見える結果が求められる(Beynon-Davies 1994、Earl
1993 年、Goodhue ら。 1992年、ペリアサミー1994年、シャンクス1997年)。
Il データウェアハウス 従来のデータベースと共存する別のデータベースです
データベースを置き換えるのではなく、したがって、次のことが可能になります。
~の管理を指揮する 与えます 費用のかかる再建を回避する
レガシーシステムの。
データ設計に対する既存のアプローチ
倉庫
を構築し完成させるプロセス データウェアハウス
というよりも、進化のプロセスとして理解されるべきです。
従来のシステムの開発ライフサイクル (デージオ、1995年、シャンクス、
オドネルとアーノット、1997a)。一つの物事には多くのプロセスが関係しています
のプロジェクト データウェアハウス 初期化、計画など。
企業の経営者に求められた要件から取得した情報。
ソース、変換、クリーニング 与えます レガシーからの同期
システムおよびその他のソース 与えます;開発中の配信システム。
の監視 データウェアハウス;そしてプロセスの無意味さ
の進化と構築 データウェアハウス (スティンチズ、オドネル
およびアーノット 1997b)。このジャーナルでは、次のことに焦点を当てます。
私を描きます 与えます これらの他のプロセスのコンテキストに保存されます。
データ アーキテクチャに関しては数多くのアプローチが提案されています
文学の倉庫 (Inmon 1994、Ives 1995、Kimball 1994)
マクファデン、1996)。これらの方法論にはそれぞれ簡単な説明があります。
強みと弱みを分析してレビューします。
Inmon 氏 (1994) のアプローチ データウェアハウス
設計
Inmon (1994) は、データを描画するための XNUMX つの反復ステップを提案しました。
倉庫 (図 2 を参照)。最初のステップはテンプレートをデザインすることです
与えます 私がどのように理解しているかを社会的に理解する 与えます 統合できる
組織内の機能領域全体で
私を割る 与えます エリアに保管します。モデル 与えます それはのために作られています
保存する 与えます 意思決定に関連するものを含む 与えます
歴史家も含めて 与えます 推定して集計したもの。 2番目のステップは
実装する対象領域を特定します。これらはベースになっています
特定の組織によって決定された優先事項に基づいて。第3
ステップでは、 データベース 主題領域、ポーズについて
適切なレベルの粒度を含めることに特に注意してください。
Inmon 氏は、エンティティとリレーションシップ モデルを使用することをお勧めします。第4
ステップはソースシステムを特定することです 与えます 必要とされ、開発される
i をキャプチャ、クリーン、フォーマットするための変換プロセス 与えます.
Inmon のアプローチの強みは、モデルが 与えます 社会的な
の統合の基礎を提供します 与えます 組織内で
反復的なデータ開発の計画をサポートします
倉庫。欠点は描画の難しさとコストです
モデル 与えます 社会的、エンティティのモデルを理解することの難しさ、
両方のモデルで使用される関係 与えます 社会的なこと 与えます
主題分野ごとに保存され、その適切性 与えます インクルード
の図面 データウェアハウス の実現のために データベース
関係的ですが、目的ではありません データベース 多次元。
アイヴズ (1995) のアプローチ データウェアハウス
設計
Ives (1995) は、システムを設計するための XNUMX 段階のアプローチを提案しています。
データの設計に適用できると彼が考える情報システム
倉庫 (図 3 を参照)。このアプローチは以下に基づいています
情報システムを開発するための情報工学
(マーティン、1990)。最初のステップは、目的と要因を決定することです
重要かつ成功した重要なパフォーマンス指標。ザ
主要なビジネスプロセスと必要な情報は、
私たちをモデルに導くためにモデル化された 与えます 社交。第二段階
定義的なアーキテクチャの開発が含まれる 与えます
エリアごとに保存され、 データベース di データウェアハウス、コンポーネント
必要なテクノロジー、組織的なサポートのセット
を実装して運用するために必要な データウェアハウス。第3
このステップには、必要なソフトウェア パッケージとツールの選択が含まれます。
4 番目のステップは、詳細な設計と構築です。
データウェアハウス。アイヴスは次のように述べています。 与えます 彼は絆のある男だ
反復プロセス。
アイブスのアプローチの強みは、特定のテクニックを使用していることです。
情報要件を決定し、構造化された情報を使用する
の統合をサポートするプロセス データウェアハウス,
適切なハードウェアとソフトウェアの選択、および複数のソフトウェアの使用
の表現技術 データウェアハウス。その欠点
それらは本質的に複雑です。他には、以下のような困難が含まれます。
多くのレベルの~を開発する データベース 内の データウェアハウス in
妥当な時間とコスト。
Kimball 氏 (1994) のアプローチ データウェアハウス
設計
Kimball (1994) は、データを描画するための XNUMX つの反復ステップを提案しました。
倉庫 (図 4 を参照)。彼のアプローチは特に
たった一つのデザインに専念 データウェアハウス そしてモデルの使用について
エンティティや関係のモデルよりも次元を優先します。キンボール
それらの次元モデルを分析するほうが理解しやすいからです
ビジネスエグゼクティブとの取引、取引の際の効率が向上します
複雑なコンサルティングとデザイン データベース フィジカルのほうが多い
効率的です (Kimball 1994)。キンボールは、
データウェアハウス それは反復的であり、 データウェアハウス 分離できます
ディメンションテーブルへの分割を通じて統合される
一般。
最初のステップは、対象となる特定の主題領域を特定することです。
完成した。 2 番目と 3 番目のステップは成形に関するものです
次元的な。第 2 ステップでは、測定により次のことが特定されます。
主題領域への関心をファクト テーブルにグループ化します。
たとえば、販売主題領域では、関心のあるメジャー
販売されたアイテムの金額とドルを含めることができます
販売通貨として。 3 番目のステップでは、次のことを特定します。
グループ化する方法であるディメンション
事実。販売主題領域の関連するディメンション
アイテム、場所、期間を含めることができます。そこには
ファクト テーブルには、それぞれにリンクする複数の部分のキーがあります。
ディメンション テーブルの数が多く、通常は非常に多くのディメンション テーブルが含まれます
事実がいっぱい。対照的に、ディメンション テーブルには次のものが含まれます。
寸法やその他の属性に関する説明情報。
ファクトをグループ化するために使用できます。ファクトテーブル e
提案フォームに関連付けられた寸法、いわゆる 1 つ
その形状による星模様。 4 番目のステップでは、
の建設 データベース 多次元で完璧にする
星の模様。最後のステップはソース システムを特定することです 与えます
取得、クリーン化するために必要な変換プロセスを開発します。
そして私をフォーマットします 与えます.
Kimball のアプローチの長所には、モデルの使用が含まれます。
i を表す次元 与えます それを作るために保存されています
わかりやすく、効率的な物理設計につながります。あ
両方を簡単に使用できる次元モデル
システム データベース リレーショナルまたはシステムを完成させることができます
データベース 多次元。その欠点には欠如が含まれます
の計画や統合を促進するためのいくつかのテクニック
一つの中にたくさんの星模様が入っている データウェアハウス
極端な非正規化構造から設計することの難しさ
次元モデル 与えます レガシーシステムでは。
マクファデン氏 (1996) のデータへのアプローチ
倉庫の設計
McFadden (1996) は、次の XNUMX 段階のアプローチを提案しています。
を描く データウェアハウス (図 5 を参照)。
彼のアプローチは文献からのアイデアの統合に基づいています
オンリーワンのデザインに焦点を当てています データウェアハウス。 最初の
ステップには要件分析が含まれます。具体的なことですが、
テクニックは規定されていないが、マクファデン氏のメモには、
エンティティ 与えます 仕様とその属性、および Watson リーダーを指します。
要件のキャプチャについては Frolick (1993) を参照してください。
2 番目のステップでは、エンティティ関係モデルが設計されます。
データウェアハウス そしてビジネスリーダーによって検証されました。第3
ステップには、レガシー システムからのマッピングの決定が含まれます
および外部ソース データウェアハウス。 4 番目のステップでは、
開発、展開、同期のプロセス 与えます
データウェアハウス。最終ステップでシステムが納品されます
ユーザーインターフェースに特に重点を置いて開発されました。
マクファデン氏は、描画プロセスは一般的に次のように行われると指摘しています。
反復的。
マクファーデンのアプローチの強みは参加を促す
ビジネスリーダーが要件を決定する際に、
資源の大切さ 与えます、彼らの掃除と収集。彼女
欠陥は、分割するためのプロセスの欠如に関するものです。
による素晴らしいプロジェクト データウェアハウス 多くの統合された段階で、
の設計に使用されるエンティティおよび関係モデルを理解するのが難しい
データウェアハウス.

    0/5 (レビュー 0 件)
    0/5 (レビュー 0 件)
    0/5 (レビュー 0 件)

    オンライン Web 代理店の詳細については、こちらをご覧ください。

    最新の記事を電子メールで受け取るには購読してください。

    作者のアバター
    管理人 最高経営責任者
    👍オンライン Web 代理店 |デジタルマーケティングとSEOのWebエージェンシーの専門家。 Web代理店オンラインはWeb代理店です。 Agenzia Web Online のデジタル変革における成功は、Iron SEO バージョン 3 の基礎に基づいています。専門分野: システム統合、エンタープライズ アプリケーション統合、サービス指向アーキテクチャ、クラウド コンピューティング、データ ウェアハウス、ビジネス インテリジェンス、ビッグ データ、ポータル、イントラネット、Web アプリケーションリレーショナル データベースと多次元データベースの設計と管理 デジタル メディアのインターフェイスの設計: ユーザビリティとグラフィックス。オンライン Web エージェンシーは企業に次のサービスを提供します。 - Google、Amazon、Bing、Yandex での SEO。 -ウェブ分析: Google アナリティクス、Google タグ マネージャー、Yandex Metrica; - ユーザーコンバージョン: Google Analytics、Microsoft Clarity、Yandex Metrica; - Google、Bing、Amazon 広告の SEM。 - ソーシャル メディア マーケティング (Facebook、Linkedin、Youtube、Instagram)。
    私のアジャイル プライバシー
    このサイトでは、テクニカル Cookie とプロファイリング Cookie を使用しています。 [同意する] をクリックすると、すべてのプロファイリング Cookie が承認されます。 拒否または X をクリックすると、すべてのプロファイリング Cookie が拒否されます。 カスタマイズをクリックすると、有効にするプロファイリング Cookie を選択できます。
    このサイトは、25 年 2020 月 2016 日のスイス連邦法であるデータ保護法 (LPD)、および個人データの保護およびかかるデータの自由な移動に関する GDPR、EU 規則 679/XNUMX に準拠しています。