fbpx

Pergudangan Data dan Perancangan Sumber Perusahaan | DWH dan ERP

ARKIB DATA TENGAH: SEJARAH ED EVOLUSI

Dua tema dominan teknologi korporat pada tahun 90-an ialah i gudang data dan ERP. Untuk sekian lama kedua-dua arus kuat ini telah menjadi sebahagian daripada IT korporat tanpa pernah mempunyai persimpangan. Ia hampir seolah-olah ia jirim dan anti jirim. Tetapi pertumbuhan kedua-dua fenomena tidak dapat dielakkan telah membawa kepada persimpangan mereka. Hari ini syarikat menghadapi masalah apa yang perlu dilakukan dengan ERP dan gudang data. Artikel ini akan menggariskan masalah yang dihadapi dan cara syarikat menanganinya.

PADA PERMULAANNYA…

Pada mulanya terdapat gudang data. Gudang data dicipta untuk mengatasi sistem aplikasi pemprosesan transaksi. Pada zaman awal hafalan dati ia hanya bertujuan untuk menjadi titik balas kepada aplikasi pemprosesan transaksi. Tetapi pada masa kini terdapat pandangan yang lebih canggih tentang apa a gudang data. Dalam dunia hari ini gudang data ia dimasukkan dalam struktur yang boleh dipanggil Kilang Maklumat Korporat.

KILANG MAKLUMAT KORPORAT (CIF)

Kilang Maklumat Korporat mempunyai komponen seni bina standard: tahap transformasi dan integrasi kod yang menyepadukan dati Sementara saya dati mereka bergerak dari persekitaran aplikasi ke arah persekitaran gudang data syarikat; a gudang data syarikat di mana dati sejarah yang terperinci dan bersepadu. The gudang data syarikat berfungsi sebagai asas di mana semua bahagian lain persekitaran boleh dibina gudang data; stor data operasi (ODS). ODS ialah struktur hibrid yang mengandungi beberapa aspek gudang data dan aspek lain persekitaran OLTP; data mart, di mana jabatan yang berbeza boleh mempunyai versi mereka sendiri gudang data; a gudang data penerokaan di mana "ahli falsafah" syarikat boleh mengemukakan pertanyaan mereka selama 72 jam tanpa kesan berbahaya ke atas gudang data; dan memori garisan hampir, di mana dati lama dan dati butiran pukal boleh disimpan dengan murah.

DI MANA ERP BERGABUNG DENGAN LA KILANG MAKLUMAT KORPORAT

ERP bergabung dengan Kilang Maklumat Korporat di dua tempat. Pertama sebagai aplikasi asas (baseline) yang menyediakan i dati daripada permohonan kepada gudang data. Dalam kes ini i dati, dijana sebagai hasil sampingan proses transaksi, disepadukan dan dimuatkan ke dalam gudang data syarikat itu. Titik kedua kesatuan antara ERP dan CIF dan ODS. Malah, dalam banyak persekitaran ERP digunakan sebagai ODS klasik.

Sekiranya ERP digunakan sebagai aplikasi asas, ERP yang sama juga boleh digunakan dalam CIF sebagai ODS. Walau apa pun, jika ERP hendak digunakan dalam kedua-dua peranan, mesti ada perbezaan yang jelas antara kedua-dua entiti. Dalam erti kata lain, apabila ERP memainkan peranan aplikasi teras dan ODS, kedua-dua entiti seni bina mesti dibezakan. Jika satu perlaksanaan ERP cuba melaksanakan kedua-dua peranan secara serentak pasti akan ada masalah dalam reka bentuk dan pelaksanaan struktur tersebut.

ODS DAN APLIKASI ASAS BERASINGAN

Terdapat banyak sebab yang membawa kepada pembahagian komponen seni bina. Mungkin isu yang paling ketara untuk memisahkan komponen seni bina yang berbeza ialah setiap komponen seni bina mempunyai pandangannya sendiri. Aplikasi garis dasar mempunyai tujuan yang berbeza daripada ODS. Cuba tumpang tindih

pandangan aplikasi asas mengenai dunia ODS atau sebaliknya bukanlah cara yang betul untuk bekerja.

Akibatnya, masalah pertama ERP dalam CIF adalah untuk mengesahkan sama ada terdapat perbezaan antara aplikasi garis dasar dan ODS.

MODEL DATA DALAM KORPORAT KILANG MAKLUMAT

Untuk mencapai kesepaduan antara komponen berbeza seni bina CIF, mesti ada model dati. Model-model daripada dati ia berfungsi sebagai penghubung antara pelbagai komponen seni bina seperti aplikasi garis dasar dan ODS. Model-model daripada dati mereka menjadi "peta jalan intelek" untuk mendapatkan makna yang betul daripada komponen seni bina yang berbeza CIF.

Seiring dengan tanggapan ini, ideanya ialah perlu ada satu model besar dan tunggal dati. Jelas sekali mesti ada model dati untuk setiap komponen dan juga mesti ada laluan masuk akal yang menghubungkan model yang berbeza. Setiap komponen seni bina – ODS, aplikasi garis dasar, gudang data syarikat, dan sebagainya.. – memerlukan modelnya sendiri dati. Oleh itu, perlu ada definisi yang tepat tentang cara model ini dati mereka antara satu sama lain.

GERAK I DATA ERP PADA TARIKH WAREHOUSE

Jika asal usul dati ialah aplikasi asas dan/atau ODS, apabila ERP memasukkan dati dalam gudang data, sisipan ini mesti berlaku pada tahap "granularity" yang paling rendah. Ringkas atau agregat i dati kerana mereka keluar daripada aplikasi garis dasar ERP atau ERP ODS bukanlah perkara yang betul untuk dilakukan. THE dati butiran diperlukan dalam gudang data untuk membentuk asas proses DSS. begitu dati akan dibentuk semula dalam pelbagai cara oleh data mart dan penerokaan gudang data.

Anjakan daripada dati daripada persekitaran aplikasi garis dasar ERP kepada gudang data syarikat dilakukan dengan cara yang agak santai. Pergerakan ini berlaku kira-kira 24 jam selepas kemas kini atau penciptaan dalam ERP. Hakikat mempunyai pergerakan "malas". dati dalam gudang data syarikat membenarkan dati datang dari ERP kepada "deposit". Sekali saya dati disimpan dalam aplikasi garis dasar, maka anda boleh mengalihkan dengan selamat dati ERP dalam perusahaan. Satu lagi matlamat yang boleh dicapai terima kasih kepada pergerakan "malas" daripada dati ia adalah persempadanan yang jelas antara proses operasi dan DSS. Dengan pergerakan "pantas" daripada dati garis pemisah antara DSS dan operasi masih kabur.

Pergerakan dati daripada ERP ODS kepada gudang data syarikat dilakukan secara berkala, biasanya mingguan atau bulanan. Dalam kes ini pergerakan daripada dati ia berdasarkan keperluan untuk "membersihkan" yang lama dati ahli sejarah. Sudah tentu, ODS mengandungi i dati yang lebih terkini daripada dati ahli sejarah yang ditemui dalam gudang data.

Anjakan daripada dati dalam gudang data ia hampir tidak pernah dilakukan secara "borong" (dengan cara pemborong). Salin jadual daripada persekitaran ERP ke gudang data ia tidak masuk akal. Pendekatan yang lebih realistik ialah memindahkan unit terpilih bagi dati. Hanya yang dati yang telah berubah sejak kemas kini terakhir gudang data mereka adalah orang-orang yang harus dipindahkan ke dalam gudang data. Satu cara untuk mengetahui yang mana satu dati telah berubah sejak kemas kini terakhir adalah untuk melihat cap masa dati terdapat dalam persekitaran ERP. Pereka bentuk memilih semua perubahan yang telah berlaku sejak kemas kini terakhir. Pendekatan lain ialah menggunakan teknik tangkapan perubahan dati. Dengan teknik ini, log dan pita jurnal dianalisis untuk menentukan yang mana dati mesti dipindahkan dari persekitaran ERP kepada persekitaran gudang data. Teknik ini adalah yang terbaik kerana log dan pita jurnal boleh dibaca daripada fail ERP tanpa menjejaskan lagi sumber ERP yang lain.

KOMPLIKASI LAIN

Salah satu isu ERP dalam CIF ialah perkara yang berlaku kepada sumber aplikasi lain atau kepada dati daripada ODS yang mesti menyumbang kepada gudang data tetapi mereka bukan sebahagian daripada persekitaran ERP. Memandangkan sifat tertutup ERP, terutamanya SAP, cuba menyepadukan kunci daripada sumber luaran dati dengan i dati yang datang daripada ERP apabila memindahkan dati dalam gudang data, ia adalah satu cabaran yang besar. Dan sebenarnya apakah kebarangkalian bahawa i dati aplikasi atau ODS di luar persekitaran ERP akan disepadukan ke dalam gudang data? Kemungkinan sebenarnya sangat tinggi.

CARI DATA SEJARAH DARI ERP

Satu lagi masalah dengan i dati ERP adalah yang berasal daripada keperluan untuk mempunyai dati ahli sejarah dalam gudang data. Biasanya yang gudang data keperluan dati ahli sejarah. Dan teknologi ERP biasanya tidak menyimpannya dati sejarah, sekurang-kurangnya tidak ke tahap di mana ia perlu dalam gudang data. Apabila sejumlah besar dati sejarah mula menambah dalam persekitaran ERP, persekitaran itu perlu dibersihkan. Sebagai contoh, andaikan bahawa a gudang data mesti dimuatkan dengan lima tahun dati sejarah manakala ERP menyimpan maksimum enam bulan ini dati. Selagi syarikat berpuas hati dengan mengumpul beberapa siri dati ahli sejarah apabila masa berlalu, maka tidak ada masalah untuk menggunakan ERP sebagai sumber untuk gudang data. Tetapi apabila gudang data dia harus kembali ke masa lalu dan mendapatkan tuhan dati sejarah yang sebelum ini tidak dikumpul dan disimpan oleh ERP, maka persekitaran ERP menjadi tidak cekap.

ERP DAN METADATA

Satu lagi pertimbangan yang perlu dibuat tentang ERP e gudang data ialah metadata yang wujud dalam persekitaran ERP. Sama seperti metadata mengalir dari persekitaran ERP ke gudang data, metadata mesti dialihkan dengan cara yang sama. Tambahan pula, metadata mesti diubah menjadi format dan struktur yang diperlukan oleh infrastruktur gudang data. Terdapat perbezaan besar antara metadata operasi dan metadata DSS. Metadata operasi adalah terutamanya untuk pembangun dan

pengaturcara. Metadata DSS adalah terutamanya untuk pengguna akhir. Metadata sedia ada dalam aplikasi ERP atau ODS perlu ditukar, dan penukaran ini tidak selalunya mudah dan mudah.

MENYUMBER DATA ERP

Jika ERP digunakan sebagai pembekal dati untuk gudang data mesti ada antara muka yang kukuh yang menggerakkan dati daripada persekitaran ERP kepada persekitaran gudang data. Antara muka mesti:

  • ▪ mudah digunakan
  • ▪ membenarkan akses kepada dati daripada ERP
  • ▪ mengambil maksud dati yang akan dipindahkan ke gudang data
  • ▪ mengetahui had ERP yang mungkin timbul apabila mengakses dati daripada ERP:
  • ▪ integriti rujukan
  • ▪ hubungan hierarki
  • ▪ hubungan logik tersirat
  • ▪ konvensyen permohonan
  • ▪ semua struktur dati disokong oleh ERP, dan sebagainya…
  • ▪ cekap dalam mengakses dati, dengan memperuntukkan:
  • ▪ pergerakan langsung daripada dati
  • ▪ pemerolehan perubahan dati
  • ▪ menyokong akses tepat pada masanya dati
  • ▪ memahami format dati, dan sebagainya… BERSAMBUNGAN DENGAN SAP Antara muka boleh terdiri daripada dua jenis, buatan sendiri atau komersial. Beberapa antara muka dagangan utama termasuk:
  • ▪ SAS
  • ▪ Penyelesaian Prims
  • ▪ D2k, dan seterusnya… PELBAGAI TEKNOLOGI ERP Merawat persekitaran ERP seolah-olah ia adalah satu teknologi adalah satu kesilapan besar. Terdapat banyak teknologi ERP, masing-masing mempunyai kekuatan tersendiri. Vendor yang paling terkenal di pasaran ialah:
  • ▪ SAP
  • ▪ Oracle Financials
  • ▪ PeopleSoft
  • ▪ JD Edwards
  • ▪ Baan SAP SAP ialah perisian ERP terbesar dan paling lengkap. Aplikasi SAP merangkumi banyak jenis aplikasi dalam banyak kawasan. SAP mempunyai reputasi sebagai:
  • ▪ sangat besar
  • ▪ sangat sukar dan mahal untuk dilaksanakan
  • ▪ memerlukan ramai orang dan perunding untuk dilaksanakan
  • ▪ memerlukan orang khusus untuk pelaksanaan
  • ▪ mengambil masa yang lama untuk dilaksanakan Tambahan pula, SAP mempunyai reputasi untuk menghafalnya dati sangat berhati-hati, menyukarkan seseorang di luar kawasan SAP untuk mengaksesnya. Kekuatan SAP ialah ia mampu menangkap dan menyimpan sejumlah besar dati. Baru-baru ini SAP mengumumkan hasratnya untuk melanjutkan permohonannya kepada gudang data. Terdapat banyak kebaikan dan keburukan menggunakan SAP sebagai vendor gudang data. Kelebihannya ialah SAP sudah dipasang dan kebanyakan perunding sudah mengetahui SAP.
    Kelemahan mempunyai SAP sebagai pembekal gudang data terdapat banyak: SAP tidak mempunyai pengalaman dalam dunia gudang data Jika SAP adalah pembekal gudang data, adalah perlu untuk "mengeluarkan" i dati dari SAP ke gudang data. Data rekod prestasi sistem tertutup SAP, tidak mungkin mudah untuk mendapatkan i dari SAP ke dalamnya (???). Terdapat banyak persekitaran warisan yang menguasakan SAP, seperti IMS, VSAM, ADABAS, ORACLE, DB2 dan sebagainya. SAP menegaskan pendekatan "tidak dicipta di sini". SAP tidak mahu bekerjasama dengan vendor lain untuk menggunakan atau mencipta gudang data. SAP berkeras untuk menjana semua perisiannya sendiri.

Walaupun SAP adalah syarikat yang besar dan berkuasa, cuba menulis semula teknologi ELT, OLAP, pentadbiran sistem dan juga kod teras dbms ia hanya gila. Daripada mengambil sikap bekerjasama dengan pembekal gudang data lama, SAP telah mengikuti pendekatan "mereka tahu terbaik". Sikap ini menghalang kejayaan yang SAP boleh miliki dalam bidang gudang data.
Keengganan SAP untuk membenarkan vendor luar mengakses mereka dengan segera dan anggun dati. Intipati penggunaan a gudang data adalah akses mudah dati. Keseluruhan sejarah SAP adalah berdasarkan menyukarkan akses dati.
Kekurangan pengalaman SAP dalam menangani jumlah besar dati; dalam bidang gudang data terdapat jilid dati tidak pernah dilihat oleh SAP dan untuk menguruskan kuantiti besar ini dati anda perlu mempunyai teknologi yang sesuai. SAP nampaknya tidak menyedari halangan teknologi ini yang wujud untuk memasuki bidang gudang data.
Budaya korporat SAP: SAP telah membuat perniagaan untuk mendapatkan dati daripada sistem. Tetapi untuk melakukan ini anda perlu mempunyai mentaliti yang berbeza. Secara tradisinya, syarikat perisian yang pandai memasukkan data ke dalam persekitaran tidak pandai mendapatkan data untuk pergi ke arah lain. Jika SAP berjaya membuat suis jenis ini, ia akan menjadi syarikat pertama yang berbuat demikian.

Ringkasnya, adalah dipersoalkan sama ada syarikat harus memilih SAP sebagai pembekalnya gudang data. Terdapat risiko yang sangat serius di satu pihak dan sangat sedikit ganjaran di pihak yang lain. Tetapi ada sebab lain yang tidak menggalakkan memilih SAP sebagai pembekal gudang data. Kerana setiap syarikat sepatutnya mempunyai perkara yang sama gudang data daripada semua syarikat lain? The gudang data ia adalah nadi kelebihan daya saing. Jika setiap syarikat menerima pakai yang sama gudang data ia akan menjadi sukar, walaupun tidak mustahil, untuk mencapai kelebihan daya saing. SAP seolah-olah berfikir bahawa a gudang data ia boleh dilihat sebagai kuki dan ini adalah petanda lanjut tentang mentaliti aplikasi mereka "dapatkan data dalam".

Tiada vendor ERP lain yang dominan seperti SAP. Tidak dinafikan akan ada syarikat yang akan mengikuti laluan SAP untuk mereka gudang data tetapi mungkin ini gudang data SAP akan menjadi besar, mahal dan memakan masa untuk dibuat.

Persekitaran ini termasuk aktiviti seperti pemprosesan juruwang bank, proses tempahan syarikat penerbangan, proses tuntutan insurans dan sebagainya. Semakin berprestasi sistem transaksi, semakin jelas keperluan untuk pengasingan antara proses operasi dan DSS (Sistem Sokongan Keputusan). Walau bagaimanapun, dengan sistem HR dan kakitangan, anda tidak pernah berhadapan dengan jumlah urus niaga yang besar. Dan, sudah tentu, apabila seseorang diupah atau meninggalkan syarikat ini adalah rekod transaksi. Tetapi berbanding dengan sistem lain, sistem HR dan kakitangan tidak mempunyai banyak transaksi. Oleh itu, dalam sistem HR dan kakitangan tidak begitu jelas bahawa terdapat keperluan untuk DataWarehouse. Dalam banyak cara sistem ini mewakili penggabungan sistem DSS.

Tetapi ada faktor lain yang mesti dipertimbangkan jika anda berurusan dengan gudang data dan PeopleSoft. Dalam banyak persekitaran, i dati sumber manusia dan peribadi adalah sekunder kepada perniagaan utama syarikat. Kebanyakan syarikat terlibat dalam pembuatan, jualan, menyediakan perkhidmatan, dan sebagainya. Sumber manusia dan sistem kakitangan biasanya merupakan bahagian kedua (atau menyokong) barisan perniagaan utama syarikat. Oleh itu, ia adalah samar-samar dan menyusahkan gudang data berasingan untuk sumber manusia dan sokongan kakitangan.

PeopleSoft sangat berbeza daripada SAP dalam hal ini. Dengan SAP, wajib ada a gudang data. Dengan PeopleSoft, ia tidak begitu jelas. Gudang data adalah pilihan dengan PeopleSoft.

Perkara terbaik yang boleh dikatakan untuk i dati PeopleSoft ialah gudang data boleh digunakan untuk mengarkib i dati berkaitan dengan sumber manusia dan peribadi lama. Sebab kedua mengapa syarikat ingin menggunakan a gudang data a

memudaratkan persekitaran PeopleSoft adalah untuk membenarkan akses dan akses percuma kepada alat analisis, untuk dati oleh PeopleSoft. Tetapi di luar sebab-sebab ini, mungkin terdapat kes di mana lebih baik untuk tidak mempunyai gudang data dati PeopleSoft.

Ringkasnya

Terdapat banyak idea mengenai pembinaan a gudang data dalam perisian ERP.
Antaranya ialah:

  • ▪ Masuk akal untuk mempunyai a gudang data itu seperti apa-apa lagi dalam industri?
  • ▪ Betapa fleksibelnya ERP gudang data perisian?
  • ▪ ERP gudang data perisian boleh mengendalikan jumlah dati yang terletak di agudang data arena"?
  • ▪ Apakah jejak rakaman yang vendor ERP lakukan dalam menghadapi mudah dan murah, dari segi masa, dati? (apakah rekod prestasi vendor ERP mengenai penghantaran data yang murah, tepat pada masanya, mudah diakses?)
  • ▪ Apakah pemahaman vendor ERP tentang seni bina DSS dan kilang maklumat korporat?
  • ▪ Vendor ERP memahami cara mencapainya dati dalam persekitaran, tetapi juga memahami cara mengeksportnya?
  • ▪ Sejauh manakah vendor ERP terbuka kepada alatan pergudangan data?
    Semua pertimbangan ini mesti dibuat dalam menentukan di mana untuk meletakkan gudang data yang akan menjadi tuan rumah i dati ERP dan lain-lain dati. Secara amnya, melainkan ada sebab yang kukuh untuk melakukan sebaliknya, pembinaan adalah disyorkan gudang data di luar persekitaran vendor ERP. BAB 1 Gambaran Keseluruhan Perkara Utama Organisasi BI:
    Repositori maklumat berfungsi secara terbalik kepada seni bina risikan perniagaan (BI):
    Budaya korporat dan IT boleh mengehadkan kejayaan dalam membina organisasi BI.

Teknologi bukan lagi faktor pengehad bagi organisasi BI. Persoalan untuk arkitek dan perancang projek bukanlah sama ada teknologi itu wujud, tetapi sama ada mereka boleh melaksanakan teknologi yang ada dengan berkesan.

Bagi banyak syarikat a gudang data ia adalah sedikit lebih daripada deposit pasif yang mengedarkan dati kepada pengguna yang memerlukannya. THE dati ia diekstrak daripada sistem sumber dan dihuni ke dalam struktur sasaran gudang data. The dati mereka juga boleh dibersihkan dengan apa-apa nasib. Walau bagaimanapun tiada nilai tambahan ditambah atau dikumpul oleh dati semasa proses ini.

Pada asasnya, Dw pasif, paling baik, hanya menyediakan i dati bersih dan beroperasi kepada persatuan pengguna. Penciptaan maklumat dan pemahaman analisis sepenuhnya terpulang kepada pengguna. Nilai sama ada DW (Gudang data) ialah kejayaan adalah subjektif. Jika kita menilai kejayaan berdasarkan keupayaan untuk mengumpul, menyepadukan dan membersihkan dengan cekap dati korporat pada asas yang boleh diramal, maka ya, DW adalah satu kejayaan. Sebaliknya, jika kita melihat pengumpulan, penyatuan dan eksploitasi maklumat oleh organisasi secara keseluruhan, maka DW adalah kegagalan. DW memberikan sedikit atau tiada nilai maklumat. Akibatnya, pengguna terpaksa melakukan, sekali gus mewujudkan silo maklumat. Bab ini membentangkan pandangan komprehensif untuk meringkaskan seni bina BI (Business Intelligence) syarikat. Kami bermula dengan penerangan tentang BI dan kemudian beralih kepada perbincangan mengenai reka bentuk dan pembangunan maklumat, berbanding dengan hanya menyediakan maklumat. dati kepada pengguna. Perbincangan kemudian fokus pada pengiraan nilai usaha BI anda. Kami membuat kesimpulan dengan menentukan cara IBM menangani keperluan seni bina BI organisasi anda.

Penerangan tentang seni bina organisasi BI

Sistem maklumat berorientasikan urus niaga yang berkuasa kini menjadi perkara biasa dalam setiap perusahaan besar, dengan berkesan meratakan medan permainan untuk syarikat di seluruh dunia.

Kekal berdaya saing, bagaimanapun, kini memerlukan sistem berorientasikan analisis yang boleh merevolusikan keupayaan syarikat untuk mencari semula dan menggunakan maklumat yang telah mereka miliki. Sistem analisis ini diperoleh daripada memahami kekayaan dati tersedia. BI boleh meningkatkan prestasi merentas perusahaan. Syarikat boleh meningkatkan hubungan pelanggan-pembekal, meningkatkan keuntungan produk dan perkhidmatan, menjana tawaran baharu dan lebih baik, mengawal risiko dan antara banyak keuntungan lain mengurangkan perbelanjaan secara mendadak. Dengan BI syarikat anda akhirnya mula menggunakan maklumat pelanggan sebagai aset yang kompetitif terima kasih kepada aplikasi yang mempunyai objektif pasaran.

Mempunyai alat perniagaan yang betul bermakna mempunyai jawapan yang pasti kepada soalan utama seperti:

  • ▪ Yang mana antara kita pelanggan adakah mereka membuat kita mendapat lebih banyak, atau adakah mereka membuat kita kehilangan wang?
  • ▪ Tempat terbaik kami tinggal pelanggan berhubung dengan kedai/ gudang yang sering mereka kunjungi?
  • ▪ Produk dan perkhidmatan kami yang manakah boleh dijual dengan paling berkesan dan kepada siapa?
  • ▪ Produk manakah yang boleh dijual paling berkesan dan kepada siapa?
  • ▪ Kempen jualan manakah yang paling berjaya dan mengapa?
  • ▪ Saluran jualan manakah yang paling berkesan untuk produk mana?
  • ▪ Bagaimana kita boleh meningkatkan hubungan dengan orang terbaik kita pelanggan? Kebanyakan syarikat mempunyai dati cara kasar untuk menjawab soalan-soalan ini.
    Sistem operasi menjana sejumlah besar produk, pelanggan dan dati pasaran daripada tempat jualan, tempahan, perkhidmatan pelanggan dan sistem sokongan teknikal. Cabarannya adalah untuk mengekstrak dan mengeksploitasi maklumat ini. Banyak syarikat hanya mendapat keuntungan daripada sebahagian kecil syarikat mereka dati untuk analisis strategik.
    I dati yang tinggal, sering disertai dengan i dati diperoleh daripada sumber luar seperti laporan kerajaan, dan maklumat lain yang dibeli, adalah lombong emas yang hanya menunggu untuk diterokai, dan dati ia hanya perlu diperhalusi dalam konteks maklumat organisasi anda.

Pengetahuan ini boleh digunakan dalam beberapa cara, bermula daripada mereka bentuk strategi korporat keseluruhan kepada komunikasi peribadi dengan pembekal, melalui pusat panggilan, invois, Internet dan mata lain. Persekitaran perniagaan hari ini menentukan bahawa DW dan penyelesaian BI yang berkaitan berkembang melangkaui menjalankan struktur perniagaan tradisional. dati yang i dati dinormalisasi pada tahap atom dan "ladang bintang/kiub".

Apa yang diperlukan untuk kekal berdaya saing ialah gabungan teknologi tradisional dan canggih dalam usaha menyokong landskap analisis yang luas.
Sebagai kesimpulan, persekitaran umum mesti meningkatkan pengetahuan syarikat secara keseluruhan, memastikan bahawa tindakan yang diambil hasil daripada analisis yang dijalankan adalah berguna supaya semua orang mendapat manfaat.

Sebagai contoh, katakan anda mengklasifikasikan milik anda pelanggan ke dalam kategori berisiko tinggi atau rendah.
Jika maklumat ini dijana oleh pengekstrak model atau cara lain, ia mesti dimasukkan ke dalam DW dan boleh diakses oleh sesiapa sahaja, melalui sebarang alat capaian, seperti laporan statik, hamparan, jadual atau pemprosesan analisis dalam talian (OLAP) .

Walau bagaimanapun, pada masa ini, kebanyakan jenis maklumat ini kekal dalam silo dati individu atau jabatan yang menghasilkan analisis. Organisasi, secara keseluruhan, mempunyai sedikit atau tiada keterlihatan untuk pemahaman. Hanya dengan menggabungkan jenis kandungan maklumat ini ke dalam DW perusahaan anda boleh menghapuskan silo maklumat dan meningkatkan persekitaran DW anda.
Terdapat dua halangan utama untuk membangunkan organisasi BI.
Pertama, kita mempunyai masalah organisasi itu sendiri dan disiplinnya.
Walaupun kami tidak dapat membantu dengan perubahan dasar organisasi, kami boleh membantu memahami komponen BI organisasi, seni binanya dan cara teknologi IBM memudahkan pembangunannya.
Halangan kedua untuk diatasi ialah kekurangan teknologi bersepadu dan pengetahuan tentang kaedah yang menangani keseluruhan ruang BI berbanding komponen kecil sahaja.

IBM akan menghadapi perubahan dalam teknologi penyepaduan. Adalah menjadi tanggungjawab anda untuk menyediakan reka bentuk yang bernas. Seni bina ini mesti dibangunkan dengan teknologi yang dipilih untuk penyepaduan tanpa batasan, atau sekurang-kurangnya, dengan teknologi yang mematuhi piawaian terbuka. Tambahan pula, pengurusan syarikat anda mesti memastikan bahawa aku janji BI dijalankan mengikut perancangan dan tidak membenarkan pembangunan silo maklumat yang timbul daripada agenda atau objektif layan diri.
Ini bukan untuk mengatakan bahawa persekitaran BI tidak sensitif untuk bertindak balas terhadap keperluan dan keperluan pengguna yang berbeza; sebaliknya, ini bermakna pelaksanaan keperluan dan keperluan individu tersebut dilakukan untuk manfaat keseluruhan organisasi BI.
Penerangan mengenai seni bina organisasi BI boleh didapati di muka surat 9 dalam Rajah 1.1 Seni bina menunjukkan gabungan teknologi dan teknik yang kaya.
Dari pandangan tradisional, seni bina merangkumi komponen gudang berikut

Lapisan Atom.

Ini adalah asas, nadi kepada keseluruhan DW dan oleh itu pelaporan strategik.
I dati disimpan di sini akan mengekalkan integriti sejarah, hubungan dati dan termasuk metrik terbitan, serta dibersihkan, disepadukan dan disimpan menggunakan pengekstrakan model.
Semua penggunaan seterusnya ini dati dan maklumat berkaitan diperoleh daripada struktur ini. Ini adalah sumber yang sangat baik untuk perlombongan dati dan untuk laporan dengan pertanyaan SQL berstruktur

Depoh operasi bagi dati atau laporan berdasarkan dati(Stor data operasi (ODS) atau pelaporan pangkalan data.)

Ini adalah struktur dati direka khusus untuk pelaporan teknikal.

I dati disimpan dan dilaporkan di atas struktur ini akhirnya boleh merambat ke dalam gudang melalui kawasan pementasan, di mana ia boleh digunakan untuk isyarat strategik.

Kawasan pementasan.

Perhentian pertama untuk kebanyakan orang dati dimaksudkan untuk persekitaran gudang ialah zon organisasi.
Disini saya dati mereka disepadukan, dibersihkan dan diubah menjadi dati keuntungan yang akan mengisi struktur gudang

Data mart.

Bahagian seni bina ini mewakili struktur dati digunakan khusus untuk OLAP. Kehadiran datamarts, jika i dati disimpan dalam skema bintang yang bertindih dati multidimensi dalam persekitaran hubungan, atau dalam fail dati Sulit yang digunakan oleh teknologi OLAP tertentu, seperti DB2 OLAP Server, tidak berkaitan.

Satu-satunya kekangan ialah seni bina memudahkan penggunaan dati pelbagai dimensi.
Seni bina ini juga termasuk teknologi dan teknik Bi kritikal yang menonjol sebagai:

Analisis ruang

Ruang adalah durian runtuh maklumat untuk penganalisis dan penting untuk menyelesaikan penyelesaian. Ruang boleh mewakili maklumat tentang orang yang tinggal di lokasi tertentu, serta maklumat tentang lokasi lokasi tersebut secara fizikal berbanding dengan seluruh dunia.

Untuk melakukan analisis ini, anda mesti bermula dengan mengikat maklumat anda pada koordinat latitud dan longitud. Ini dirujuk sebagai "geocoding" dan mesti menjadi sebahagian daripada proses ekstrak, transformasi dan muat (ETL) pada peringkat atom gudang anda.

Perlombongan data.

Pengekstrakan daripada dati membolehkan syarikat kami meningkatkan bilangan pelanggan, untuk meramalkan arah aliran jualan dan membenarkan pengurusan perhubungan dengan pelanggan (CRM), antara inisiatif BI yang lain.

Pengekstrakan daripada dati Oleh itu, ia mesti disepadukan dengan struktur dati Dwhouse dan disokong oleh proses gudang untuk memastikan penggunaan teknologi dan teknik yang berkaitan dengan berkesan dan cekap.

Seperti yang ditunjukkan dalam seni bina BI, tahap atom Dwhouse, serta datamarts, adalah sumber yang sangat baik untuk dati untuk perahan. Kemudahan yang sama itu juga mestilah penerima hasil pengekstrakan untuk memastikan ketersediaan kepada khalayak yang paling luas.

Ejen.

Terdapat pelbagai "ejen" untuk memeriksa pelanggan untuk setiap titik seperti, sistem pengendalian syarikat dan dw sendiri. Ejen ini boleh menjadi rangkaian saraf lanjutan yang dilatih untuk mempelajari tentang arah aliran pada setiap titik, seperti permintaan produk masa hadapan berdasarkan promosi jualan, enjin berasaskan peraturan untuk bertindak balas terhadap dato set keadaan, atau ejen mudah yang melaporkan pengecualian kepada "eksekutif atasan". Proses ini biasanya berlaku dalam masa nyata dan, oleh itu, mesti digandingkan rapat dengan pergerakannya dati. Semua struktur ini dati, teknologi dan teknik menjamin bahawa anda tidak akan menghabiskan malam menjana organisasi BI anda.

Aktiviti ini akan dibangunkan dalam langkah-langkah tambahan, untuk mata kecil.
Setiap langkah adalah usaha projek bebas, dan dirujuk sebagai lelaran dalam inisiatif DW atau BI anda. Lelaran boleh termasuk melaksanakan teknologi baharu, bermula dengan teknik baharu, menambah struktur baharu dati , memuatkan i dati tambahan , atau dengan pengembangan analisis persekitaran anda. Perenggan ini dibincangkan dengan lebih mendalam dalam bab 3.

Selain struktur DW tradisional dan alatan BI, terdapat fungsi lain organisasi BI anda yang perlu anda reka bentuk, seperti:

Titik sentuh pelanggan (Sentuhan pelanggan mata).

Seperti mana-mana organisasi moden, terdapat beberapa titik sentuh pelanggan yang menunjukkan cara untuk mendapatkan pengalaman positif untuk anda pelanggan. Terdapat saluran tradisional seperti peruncit, pengendali papan suis, mel terus, pengiklanan multimedia dan cetak, serta lebih banyak saluran semasa seperti e-mel dan web, dati produk dengan beberapa titik hubungan mesti diperoleh, diangkut, dibersihkan, diproses dan kemudian diisi di kemudahan dati daripada BI.

Asas daripada dati persatuan operasi dan pengguna (Operasi

pangkalan data dan komuniti pengguna).
Pada penghujung titik hubungan pelanggan asas-asas ditemui dati aplikasi syarikat dan komuniti pengguna. THE dati sedia ada adalah dati tradisional yang mesti disatukan dan digabungkan dengan dati yang mengalir dari titik hubungan untuk memenuhi maklumat yang diperlukan.

Penganalisis. (Penganalisis)

Penerima manfaat utama persekitaran BI ialah penganalisis. Dialah yang mendapat manfaat daripada pengekstrakan semasa dati beroperasi, disepadukan dengan sumber yang berbeza dati , ditambah dengan ciri seperti analisis geografi (geocoding) dan dibentangkan dalam teknologi BI yang membolehkan pengekstrakan, OLAP, pelaporan SQL lanjutan dan analisis geografi. Antara muka penganalisis utama untuk persekitaran pelaporan ialah portal BI.

Bagaimanapun, penganalisis itu bukan satu-satunya yang mendapat manfaat daripada seni bina BI.
Pengurus, persatuan pengguna besar, dan juga ahli, pembekal dan pelanggan mereka harus mencari faedah dalam BI perusahaan.

Gelung suapan belakang.

Seni bina BI ialah persekitaran pembelajaran. Prinsip ciri pembangunan adalah membenarkan struktur yang berterusan dati untuk dikemas kini oleh teknologi BI yang digunakan dan oleh tindakan yang diambil oleh pengguna. Contohnya ialah pemarkahan pelanggan.

Jika jabatan jualan memodelkan skor pelanggan untuk menggunakan perkhidmatan baharu, maka jabatan jualan bukan satu-satunya kumpulan yang mendapat manfaat daripada perkhidmatan tersebut.

Sebaliknya, pengekstrakan model harus dilakukan sebagai bahagian semula jadi aliran data dalam perusahaan dan skor pelanggan harus menjadi bahagian bersepadu dalam konteks maklumat gudang, yang boleh dilihat oleh semua pengguna. Suite IBM Bi-bI-centric termasuk DB2 UDB, DB2 OLAP Server merangkumi kebanyakan komponen teknologi utama, yang ditakrifkan dalam Rajah 1.1.

Kami menggunakan seni bina seperti yang ditunjukkan dalam ilustrasi ini dari buku untuk memberi kami tahap kesinambungan dan menunjukkan cara setiap produk IBM sesuai dengan keseluruhan skema BI.

Menyediakan Kandungan Maklumat (Menyediakan Kandungan Maklumat)

Mereka bentuk, membangun dan melaksanakan persekitaran BI anda adalah tugas yang sukar. Reka bentuk mesti merangkumi kedua-dua keperluan perniagaan semasa dan masa hadapan. Lukisan seni bina mestilah lengkap untuk memasukkan semua kesimpulan yang ditemui semasa fasa reka bentuk. Pelaksanaan mesti kekal komited kepada satu tujuan: membangunkan seni bina BI seperti yang dibentangkan secara rasmi dalam reka bentuk dan berdasarkan keperluan perniagaan.

Amat sukar untuk berhujah bahawa disiplin akan memastikan kejayaan relatif.
Ini mudah kerana anda tidak membangunkan persekitaran BI sekaligus, tetapi anda melakukannya dalam langkah-langkah kecil dari semasa ke semasa.

Walau bagaimanapun, mengenal pasti komponen BI seni bina anda adalah penting untuk dua sebab: Anda akan membimbing semua keputusan seni bina teknikal berikutnya.
Anda akan dapat merancang penggunaan teknologi tertentu secara sedar walaupun anda mungkin tidak mengulangi memerlukan teknologi selama beberapa bulan.

Memahami keperluan perniagaan anda dengan secukupnya akan mempengaruhi jenis produk yang anda peroleh untuk seni bina anda.
Mereka bentuk dan membangunkan seni bina anda memastikan bahawa gudang anda adalah

bukan peristiwa rawak, sebaliknya "difikirkan dengan baik" yang dibina dengan teliti. opera seni sebagai mozek teknologi campuran.

Reka bentuk kandungan maklumat

Semua reka bentuk awal mesti memberi tumpuan dan mengenal pasti komponen BI utama yang akan diperlukan oleh keseluruhan persekitaran sekarang dan pada masa hadapan.
Mengetahui keperluan perniagaan adalah penting.

Malah sebelum sebarang reka bentuk formal bermula, perancang projek selalunya boleh mengenal pasti satu atau dua komponen dengan segera.
Baki komponen yang mungkin diperlukan untuk seni bina anda, walau bagaimanapun, tidak dapat ditemui dengan mudah. Semasa fasa reka bentuk, bahagian utama seni bina mengikat sesi pembangunan aplikasi (JAD) pada usaha untuk mengenal pasti keperluan perniagaan.

Kadangkala keperluan ini boleh diamanahkan kepada alat pertanyaan dan pelaporan.
Sebagai contoh, pengguna menyatakan bahawa jika mereka ingin mengautomasikan laporan semasa, mereka mesti menjananya secara manual dengan menyepadukan dua laporan semasa dan menambah pengiraan yang diperoleh daripada gabungan dati.
Walaupun keperluan ini mudah, ia mentakrifkan fungsi tertentu ciri yang mesti anda sertakan semasa membeli alat pelaporan untuk organisasi anda.

Pereka bentuk juga mesti mengejar keperluan tambahan untuk mendapatkan gambaran lengkap. Adakah pengguna mahu melanggan laporan ini?
Adakah subset laporan dijana dan dihantar melalui e-mel kepada pelbagai pengguna? Adakah mereka mahu melihat laporan ini dalam portal syarikat? Semua keperluan ini adalah sebahagian daripada keperluan mudah untuk menggantikan laporan manual seperti yang diminta oleh pengguna. Faedah jenis keperluan ini ialah setiap orang, pengguna dan pereka bentuk, mempunyai pemahaman tentang konsep laporan.

Walau bagaimanapun, terdapat jenis perniagaan lain yang perlu kita rancang. Apabila keperluan perniagaan dinyatakan dalam bentuk soalan perniagaan strategik, mudah bagi pereka pakar untuk membezakan ukuran/fakta dan keperluan dimensi.

Jika pengguna JAD tidak tahu cara menyatakan keperluan mereka dalam bentuk masalah perniagaan, pereka bentuk selalunya akan memberikan contoh untuk memulakan sesi pengumpulan keperluan.
Pereka bentuk pakar boleh membantu pengguna memahami bukan sahaja perdagangan strategik, tetapi juga cara membentuknya.
Pendekatan pengumpulan keperluan dibincangkan dalam bab 3; buat masa ini kami hanya ingin menunjukkan keperluan untuk mereka bentuk untuk semua jenis keperluan BI.

Masalah perniagaan strategik bukan sahaja keperluan perniagaan, tetapi juga petunjuk reka bentuk. Jika anda perlu menjawab soalan multidimensi, maka anda perlu menghafal, membentangkan i dati dimensi, dan jika anda perlu menyimpan dati multidimensi, anda mesti memutuskan jenis teknologi atau teknik yang akan anda gunakan.

Adakah anda melaksanakan skema bintang kiub terpelihara, atau kedua-duanya? Seperti yang anda lihat, walaupun masalah perniagaan yang mudah boleh mempengaruhi reka bentuk dengan ketara. Tetapi jenis keperluan perniagaan ini adalah perkara biasa dan difahami, sekurang-kurangnya oleh pereka bentuk dan perancang dengan pengalaman projek.

Terdapat perbincangan yang mencukupi tentang teknologi dan sokongan OLAP, dan pelbagai penyelesaian tersedia. Setakat ini kami telah menyebut keperluan untuk mengumpulkan pelaporan mudah dengan keperluan dimensi perniagaan, dan cara keperluan ini mempengaruhi keputusan seni bina teknikal.

Tetapi apakah keperluan yang tidak mudah difahami oleh pengguna atau pasukan Dw? Adakah anda memerlukan analisis spatial?
Model pengekstrakan daripada dati adakah mereka akan menjadi sebahagian daripada masa depan anda? Siapa tahu?

Adalah penting untuk ambil perhatian bahawa jenis teknologi ini tidak begitu dikenali oleh komuniti pengguna umum dan ahli pasukan Dw, sebahagiannya, ini mungkin kerana ia biasanya dikendalikan oleh beberapa pakar teknikal dalaman atau pihak ketiga. Ini adalah kes yang melampau bagi masalah yang dihasilkan oleh jenis teknologi ini. Jika pengguna tidak dapat menerangkan keperluan perniagaan atau membingkainya dengan cara yang memberikan panduan kepada pereka bentuk, mereka boleh tidak disedari atau, lebih teruk, diabaikan begitu sahaja.

Lebih bermasalah apabila pereka bentuk dan pembangun tidak dapat mengenali aplikasi salah satu daripada teknologi canggih tetapi kritikal ini.
Seperti yang sering kita dengar Pereka berkata, “baik, kenapa tidak kita ketepikan sehingga kita mendapat perkara lain ini? “Adakah mereka benar-benar berminat dengan keutamaan, atau adakah mereka hanya mengelak daripada keperluan yang mereka tidak faham? Kemungkinan besar ia adalah hipotesis terakhir. Katakan pasukan jualan anda telah menyampaikan keperluan perniagaan, seperti yang dinyatakan dalam Rajah 1.3, seperti yang anda lihat, keperluan tersebut dirangka dalam bentuk masalah perniagaan. Perbezaan antara masalah ini dan masalah dimensi biasa ialah jarak. Dalam kes ini, pasukan jualan ingin mengetahui, setiap bulan, jumlah jualan daripada produk, gudang dan pelanggan yang tinggal dalam jarak 5 batu dari gudang tempat mereka membeli.

Malangnya, pereka bentuk atau arkitek boleh mengabaikan komponen spatial dengan berkata, "kami mempunyai pelanggan, produk dan dati daripada deposit itu. Mari kekalkan jarak sehingga lelaran lain.

"Jawapan yang salah. Masalah perniagaan jenis ini adalah mengenai BI. Ia mewakili pemahaman yang lebih mendalam tentang perniagaan kami dan ruang analisis yang mantap untuk penganalisis kami. BI melangkaui pertanyaan mudah atau pelaporan standard, malah OLAP. Ini bukan bermaksud bahawa teknologi ini tidak penting untuk BI anda, tetapi teknologi ini sahaja tidak mewakili persekitaran BI.

Reka bentuk untuk konteks maklumat (Merancang untuk Kandungan Maklumat)

Memandangkan kami telah mengenal pasti keperluan perniagaan yang membezakan pelbagai komponen asas, ia mesti disertakan dalam keseluruhan reka bentuk seni bina. Sebahagian daripada komponen BI adalah sebahagian daripada usaha awal kami, manakala sebahagiannya tidak akan dilaksanakan selama beberapa bulan.

Walau bagaimanapun, semua keperluan yang diketahui ditunjukkan dalam reka bentuk supaya apabila kami perlu melaksanakan teknologi tertentu, kami bersedia untuk melakukannya. Sesuatu tentang projek itu akan mencerminkan pemikiran tradisional.

Set ini dati digunakan untuk menyokong penggunaan seterusnya dati dimensi berpandukan isu Perniagaan yang telah kami kenal pasti. Apabila dokumen tambahan dijana, seperti pembangunan reka bentuk dati, kita akan mula merasmikan bagaimana i dati mereka merebak di persekitaran. Kami telah memastikan keperluan untuk mewakili i dati dalam cara dimensi, membahagikannya (mengikut keperluan khusus khusus) kepada data mart.

Soalan seterusnya untuk dijawab ialah: bagaimana data mart ini akan dibina?
Adakah anda membina bintang untuk menyokong kiub, atau hanya kiub, atau hanya bintang? (atau kiub kanan, atau bintang kanan). Hasilkan seni bina untuk data mart bergantung yang memerlukan lapisan atom untuk semua dati diperolehi? Benarkan data mart bebas memperoleh i dati terus daripada sistem pengendalian?

Apakah Teknologi Cube yang akan anda cuba standardkan?

Anda mempunyai kuantiti yang banyak dati diperlukan untuk analisis dimensi atau adakah anda memerlukan kiub daripada pasukan jualan nasional anda setiap minggu atau kedua-duanya? Adakah anda membina sesuatu yang berkuasa seperti Pelayan DB2 OLAP untuk kewangan atau kiub Cognos PowerPlay untuk organisasi jualan anda, atau kedua-duanya? Ini adalah keputusan reka bentuk seni bina yang besar yang akan memberi kesan kepada persekitaran BI anda dari sini dan seterusnya. Ya, anda telah mewujudkan keperluan untuk OLAP. Sekarang bagaimana anda akan melaksanakan jenis teknik dan teknologi itu?

Bagaimanakah beberapa teknologi tercanggih mempengaruhi reka bentuk anda? Katakan anda telah mengenal pasti keperluan ruang dalam organisasi anda. Anda kini mesti mengingati edisi lukisan seni bina walaupun anda tidak bercadang untuk membuat komponen spatial selama beberapa bulan. Arkitek mesti mereka bentuk hari ini berdasarkan apa yang diperlukan. Ramalkan keperluan untuk analisis spatial yang menjana, menyimpan, melaksanakan dan menyediakan akses kepada dati spatial. Ini seterusnya harus menjadi kekangan mengenai jenis teknologi perisian dan spesifikasi platform yang boleh anda pertimbangkan pada masa ini. Contohnya, sistem pentadbiran bagi pangkalan data lapisan hubungan (RDBMS) yang anda lakukan untuk lapisan atom anda mesti mempunyai takat spatial yang teguh tersedia. Ini akan memastikan prestasi maksimum apabila menggunakan geometri dan objek spatial dalam aplikasi analisis anda. Jika RDBMS anda tidak dapat mengendalikan dati (spatial-centric) secara dalaman, jadi anda perlu menubuhkan a pangkalan data (spatial-centric) luaran. Ini merumitkan pengurusan isu dan menjejaskan prestasi keseluruhan anda, apatah lagi masalah tambahan yang dicipta untuk DBA anda, kerana mereka mungkin mempunyai pemahaman yang minimum tentang asas-asas dati spatial juga. Sebaliknya, jika enjin RDMBS anda mengendalikan semua komponen spatial dan pengoptimumnya mengetahui keperluan khas (contohnya, pengindeksan) objek spatial, maka DBA anda boleh mengendalikan dengan mudah pengurusan isu dan anda boleh memaksimumkan prestasi.

Selain itu, anda perlu melaraskan kawasan pementasan dan lapisan persekitaran atom untuk memasukkan pembersihan alamat (a

elemen utama kepada analisis spatial), serta penjimatan seterusnya objek angkasa. Penggantian edisi lukisan diteruskan sekarang kerana kami telah memperkenalkan tanggapan arah yang jelas. Untuk satu perkara, aplikasi ini akan menentukan jenis perisian yang diperlukan untuk usaha ETL anda.

Adakah anda memerlukan produk seperti Trillium untuk menyediakannya dengan alamat bersih, atau vendor ETL pilihan anda untuk menyediakan fungsi tersebut?
Buat masa ini adalah penting untuk anda menghargai tahap reka bentuk yang mesti disiapkan sebelum anda mula melaksanakan gudang anda. Contoh di atas harus menunjukkan banyak keputusan reka bentuk yang mesti mengikut pengenalpastian mana-mana keperluan perniagaan tertentu. Jika dibuat dengan betul, keputusan reka bentuk ini menggalakkan saling bergantung antara struktur fizikal persekitaran anda, pemilihan teknologi yang digunakan dan aliran penyebaran kandungan maklumat. Tanpa seni bina BI konvensional ini, organisasi anda akan tertakluk kepada gabungan huru-hara teknologi sedia ada, paling baik dicantum secara longgar untuk memberikan kestabilan yang jelas.

Mengekalkan kandungan maklumat

Membawa nilai maklumat kepada organisasi anda adalah tugas yang sangat sukar. Tanpa pemahaman dan pengalaman yang mencukupi, atau perancangan dan reka bentuk yang betul, pasukan terbaik pun akan gagal. Sebaliknya, jika anda mempunyai intuisi yang hebat dan perancangan terperinci tetapi tiada disiplin untuk pelaksanaan, anda hanya membazirkan wang dan masa anda kerana usaha anda pasti akan gagal. Mesejnya hendaklah jelas: Jika anda kekurangan satu atau lebih kemahiran, pemahaman/pengalaman atau perancangan/reka bentuk atau disiplin pelaksanaan ini, ia akan melumpuhkan atau memusnahkan bangunan organisasi BI.

Adakah pasukan anda cukup bersedia? Adakah sesiapa dalam pasukan BI anda yang memahami landskap analitik yang luas yang tersedia dalam persekitaran BI, dan teknik serta teknologi yang diperlukan untuk mengekalkan landskap tersebut? Adakah terdapat seseorang dalam pasukan anda yang dapat mengenali perbezaan aplikasi antara lanjutan

pelaporan statik dan OLAP, atau perbezaan antara ROLAP dan OLAP? Adakah salah seorang ahli pasukan anda mengenali dengan jelas cara mengekstrak dan cara ia mungkin memberi kesan kepada gudang atau cara gudang boleh menyokong prestasi pengekstrakan? Seorang ahli pasukan memahami nilai dati ruang atau teknologi berasaskan ejen? Adakah anda mempunyai seseorang yang menghargai aplikasi unik alat ETL berbanding teknologi broker mesej? Jika anda tidak mempunyai satu, dapatkan satu. BI jauh lebih besar daripada lapisan atom ternormal, OLAP, skema bintang dan ODS.

Mempunyai pemahaman dan pengalaman untuk mengenali keperluan BI dan penyelesaiannya adalah penting untuk keupayaan anda untuk memformalkan keperluan pengguna dengan betul dan mereka bentuk serta melaksanakan penyelesaian mereka. Jika komuniti pengguna anda mengalami kesukaran untuk menerangkan keperluan, adalah tugas pasukan gudang untuk memberikan pemahaman tersebut. Tetapi jika pasukan gudang

tidak mengiktiraf aplikasi khusus BI - contohnya, perlombongan data - maka ia bukanlah perkara terbaik bahawa persekitaran BI sering terhad kepada repositori pasif. Walau bagaimanapun, mengabaikan teknologi ini tidak mengurangkan kepentingannya dan kesannya terhadap kemunculan keupayaan risikan perniagaan organisasi anda, serta landskap maklumat yang anda merancang untuk memupuk.

Perancangan mesti merangkumi pengertian lukisan, dan kedua-duanya memerlukan individu yang cekap. Selain itu, reka bentuk memerlukan falsafah gudang pasukan dan pematuhan kepada piawaian. Sebagai contoh, jika syarikat anda telah menubuhkan platform standard atau telah mengenal pasti RDBMS tertentu yang anda ingin standardkan merentas platform, tanggungjawab adalah pada semua orang dalam pasukan untuk mematuhi piawaian tersebut. Secara amnya sesebuah pasukan mendedahkan keperluan untuk penyeragaman (kepada komuniti pengguna), tetapi pasukan itu sendiri tidak mahu mematuhi piawaian yang juga ditetapkan di kawasan lain dalam syarikat atau mungkin juga dalam syarikat yang serupa. Ini bukan sahaja hipokrit, tetapi ia membuktikan syarikat itu tidak mampu mengeksploitasi sumber dan pelaburan sedia ada. Ini tidak bermakna tiada situasi yang menjamin platform atau teknologi yang tidak standard; bagaimanapun, usaha gudang

mereka harus berhati-hati menjaga piawaian perusahaan sehingga keperluan perniagaan menentukan sebaliknya.

Komponen utama ketiga yang diperlukan untuk membina organisasi BI ialah disiplin.
Ia bergantung secara keseluruhan, sama rata kepada individu dan persekitaran. Perancang projek, penaja, arkitek dan pengguna mesti menghargai disiplin yang diperlukan untuk membina landskap maklumat syarikat. Pereka bentuk mesti mengarahkan usaha reka bentuk mereka sedemikian rupa untuk melengkapkan usaha lain yang diperlukan dalam masyarakat.

Sebagai contoh, katakan syarikat anda membina aplikasi ERP yang mempunyai komponen gudang.
Oleh itu adalah menjadi tanggungjawab pereka ERP untuk bekerjasama dengan pasukan persekitaran gudang supaya tidak bersaing atau menduplikasi kerja yang telah dimulakan.

Disiplin juga merupakan topik yang mesti ditangani oleh seluruh organisasi dan biasanya ditubuhkan dan diamanahkan kepada peringkat eksekutif.
Adakah pengurus bersedia untuk mematuhi pendekatan yang direka bentuk? Pendekatan yang menjanjikan untuk mencipta kandungan maklumat yang akhirnya akan membawa nilai kepada semua bidang perusahaan, tetapi mungkin menjejaskan agenda individu atau jabatan? Ingat pepatah "Memikirkan segala-galanya lebih penting daripada memikirkan satu perkara sahaja". Pepatah ini benar bagi organisasi BI.

Malangnya, banyak gudang menumpukan usaha mereka untuk cuba menyasarkan dan membawa nilai kepada jabatan tertentu atau pengguna tertentu, tanpa mengambil kira organisasi secara amnya. Katakan eksekutif meminta bantuan daripada pasukan rumah jagaan. Pasukan bertindak balas dengan usaha selama 90 hari yang termasuk bukan sahaja menyampaikan keperluan pemberitahuan yang ditakrifkan oleh pengurus tetapi memastikan semua dati bes dicampur pada tahap atom sebelum diperkenalkan ke dalam teknologi kiub yang dicadangkan.
Penambahan kejuruteraan ini memastikan bahawa perusahaan rumah jagaan akan mendapat manfaat daripadanya dati perlu bagi pengurus.
Bagaimanapun, eksekutif itu bercakap dengan firma perunding luar yang mencadangkan permohonan serupa dengan penghantaran dalam masa kurang daripada 4 minggu.

Dengan mengandaikan pasukan gudang dalaman adalah cekap, eksekutif mempunyai pilihan. Siapa yang boleh menyokong disiplin kejuruteraan tambahan yang diperlukan untuk memupuk perusahaan aset maklumat atau boleh memilih untuk membina penyelesaian mereka sendiri dengan cepat. Yang terakhir nampaknya dipilih terlalu kerap dan hanya berfungsi untuk mencipta bekas maklumat yang hanya menguntungkan segelintir atau individu.

Objektif jangka pendek dan panjang

Arkitek dan pereka projek mesti memformalkan visi jangka panjang keseluruhan seni bina dan rancangan untuk pertumbuhan dalam organisasi BI. Gabungan keuntungan jangka pendek dan perancangan jangka panjang ini mewakili kedua-dua belah usaha BI. Keuntungan jangka pendek ialah aspek BI yang dikaitkan dengan lelaran gudang anda.

Di sinilah perancang, arkitek dan penaja menumpukan pada memenuhi keperluan komersial tertentu. Pada tahap inilah struktur fizikal dibina, teknologi dibeli dan teknik dilaksanakan. Ia sama sekali tidak dibuat untuk menangani keperluan khusus seperti yang ditakrifkan oleh komuniti pengguna tertentu. Semuanya dilakukan untuk memenuhi keperluan khusus yang ditentukan oleh komuniti tertentu.
Perancangan jangka panjang, bagaimanapun, adalah aspek lain BI. Di sinilah rancangan dan reka bentuk memastikan bahawa sebarang struktur fizikal dibina, teknologi yang dipilih dan teknik yang dilaksanakan dibuat dengan fokus terhadap perusahaan. Perancangan jangka panjanglah yang menyediakan kesepaduan yang diperlukan untuk memastikan manfaat perniagaan timbul daripada sebarang keuntungan jangka pendek yang ditemui.

Wajarkan usaha BI anda

Un gudang data dengan sendirinya ia tidak mempunyai nilai yang wujud. Dalam erti kata lain, tiada nilai yang wujud antara teknologi gudang dan teknik pelaksanaan.

Nilai mana-mana usaha gudang didapati dalam tindakan yang dilakukan sebagai hasil daripada persekitaran gudang dan kandungan maklumat yang ditanam dari semasa ke semasa. Ini adalah perkara kritikal untuk difahami sebelum anda cuba menganggarkan nilai mana-mana inisiatif wherehouse.

Terlalu kerap, arkitek dan pereka bentuk cuba menggunakan nilai pada komponen fizikal dan teknikal gudang sedangkan nilai sebenarnya adalah berdasarkan proses perniagaan yang dipengaruhi secara positif oleh gudang dan maklumat yang diperoleh dengan baik.

Di sinilah terletaknya cabaran untuk menubuhkan BI: Bagaimanakah anda mewajarkan pelaburan? Jika rumah kediaman itu sendiri tidak mempunyai nilai intrinsik, pereka bentuk projek mesti menyiasat, mentakrifkan dan memformalkan faedah yang dicapai oleh individu tersebut yang akan menggunakan gudang untuk meningkatkan proses perniagaan tertentu atau nilai maklumat yang dilindungi, atau kedua-duanya.

Untuk merumitkan perkara, sebarang proses perniagaan yang terjejas oleh usaha pergudangan boleh memberikan faedah yang "cukup besar" atau "sedikit". Faedah yang besar menyediakan metrik ketara untuk mengukur pulangan pelaburan (ROI) – contohnya, menukar inventori sebagai masa tambahan dalam tempoh tertentu atau untuk kos pengangkutan yang lebih rendah bagi setiap penghantaran. Adalah lebih sukar untuk mentakrifkan faedah halus, seperti akses yang dipertingkatkan kepada maklumat, dari segi nilai ketara.

Sambungkan projek anda untuk mengetahui tentang Permintaan perniagaan

Terlalu kerap, perancang projek cuba memautkan nilai gudang kepada objektif perusahaan amorfus. Dengan mengisytiharkan bahawa "nilai gudang adalah berdasarkan keupayaan kami untuk memenuhi permintaan strategik", kami membuka perbincangan dengan cara yang menyenangkan. Tetapi itu sahaja tidak mencukupi untuk menentukan sama ada melabur dalam inventori masuk akal. Adalah lebih baik untuk memautkan lelaran gudang dengan permintaan perniagaan tertentu yang diketahui.

Mengukur ROI

Mengira ROI dalam tetapan gudang boleh menjadi sangat sukar. Ia amat sukar jika kelebihan

pokok bagi pengulangan tertentu ialah sesuatu yang tidak ketara atau mudah diukur. Satu kajian mendapati bahawa pengguna merasakan dua faedah utama inisiatif BI:

  • ▪ Cipta keupayaan untuk membuat keputusan
  • ▪ Cipta akses kepada maklumat
    Faedah ini adalah faedah lembut (atau ringan). Mudah untuk melihat cara kita boleh mengira ROI berdasarkan faedah yang sukar (atau utama) seperti pengurangan kos pengangkutan, tetapi bagaimanakah kita mengukur keupayaan untuk membuat keputusan yang lebih baik?
    Ini sememangnya satu cabaran bagi perancang projek apabila mereka cuba meyakinkan syarikat untuk melabur dalam usaha gudang tertentu. Peningkatan jualan atau penurunan kos bukan lagi tema utama yang memacu persekitaran BI.
    Sebaliknya, anda sedang melihat permintaan perniagaan untuk akses yang lebih baik kepada maklumat supaya jabatan tertentu boleh membuat keputusan yang lebih pantas. Ini adalah pemacu strategik yang kebetulan sama pentingnya dengan perusahaan tetapi lebih samar-samar dan lebih sukar untuk dicirikan dalam metrik ketara. Dalam kes ini, pengiraan ROI boleh mengelirukan, jika tidak relevan.
    Perancang projek mesti dapat menunjukkan nilai ketara untuk eksekutif memutuskan sama ada pelaburan dalam lelaran tertentu berbaloi. Walau bagaimanapun, kami tidak akan mencadangkan kaedah baharu untuk mengira ROI, dan kami juga tidak akan membuat sebarang hujah menyokong atau menentangnya.
    Terdapat banyak artikel dan buku tersedia yang membincangkan asas-asas pengiraan ROI. Terdapat cadangan nilai khas seperti nilai pelaburan (VOI), yang ditawarkan oleh kumpulan seperti Gartner, yang boleh anda selidiki. Sebaliknya, kami akan menumpukan pada aspek teras mana-mana ROI atau cadangan nilai lain yang perlu anda pertimbangkan. Menggunakan ROI Di sebalik hujah tentang faedah "keras" berbanding faedah "lembut" yang dikaitkan dengan usaha BI, terdapat isu lain yang perlu dipertimbangkan semasa menggunakan ROI. Sebagai contoh:

Atributkan terlalu banyak penjimatan kepada usaha DW yang akan datang juga
Katakan syarikat anda beralih daripada seni bina kerangka utama kepada persekitaran UNIX teragih. Jadi apa-apa penjimatan yang mungkin (atau mungkin tidak) direalisasikan daripada usaha itu tidak boleh dikaitkan secara eksklusif, jika sama sekali (?), kepada gudang.

Tidak mengambil kira segala-galanya adalah mahal. Dan banyak perkara yang perlu diambil kira. Pertimbangkan senarai berikut:

  • ▪ Kos permulaan, termasuk kebolehlaksanaan.
  • ▪ Kos perkakasan khusus dengan storan dan komunikasi yang berkaitan
  • ▪ Kos perisian, termasuk pengurusan dati dan sambungan pelanggan/pelayan, perisian ETL, teknologi DSS, alat visualisasi, aplikasi penjadualan dan aliran kerja, dan perisian pemantauan, .
  • ▪ Kos reka bentuk struktur dati, dengan penciptaan dan pengoptimuman
  • ▪ Kos pembangunan perisian dikaitkan secara langsung dengan usaha BI
  • ▪ Kos sokongan di tapak, termasuk pengoptimuman prestasi, termasuk kawalan versi perisian dan operasi bantuan Gunakan ROI "Big-Bang". Membina gudang sebagai usaha tunggal yang besar pasti akan gagal, jadi kira ROI untuk inisiatif perusahaan besar Tawaran itu mengejutkan, dan perancang terus membuat percubaan lemah untuk menganggarkan nilai keseluruhan usaha . Mengapakah perancang cuba meletakkan nilai kewangan pada inisiatif perniagaan jika diketahui secara meluas dan diterima bahawa menganggarkan pengulangan tertentu adalah sukar? Bagaimana mungkin? Ia tidak mungkin dengan beberapa pengecualian. jangan buat. Memandangkan kami telah menetapkan perkara yang tidak boleh dilakukan semasa mengira ROI, berikut ialah beberapa perkara yang akan membantu kami dalam mewujudkan proses yang boleh dipercayai untuk menganggarkan nilai usaha BI anda.

Mendapat konsensus ROI. Tidak kira teknik pilihan anda untuk menganggarkan nilai usaha BI anda, ia mesti dipersetujui oleh semua pihak, termasuk pereka projek, penaja dan eksekutif perniagaan.

Kurangkan ROI kepada bahagian yang boleh dikenal pasti. Langkah yang perlu ke arah pengiraan ROI yang munasabah ialah memfokuskan pengiraan itu pada projek tertentu. Ini kemudian membolehkan anda menganggarkan nilai berdasarkan keperluan perniagaan tertentu yang dipenuhi

Tentukan kos. Seperti yang dinyatakan, banyak kos mesti dipertimbangkan. Tambahan pula, kos mesti termasuk bukan sahaja yang berkaitan dengan lelaran tunggal tetapi juga kos yang berkaitan dengan memastikan pematuhan piawaian perusahaan.

Tentukan faedah. Dengan memautkan ROI dengan jelas kepada keperluan perniagaan tertentu, kami seharusnya dapat mengenal pasti faedah yang akan membawa kepada memenuhi keperluan.

Kurangkan kos dan faedah dalam keuntungan yang akan berlaku. Ini adalah cara terbaik untuk mendasarkan penilaian anda pada nilai semasa bersih (NPV) berbanding cuba meramal nilai masa depan dalam pendapatan masa hadapan.

Pastikan masa pembahagian ROI anda pada tahap minimum. Ia didokumenkan dengan baik sepanjang tempoh masa yang panjang ia telah digunakan dalam ROI anda.

Gunakan lebih daripada satu formula ROI. Terdapat banyak kaedah untuk meramalkan ROI dan anda harus merancang sama ada untuk menggunakan satu atau lebih daripadanya, termasuk nilai semasa bersih, kadar pulangan dalaman (IRR) dan bayaran balik.

Tentukan proses yang boleh diulang. Ini penting untuk mengira sebarang nilai jangka panjang. Satu proses yang boleh berulang harus didokumenkan untuk diikuti oleh semua susulan projek.

Masalah yang disenaraikan adalah yang paling biasa ditakrifkan oleh pakar dalam persekitaran rumah jagaan. Desakan pihak pengurusan untuk menyampaikan ROI “Big-Bang” sangat mengelirukan. Jika anda memulakan semua pengiraan ROI anda dengan membahagikannya kepada bahagian yang boleh dikenal pasti dan ketara, anda mempunyai peluang yang baik untuk menganggarkan penilaian ROI yang tepat.

Soalan mengenai faedah ROI

Walau apa pun faedah anda, lembut atau keras, anda boleh menggunakan beberapa soalan asas untuk menentukan nilainya. Contohnya, menggunakan sistem penskalaan mudah, dari 1 hingga 10, anda boleh mengukur kesan sebarang usaha dengan menggunakan soalan berikut:

  • Bagaimana anda menilai pemahaman tentang dati mengikuti projek syarikat anda ini?
  • Bagaimanakah anda menganggarkan peningkatan proses hasil daripada projek ini?
  • Bagaimanakah anda mengukur kesan cerapan dan inferens baharu yang kini tersedia melalui lelaran ini
  • Apakah kesan persekitaran pengkomputeran baharu dan berprestasi hasil daripada apa yang telah dipelajari? Sekiranya jawapan kepada soalan-soalan ini sedikit, kemungkinan syarikat itu tidak berbaloi dengan pelaburan yang dibuat. Soalan berskor tinggi menunjukkan keuntungan nilai yang ketara dan harus menjadi panduan untuk penyiasatan lanjut. Sebagai contoh, skor yang tinggi untuk penambahbaikan proses harus membawa pereka bentuk untuk mengkaji bagaimana proses telah diperbaiki. Anda mungkin mendapati bahawa sebahagian atau semua keuntungan yang diperoleh adalah ketara dan oleh itu nilai kewangan boleh digunakan dengan mudah. Memanfaatkan sepenuhnya daripada lelaran pertama gudang Hasil terbaik daripada usaha perusahaan anda selalunya dalam beberapa lelaran pertama. Usaha awal ini secara tradisinya mewujudkan kandungan maklumat yang paling berguna untuk orang ramai dan membantu mewujudkan asas teknologi untuk aplikasi BI berikutnya. Biasanya setiap susulan berikutnya daripada dati projek gudang membawa semakin kurang nilai tambahan kepada perusahaan secara keseluruhan. Ini benar terutamanya jika lelaran tidak menambah topik baharu atau memenuhi keperluan komuniti pengguna baharu.

Ciri storan ini juga digunakan pada susunan yang semakin meningkat dati ahli sejarah. Memandangkan usaha seterusnya memerlukan lebih dati dan bagaimana lagi dati dituangkan ke dalam gudang dari semasa ke semasa, kebanyakannya dati menjadi kurang relevan dengan analisis yang digunakan. Ini dati mereka sering dipanggil dati tidak aktif dan sentiasa mahal untuk menyimpannya kerana ia hampir tidak pernah digunakan.

Apakah maksud ini untuk penaja projek? Pada asasnya, penaja awal berkongsi lebih banyak daripada kos pelaburan. Ini adalah yang utama kerana ia adalah pendorong untuk mewujudkan teknologi luas gudang dan lapisan persekitaran sumber, termasuk organik.

Tetapi langkah pertama ini membawa nilai tertinggi dan oleh itu pereka projek selalunya perlu mewajarkan pelaburan.
Projek yang dilakukan selepas inisiatif BI anda mungkin mempunyai kos yang lebih rendah (berbanding dengan yang pertama) dan langsung, tetapi membawa nilai yang kurang kepada syarikat.

Dan pemilik organisasi perlu mula mempertimbangkan untuk membuang pengumpulan itu dati dan teknologi yang kurang relevan.

Perlombongan Data: Pengekstrakan Dati

Banyak komponen seni bina memerlukan variasi dalam teknologi dan teknik perlombongan data—
sebagai contoh, "ejen" yang berbeza untuk memeriksa tempat menarik pelanggan, sistem pengendalian syarikat dan untuk dw itu sendiri. Ejen ini boleh menjadi rangkaian saraf lanjutan yang dilatih mengenai trend POT, seperti permintaan produk masa hadapan berdasarkan promosi jualan; enjin berasaskan peraturan untuk bertindak balas terhadap set dato keadaan, contohnya, diagnosis perubatan dan cadangan rawatan; atau bahkan ejen mudah dengan peranan melaporkan pengecualian kepada eksekutif tertinggi. Secara umumnya proses pengekstrakan ini dati si

sahkan dalam masa nyata; oleh itu, mereka mesti bersatu sepenuhnya dengan gerakan dati diri mereka.

Pemprosesan Analitik Dalam Talian

Analitis Dalam Talian

Keupayaan untuk memotong, memotong dadu, menggulung, menggerudi ke bawah, dan melakukan analisis
bagaimana jika, adalah dalam skop, tumpuan suite teknologi IBM. Contohnya, fungsi pemprosesan analitikal dalam talian (OLAP) wujud untuk DB2 yang membawa analisis dimensi ke dalam enjin perisian. pangkalan data sama .

Fungsi menambah utiliti dimensi kepada SQL sambil mengambil kesempatan daripada semua faedah menjadi sebahagian semula jadi DB2. Satu lagi contoh integrasi OLAP ialah alat pengekstrakan, DB2 OLAP Server Analyzer. Teknologi ini membolehkan kiub Pelayan DB2 OLAP dianalisis dengan cepat dan automatik untuk mencari dan melaporkan nilai nilai dati luar biasa atau tidak dijangka sepanjang kiub kepada penganalisis perniagaan. Dan akhirnya, ciri DW Center menyediakan cara untuk arkitek mengawal, antara lain, profil kiub pelayan DB2 OLAP sebagai bahagian semula jadi proses ETL.

Analisis Spatial Analisis Spatial

Ruang mewakili separuh daripada sauh analitik (lead) yang diperlukan untuk panorama
luas analitikal (masa mewakili separuh lagi). Tahap atom gudang, yang digambarkan dalam Rajah 1.1, merangkumi kedua-dua asas masa dan ruang. Setem masa menganalisis sauh mengikut masa dan menangani analisis sauh maklumat mengikut ruang. Cap masa menjalankan analisis mengikut masa, dan maklumat alamat menjalankan analisis mengikut ruang. Rajah menunjukkan geokod - proses menukar alamat kepada titik dalam peta atau titik dalam ruang supaya konsep seperti jarak dan dalam/luar boleh digunakan dalam analisis - dijalankan pada peringkat atom dan analisis spatial yang disediakan untuk penganalisis itu. IBM menyediakan sambungan spatial, dibangunkan dengan Institut Penyelidikan Sistem Alam Sekitar (ESRI), untuk pangkalan data DB2 supaya objek ruang boleh disimpan sebagai bahagian biasa pangkalan data perhubungan. DB2

Spatial Extenders, juga menyediakan semua sambungan SQL untuk memanfaatkan analisis spatial. Sebagai contoh, sambungan SQL untuk membuat pertanyaan
jarak antara alamat atau sama ada titik berada di dalam atau di luar kawasan poligon yang ditentukan, adalah piawaian analitik dengan Pemanjangan Ruang. Lihat bab 16 untuk maklumat lanjut.

Pangkalan Data-Alat Alat Penduduk Pangkalan Data-Penduduk

DB2 mempunyai banyak ciri SQL pemastautin BI yang membantu dalam tindakan analisis. Ini termasuk:

  • Rekursi berfungsi untuk melakukan analisis, seperti “ mencari semua laluan penerbangan yang mungkin dari San Francisco a New York".
  • Fungsi analitikal untuk kedudukan, fungsi terkumpul, kubus dan rollup untuk memudahkan tugas yang biasanya hanya berlaku dengan teknologi OLAP, kini merupakan bahagian semula jadi enjin pangkalan data
  • Keupayaan untuk mencipta jadual yang mengandungi hasil
    Penjual daripada pangkalan data pemimpin mencampurkan lebih banyak keupayaan BI ke dalam pangkalan data sama.
    Pembekal utama bagi pangkalan data mereka mencampurkan lebih banyak keupayaan BI ke dalam pangkalan data sama.
    Ini memberikan prestasi yang lebih baik dan lebih banyak pilihan pelaksanaan untuk penyelesaian BI.
    Ciri dan fungsi DB2 V8 dibincangkan secara terperinci dalam bab berikut:
    Seni Bina Teknikal dan Asas Pengurusan Data (Bab 5)
  • Asas DB2 BI (Bab 6)
  • Jadual Pertanyaan Terwujud DB2 (Bab 7)
  • Fungsi OLAP DB2 (Bab 13)
  • Ciri dan Fungsi BI Dipertingkatkan DB2 (Bab 15) Sistem Penyampaian Data Ringkas Sistem penyampaian daripada dati dipermudahkan

Seni bina yang digambarkan dalam Rajah 1.1 merangkumi banyak struktur dati fizikal. Satu ialah gudang dati beroperasi. Secara amnya, ODS ialah objek berorientasikan subjek, bersepadu dan semasa. Anda akan membina ODS untuk menyokong, contohnya, pejabat jualan. Jualan ODS akan menambah dati daripada pelbagai sistem yang berbeza tetapi hanya akan mengekalkan, sebagai contoh, urus niaga hari ini. ODS juga boleh dikemas kini berkali-kali sehari. Pada masa yang sama, proses menolak dati diintegrasikan ke dalam aplikasi lain. Struktur ini direka khusus untuk disepadukan dati semasa dan dinamik dan akan menjadi calon yang mungkin menyokong analisis masa nyata, seperti menyediakan kepada ejen perkhidmatan pelanggan maklumat jualan semasa pelanggan dengan mengekstrak maklumat trend jualan daripada gudang itu sendiri. Satu lagi struktur yang ditunjukkan dalam Rajah 1.1 ialah keadaan formal untuk dw. Bukan sahaja ini adalah tempat untuk melaksanakan integrasi yang diperlukan, kualiti dati, dan tentang transformasi dati daripada gudang masuk, tetapi ia juga merupakan kawasan simpanan yang boleh dipercayai dan sementara untuk dati replika yang boleh digunakan dalam analisis masa nyata. Jika anda memutuskan untuk menggunakan ODS atau kawasan pementasan, salah satu alat terbaik untuk mengisi struktur ini dati menggunakan sumber operasi yang berbeza ialah pertanyaan teragih heterogen DB2. Keupayaan ini disampaikan oleh ciri DB2 pilihan yang dipanggil DB2 Relational Connect (pertanyaan sahaja) dan melalui DB2 DataJoiner (produk berasingan yang menyampaikan keupayaan pertanyaan, memasukkan, mengemas kini dan memadamkan kepada RDBMS teragih heterogen).

Teknologi ini membolehkan arkitek untuk dati untuk mengikat dati pengeluaran dengan proses analisis. Bukan sahaja teknologi boleh menyesuaikan diri dengan hampir mana-mana tuntutan replikasi yang mungkin timbul dengan analitik masa nyata, tetapi ia juga boleh menyambung kepada pelbagai jenis pangkalan data dati paling popular, termasuk DB2, Oracle, Sybase, SQL Server, Informix dan lain-lain. DB2 DataJoiner boleh digunakan untuk mengisi struktur dati formal sebagai ODS atau meja tetap yang diwakili dalam gudang yang direka untuk pemulihan pantas kemas kini segera atau untuk dijual. Sudah tentu, struktur yang sama ini dati boleh dihuni menggunakan

satu lagi teknologi penting yang direka untuk replikasi dati, IBM DataPropagator Relational. (DataPropagator ialah produk berasingan untuk sistem pusat. DB2 UNIX, Linux, Windows dan OS/2 termasuk perkhidmatan replikasi data dati sebagai ciri standard).
Kaedah lain untuk bergerak dati beroperasi di sekitar perusahaan ialah penyepadu aplikasi perusahaan atau dikenali sebagai broker mesej. Teknologi unik ini membolehkan kawalan yang tiada tandingan untuk penyasaran dan pergerakan dati sekitar syarikat. IBM mempunyai broker mesej yang paling banyak digunakan, MQSeries, atau variasi produk yang merangkumi keperluan e-dagang, IBM WebSphere MQ.
Untuk perbincangan lanjut tentang cara memanfaatkan MQ untuk menyokong gudang dan persekitaran BI, lawati laman web daripada buku itu. Buat masa ini, cukuplah untuk mengatakan bahawa teknologi ini adalah cara terbaik untuk menangkap dan mengubah (menggunakan MQSeries Integrator) dati pengendali berpusat (sasaran) yang diambil untuk penyelesaian BI. Teknologi MQ telah disepadukan dan dibungkus ke dalam UDB V8, bermakna baris gilir mesej kini boleh diuruskan seolah-olah ia adalah jadual DB2. Konsep kimpalan mesej beratur dan alam semesta pangkalan data menuju ke arah persekitaran penyampaian yang berkuasa bagi dati.

Kependaman Sifar-Latensi Sifar

Matlamat strategik utama untuk IBM ialah analisis kependaman sifar. Seperti yang ditakrifkan oleh
Gartner, sistem BI mesti boleh membuat kesimpulan, mengasimilasikan dan memberikan maklumat kepada penganalisis atas permintaan. Cabarannya, sudah tentu, adalah bagaimana untuk bercampur dati semasa dan masa nyata dengan maklumat sejarah yang diperlukan, seperti i dati corak/trend yang berkaitan, atau pemahaman yang diekstrak, seperti pemprofilan pelanggan.

Maklumat sedemikian termasuk, sebagai contoh, pengenalan pelanggan berisiko tinggi atau rendah atau produk mana i pelanggan mereka berkemungkinan besar akan membeli jika mereka sudah mempunyai keju dalam troli beli-belah mereka.

Mencapai kependaman sifar sebenarnya bergantung kepada dua mekanisme asas:

  • Kesatuan lengkap daripada dati yang dianalisis dengan teknik dan alat yang telah ditetapkan yang dicipta oleh BI
  • Sistem penyampaian dati cekap untuk memastikan analitik masa nyata benar-benar tersedia Prasyarat untuk kependaman sifar ini tidak berbeza daripada dua matlamat yang ditetapkan oleh IBM dan diterangkan di atas. Perkawinan rapat daripada dati Ia adalah sebahagian daripada program penyepaduan lancar IBM. Dan buat sistem penyampaian dati cekap adalah bergantung sepenuhnya kepada teknologi yang ada yang memudahkan proses penyampaian dati. Akibatnya, dua daripada tiga matlamat IBM adalah penting untuk merealisasikan matlamat ketiga. IBM secara sedar mengembangkan teknologinya untuk memastikan kependaman sifar adalah realiti untuk usaha gudang. Ringkasan / Sintesis Organisasi BI menyediakan peta jalan untuk membina persekitaran anda
    secara berulang. Ia mesti dilaraskan untuk mencerminkan keperluan perniagaan anda, semasa dan masa hadapan. Tanpa visi seni bina yang luas, lelaran gudang adalah lebih daripada pelaksanaan serampangan bagi gudang pusat yang tidak banyak membantu untuk mewujudkan perusahaan yang luas dan bermaklumat. Halangan pertama bagi pengurus projek ialah bagaimana untuk mewajarkan pelaburan yang diperlukan untuk membangunkan organisasi BI. Walaupun pengiraan ROI kekal sebagai asas utama pelaksanaan gudang, ia menjadi lebih sukar untuk diramal dengan tepat. Ini telah membawa kepada kaedah lain untuk menentukan sama ada anda mendapat nilai wang anda. Nilai atas pelaburan2 (VOI), sebagai contoh, dipromosikan sebagai penyelesaian. Ia adalah tanggungjawab arkitek dati dan perancang projek sengaja menjana dan memberikan maklumat kepada persatuan pengguna dan bukan sekadar memberikan perkhidmatan kepada mereka dati. Terdapat perbezaan yang besar antara keduanya. Maklumat adalah sesuatu yang membuat perbezaan dalam membuat keputusan dan keberkesanan; secara relatif, i dati mereka membina blok untuk mendapatkan maklumat itu.

Walaupun saya mengkritik sumbernya dati Untuk menangani permintaan perniagaan, persekitaran BI harus memainkan peranan yang lebih besar dalam mencipta kandungan maklumat. Kita mesti mengambil langkah tambahan untuk membersihkan, menyepadukan, mengubah atau sebaliknya mencipta kandungan maklumat yang boleh diambil tindakan oleh pengguna, dan kemudian kita mesti memastikan bahawa tindakan dan keputusan tersebut, jika munasabah, dicerminkan dalam persekitaran BI. Jika kita relegate gudang untuk berkhidmat sahaja dati, dipastikan bahawa persatuan pengguna akan mencipta kandungan maklumat yang diperlukan untuk mengambil tindakan. Ini memastikan komuniti mereka dapat membuat keputusan yang lebih baik, tetapi perusahaan mengalami kekurangan pengetahuan yang telah mereka gunakan. Data Memandangkan arkitek dan perancang projek memulakan projek tertentu dalam persekitaran BI, mereka kekal bertanggungjawab kepada perusahaan secara keseluruhan. Contoh mudah ciri dua belah lelaran BI ini terdapat dalam sumber dati. Semua dati diterima untuk permintaan perniagaan tertentu mesti diisi dalam lapisan atom pertama. Ini memastikan pembangunan aset maklumat perusahaan, serta mengurus, menangani permintaan pengguna khusus yang ditakrifkan dalam lelaran.

WhatisaDataWarehouse?

Gudang data ia telah menjadi nadi seni bina sistem maklumat sejak 1990 dan menyokong proses maklumat dengan menawarkan platform bersepadu yang kukuh dati data sejarah yang diambil sebagai asas untuk analisis seterusnya. THE gudang data mereka menawarkan kemudahan penyepaduan dalam dunia sistem aplikasi yang tidak serasi. Gudang data ia telah berkembang menjadi trend. Gudang data menyusun dan menyimpan i dati diperlukan untuk maklumat dan proses analisis berdasarkan perspektif temporal sejarah yang panjang. Semua ini memerlukan komitmen yang besar dan berterusan dalam pembinaan dan penyelenggaraan gudang data.

Jadi apa itu a gudang data? A gudang data Dan:

  • ▪ berorientasikan subjek
  • ▪ sistem bersepadu
  • ▪ masa variasi
  • ▪ tidak meruap (tidak boleh dipadamkan)

koleksi daripada dati digunakan untuk menyokong keputusan pengurusan dalam pelaksanaan proses.
I dati dimasukkan ke dalam gudang data dalam kebanyakan kes ia berasal daripada persekitaran operasi. The gudang data ia dicipta oleh unit storan, dipisahkan secara fizikal daripada seluruh sistem, yang terkandung di dalamnya dati sebelum ini diubah oleh aplikasi yang beroperasi pada maklumat yang diperoleh daripada persekitaran operasi.

Definisi literal a gudang data berhak mendapat penjelasan yang mendalam kerana terdapat motivasi penting dan makna asas yang menggambarkan ciri-ciri gudang.

ORIENTASI ORIENTASI SUBJEK TEMATIK

Ciri pertama a gudang data ialah ia berorientasikan kepada pemain utama dalam syarikat. Panduan ujian melalui dati ia berbeza dengan kaedah yang lebih klasik yang melibatkan orientasi aplikasi ke arah proses dan fungsi, kaedah yang kebanyakannya dikongsi oleh kebanyakan sistem pengurusan yang kurang terkini.

Dunia operasi direka berdasarkan aplikasi dan fungsi seperti pinjaman, simpanan, kad bank dan amanah untuk institusi kewangan. Dunia dw disusun mengikut subjek utama seperti pelanggan, penjual, produk dan aktiviti. Penjajaran sekitar topik mempengaruhi reka bentuk dan pelaksanaan dati terdapat dalam dw. Lebih penting lagi, topik utama mempengaruhi bahagian terpenting struktur utama.

Dunia aplikasi dipengaruhi oleh kedua-dua reka bentuk pangkalan data dan reka bentuk proses. Dunia dw tertumpu secara eksklusif pada pemodelan dati dan pada reka bentuk pangkalan data. Reka bentuk proses (dalam bentuk klasiknya) bukan sebahagian daripada persekitaran dw.

Perbezaan antara pilihan aplikasi proses/fungsi dan pilihan subjek juga didedahkan sebagai perbezaan dalam kandungan dati pada tahap terperinci. THE dati daripada dw tidak termasuk i dati yang tidak akan digunakan untuk proses DSS semasa permohonan

berorientasikan operasi dati mengandungi i dati untuk segera memenuhi keperluan fungsian/pemprosesan yang mungkin mempunyai sebarang kegunaan atau tidak untuk penganalisis DSS.
Satu lagi cara penting dalam aplikasi berorientasikan operasi dati berbeza daripada dati daripada dw ada dalam laporan dei dati. The dati operasi mengekalkan hubungan berterusan antara dua atau lebih jadual berdasarkan peraturan perniagaan yang aktif. THE dati daripada dw merentasi spektrum masa dan perhubungan yang terdapat dalam dw adalah banyak. Banyak peraturan perdagangan (dan sejajar dengan itu, banyak hubungan dati ) diwakili dalam gudang dati antara dua atau lebih meja.

(Untuk penjelasan terperinci tentang bagaimana hubungan antara dati dikendalikan dalam DW, kami merujuk kepada Topik Teknologi mengenai isu itu.)
Daripada perspektif lain selain daripada perbezaan asas antara pilihan aplikasi berfungsi/proses dan pilihan subjek, adakah terdapat perbezaan yang lebih besar antara sistem pengendalian dan dati dan DW.

INTEGRASI INTEGRASI

Aspek yang paling penting dalam persekitaran dw ialah i dati yang terdapat dalam dw mudah disepadukan. SENTIASA. TANPA PENGECUALIAN. Intipati persekitaran dw ialah i dati terkandung dalam had gudang disepadukan.

Integrasi mendedahkan dirinya dalam pelbagai cara - dalam konvensyen yang dikenal pasti konsisten, dalam ukuran pembolehubah yang konsisten, dalam struktur berkod yang konsisten, dalam sifat fizikal dati konsisten, dan sebagainya.

Selama bertahun-tahun, pereka bentuk pelbagai aplikasi telah membuat banyak keputusan tentang cara aplikasi harus dibangunkan. Gaya dan keputusan reka bentuk individu aplikasi pereka mendedahkan diri mereka dalam seratus cara: dalam perbezaan dalam pengekodan, struktur utama, ciri fizikal, mengenal pasti konvensyen, dan sebagainya. Keupayaan kolektif ramai pereka aplikasi untuk mencipta aplikasi yang tidak konsisten adalah legenda. Rajah 3 memaparkan beberapa perbezaan yang paling penting dalam cara aplikasi direka bentuk.

Pengekodan: Pengekodan:

Pereka aplikasi telah memilih pengekodan medan - jantina - dengan cara yang berbeza. Pereka bentuk mewakili seks sebagai "m" dan "f". Pereka bentuk lain mewakili jantina sebagai "1" dan "0". Pereka bentuk lain mewakili seks sebagai "x" dan "y". Pereka bentuk lain mewakili seks sebagai "lelaki" dan "perempuan." Tidak kira bagaimana jantina masuk ke dalam DW. "M" dan "F" mungkin sama baiknya dengan keseluruhan permainan.

Apa yang penting ialah dari apa jua asal yang diperolehi medan seks, medan itu tiba di DW dalam keadaan bersepadu yang konsisten. Akibatnya apabila medan dimuatkan ke dalam DW daripada aplikasi yang telah diwakili dalam format "M" dan "F", dati mesti ditukar kepada format DW.

Pengukuran Atribut: Pengukuran Atribut:

Pereka aplikasi telah memilih untuk mengukur saluran paip dalam pelbagai cara selama ini. Seorang pereka menyimpan dati daripada saluran paip dalam sentimeter. Pereka bentuk aplikasi lain menyimpan dati saluran paip dari segi inci. Pereka aplikasi lain menyimpan dati saluran paip dalam juta kaki padu sesaat. Dan pereka lain menyimpan maklumat saluran paip dari segi ela. Walau apa pun sumbernya, apabila maklumat saluran paip tiba di DW, ia mesti diukur dengan cara yang sama.

Menurut petunjuk dalam rajah 3, isu integrasi mempengaruhi hampir setiap aspek projek - ciri fizikal dati, dilema mempunyai lebih daripada satu sumber dati, isu sampel yang dikenal pasti tidak konsisten, format bagi dati tidak konsisten, dan sebagainya.

Walau apa pun topik reka bentuk, hasilnya adalah sama – i dati mesti disimpan dalam DW dengan cara yang tunggal dan boleh diterima secara global walaupun sistem pengendalian asas menyimpannya secara berbeza dati.

Apabila penganalisis DSS melihat DW, matlamat penganalisis adalah untuk mengeksploitasi dati yang ada di dalam gudang,

daripada tertanya-tanya tentang kredibiliti atau konsistensi dati.

VARIANSI MASA

Semua i dati dalam DW mereka tepat pada satu ketika. Ciri asas ini dati dalam DW ia sangat berbeza daripada yang dati terdapat dalam persekitaran operasi. THE dati persekitaran operasi adalah tepat seperti pada saat akses. Dalam erti kata lain, dalam persekitaran operasi apabila pemacu diakses dati, ia dijangka akan mencerminkan nilai yang tepat seperti pada masa akses. Kerana saya dati dalam DW adalah tepat seperti pada satu ketika dalam masa (iaitu, bukan "sekarang"), dikatakan bahawa saya dati yang terdapat dalam DW ialah "varian masa".
Varian masa bagi dati oleh DW dirujuk dalam pelbagai cara.
Cara paling mudah ialah i dati daripada wakil DW dati dalam jangka masa yang panjang - lima hingga sepuluh tahun. Horizon masa yang diwakili untuk persekitaran operasi adalah lebih pendek daripada nilai semasa hari ini daripada sehingga enam puluh sembilan puluh
Aplikasi yang mesti berfungsi dengan baik dan mesti tersedia untuk pemprosesan transaksi mesti membawa jumlah minimum dati jika mereka membenarkan sebarang tahap fleksibiliti. Jadi aplikasi operasi mempunyai tempoh masa yang singkat, seperti topik reka bentuk aplikasi audio.
Cara kedua 'varians masa' muncul dalam DW adalah dalam struktur utama. Setiap struktur utama dalam DW mengandungi, secara tersirat atau eksplisit, elemen masa, seperti hari, minggu, bulan, dsb. Elemen masa hampir selalu berada di bahagian bawah kekunci bercantum yang terdapat dalam DW. Pada masa ini, elemen masa akan wujud secara tersirat, seperti kes di mana keseluruhan fail diduplikasi pada akhir bulan atau suku tahun.
Cara ketiga varians masa dipaparkan ialah i dati DW, setelah didaftarkan dengan betul, tidak boleh dikemas kini. THE dati DW adalah, untuk semua tujuan praktikal, siri syot kilat yang panjang. Sudah tentu jika syot kilat diambil secara salah, maka syot kilat boleh diubah suai. Tetapi dengan mengandaikan syot kilat diambil dengan betul, ia tidak diubah suai sebaik sahaja ia diambil. Di sesetengah

Dalam sesetengah kes, ia mungkin tidak beretika atau bahkan tidak sah untuk syot kilat dalam DW diubah suai. THE dati beroperasi, tepat pada masa akses, ia boleh dikemas kini apabila diperlukan.

TIDAK MENURUN

Ciri penting keempat DW ialah ia tidak meruap.
Kemas kini, sisipan, pemadaman dan pengubahsuaian dibuat secara kerap kepada persekitaran operasi berdasarkan rekod demi rekod. Tetapi manipulasi asas dati yang diperlukan dalam DW adalah lebih mudah. Terdapat hanya dua jenis operasi yang berlaku dalam DW – pemuatan awal dati dan akses kepada dati. Tiada kemas kini dati (dalam pengertian umum mengemas kini) dalam DW sebagai operasi pemprosesan biasa. Terdapat beberapa akibat yang sangat kuat dari perbezaan asas ini antara pemprosesan operasi dan pemprosesan DW. Pada peringkat reka bentuk, keperluan untuk berhati-hati tentang pengemaskinian anomali bukanlah faktor dalam DW, kerana pengemaskinian dati tidak dijalankan. Ini bermakna pada peringkat reka bentuk fizikal, kebebasan boleh diambil untuk mengoptimumkan akses kepada dati, khususnya dalam menangani topik normalisasi fizikal dan denormalisasi. Satu lagi akibat daripada kesederhanaan operasi DW adalah dalam teknologi asas yang digunakan untuk menjalankan persekitaran DW. Perlu menyokong kemas kini rekod demi rekod sebaris (seperti yang sering berlaku dengan pemprosesan operasi) memerlukan teknologi mempunyai asas yang sangat kompleks di bawah kesederhanaan yang jelas.
Teknologi yang menyokong sandaran dan pemulihan, urus niaga dan integriti dati dan pengesanan dan pembetulan keadaan kebuntuan adalah agak kompleks dan tidak diperlukan untuk pemprosesan DW. Ciri-ciri DW, orientasi reka bentuk, penyepaduan dati dalam DW, varians masa dan kesederhanaan pengurusan dati, semuanya membawa kepada persekitaran yang sangat, sangat berbeza daripada persekitaran operasi klasik. Sumber hampir semua dati DW ialah persekitaran operasi. Ia menggoda untuk berfikir bahawa terdapat lebihan besar-besaran dati antara dua persekitaran.
Malah, tanggapan pertama yang dimiliki oleh ramai orang ialah kesan yang berlebihan dati antara persekitaran operasi dan persekitaran bagi

DW. Tafsiran sedemikian adalah dangkal dan menunjukkan kekurangan pemahaman tentang apa yang berlaku dalam DW.
Malah terdapat minimum redundansi dati antara persekitaran operasi dan i dati daripada DW. Pertimbangkan perkara berikut:I dati mereka ditapis dato beralih daripada persekitaran operasi kepada persekitaran DW. banyak dati mereka tidak pernah melepasi di luar persekitaran operasi. Kecuali i dati yang diperlukan untuk pemprosesan DSS mencari arah mereka dalam persekitaran

▪ ufuk masa bagi dati ia sangat berbeza antara satu persekitaran dengan persekitaran yang lain. THE dati dalam persekitaran operasi mereka sangat segar. THE dati dalam DW mereka jauh lebih tua. Hanya dari perspektif ufuk masa, terdapat sedikit pertindihan antara persekitaran operasi dan DW.

▪ DW mengandungi dati ringkasan yang tidak pernah ditemui dalam persekitaran

▪ Saya dati menjalani transformasi asas kerana ia beralih kepada Rajah 3 menggambarkan bahawa kebanyakan dati diubah suai dengan ketara dengan syarat ia dipilih dan dipindahkan ke DW. Dengan kata lain, kebanyakannya dati ia berubah secara fizikal dan radikal apabila ia dipindahkan ke DW. Dari sudut integrasi mereka tidak sama dati yang berada dalam persekitaran operasi. Berdasarkan faktor ini, redundansi daripada dati antara kedua-dua persekitaran adalah peristiwa yang jarang berlaku, yang membawa kepada kurang daripada 1% lebihan antara kedua-dua persekitaran. STRUKTUR GUDANG DW mempunyai struktur yang berbeza. Terdapat pelbagai peringkat ringkasan dan perincian yang membezakan DW.
Pelbagai komponen DW ialah:

  • Metadata
  • Dati butiran semasa
  • Dati daripada butiran lama
  • Dati diringkaskan sedikit
  • Dati sangat diringkaskan

Setakat ini kebimbangan utama adalah untuk dati butiran semasa. Ia adalah kebimbangan utama kerana:

  • I dati butiran semasa mencerminkan peristiwa terkini, yang sentiasa menarik minat dan
  • i dati butiran semasa adalah besar kerana ia disimpan pada tahap butiran terendah dan
  • i dati Butiran semasa hampir selalu disimpan pada memori cakera, yang cepat untuk diakses, tetapi mahal dan kompleks untuk digunakan dati terperinci semakin tua mereka dati yang disimpan pada beberapa ingatan massa. Ia diakses secara sporadis dan disimpan pada tahap perincian yang serasi dengannya dati butiran semasa. Walaupun tidak diwajibkan untuk disimpan pada medium penyimpanan alternatif, kerana jumlah yang besar dati digabungkan dengan akses sporadis dati, sokongan ingatan untuk dati data butiran lama biasanya tidak disimpan pada cakera. THE dati diringkaskan sedikit ialah dati yang disuling daripada tahap perincian rendah yang ditemui kepada tahap perincian semasa. Tahap DW ini hampir selalu disimpan pada storan cakera. Masalah reka bentuk yang dihadapi oleh arkitek dati dalam pembinaan tahap DW ini ialah:
  • Apakah unit masa ringkasan yang dibuat di atas
  • Kandungan mana, atribut akan meringkaskan sedikit kandungan dati Peringkat seterusnya dati yang terdapat dalam DW ialah daripada dati sangat diringkaskan. THE dati sangat diringkaskan adalah padat dan mudah diakses. THE dati sangat diringkaskan kadangkala ditemui dalam persekitaran DW dan dalam kes lain i dati sangat diringkaskan ditemui di luar dinding terdekat teknologi yang menempatkan DW. (dalam apa jua keadaan, i dati sangat diringkaskan adalah sebahagian daripada DW tanpa mengira di mana i dati ditempatkan secara fizikal). Komponen akhir DW ialah metadata. Dalam banyak aspek metadata terletak dalam dimensi yang berbeza daripada yang lain dati DW, kerana metadata tidak mengandungi sebarang dato diambil secara langsung dari persekitaran operasi. Metadata mempunyai peranan yang istimewa dan sangat penting dalam DW. Metadata digunakan sebagai:
  • direktori untuk membantu penganalisis DSS mencari kandungan DW,
  • panduan untuk memetakan dati bagaimana saya dati telah diubah daripada persekitaran operasi kepada persekitaran DW,
  • panduan kepada algoritma yang digunakan untuk meringkaskan antara dati butiran semasa ei dati diringkaskan sedikit, i dati sangat diringkaskan, Metadata memainkan peranan yang lebih besar dalam persekitaran DW berbanding yang pernah ada dalam persekitaran operasi MEDIUM PENYIMPANAN BUTIRAN LAMA Pita magnet boleh digunakan untuk menyimpan jenis itu dati. Sebenarnya terdapat pelbagai jenis media storan yang harus dipertimbangkan untuk storan lama dati terperinci. Bergantung kepada isipadu dati, kekerapan capaian, kos alatan dan jenis capaian, kemungkinan besar alat lain memerlukan tahap perincian lama dalam DW. ALIRAN DATA Terdapat aliran normal dan boleh diramalkan dati di dalam DW.
    I dati mereka memasuki DW dari persekitaran operasi. (NOTA: Terdapat beberapa pengecualian yang sangat menarik untuk peraturan ini. Walau bagaimanapun, hampir semua dati masukkan DW dari persekitaran operasi). Data bahawa saya dati masukkan DW dari persekitaran operasi, ia diubah seperti yang diterangkan sebelum ini. Dengan syarat memasuki DW, i dati masukkan tahap butiran semasa, seperti yang ditunjukkan. Ia tinggal di sana dan digunakan sehingga salah satu daripada tiga peristiwa berlaku:
  • disucikan,
  • diringkaskan, dan/atau ▪è Proses usang dalam DW bergerak i dati butiran semasa a dati butiran lama, berdasarkan umur dati. Prosesnya

ringkasan menggunakan butiran daripada dati untuk mengira i dati ringkasan sedikit dan tahap diringkaskan tinggi bagi dati. Terdapat beberapa pengecualian kepada aliran yang ditunjukkan (akan dibincangkan kemudian). Walau bagaimanapun, biasanya, untuk sebahagian besar dati ditemui dalam DW, aliran dati ia adalah seperti yang digambarkan.

MENGGUNAKAN DATAWAREHOUSE

Tidak hairanlah pelbagai peringkat dati dalam DW mereka tidak menerima tahap penggunaan yang berbeza. Sebagai peraturan, lebih tinggi tahap rumusan, lebih banyak i dati mereka digunakan.
Banyak kegunaan berlaku dalam dati sangat diringkaskan, manakala yang lama dati perincian hampir tidak pernah digunakan. Terdapat sebab yang baik untuk memindahkan organisasi kepada paradigma penggunaan sumber. Lebih dirumuskan i dati, lebih cepat dan lebih cekap untuk sampai ke dati. Sekiranya kedai mendapati bahawa ia melakukan banyak proses pada tahap terperinci DW, maka sejumlah besar sumber mesin yang sepadan digunakan. Adalah demi kepentingan terbaik semua orang untuk memproses rumusan tahap tinggi secepat mungkin.

Bagi kebanyakan kedai, penganalisis DSS dalam persekitaran pra-DW telah menggunakan dati pada tahap perincian. Dalam banyak hal ketibaan di dati ringkasan terperinci menyerupai selimut keselamatan, walaupun tahap ringkasan lain tersedia. Salah satu aktiviti arkitek dati adalah untuk menghentikan pengguna DSS daripada penggunaan berterusan dati pada tahap perincian yang paling rendah. Terdapat dua motivasi yang tersedia untuk arkitek dati:

  • dengan memasang sistem caj balik, di mana pengguna akhir membayar untuk sumber yang digunakan dan
  • yang menunjukkan bahawa masa tindak balas yang sangat baik boleh dicapai apabila tingkah laku dengan i dati berada pada tahap rumusan yang tinggi, manakala masa tindak balas yang lemah datang daripada tingkah laku dati pada tahap yang rendah PERHIMPUNAN LAIN Terdapat beberapa pertimbangan pembinaan dan pengurusan DW lain.
    Pertimbangan pertama ialah indeks. THE dati pada peringkat ringkasan yang lebih tinggi ia boleh diindeks secara bebas, manakala i dati

pada tahap perincian yang lebih rendah ia sangat besar sehingga boleh diindeks secara berjimat. Daripada token yang sama, i dati pada tahap perincian yang tinggi boleh distruktur semula dengan agak mudah, manakala jumlah dati di peringkat bawah ia adalah sangat besar sehingga i dati mereka tidak boleh diubahsuai dengan mudah. Akibatnya, model bagi dati dan kerja formal yang dilakukan oleh reka bentuk meletakkan asas untuk DW digunakan hampir secara eksklusif pada tahap perincian semasa. Dengan kata lain, aktiviti pemodelan bagi dati ia tidak digunakan pada tahap ringkasan, dalam hampir setiap kes. Satu lagi pertimbangan struktur ialah pembahagian dati oleh DW.

Pembahagian boleh dilakukan pada dua peringkat – pada tahap dbms dan di peringkat permohonan. Dalam bahagian di peringkat dbms, yang dbms dimaklumkan tentang bahagian dan mengawalnya dengan sewajarnya. Dalam kes pembahagian di peringkat permohonan, hanya pengaturcara dimaklumkan mengenai bahagian dan tanggungjawab untuk pentadbiran mereka diserahkan kepadanya

Di bawah paras dbms, banyak kerja dilakukan secara automatik. Terdapat banyak ketidakfleksibelan yang dikaitkan dengan mentadbir bahagian secara automatik. Dalam kes pembahagian di peringkat permohonan dati yang gudang data, banyak kerja membebankan pengaturcara, tetapi hasil akhirnya adalah fleksibiliti dalam pentadbiran dati dalam gudang data

ANOMALI LAIN

Manakala komponen dalam gudang data Mereka berfungsi seperti yang diterangkan untuk hampir semua dati, terdapat beberapa pengecualian berguna yang perlu dibincangkan. Pengecualian adalah daripada dati data ringkasan awam. Ini adalah dati ringkasan yang telah dikira daripada gudang data tetapi ia digunakan oleh masyarakat. THE dati Ringkasan awam disimpan dan diuruskan dalam gudang data, walaupun seperti yang dinyatakan sebelum ini ia dikira keluar. Akauntan bekerja untuk menghasilkan suku tahunan sedemikian dati seperti pendapatan, perbelanjaan suku tahunan, untung suku tahunan, dan sebagainya. Kerja yang dilakukan oleh akauntan adalah luaran kepada gudang data. Walau bagaimanapun, i dati digunakan "secara dalaman" dalam syarikat - daripada pemasaran, jualan, dsb. Satu lagi anomali, yang tidak akan dibincangkan, ialah dati luaran.

Satu lagi jenis yang luar biasa dati yang boleh didapati dalam a gudang data ialah data butiran kekal. Ini menyebabkan keperluan untuk menyimpan secara kekal dati pada tahap terperinci atas sebab etika atau undang-undang. Jika sesebuah syarikat mendedahkan pekerjanya kepada bahan berbahaya adalah perlu dati terperinci dan kekal. Jika syarikat mengeluarkan produk yang melibatkan keselamatan awam, seperti alat ganti kapal terbang, adalah perlu dati butiran kekal, serta jika syarikat membuat kontrak berbahaya.

Syarikat tidak mampu untuk mengabaikan butiran kerana dalam beberapa tahun akan datang, sekiranya berlaku tuntutan mahkamah, panggilan balik, kecacatan pembinaan yang dipertikaikan, dsb. pendedahan syarikat mungkin besar. Akibatnya terdapat jenis yang unik dati dikenali sebagai data butiran kekal.

RINGKASAN

Un gudang data ialah berorientasikan objek, bersepadu, varian masa, koleksi dati tidak berubah-ubah untuk menyokong keperluan membuat keputusan pentadbiran. Setiap fungsi penting a gudang data mempunyai implikasinya. Tambahan pula terdapat empat peringkat dati yang gudang data:

  • Perincian lama
  • Perincian semasa
  • Dati sedikit dirumuskan semula
  • Dati Metadata yang diringkaskan sangat juga merupakan bahagian penting dalam gudang data. ABSTRAK Konsep penyimpanan bagi dati Ia baru-baru ini mendapat perhatian ramai dan telah menjadi trend tahun 90-an. Ini disebabkan oleh keupayaan seorang gudang data untuk mengatasi batasan sistem sokongan pengurusan seperti sistem sokongan keputusan (DSS) dan sistem maklumat eksekutif (EIS). Walaupun konsep gudang data kelihatan menjanjikan, melaksanakan i gudang data boleh menjadi masalah kerana proses pergudangan berskala besar. Walaupun kerumitan projek pergudangan dati, ramai pembekal dan perunding yang membuat stok dati mereka mendakwa bahawa penyimpanan dati semasa tidak menyebabkan sebarang masalah. Walau bagaimanapun, pada permulaan projek penyelidikan ini, hampir tiada kajian bebas, teliti dan sistematik telah dijalankan. Akibatnya sukar untuk mengatakan, apa yang sebenarnya berlaku dalam industri apabila ia dibina gudang data. Kajian ini meneroka amalan pergudangan dati kontemporari yang bertujuan untuk membangunkan pemahaman yang lebih kaya tentang amalan Australia. Kajian literatur menyediakan konteks dan asas untuk kajian empirikal. Terdapat beberapa dapatan daripada kajian ini. Pertama, kajian ini mendedahkan aktiviti yang timbul semasa pembangunan gudang data. Dalam banyak kawasan, i dati berkumpul mengesahkan amalan yang dilaporkan dalam literatur. Kedua, isu dan masalah yang mungkin memberi kesan kepada pembangunan gudang data dikenal pasti melalui kajian ini. Akhir sekali, faedah yang diperoleh oleh organisasi Australia yang berkaitan dengan penggunaan gudang data telah didedahkan.

Bab 1

Konteks penyelidikan

Konsep pergudangan data menerima pendedahan yang meluas dan menjadi trend baru muncul pada tahun 90-an (McFadden 1996, TDWI 1996, Shah dan Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman dan Oates 2000). Ini dapat dilihat daripada semakin banyak artikel mengenai pergudangan data dalam penerbitan perdagangan (Little dan Gibson 1999). Banyak artikel (lihat, sebagai contoh, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett and King 1996, Graham et al. 1996, Sakaguchi dan Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, O. Edwards 1997, TDWI 1997) telah melaporkan manfaat ketara yang diperoleh oleh organisasi yang melaksanakan i gudang data. Mereka menyokong teori mereka dengan bukti anekdot tentang pelaksanaan yang berjaya, angka pulangan pelaburan (ROI) yang tinggi dan, juga, dengan menyediakan garis panduan atau metodologi untuk membangunkan gudang data

(Shanks et al. 1997, Seddon dan Benjamin 1998, Little dan Gibson 1999). Dalam kes yang melampau, Graham et al. (1996) melaporkan pulangan purata ke atas pelaburan tiga tahun sebanyak 401%.

Walau bagaimanapun, kebanyakan kesusasteraan semasa telah mengabaikan kerumitan yang terlibat dalam melaksanakan projek tersebut. Projek-projek daripada gudang data ia biasanya kompleks dan berskala besar dan oleh itu membawa kebarangkalian kegagalan yang tinggi jika ia tidak dikawal dengan teliti (Shah dan Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs dan Clymer 1998, Rao 1998). Mereka memerlukan sejumlah besar sumber manusia dan kewangan, serta masa dan usaha untuk membinanya (Hill 1998, Crofts 1998). Masa biasa dan cara kewangan yang diperlukan adalah kira-kira dua tahun dan dua hingga tiga juta dolar, masing-masing (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Masa dan cara kewangan ini diperlukan untuk mengawal dan menyatukan pelbagai aspek pergudangan data yang berbeza (Cafasso 1995, Hill 1998). Di samping pertimbangan perkakasan dan perisian, fungsi lain, yang berbeza daripada pengekstrakan dati kepada proses pemuatan dati, kapasiti memori untuk mengurus kemas kini dan meta dati untuk latihan pengguna, mesti dipertimbangkan.

Pada masa projek penyelidikan ini bermula, sangat sedikit penyelidikan akademik dijalankan dalam bidang pergudangan data, terutamanya di Australia. Ini terbukti daripada kekurangan artikel yang diterbitkan mengenai pergudangan data daripada jurnal atau penulisan akademik lain pada masa itu. Banyak tulisan akademik yang ada menggambarkan pengalaman AS. Kekurangan penyelidikan akademik dalam bidang pergudangan data telah menyebabkan panggilan untuk penyelidikan yang teliti dan kajian empirikal (McFadden 1996, Shanks et al. 1997, Little dan Gibson 1999). Khususnya, kajian penyelidikan mengenai proses pelaksanaan gudang data perlu dijalankan untuk meluaskan pengetahuan am berkenaan pelaksanaan gudang data dan akan menjadi asas untuk kajian penyelidikan masa hadapan (Shanks et al. 1997, Little dan Gibson 1999).

Oleh itu, tujuan kajian ini adalah untuk mengkaji apa yang sebenarnya berlaku apabila organisasi menjalankan dan menggunakan i gudang data di Australia. Secara khusus, kajian ini akan melibatkan analisis keseluruhan proses pembangunan a gudang data, bermula dari permulaan dan perancangan melalui reka bentuk dan pelaksanaan dan penggunaan seterusnya dalam organisasi Australia. Di samping itu, kajian ini juga akan menyumbang kepada amalan semasa dengan mengenal pasti bidang di mana amalan boleh dipertingkatkan lagi dan ketidakcekapan dan risiko dapat diminimumkan atau dielakkan. Tambahan pula, ia akan menjadi asas kepada kajian lain mengenai gudang data di Australia dan akan mengisi jurang yang wujud dalam kesusasteraan pada masa ini.

Soalan kajian

Objektif penyelidikan ini adalah untuk mengkaji aktiviti yang terlibat dalam pelaksanaan gudang data dan penggunaannya oleh organisasi Australia. Khususnya, elemen mengenai perancangan projek, pembangunan, operasi, penggunaan dan risiko yang terlibat dikaji. Maka persoalan kajian ini ialah:

“Apakah amalan semasa gudang data di Australia?"

Untuk menjawab soalan ini dengan berkesan, beberapa soalan penyelidikan subsidiari diperlukan. Secara khususnya, tiga sub-soalan telah dikenal pasti daripada literatur, yang dibentangkan dalam bab 2, untuk membimbing projek penyelidikan ini: Bagaimana gudang data daripada organisasi Australia? Apakah masalah yang anda hadapi?

Apakah faedah yang dialami?
Dalam menjawab soalan-soalan ini, reka bentuk penyelidikan penerokaan menggunakan tinjauan telah digunakan. Sebagai kajian penerokaan, jawapan kepada soalan di atas adalah tidak lengkap (Shanks et al. 1993, Denscombe 1998). Dalam kes ini, triangulasi diperlukan untuk menambah baik jawapan kepada soalan-soalan ini. Walau bagaimanapun, penyiasatan akan menyediakan asas yang kukuh untuk kerja masa depan yang meneliti soalan-soalan ini. Perbincangan terperinci mengenai justifikasi dan reka bentuk kaedah penyelidikan dibentangkan dalam Bab 3.

Struktur projek penyelidikan

Projek penyelidikan ini dibahagikan kepada dua bahagian: kajian kontekstual konsep pergudangan data dan penyelidikan empirikal (lihat Rajah 1.1), setiap satunya dibincangkan di bawah.

Bahagian I: Kajian kontekstual

Bahagian pertama penyelidikan terdiri daripada mengkaji literatur semasa mengenai pelbagai jenis pergudangan data termasuk sistem sokongan keputusan (DSS), sistem maklumat eksekutif (EIS), kajian kes gudang data dan konsep gudang data. Tambahan pula, hasil forum gudang data dan kumpulan pertemuan pakar dan pengamal yang diketuai oleh pasukan penyelidik Monash DSS, menyumbang kepada fasa kajian ini yang bertujuan untuk mendapatkan pandangan tentang amalan gudang data dan untuk mengenal pasti risiko yang terlibat dalam pengambilan mereka. Dalam tempoh kajian kontekstual ini, pemahaman tentang kawasan masalah telah diwujudkan untuk menyediakan pengetahuan latar belakang untuk penyiasatan empirikal seterusnya. Walau bagaimanapun, ini adalah proses yang berterusan semasa menjalankan kajian penyelidikan.

Bahagian II: Penyelidikan empirikal

Konsep pergudangan data yang agak baharu, terutamanya di Australia, telah mewujudkan keperluan untuk tinjauan untuk mendapatkan gambaran luas tentang pengalaman pengguna. Bahagian ini dijalankan sebaik sahaja domain masalah telah diwujudkan melalui kajian literatur yang meluas. Konsep penyimpanan data yang dibentuk semasa fasa kajian kontekstual digunakan sebagai input untuk soal selidik awal kajian ini. Selepas ini, soal selidik telah diteliti. Anda pakar dalam gudang data mengambil bahagian dalam ujian. Tujuan menguji soal selidik awal adalah untuk menyemak kesempurnaan dan ketepatan soalan. Berdasarkan keputusan ujian, soal selidik telah diubah suai dan versi yang diubah suai telah dihantar kepada peserta tinjauan. Soal selidik yang dikembalikan kemudiannya dianalisis untuk i dati dalam jadual, rajah dan format lain. THE

keputusan analisis daripada dati mereka membentuk gambaran amalan pergudangan data di Australia.

TINJAUAN PERGUDANGAN DATA

Konsep pergudangan data telah berkembang dengan peningkatan dalam teknologi komputer.
Ia bertujuan untuk mengatasi masalah yang dihadapi oleh kumpulan sokongan aplikasi seperti Sistem Sokongan Keputusan (DSS) dan Sistem Maklumat Eksekutif (EIS).

Pada masa lalu, halangan terbesar bagi aplikasi ini ialah ketidakupayaan aplikasi ini untuk menyediakan a pangkalan data perlu untuk analisis.
Ini disebabkan terutamanya oleh sifat kerja pengurusan. Kepentingan pengurusan syarikat sentiasa berbeza-beza bergantung pada kawasan yang dilindungi. Oleh itu i dati asas untuk aplikasi ini mereka mesti boleh berubah dengan cepat bergantung pada bahagian yang akan dirawat.
Ini bermakna i dati mesti tersedia dalam bentuk yang sesuai untuk analisis yang diminta. Malah, kumpulan sokongan aplikasi mendapati sukar pada masa lalu untuk mengumpul dan menyepadukan dati daripada sumber yang kompleks dan pelbagai.

Baki bahagian ini membentangkan gambaran keseluruhan konsep pergudangan data dan membincangkan bagaimana gudang data dapat mengatasi masalah kumpulan sokongan aplikasi.
Istilah "Gudang Data” telah dipopularkan oleh William Inmon pada tahun 1990. Takrifannya yang sering disebut melihat Gudang Data sebagai koleksi dati berorientasikan subjek, bersepadu, tidak meruap, dan berubah-ubah dari semasa ke semasa, dalam menyokong keputusan pengurusan.

Menggunakan definisi ini Inmon menyerlahkan bahawa i dati menetap di a gudang data mereka mesti mempunyai 4 ciri berikut:

  • ▪ Berorientasikan subjek
  • ▪ Bersepadu
  • ▪ Tidak meruap
  • ▪ Pembolehubah mengikut masa Mengikut Inmon berorientasikan subjek bermakna i dati dalam gudang data dalam bidang organisasi terbesar yang telah

ditakrifkan dalam model dati. Contohnya semua dati berkenaan i pelanggan terkandung dalam bidang subjek PELANGGAN. Begitu juga semua dati berkaitan dengan produk terkandung dalam bidang subjek PRODUK.

Dengan Inmon Bersepadu bermakna i dati datang dari platform, sistem dan lokasi yang berbeza digabungkan dan disimpan di satu tempat. Akibatnya dati yang serupa mesti diubah menjadi format yang konsisten supaya ia boleh ditambah dan dibandingkan dengan mudah.
Sebagai contoh, jantina lelaki dan perempuan diwakili oleh huruf M dan F dalam satu sistem, dan dengan 1 dan 0 dalam sistem yang lain. Untuk menyepadukannya dengan betul, satu atau kedua-dua format mesti diubah supaya kedua-dua format adalah sama. Dalam kes ini kita boleh menukar M kepada 1 dan F kepada 0 atau sebaliknya. Berorientasikan subjek dan Bersepadu menunjukkan bahawa gudang data direka untuk menyediakan penglihatan berfungsi dan melintang dati oleh syarikat.

Dengan Non-volatile dia bermaksud bahawa i dati dalam gudang data kekal konsisten dan pengemaskinian dati ia tidak perlu. Sebaliknya, setiap perubahan dalam dati asal ditambah pada pangkalan data yang gudang data. Ini bermakna bahawa dei sejarah dati terkandung dalam gudang data.

Untuk Pembolehubah dengan masa Inmon menunjukkan bahawa i dati dalam gudang data sentiasa mengandungi penunjuk masa ei dati mereka biasanya melintasi ufuk masa tertentu. Contohnya a
gudang data boleh mengandungi 5 tahun nilai sejarah pelanggan dari 1993 hingga 1997. Ketersediaan sejarah dan siri masa dati membolehkan anda menganalisis trend.

Un gudang data dia boleh kumpul sendiri dati daripada sistem OLTP; daripada sumber dati luar organisasi dan/atau oleh projek sistem tangkapan khas lain dati.
I dati ekstrak boleh melalui proses pembersihan, dalam kes ini i dati diubah dan disepadukan sebelum disimpan dalam pangkalan data yang gudang data. Kemudian saya dati

penduduk di dalam pangkalan data yang gudang data disediakan untuk log masuk pengguna akhir dan alatan pemulihan. Menggunakan alatan ini pengguna akhir boleh mengakses pandangan bersepadu organisasi dati.

I dati penduduk di dalam pangkalan data yang gudang data ia disimpan secara terperinci dan dalam format ringkasan.
Tahap ringkasan mungkin bergantung pada sifat dati. The dati terperinci mungkin terdiri daripada dati semasa e dati ahli sejarah
I dati royalti tidak termasuk dalam gudang data sehingga saya dati dalam gudang data dikemas kini.
Selain menyimpan i dati sendiri, a gudang data ia juga boleh menyimpan jenis yang berbeza dato dipanggil METADATA menggambarkan dati penduduk di rumahnya pangkalan data.
Terdapat dua jenis metadata: metadata pembangunan dan metadata analitik.
Metadata pembangunan digunakan untuk mengurus dan mengautomasikan proses pengekstrakan, pembersihan, pemetaan dan pemuatan dati dalam gudang data.
Maklumat yang terkandung dalam metadata pembangunan mungkin mengandungi butiran sistem pengendalian, butiran elemen yang akan diekstrak, model dati yang gudang data dan peraturan perniagaan untuk menukar dati.

Jenis metadata kedua, yang dikenali sebagai metadata analitik, membolehkan pengguna akhir meneroka kandungan gudang data untuk mencari dati tersedia dan maksudnya dalam istilah yang jelas dan bukan teknikal.

Oleh itu metadata analitik berfungsi sebagai jambatan antara gudang data dan aplikasi pengguna akhir. Metadata ini boleh mengandungi model perniagaan, penerangan tentang dati sepadan dengan model perniagaan, pertanyaan dan laporan yang telah ditetapkan, maklumat untuk akses pengguna dan indeks.

Metadata analisis dan pembangunan mesti digabungkan menjadi satu metadata pembendungan bersepadu untuk berfungsi dengan baik.

Malangnya banyak alat sedia ada mempunyai metadata mereka sendiri dan pada masa ini tiada piawaian sedia ada untuk itu

benarkan alat pergudangan data untuk menyepadukan metadata ini. Untuk membetulkan keadaan ini, ramai pedagang alat pergudangan data utama membentuk Meta Data Council yang kemudiannya menjadi Meta Data Coalition.

Matlamat gabungan ini adalah untuk membina set metadata standard yang membolehkan alat pergudangan data yang berbeza untuk menukar metadata
Usaha mereka menghasilkan lahirnya Meta Data Interchange Specification (MDIS) yang akan membolehkan pertukaran maklumat antara arkib Microsoft dan fail MDIS yang berkaitan.

Kewujudan dati kedua-duanya diringkaskan/diindeks dan terperinci memberi pengguna kemungkinan untuk menjalankan DRILL DROWN (penggerudian) dari dati diindeks kepada yang terperinci dan sebaliknya. Kewujudan dati sejarah terperinci membolehkan penciptaan analisis trend dari semasa ke semasa. Selain itu, metadata analitik boleh digunakan sebagai direktori pangkalan data yang gudang data untuk membantu pengguna akhir mencari dati perlu.

Berbanding dengan sistem OLTP, dengan keupayaan mereka untuk menyokong analisis dati dan pelaporan, yang gudang data ia dilihat sebagai sistem yang lebih sesuai untuk proses maklumat seperti membuat dan menjawab pertanyaan dan menghasilkan laporan. Bahagian seterusnya akan menyerlahkan perbezaan kedua-dua sistem secara terperinci.

GUDANG DATA TERHADAP SISTEM OLTP

Banyak sistem maklumat dalam organisasi bertujuan untuk menyokong operasi harian. Sistem ini dikenali sebagai OLTP SYSTEMS, menangkap transaksi harian yang dikemas kini secara berterusan.

I dati dalam sistem ini ia sering diubah suai, ditambah atau dipadamkan. Contohnya, alamat pelanggan berubah apabila dia berpindah dari satu tempat ke tempat lain. Dalam kes ini, alamat baharu akan didaftarkan dengan mengubah suai medan alamat pangkalan data. Objektif utama sistem ini adalah untuk mengurangkan kos transaksi dan pada masa yang sama mengurangkan masa pemprosesan. Contoh Sistem OLTP termasuk tindakan kritikal seperti kemasukan pesanan, senarai gaji, invois, pembuatan, perkhidmatan pelanggan pelanggan.

Tidak seperti sistem OLTP, yang dicipta untuk proses berasaskan transaksi dan peristiwa, i gudang data telah dicipta untuk menyediakan sokongan untuk proses berasaskan analisis dati dan proses membuat keputusan.

Ini biasanya dicapai dengan menyepadukan i dati daripada pelbagai OLTP dan sistem luaran dalam satu "bekas" tunggal dati, seperti yang dibincangkan dalam bahagian sebelumnya.

Model Proses Pergudangan Data Monash

Model proses untuk gudang data Monash telah dibangunkan oleh penyelidik di Monash DSS Research Group, dan berdasarkan kesusasteraan gudang data, mengenai pengalaman dalam menyokong pembangunan bidang sistem, mengenai perbincangan dengan vendor aplikasi untuk digunakan pada gudang data, pada sekumpulan pakar dalam penggunaan gudang data.

Fasa tersebut ialah: Permulaan, Perancangan, Pembangunan, Operasi dan Penjelasan. Rajah menerangkan sifat berulang atau evolusi bagi perkembangan a gudang data proses menggunakan anak panah dua hala yang diletakkan di antara fasa yang berbeza. Dalam konteks ini, "berulang" dan "evolusi" bermakna, pada setiap langkah proses, aktiviti pelaksanaan sentiasa boleh menyebar ke belakang ke fasa sebelumnya. Ini disebabkan oleh sifat sesuatu projek gudang data di mana permintaan tambahan daripada pengguna akhir timbul pada bila-bila masa. Contohnya, semasa fasa pembangunan sesuatu proses gudang data, dimensi baharu atau kawasan subjek diminta oleh pengguna akhir, yang bukan sebahagian daripada pelan asal, ini mesti ditambahkan pada sistem. Ini menyebabkan perubahan dalam projek. Hasilnya ialah pasukan reka bentuk mesti mengubah keperluan dokumen yang dibuat setakat ini semasa fasa reka bentuk. Dalam kebanyakan kes, keadaan semasa projek mesti kembali ke fasa reka bentuk di mana keperluan baharu mesti ditambah dan didokumenkan. Pengguna akhir mesti dapat melihat dokumentasi khusus yang disemak dan perubahan yang telah dibuat dalam fasa pembangunan. Pada akhir kitaran pembangunan ini, projek mesti mendapat maklum balas yang sangat baik daripada kedua-dua pasukan pembangunan dan pengguna. Maklum balas kemudiannya digunakan semula untuk menambah baik projek masa hadapan.

Perancangan kapasiti
Dw cenderung bersaiz sangat besar dan berkembang dengan cepat (Best 1995, Rudin 1997a) akibat daripada jumlah dati sejarah yang mereka simpan dari tempoh mereka. Pertumbuhan juga boleh disebabkan oleh dati tambahan yang diminta oleh pengguna untuk meningkatkan nilai dati yang telah mereka miliki. Sehubungan itu, keperluan penyimpanan untuk dati boleh dipertingkatkan dengan ketara (Eckerson 1997). Oleh itu, adalah penting untuk memastikan, dengan menjalankan perancangan kapasiti, bahawa sistem yang dibina boleh berkembang apabila keperluan berkembang (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Dalam perancangan untuk skalabiliti pangkalan data, seseorang mesti mengetahui jangkaan pertumbuhan dalam saiz gudang, jenis pertanyaan yang mungkin dibuat, dan bilangan pengguna akhir yang disokong (Best 1995, Rudin 1997b, Foley 1997a). Membina aplikasi berskala memerlukan gabungan teknologi pelayan berskala dan teknik reka bentuk aplikasi berskala (Best 1995, Rudin 1997b. Kedua-duanya perlu dalam membina aplikasi berskala tinggi. Teknologi pelayan berskala boleh menjadikannya mudah dan berfaedah untuk menambah storan, memori dan CPU tanpa merendahkan maruah prestasi (Lang 1997, Telephony 1997).

Terdapat dua teknologi pelayan berskala utama: pemprosesan berbilang simetri (SMP) dan pemprosesan selari secara besar-besaran (MPP) (IDC 1997, Humphries et al. 1999). Pelayan SMP biasanya mempunyai berbilang pemproses yang berkongsi memori, bas sistem dan sumber lain (IDC 1997, Humphries et al. 1999). Pemproses tambahan boleh ditambah untuk meningkatkannya kuasa pengiraan. Kaedah lain untuk meningkatkan kuasa pelayan SMP, adalah untuk menggabungkan banyak mesin SMP. Teknik ini dikenali sebagai clustering (Humphries et al. 1999). Pelayan MPP, sebaliknya, mempunyai berbilang pemproses yang masing-masing mempunyai memori sendiri, sistem bas dan sumber lain (IDC 1997, Humphries et al. 1999). Setiap pemproses dipanggil nod. Peningkatan dalam kuasa pengiraan boleh dicapai

menambah nod tambahan pada pelayan MPP (Humphries et al. 1999).

Kelemahan pelayan SMP ialah terlalu banyak operasi input-output (I/O) boleh menyesakkan bas sistem (IDC 1997). Masalah ini tidak berlaku dalam pelayan MPP kerana setiap pemproses mempunyai sistem bas sendiri. Walau bagaimanapun, sambungan antara setiap nod secara amnya lebih perlahan daripada sistem bas SMP. Selain itu, pelayan MPP boleh menambah tahap kerumitan tambahan kepada pembangun aplikasi (IDC 1997). Oleh itu, pilihan antara pelayan SMP dan MPP boleh dipengaruhi oleh banyak faktor, termasuk kerumitan aplikasi, nisbah harga/prestasi, kapasiti pemprosesan yang diperlukan, aplikasi dw yang dihalang dan peningkatan saiz pangkalan data daripada dw dan dalam bilangan pengguna akhir.

Banyak teknik reka bentuk aplikasi berskala boleh digunakan dalam perancangan kapasiti. Seseorang menggunakan pelbagai tempoh pemberitahuan seperti hari, minggu, bulan dan tahun. Mempunyai pelbagai tempoh pemberitahuan, yang pangkalan data ia boleh dibahagikan kepada bahagian terurus berkumpulan (Inmon et al. 1997). Teknik lain ialah menggunakan jadual ringkasan yang dibina dengan meringkaskan dati da dati terperinci. Jadi saya dati diringkaskan adalah lebih padat daripada terperinci, yang memerlukan lebih sedikit ruang memori. Jadi dati perincian boleh disimpan dalam unit storan yang lebih murah, yang menjimatkan lebih banyak storan. Walaupun menggunakan jadual ringkasan boleh menjimatkan ruang memori, mereka memerlukan banyak usaha untuk memastikannya dikemas kini dan selaras dengan keperluan perniagaan. Walau bagaimanapun, teknik ini digunakan secara meluas dan sering digunakan bersama-sama dengan teknik sebelumnya (Best 1995, Inmon 1996a, Chauduri dan Dayal
1997).

Menetapkan Gudang Data Seni Bina Teknikal Definisi teknik seni bina dw

Pengguna awal pergudangan data terutamanya membayangkan pelaksanaan terpusat dw di mana semua dati, termasuk i dati luaran, diintegrasikan ke dalam satu,
penyimpanan fizikal (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Kelebihan utama pendekatan ini ialah pengguna akhir dapat mengakses pandangan seluruh perusahaan bagi dati organisasi (Ovum 1998). Kelebihan lain ialah ia menawarkan penyeragaman dati melalui organisasi, yang bermaksud hanya terdapat satu versi atau definisi bagi setiap terminologi yang digunakan dalam repositori dw (metadata) (Flanagan dan Safdie 1997, Ovum 1998). Kelemahan pendekatan ini, sebaliknya, adalah mahal dan sukar untuk dibina (Flanagan dan Safdie 1997, Ovum 1998, Inmon et al. 1998). Tidak lama selepas seni bina storan dati berpusat menjadi popular, konsep mengekstrak subset yang lebih kecil daripada yang berkembang dati untuk menyokong keperluan aplikasi khusus (Varney 1996, IDC 1997, Berson dan Smith 1997, peacock 1998). Sistem kecil ini adalah terbitan daripada sistem yang lebih besar gudang data berpusat. Mereka dinamakan gudang data jabatan bergantung atau mart data bergantung. Seni bina data mart bergantung dikenali sebagai seni bina tiga peringkat di mana peringkat pertama terdiri daripada gudang data berpusat, yang kedua terdiri daripada deposit daripada dati jabatan dan yang ketiga terdiri daripada akses kepada dati dan dengan alat analisis (Demarest 1994, Inmon et al. 1997).

Data mart biasanya dibina selepas gudang data berpusat dibina untuk memenuhi keperluan unit tertentu (White 1995, Varney 1996).
Data marts menyimpan dati sangat relevan berkaitan dengan unit tertentu (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

Kelebihan kaedah ini ialah tidak akan ada dato tidak bersepadu dan i dati akan menjadi kurang berlebihan dalam data mart seperti semua dati mereka datang dari gudang dati bersepadu. Kelebihan lain ialah terdapat sedikit sambungan antara setiap data mart dan sumbernya dati kerana setiap data mart hanya mempunyai satu sumber dati. Selain itu, dengan adanya seni bina ini, pengguna akhir masih boleh mengakses gambaran keseluruhan dati

organisasi korporat. Kaedah ini dikenali sebagai kaedah atas ke bawah, di mana data mart dibina selepas gudang data (peacock 1998, Goff 1998).
Meningkatkan keperluan untuk menunjukkan hasil awal, beberapa organisasi telah mula membina data mart bebas (Flanagan dan Safdie 1997, White 2000). Dalam kes ini, data mart mendapat sendiri dati terus dari asas dati OLTP dan bukan dari gudang berpusat dan bersepadu, sekali gus menghapuskan keperluan untuk mempunyai gudang pusat di tapak.

Setiap data mart memerlukan sekurang-kurangnya satu pautan ke sumbernya dati. Kelemahan mempunyai berbilang sambungan untuk setiap data mart ialah, berbanding dengan dua seni bina sebelumnya, lebihan dati meningkat dengan ketara.

Setiap data mart mesti menyimpan semua dati diperlukan secara tempatan untuk tidak mempunyai kesan ke atas sistem OLTP. Ini menyebabkan i dati ia disimpan dalam data mart yang berbeza (Inmon et al. 1997). Satu lagi kelemahan seni bina ini ialah ia membawa kepada penciptaan interkoneksi yang kompleks antara data mart dan sumber data mereka. dati yang sukar untuk dijalankan dan dikawal (Inmon et al. 1997).

Satu lagi kelemahan ialah pengguna akhir tidak boleh mengakses gambaran keseluruhan maklumat syarikat kerana i dati daripada data mart yang berbeza tidak disepadukan (Ovum 1998).
Kelemahan lain ialah mungkin terdapat lebih daripada satu takrifan untuk setiap terminologi yang digunakan dalam data mart yang menghasilkan ketidakkonsistenan dati dalam organisasi (Ovum 1998).
Walaupun kelemahan yang dibincangkan di atas, data mart bebas masih menarik minat banyak organisasi (IDC 1997). Satu faktor yang menjadikan mereka menarik ialah mereka lebih cepat berkembang dan memerlukan lebih sedikit masa dan sumber (Bresnahan 1996, Berson dan Smith 1997, Ovum 1998). Akibatnya, ia berfungsi terutamanya sebagai projek ujian yang boleh digunakan untuk mengenal pasti faedah dan/atau ketidaksempurnaan dengan cepat dalam projek (Parsaye 1995, Braly 1995, Newing 1996). Dalam kes ini, bahagian yang akan dilaksanakan dalam projek perintis mestilah kecil tetapi penting untuk organisasi (Newing 1996, Mansell-Lewis 1996).

Dengan meneliti prototaip, pengguna akhir dan pentadbiran boleh memutuskan sama ada untuk meneruskan atau menghentikan projek (Flanagan dan Safdie 1997).
Jika keputusan mahu diteruskan, data mart untuk industri lain harus dibina satu demi satu. Terdapat dua pilihan untuk pengguna akhir berdasarkan keperluan mereka dalam membina matriks data bebas: bersepadu/bersekutu dan tidak bersepadu (Ovum 1998)

Dalam kaedah pertama, setiap data mart baharu hendaklah dibina berdasarkan data mart semasa dan model dati digunakan oleh syarikat (Varney 1996, Berson dan Smith 1997, Peacock 1998). Keperluan untuk menggunakan model dati syarikat bermakna bahawa ia mesti dipastikan bahawa hanya terdapat satu definisi bagi setiap terminologi yang digunakan di seluruh data mart, ini juga untuk memastikan bahawa data mart yang berbeza boleh digabungkan untuk memberikan gambaran keseluruhan maklumat syarikat (Bresnahan 1996). Kaedah ini dipanggil bottom-up dan paling baik apabila terdapat kekangan dari segi kewangan dan masa (Flanagan dan Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). Dalam kaedah kedua, data mart yang dibina hanya dapat memenuhi keperluan unit tertentu. Satu varian data mart bersekutu ialah gudang data diedarkan di mana pangkalan data Perisian tengah Hub Server digunakan untuk menggabungkan banyak data mart ke dalam satu repositori dati diedarkan (White 1995). Dalam kes ini, i dati syarikat diedarkan di beberapa data mart. Permintaan pengguna akhir dimajukan kepada pangkalan data middleware hab pelayan, yang mengekstrak semua dati diminta oleh data mart dan mengembalikan hasilnya kepada aplikasi pengguna akhir. Kaedah ini menyediakan maklumat perniagaan kepada pengguna akhir. Walau bagaimanapun, masalah data mart bebas masih tidak dihapuskan. Terdapat satu lagi seni bina yang boleh digunakan iaitu dipanggil the gudang data maya (White 1995). Walau bagaimanapun, seni bina ini, yang diterangkan dalam Rajah 2.9, bukanlah seni bina penyimpanan data. dati nyata kerana ia tidak memindahkan pemuatan dari sistem OLTP ke gudang data (Demarest 1994).

Malah, permintaan daripada dati daripada pengguna akhir diteruskan ke sistem OLTP yang mengembalikan hasil selepas memproses permintaan pengguna. Walaupun seni bina ini membenarkan pengguna akhir menjana laporan dan membuat permintaan, ia tidak dapat menyediakan

dati sejarah dan gambaran keseluruhan maklumat syarikat seperti i dati daripada sistem OLTP yang berbeza tidak disepadukan. Oleh itu, seni bina ini tidak dapat memenuhi analisis dati kompleks seperti ramalan.

Pemilihan akses dan aplikasi pemulihan dati

Tujuan pembinaan a gudang data adalah untuk menyampaikan maklumat kepada pengguna akhir (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); satu atau lebih aplikasi akses dan pemulihan dati mesti disediakan. Sehingga kini, terdapat pelbagai jenis aplikasi ini yang boleh dipilih oleh pengguna (Hammergren 1998, Humphries et al. 1999). Aplikasi yang anda pilih menentukan kejayaan usaha pergudangan anda dati dalam sesebuah organisasi kerana aplikasi adalah bahagian yang paling ketara gudang data kepada pengguna akhir (Inmon et al. 1997, Poe 1996). Untuk berjaya a gudang data, mesti boleh menyokong aktiviti analisis bagi dati daripada pengguna akhir (Poe 1996, Seddon dan Benjamin 1998, Eckerson 1999). Oleh itu "tahap" apa yang dikehendaki oleh pengguna akhir mesti dikenal pasti (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

Secara amnya, pengguna akhir boleh dikumpulkan kepada tiga kategori: pengguna eksekutif, penganalisis perniagaan dan pengguna kuasa (Poe 1996, Humphries et al. 1999). Pengguna eksekutif memerlukan akses mudah kepada set laporan yang telah ditetapkan (Humphries et al. 1999). Nisbah ini boleh diakses dengan mudah dengan navigasi menu (Poe 1996). Selain itu, laporan hendaklah membentangkan maklumat menggunakan perwakilan grafik seperti jadual dan templat untuk menyampaikan maklumat dengan cepat (Humphries et al. 1999). Penganalisis perniagaan, yang mungkin tidak mempunyai keupayaan teknikal untuk membangunkan laporan dari awal sendiri, perlu boleh mengubah suai laporan semasa untuk memenuhi keperluan khusus mereka (Poe 1996, Humphries et al. 1999). Pengguna kuasa pula ialah jenis pengguna akhir yang mempunyai keupayaan untuk menjana dan menulis permintaan dan laporan dari awal (Poe 1996, Humphries et al. 1999). Mereka adalah orang-orang yang

mereka membangunkan laporan untuk jenis pengguna lain (Poe 1996, Humphries et al. 1999).

Setelah keperluan pengguna akhir telah ditentukan, pilihan akses dan aplikasi pemulihan mesti dibuat dati antara semua yang ada (Poe 1996, Inmon et al. 1997).
Akses kepada dati dan alat cari semula boleh dikelaskan kepada 4 jenis: alatan OLAP, alatan EIS/DSS, alatan pertanyaan dan pelaporan serta alatan perlombongan data.

Alat OLAP membolehkan pengguna membuat pertanyaan ad hoc serta pertanyaan yang dibuat pada pangkalan data yang gudang data. Selain itu, produk ini membenarkan pengguna untuk menelusuri dati umum kepada yang terperinci.

Alat EIS/DSS menyediakan pelaporan eksekutif seperti analisis "bagaimana jika" dan akses kepada laporan dipacu menu. Laporan hendaklah dipratakrifkan dan digabungkan dengan menu untuk navigasi yang lebih mudah.
Alat pertanyaan dan pelaporan membolehkan pengguna menghasilkan laporan yang dipratentukan dan khusus.

Alat perlombongan data digunakan untuk mengenal pasti perhubungan yang boleh memberi penerangan baharu tentang operasi yang terlupa dalam dati daripada gudang data.

Di samping mengoptimumkan keperluan setiap jenis pengguna, alatan yang dipilih mestilah intuitif, cekap dan mudah digunakan. Mereka juga perlu serasi dengan bahagian lain seni bina dan boleh berfungsi dengan sistem sedia ada. Ia juga disyorkan untuk memilih akses data dan alat mendapatkan semula dengan harga dan prestasi yang berpatutan. Kriteria lain yang perlu dipertimbangkan termasuk komitmen vendor alat untuk menyokong produk mereka dan cara produk itu akan berkembang dalam keluaran masa hadapan. Untuk memastikan penglibatan pengguna dalam menggunakan gudang data, pasukan pembangunan melibatkan pengguna dalam proses pemilihan alat. Dalam kes ini, penilaian pengguna praktikal harus dijalankan.

Untuk meningkatkan nilai gudang data, pasukan pembangunan juga boleh menyediakan akses web kepada gudang data mereka. Gudang data yang didayakan web membolehkan pengguna mengakses dati dari tempat terpencil atau semasa dalam perjalanan. Tambahan pula maklumat boleh

disediakan pada kos yang lebih rendah melalui pengurangan kos latihan.

2.4.3 Gudang Data Fasa Operasi

Fasa ini terdiri daripada tiga aktiviti: definisi strategi penyegaran data, kawalan aktiviti gudang data dan pengurusan keselamatan gudang data.

Definisi strategi penyegaran data

Selepas pemuatan awal, i dati dalam pangkalan data daripada gudang data mesti dimuat semula secara berkala untuk menghasilkan semula perubahan yang dibuat kepada mereka dati asal. Oleh itu, anda mesti memutuskan masa untuk memuat semula, kekerapan muat semula harus dijadualkan dan cara memuat semula data dati. Adalah dicadangkan untuk menyegarkan semula dati apabila sistem boleh dibawa ke luar talian. Kekerapan muat semula ditentukan oleh pasukan pembangunan berdasarkan keperluan pengguna. Terdapat dua pendekatan untuk menyegarkan gudang data: penyegaran lengkap dan pemuatan berterusan perubahan.

Pendekatan pertama, muat semula penuh, memerlukan muat semula semua dati dari awal. Ini bermakna semua dati yang diperlukan mesti diekstrak, dibersihkan, diubah dan disepadukan ke dalam setiap penyegaran. Pendekatan ini harus, seboleh-bolehnya, dielakkan kerana ia memerlukan banyak masa dan sumber.

Pendekatan alternatif ialah memuat naik perubahan secara berterusan. Ini menambah i dati yang telah diubah sejak kitaran muat semula gudang data terakhir. Mengenal pasti rekod baharu atau diubah suai mengurangkan jumlah dati yang mesti disebarkan ke gudang data dalam setiap kemas kini kerana hanya ini dati akan ditambah kepada pangkalan data daripada gudang data.

Terdapat sekurang-kurangnya 5 pendekatan yang boleh digunakan untuk menarik diri i dati baharu atau diubah suai. Untuk mendapatkan strategi penyegaran semula data yang cekap dati campuran pendekatan ini yang menangkap semua perubahan dalam sistem boleh berguna.

Pendekatan pertama, yang menggunakan cap masa, menganggap bahawa semua telah ditetapkan dati mengedit dan mengemas kini cap masa supaya anda boleh mengenal pasti semua dengan mudah dati diubahsuai dan baharu. Pendekatan ini, bagaimanapun, tidak digunakan secara meluas dalam kebanyakan sistem pengendalian hari ini.
Pendekatan kedua ialah menggunakan fail delta yang dihasilkan oleh aplikasi yang mengandungi hanya perubahan yang dibuat kepada dati. Menggunakan fail ini juga menguatkan kitaran kemas kini. Walau bagaimanapun, walaupun kaedah ini tidak digunakan dalam banyak aplikasi.
Pendekatan ketiga ialah mengimbas fail log, yang pada asasnya mengandungi maklumat yang serupa dengan fail delta. Satu-satunya perbezaan ialah fail log dicipta untuk proses pemulihan dan boleh menjadi sukar untuk difahami.
Pendekatan keempat ialah mengubah suai kod aplikasi. Walau bagaimanapun, kebanyakan kod aplikasi adalah lama dan rapuh; oleh itu teknik ini harus dielakkan.
Pendekatan terakhir ialah membandingkan dati sumber dengan fail dei utama dati.

Kawalan aktiviti gudang data

Setelah gudang data telah dikeluarkan kepada pengguna, ia mesti dipantau dari semasa ke semasa. Dalam kes ini, pentadbir gudang data boleh menggunakan satu atau lebih alat pengurusan dan kawalan untuk memantau penggunaan gudang data. Khususnya, maklumat boleh dikumpul tentang orang dan masa di mana mereka mengakses gudang data. Ayuh dati dikumpul, profil kerja yang dilakukan boleh dibuat yang boleh digunakan sebagai input ke dalam pelaksanaan caj balik pengguna. Caj balik membolehkan pengguna dimaklumkan tentang kos pemprosesan gudang data.

Tambahan pula, audit gudang data juga boleh digunakan untuk mengenal pasti jenis pertanyaan, saiznya, bilangan pertanyaan setiap hari, masa tindak balas pertanyaan, sektor yang dicapai dan jumlah dati telah di proses. Tujuan lain melakukan pengauditan gudang data adalah untuk mengenal pasti dati yang tidak digunakan. Ini dati mereka boleh dialih keluar dari gudang data untuk menambah baik masa

tindak balas pelaksanaan pertanyaan dan memantau pertumbuhan dati yang tinggal di dalam pangkalan data daripada gudang data.

Pengurusan keselamatan gudang data

Sebuah gudang data mengandungi dati bersepadu, kritikal, sensitif yang boleh dicapai dengan mudah. Atas sebab ini ia harus dilindungi daripada pengguna yang tidak dibenarkan. Satu cara untuk melaksanakan keselamatan adalah dengan menggunakan fungsi del DBMS untuk memberikan keistimewaan yang berbeza kepada jenis pengguna yang berbeza. Dengan cara ini, profil akses mesti dikekalkan untuk setiap jenis pengguna. Satu lagi cara untuk mengamankan gudang data adalah dengan menyulitkannya seperti yang ditulis dalam pangkalan data daripada gudang data. Akses kepada dati dan alat mendapatkan semula mesti menyahsulit dati sebelum membentangkan keputusan kepada pengguna.

2.4.4 Gudang Data Fasa Penyerahan

Ia adalah fasa terakhir dalam kitaran pelaksanaan gudang data. Aktiviti yang akan dijalankan dalam fasa ini termasuklah melatih pengguna menggunakan data warehouse dan menjalankan semakan terhadap data warehouse.

Latihan pengguna

Latihan pengguna perlu dilakukan sebelum mengakses dati daripada gudang data dan penggunaan alat mendapatkan semula. Secara amnya, sesi hendaklah bermula dengan pengenalan kepada konsep storan dati, kandungan gudang data, meta dati dan ciri asas alat. Kemudian, pengguna yang lebih maju juga boleh mengkaji jadual fizikal dan ciri pengguna akses data dan alatan mendapatkan semula.

Terdapat banyak pendekatan untuk melakukan latihan pengguna. Salah satu daripada ini melibatkan pemilihan ramai pengguna atau penganalisis yang dipilih daripada satu set pengguna, berdasarkan kemahiran kepimpinan dan komunikasi mereka. Mereka dilatih secara peribadi tentang semua yang mereka perlu tahu untuk membiasakan diri dengan sistem. Setelah latihan selesai, mereka kembali ke tugas mereka dan mula mengajar pengguna lain cara menggunakan sistem. Pada

Berdasarkan apa yang mereka pelajari, pengguna lain boleh mula meneroka gudang data.
Pendekatan lain ialah melatih ramai pengguna pada masa yang sama, seolah-olah anda sedang mengikuti kursus bilik darjah. Kaedah ini sesuai apabila terdapat ramai pengguna yang perlu dilatih pada masa yang sama. Kaedah lain ialah melatih setiap pengguna secara individu, satu demi satu. Kaedah ini sesuai apabila terdapat sedikit pengguna.

Tujuan latihan pengguna adalah untuk membiasakan anda dengan mengakses dati dan alat mendapatkan semula serta kandungan gudang data. Walau bagaimanapun, sesetengah pengguna mungkin terharu dengan jumlah maklumat yang diberikan semasa sesi latihan. Oleh itu, beberapa sesi penyegaran mesti dijalankan untuk bantuan berterusan dan untuk menjawab soalan tertentu. Dalam sesetengah kes, kumpulan pengguna dibentuk untuk menyediakan jenis sokongan ini.

Mengumpul maklum balas

Setelah gudang data telah dilancarkan, pengguna boleh menggunakan i dati yang berada di dalam gudang data untuk pelbagai tujuan. Kebanyakannya, penganalisis atau pengguna menggunakan i dati dalam gudang data untuk:

  1. 1 Kenal pasti trend syarikat
  2. 2 Menganalisis profil pembelian bagi pelanggan
  3. 3 Bahagi i pelanggan dan daripada
  4. 4 Memberi perkhidmatan yang terbaik kepada pelanggan – menyesuaikan perkhidmatan
  5. 5 Merangka strategi pemasaran
  6. 6 Sediakan sebut harga kompetitif untuk analisis kos dan kawalan bantuan
  7. 7 Menyokong pembuatan keputusan strategik
  8. 8 Kenal pasti peluang untuk menonjol
  9. 9 Meningkatkan kualiti proses perniagaan semasa
  10. 10 Semak keuntungan

Mengikut arahan pembangunan gudang data, satu siri semakan boleh dijalankan kepada sistem untuk mendapatkan maklum balas

kedua-duanya daripada pasukan pembangunan dan daripada komuniti pengguna akhir.
Keputusan yang diperolehi boleh diambil kira untuk kitaran pembangunan seterusnya.

Memandangkan gudang data mempunyai pendekatan tambahan, adalah penting untuk belajar daripada kejayaan dan kesilapan perkembangan sebelumnya.

2.5 Rumusan

Dalam bab ini pendekatan yang terdapat dalam literatur telah dibincangkan. Dalam bahagian 1, konsep gudang data dan peranannya dalam sains keputusan telah dibincangkan. Bahagian 2 menerangkan perbezaan utama antara gudang data dan sistem OLTP. Dalam bahagian 3 kami membincangkan model gudang data Monash yang digunakan dalam bahagian 4 untuk menerangkan aktiviti yang terlibat dalam proses membangunkan gudang data, tesis ini tidak berdasarkan penyelidikan yang teliti. Apa yang berlaku dalam realiti boleh sangat berbeza daripada apa yang dilaporkan oleh literatur, namun keputusan ini boleh digunakan untuk mencipta latar belakang asas yang menggariskan konsep gudang data untuk penyelidikan ini.

Bab 3

Kaedah penyelidikan dan reka bentuk

Bab ini membincangkan kaedah penyelidikan dan reka bentuk untuk kajian ini. Bahagian pertama menunjukkan pandangan umum tentang kaedah penyelidikan yang tersedia untuk mendapatkan maklumat, selain itu kriteria untuk memilih kaedah terbaik untuk kajian tertentu dibincangkan. Dalam bahagian 2, dua kaedah yang dipilih dengan kriteria yang baru didedahkan kemudian dibincangkan; daripada ini, satu akan dipilih dan diterima pakai dengan alasan yang dinyatakan dalam seksyen 3 di mana sebab untuk mengecualikan kriteria lain juga dinyatakan. Bahagian 4 membentangkan reka bentuk penyelidikan dan bahagian 5 kesimpulan.

3.1 Penyelidikan dalam sistem maklumat

Penyelidikan dalam sistem maklumat tidak hanya terhad kepada domain teknologi tetapi juga mesti diperluaskan untuk merangkumi tujuan tingkah laku dan organisasi.
Kami berhutang ini kepada tesis pelbagai disiplin yang terdiri daripada sosial kepada sains semula jadi; ini membawa kepada keperluan spektrum kaedah penyelidikan tertentu yang melibatkan kaedah kuantitatif dan kualitatif untuk digunakan untuk sistem maklumat.
Semua kaedah penyelidikan yang ada adalah penting, malah beberapa penyelidik seperti Jenkins (1985), Nunamaker et al. (1991), dan Galliers (1992) berpendapat bahawa tiada kaedah universal khusus untuk menjalankan penyelidikan dalam pelbagai bidang sistem maklumat; sebenarnya sesuatu kaedah mungkin sesuai untuk sesuatu penyelidikan tetapi tidak untuk yang lain. Ini membawa kepada kami keperluan untuk memilih kaedah yang sesuai untuk projek penyelidikan kami: untuk pilihan ini Benbasat et al. (1987) menyatakan bahawa sifat dan tujuan penyelidikan mesti dipertimbangkan.

3.1.1 Sifat penyelidikan

Pelbagai kaedah berdasarkan sifat penyelidikan boleh diklasifikasikan kepada tiga tradisi yang diketahui secara meluas dalam sains maklumat: penyelidikan positivis, interpretif dan kritikal.

3.1.1.1 Penyelidikan positivistik

Penyelidikan positivis juga dikenali sebagai kajian saintifik atau empirikal. Ia bertujuan untuk: "menjelaskan dan meramalkan apa yang akan berlaku dalam dunia sosial dengan melihat keteraturan dan hubungan sebab-akibat antara unsur-unsur yang membentuknya" (Shanks et al 1993).

Penyelidikan positivis juga dicirikan oleh kebolehulangan, penyederhanaan dan penolakan. Tambahan pula, penyelidikan positivis mengakui wujudnya hubungan priori antara fenomena yang dikaji.
Menurut Galliers (1992) taksonomi ialah kaedah penyelidikan yang termasuk dalam paradigma positivis, yang walau bagaimanapun tidak terhad kepada ini, malah terdapat eksperimen makmal, eksperimen lapangan, kajian kes, demonstrasi teorem, ramalan dan simulasi. Dengan menggunakan kaedah ini, pengkaji mengakui bahawa fenomena yang dikaji boleh diperhatikan secara objektif dan teliti.

3.1.1.2 Penyelidikan interpretatif

Penyelidikan interpretatif, yang sering dipanggil fenomenologi atau anti-positivisme, diterangkan oleh Neuman (1994) sebagai "analisis sistematik tentang makna sosial tindakan melalui pemerhatian langsung dan terperinci tentang orang dalam situasi semula jadi, untuk mencapai pemahaman dan kepada tafsiran bagaimana orang mencipta dan mengekalkan dunia sosial mereka." Kajian tafsiran menolak andaian bahawa fenomena yang diperhatikan boleh diperhatikan secara objektif. Malah ia berdasarkan tafsiran subjektif. Tambahan pula, penyelidik interpretif tidak mengenakan makna priori terhadap fenomena yang mereka kaji.

Kaedah ini merangkumi kajian subjektif/argumentatif, kajian tindakan, kajian deskriptif/interpretatif, kajian masa depan dan main peranan. Sebagai tambahan kepada tinjauan dan kajian kes ini boleh dimasukkan dalam pendekatan ini kerana ia melibatkan kajian individu atau organisasi dalam situasi dunia sebenar yang kompleks.

3.1.1.3 Penyelidikan kritis

Siasatan kritikal ialah pendekatan yang paling kurang diketahui dalam sains sosial tetapi baru-baru ini mendapat perhatian daripada penyelidik sistem maklumat. Andaian falsafah bahawa realiti sosial secara sejarah dihasilkan dan diterbitkan semula oleh manusia, serta sistem sosial dengan tindakan dan interaksi mereka. Keupayaan mereka, bagaimanapun, dimediasi oleh beberapa pertimbangan sosial, budaya dan politik.

Seperti penyelidikan tafsiran, penyelidikan kritikal mengekalkan bahawa penyelidikan positivis tidak ada kaitan dengan konteks sosial dan mengabaikan pengaruhnya terhadap tindakan manusia.
Penyelidikan kritikal, sebaliknya, mengkritik penyelidikan tafsiran kerana terlalu subjektif dan tidak bertujuan untuk membantu orang ramai memperbaiki kehidupan mereka. Perbezaan terbesar antara penyelidikan kritikal dan dua pendekatan lain ialah dimensi penilaiannya. Walaupun objektiviti tradisi positivis dan tafsiran adalah untuk meramal atau menjelaskan status quo atau realiti sosial, penyelidikan kritikal bertujuan untuk menilai secara kritis dan mengubah realiti sosial yang dikaji.

Penyelidik kritikal biasanya menentang status quo untuk menghapuskan perbezaan sosial dan memperbaiki keadaan sosial. Penyelidikan kritikal mempunyai komitmen terhadap pandangan proses tentang fenomena yang menarik dan, oleh itu, biasanya membujur. Contoh kaedah penyelidikan ialah kajian sejarah jangka panjang dan kajian etnografi. Walau bagaimanapun, penyelidikan kritikal belum digunakan secara meluas dalam penyelidikan sistem maklumat

3.1.2 Tujuan penyelidikan

Seiring dengan sifat penyelidikan, tujuannya boleh digunakan untuk membimbing penyelidik dalam memilih kaedah penyelidikan tertentu. Tujuan projek penyelidikan adalah berkait rapat dengan kedudukan penyelidikan berhubung dengan kitaran penyelidikan yang terdiri daripada tiga fasa: pembinaan teori, pengujian teori dan penghalusan teori. Oleh itu, berdasarkan masa kitaran penyelidikan, projek penyelidikan boleh mempunyai tujuan penjelasan, deskriptif, penerokaan atau ramalan.

3.1.2.1 Penyelidikan penerokaan

Penyelidikan penerokaan bertujuan untuk menyiasat topik yang sama sekali baru dan merumuskan soalan dan hipotesis untuk penyelidikan masa depan. Penyelidikan jenis ini digunakan dalam pembinaan teori untuk mendapatkan rujukan awal dalam bidang baru. Lazimnya, kaedah penyelidikan kualitatif digunakan, seperti kajian kes atau kajian fenomenologi.

Walau bagaimanapun, teknik kuantitatif juga boleh digunakan seperti tinjauan penerokaan atau eksperimen.

3.1.3.3 Penyelidikan deskriptif

Penyelidikan deskriptif bertujuan untuk menganalisis dan menerangkan secara terperinci situasi atau amalan organisasi tertentu. Ini sesuai untuk membina teori dan juga boleh digunakan untuk mengesahkan atau mencabar hipotesis. Penyelidikan deskriptif biasanya merangkumi penggunaan ukuran dan sampel. Kaedah penyelidikan yang paling sesuai termasuk tinjauan dan analisis anteseden.

3.1.2.3 Penyelidikan penerangan

Penyelidikan penjelasan cuba menjelaskan mengapa sesuatu berlaku. Ia dibina berdasarkan fakta yang telah dikaji dan cuba mencari sebab fakta ini.
Oleh itu, penyelidikan penerangan biasanya dibina atas penyelidikan penerokaan atau deskriptif dan adalah sampingan kepada teori pengujian dan pemurnian. Penyelidikan penjelasan biasanya menggunakan kajian kes atau kaedah penyelidikan berasaskan tinjauan.

3.1.2.4 Penyelidikan pencegahan

Penyelidikan pencegahan bertujuan untuk meramalkan peristiwa dan tingkah laku di bawah pemerhatian yang sedang dikaji (Marshall dan Rossman 1995). Ramalan adalah ujian saintifik standard kebenaran. Penyelidikan jenis ini biasanya menggunakan tinjauan atau analisis dati ahli sejarah. (Yin 1989)

Perbincangan di atas menunjukkan bahawa terdapat beberapa kaedah penyelidikan yang mungkin boleh digunakan dalam kajian tertentu. Walau bagaimanapun, mesti ada satu kaedah khusus yang lebih sesuai daripada yang lain untuk jenis projek penyelidikan tertentu. (Galliers 1987, Yin 1989, De Vaus 1991). Oleh itu, setiap penyelidik perlu menilai dengan teliti kekuatan dan kelemahan pelbagai kaedah, untuk mengguna pakai kaedah penyelidikan yang paling sesuai dan serasi dengan projek penyelidikan. (Jenkins 1985, Pervan dan Klass 1992, Bonomia 1985, Yin 1989, Himilton dan Ives 1992).

3.2. Kaedah penyelidikan yang mungkin

Objektif projek ini adalah untuk mengkaji pengalaman dalam organisasi Australia dengan i dati disimpan dengan perkembangan gudang data. Data bahawa, pada masa ini, terdapat kekurangan penyelidikan dalam bidang pergudangan data di Australia, projek penyelidikan ini masih dalam fasa teori kitaran penyelidikan dan mempunyai tujuan penerokaan. Meneroka pengalaman dalam organisasi Australia yang mengguna pakai pergudangan data memerlukan tafsiran masyarakat sebenar. Akibatnya, andaian falsafah yang mendasari projek penyelidikan mengikuti tafsiran tradisional.

Selepas pemeriksaan rapi terhadap kaedah yang ada, dua kaedah penyelidikan yang mungkin dikenal pasti: tinjauan dan kajian kes, yang boleh digunakan untuk penyelidikan penerokaan (Shanks et al. 1993). Galliers (1992) berhujah untuk kesesuaian kedua-dua kaedah ini untuk kajian khusus ini dalam taksonomi semakannya dengan mengatakan bahawa ia sesuai untuk pembinaan teori. Dua subseksyen berikut membincangkan setiap kaedah secara terperinci.

3.2.1 Kaedah kajian tinjauan

Kaedah kajian tinjauan berasal daripada kaedah bancian purba. Banci terdiri daripada mengumpul maklumat daripada keseluruhan populasi. Kaedah ini mahal dan tidak praktikal, terutamanya jika populasi ramai. Oleh itu, berbanding dengan banci, tinjauan biasanya tertumpu kepada pengumpulan maklumat untuk sebilangan kecil, atau sampel, wakil populasi (Fowler 1988, Neuman 1994). Sampel mencerminkan populasi dari mana ia diambil, dengan tahap ketepatan yang berbeza, bergantung kepada struktur sampel, saiz, dan kaedah pemilihan yang digunakan (Fowler 1988, Babbie 1982, Neuman 1994).

Kaedah tinjauan ditakrifkan sebagai "gambaran amalan, situasi atau pandangan pada satu masa tertentu, yang dijalankan menggunakan soal selidik atau temu bual, daripada mana kesimpulan boleh dibuat.
dibuat” (Galliers 1992:153) [snapshot amalan, situasi atau pandangan pada masa tertentu, dijalankan menggunakan soal selidik atau temu bual, dari mana inferens boleh dibuat]. Tinjauan berurusan dengan pengumpulan maklumat tentang beberapa aspek kajian, daripada bilangan peserta tertentu, dengan bertanya soalan (Fowler 1988). Soal selidik dan temu bual ini, termasuk temu bual telefon bersemuka dan temu bual berstruktur, juga merupakan teknik pengumpulan dati yang paling biasa digunakan dalam penyiasatan (Blalock 1970, Nachmias dan Nachmias 1976, Fowler 1988), pemerhatian dan analisis boleh digunakan (Gable 1994). Daripada semua kaedah mengumpul ini dati, penggunaan soal selidik adalah teknik yang paling popular, kerana ia memastikan bahawa i dati

yang dikumpul adalah berstruktur dan diformat, dan oleh itu memudahkan pengelasan maklumat (Hwang 1987, de Vaus 1991).

Semasa menganalisis i dati, strategi penyiasatan sering menggunakan teknik kuantitatif, seperti analisis statistik, tetapi teknik kualitatif juga boleh digunakan (Galliers 1992, Pervan

dan Kelas 1992, Gable 1994). Biasanya, i dati yang dikumpul digunakan untuk menganalisis taburan dan corak persatuan (Fowler 1988).

Walaupun tinjauan secara amnya sesuai untuk penyelidikan yang berkaitan dengan soalan 'apa?' (apa) atau terbitan daripadanya, seperti 'berapa banyak' dan 'berapa banyak', mereka boleh ditanya melalui soalan 'mengapa' (Sonquist dan Dunkelberg 1977, Yin 1989). Menurut Sonquist dan Dunkelberg (1977), penyelidikan inkuiri bertujuan untuk mencabar hipotesis, menilai program, menggambarkan populasi, dan membangunkan model tingkah laku manusia. Tambahan pula, tinjauan boleh digunakan untuk mengkaji pendapat populasi tertentu, keadaan, pendapat, ciri, jangkaan dan juga tingkah laku masa lalu atau sekarang (Neuman 1994).

Tinjauan membolehkan penyelidik menemui hubungan di kalangan populasi dan hasilnya biasanya lebih umum daripada kaedah lain (Sonquist dan Dunkelberg 1977, Gable 1994). Tinjauan membolehkan penyelidik meliputi kawasan geografi yang lebih besar dan mencapai ramai responden (Blalock 1970, Sonquist dan Dunkelberg 1977, Hwang dan Lin 1987, Gable 1994, Neuman 1994). Akhir sekali, tinjauan boleh memberikan maklumat yang tidak terdapat di tempat lain atau dalam bentuk yang diperlukan untuk analisis (Fowler 1988).

Walau bagaimanapun, terdapat beberapa batasan dalam menjalankan tinjauan. Kelemahannya ialah pengkaji tidak dapat memperoleh banyak maklumat tentang objek yang dikaji. Ini disebabkan oleh fakta bahawa tinjauan dijalankan hanya pada masa tertentu dan, oleh itu, terdapat bilangan pembolehubah dan orang yang terhad yang penyelidik boleh

kajian (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Satu lagi kelemahan ialah menjalankan tinjauan boleh memakan kos yang tinggi dari segi masa dan sumber, terutamanya jika ia melibatkan temu bual bersemuka (Fowler 1988).

3.2.2. Kaedah Penyelidikan Inkuiri

Kaedah penyelidikan inkuiri melibatkan kajian mendalam tentang situasi tertentu dalam konteks dunia sebenar dalam tempoh masa yang ditetapkan, tanpa sebarang campur tangan di pihak penyelidik (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Terutamanya kaedah ini digunakan untuk menerangkan hubungan antara pembolehubah yang sedang dikaji dalam situasi tertentu (Galliers 1992). Penyiasatan boleh melibatkan satu atau beberapa kes, bergantung kepada fenomena yang dianalisis (Franz dan Robey 1987, Eisenhardt 1989, Yin 1989).

Kaedah penyelidikan inkuiri ditakrifkan sebagai "inkuiri empirikal yang mengkaji fenomena kontemporari dalam konteks sebenar, menggunakan pelbagai sumber yang dikumpul daripada satu atau lebih entiti seperti orang, kumpulan, atau organisasi" (Yin 1989). Tiada pemisahan yang jelas antara fenomena dan konteksnya dan tiada kawalan eksperimen atau manipulasi pembolehubah (Yin 1989, Benbasat et al. 1987).

Terdapat pelbagai teknik untuk mengumpul dati yang boleh digunakan dalam kaedah inkuiri, yang termasuk pemerhatian langsung, semakan rekod arkib, soal selidik, semakan dokumentasi dan temu bual berstruktur. Mempunyai pelbagai teknik penuaian dati, penyiasatan membolehkan penyelidik menangani kedua-duanya dati kualitatif dan kuantitatif pada masa yang sama (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Seperti yang berlaku dengan kaedah tinjauan, penyelidik tinjauan berfungsi sebagai pemerhati atau penyelidik dan bukan sebagai peserta aktif dalam organisasi yang dikaji.

Benbasat et al.(1987) menegaskan bahawa kaedah inkuiri amat sesuai untuk membina teori penyelidikan, yang bermula dengan persoalan kajian dan diteruskan dengan pendidikan.

sesuatu teori semasa proses mengumpul dati. Menjadi juga sesuai untuk pentas

pembinaan teori, Franz dan Robey (1987) mencadangkan kaedah inkuiri juga boleh digunakan untuk fasa teori kompleks. Dalam kes ini, berdasarkan bukti yang dikumpul, teori atau hipotesis yang diberikan disahkan atau disangkal. Selain itu, tinjauan juga sesuai untuk penyelidikan yang berkaitan dengan soalan 'bagaimana' atau 'mengapa' (Yin 1989).

Berbanding dengan kaedah lain, tinjauan membolehkan penyelidik menangkap maklumat penting dengan lebih terperinci (Galliers 1992, Shanks et al. 1993). Tambahan pula, tinjauan membolehkan penyelidik memahami sifat dan kerumitan proses yang dikaji (Benbasat et al. 1987).

Terdapat empat kelemahan utama yang berkaitan dengan kaedah tinjauan. Yang pertama ialah kekurangan potongan terkawal. Subjektiviti pengkaji boleh mengubah keputusan dan kesimpulan kajian (Yin 1989). Kelemahan kedua ialah kurangnya pemerhatian terkawal. Tidak seperti kaedah eksperimen, penyelidik inkuiri tidak dapat mengawal fenomena yang dikaji kerana ia diperiksa dalam konteks semula jadinya (Gable 1994). Kelemahan ketiga ialah kekurangan kebolehulangan. Ini kerana penyelidik tidak mungkin memerhatikan peristiwa yang sama, dan tidak dapat mengesahkan keputusan kajian tertentu (Lee 1989). Akhir sekali, akibat daripada kebolehulangan, adalah sukar untuk menyamaratakan keputusan yang diperoleh daripada satu atau lebih penyiasatan (Galliers 1992, Shanks et al 1993). Kesemua masalah ini, bagaimanapun, tidak boleh diatasi dan sebenarnya, boleh diminimumkan oleh penyelidik dengan menggunakan tindakan yang sewajarnya (Lee 1989).

3.3. Mewajarkan metodologi penyelidikan diterima pakai

Daripada dua kaedah kajian yang mungkin untuk kajian ini, kaedah tinjauan dianggap paling sesuai. Siasatan itu dibuang berikutan pertimbangan yang teliti terhadap yang berkaitan

kebaikan dan kelemahan. Kesesuaian atau ketidaksesuaian setiap kaedah untuk kajian ini dibincangkan di bawah.

3.3.1. Ketidaksesuaian kaedah penyelidikan penyiasatan

Kaedah inkuiri memerlukan kajian mendalam tentang situasi tertentu dalam satu atau lebih organisasi dalam satu tempoh masa (Eisenhardt 1989). Dalam kes ini, tempoh mungkin melebihi jangka masa yang diberikan untuk kajian ini. Satu lagi sebab untuk tidak menggunakan kaedah tinjauan ialah keputusan mungkin mengalami kekurangan ketelitian (Yin 1989). Subjektiviti pengkaji boleh mempengaruhi keputusan dan kesimpulan. Alasan lain ialah kaedah ini lebih sesuai untuk kajian tentang soalan jenis 'bagaimana' atau 'mengapa' (Yin 1989), manakala persoalan kajian bagi kajian ini adalah jenis 'apa'. Akhir sekali, adalah sukar untuk membuat generalisasi penemuan daripada hanya satu atau beberapa penyiasatan (Galliers 1992, Shanks et al. 1993). Berdasarkan rasional ini, kaedah kajian tinjauan tidak dipilih kerana tidak sesuai untuk kajian ini.

3.3.2. Kemudahan kaedah carian bagi penyiasatan

Semasa penyelidikan ini dijalankan, amalan pergudangan data belum diterima pakai secara meluas oleh organisasi Australia. Jadi, tidak banyak maklumat mengenai pelaksanaannya dalam organisasi Australia. Maklumat yang ada datang daripada organisasi yang telah melaksanakan atau menggunakan a gudang data. Dalam kes ini, kaedah kajian tinjauan adalah yang paling sesuai kerana ia membolehkan mendapatkan maklumat yang tidak terdapat di tempat lain atau dalam bentuk yang diperlukan untuk analisis (Fowler 1988). Di samping itu, kaedah kajian tinjauan membolehkan penyelidik mendapat gambaran yang baik tentang amalan, situasi, atau pandangan pada masa tertentu (Galliers 1992, Denscombe 1998). Gambaran keseluruhan diperlukan untuk meningkatkan pengetahuan tentang pengalaman pergudangan data Australia.

Tambahan pula, Sonquist dan Dunkelberg (1977) menyatakan bahawa hasil kajian tinjauan adalah lebih umum berbanding kaedah lain.

3.4. Reka Bentuk Kajian Tinjauan

Tinjauan mengenai amalan pergudangan data telah dijalankan pada tahun 1999. Populasi sasaran dibentuk oleh organisasi Australia yang berminat dalam kajian pergudangan data, kerana mereka mungkin sudah dimaklumkan tentang dati yang mereka simpan dan, oleh itu, boleh memberikan maklumat yang berguna untuk kajian ini. Populasi sasaran dikenal pasti melalui tinjauan awal semua ahli Australia The Data Warehousing Institute (Tdwi-aap). Bahagian ini membincangkan reka bentuk fasa kajian empirikal kajian ini.

3.4.1. Teknik penuaian dati

Daripada tiga teknik yang biasa digunakan dalam kajian tinjauan (iaitu soal selidik mel, temu bual telefon dan temu bual peribadi) (Nachmias 1976, Fowler 1988, de Vaus 1991), soal selidik mel telah diterima pakai untuk kajian ini. Sebab pertama untuk mengguna pakai yang kedua ialah ia boleh mencapai populasi yang tersebar secara geografi (Blalock 1970, Nachmias dan Nachmias 1976, Hwang dan Lin 1987, de Vaus 1991, Gable 1994). Kedua, soal selidik mel adalah sesuai untuk peserta yang berpendidikan tinggi (Fowler 1988). Soal selidik mel untuk kajian ini ditujukan kepada penaja projek pergudangan data, pengarah dan/atau pengurus projek. Ketiga, soal selidik mel adalah sesuai apabila senarai mel selamat tersedia (Salant dan Dilman 1994). TDWI, dalam kes ini, persatuan pergudangan data yang dipercayai telah menyediakan senarai mel ahli Australianya. Satu lagi kelebihan soal selidik mel berbanding soal selidik telefon atau temu bual peribadi ialah ia membolehkan responden menjawab dengan lebih tepat, terutamanya apabila responden mesti merujuk nota atau membincangkan soalan dengan orang lain (Fowler 1988).

Kelemahan yang berpotensi mungkin adalah masa yang diperlukan untuk menjalankan soal selidik melalui pos. Biasanya, tinjauan mel dijalankan dalam urutan ini: surat mel, tunggu maklum balas, dan hantar pengesahan (Fowler 1988, Bainbridge 1989). Oleh itu, jumlah masa mungkin lebih lama daripada masa yang diperlukan untuk temu duga peribadi atau temu duga telefon. Bagaimanapun, jumlah masa boleh diketahui lebih awal (Fowler 1988, Denscombe 1998). Masa yang digunakan untuk menjalankan temu bual peribadi tidak dapat diketahui lebih awal kerana ia berbeza dari satu temu bual dengan yang lain (Fowler 1988). Temu bual telefon boleh menjadi lebih cepat daripada soal selidik pos dan temu bual peribadi tetapi boleh mempunyai kadar tidak menjawab yang tinggi kerana ketiadaan sesetengah orang (Fowler 1988). Selain itu, temu bual telefon secara amnya terhad kepada senarai soalan yang agak pendek (Bainbridge 1989).

Satu lagi kelemahan soal selidik mel ialah kadar tidak menjawab yang tinggi (Fowler 1988, Bainbridge 1989, Neuman 1994). Walau bagaimanapun, langkah balas telah diambil dengan mengaitkan kajian ini dengan institusi pergudangan data yang dipercayai (iaitu TDWI) (Bainbridge 1989, Neuman 1994), yang menghantar dua surat peringatan kepada bukan responden (Fowler 1988, Neuman 1994) dan juga termasuk surat tambahan menjelaskan tujuan kajian (Neuman 1994).

3.4.2. Unit analisis

Tujuan kajian ini adalah untuk mendapatkan maklumat tentang pelaksanaan pergudangan data dan penggunaannya dalam organisasi Australia. Populasi sasaran terdiri daripada semua organisasi Australia yang telah melaksanakan, atau sedang melaksanakan, i gudang data. Organisasi individu kemudiannya didaftarkan dalam nama. Soal selidik telah dihantar melalui pos kepada organisasi yang berminat untuk menerima pakai gudang data. Kaedah ini memastikan maklumat yang dikumpul datang daripada sumber yang paling sesuai bagi setiap organisasi yang mengambil bahagian.

3.4.3. Sampel tinjauan

"senarai mel" peserta tinjauan diperoleh daripada TDWI. Daripada senarai ini, 3000 organisasi Australia telah dipilih sebagai asas untuk pensampelan. Surat tambahan yang menerangkan projek dan tujuan tinjauan, bersama-sama dengan helaian jawapan dan sampul surat prabayar untuk memulangkan soal selidik yang lengkap telah dihantar kepada sampel. Daripada 3000 organisasi, 198 bersetuju untuk mengambil bahagian dalam kajian itu. Sebilangan kecil jawapan telah dijangkakan dato sejumlah besar organisasi Australia yang kemudiannya menerima atau menerima strategi penyimpanan data dalam organisasi mereka. Oleh itu, populasi sasaran untuk kajian ini hanya terdiri daripada 198 organisasi.

3.4.4. Kandungan soal selidik

Struktur soal selidik adalah berdasarkan model pergudangan data Monash (dibincangkan sebelum ini dalam bahagian 2.3). Kandungan soal selidik adalah berdasarkan analisis literatur yang dibentangkan dalam bab 2. Salinan soal selidik yang dihantar kepada peserta tinjauan boleh didapati di Lampiran B. Soal selidik terdiri daripada enam bahagian, yang mengikut fasa model yang diliputi . Enam perenggan berikut secara ringkas meringkaskan kandungan setiap bahagian.

Bahagian A: Maklumat asas tentang organisasi
Bahagian ini mengandungi soalan yang berkaitan dengan profil organisasi yang mengambil bahagian. Selain itu, beberapa soalan adalah berkaitan dengan status projek pergudangan data peserta. Maklumat sulit seperti nama organisasi tidak didedahkan dalam analisis tinjauan.

Bahagian B: Permulaan
Soalan dalam bahagian ini adalah berkaitan dengan tugas memulakan pergudangan data. Soalan ditanya mengenai pemula projek, penjamin, kemahiran dan pengetahuan yang diperlukan, objektif pembangunan pergudangan data dan jangkaan pengguna akhir.

Bahagian C: Reka Bentuk
Bahagian ini mengandungi soalan berkaitan aktiviti perancangan gudang data. Secara khususnya, soalan adalah mengenai skop pelaksanaan, tempoh projek, kos projek dan analisis kos/faedah.

Bahagian D: Pembangunan
Dalam bahagian pembangunan terdapat soalan yang berkaitan dengan aktiviti pembangunan gudang data: koleksi keperluan pengguna akhir, sumber dati, model logik bagi dati, prototaip, perancangan kapasiti, seni bina teknikal dan pemilihan alat pembangunan pergudangan data.

Bahagian E: Operasi
Soalan operasi berkaitan operasi dan kebolehlanjutan gudang data, bagaimana ia berkembang dalam fasa pembangunan seterusnya. di sana kualiti data, strategi penyegaran semula dati, kebutiran daripada dati, kebolehskalaan bagi gudang data dan isu keselamatan gudang data adalah antara jenis soalan yang ditanya.

Bahagian F: Pembangunan
Bahagian ini mengandungi soalan yang berkaitan dengan menggunakan gudang data oleh pengguna akhir. Pengkaji tertarik dengan tujuan dan kegunaannya gudang data, kajian semula dan strategi latihan yang diguna pakai dan strategi kawalan bagi gudang data diterima pakai.

3.4.5. Kadar tindakbalas

Walaupun tinjauan mel dikritik kerana mempunyai kadar tindak balas yang rendah, langkah telah diambil untuk meningkatkan kadar pulangan (seperti yang dibincangkan sebelum ini dalam bahagian 3.4.1). Istilah 'kadar tindak balas' merujuk kepada peratusan orang dalam sampel tinjauan tertentu yang menjawab soal selidik (Denscombe 1998). Formula berikut digunakan untuk mengira kadar tindak balas bagi kajian ini:

Bilangan orang yang menjawab
Kadar tindak balas = ——————————————————————————— X 100 Jumlah bilangan soal selidik yang dihantar

3.4.6. Ujian Juruterbang

Sebelum soal selidik dihantar kepada sampel, soalan telah diperiksa dengan menjalankan ujian rintis, seperti yang dicadangkan oleh Luck dan Rubin (1987), Jackson (1988) dan de Vaus (1991). Tujuan ujian rintis adalah untuk mendedahkan sebarang ungkapan janggal, samar-samar dan soalan yang sukar untuk ditafsir, untuk menjelaskan sebarang definisi dan istilah yang digunakan dan untuk mengenal pasti anggaran masa yang diperlukan untuk melengkapkan soal selidik (Warwick dan Lininger 1975, Jackson 1988, Salant dan Dilman 1994). Ujian rintis dijalankan dengan memilih subjek yang mempunyai ciri-ciri yang serupa dengan subjek akhir, seperti yang dicadangkan oleh Davis e Cosenza (1993). Dalam kajian ini, enam profesional pergudangan data telah dipilih sebagai subjek perintis. Selepas setiap ujian rintis, pembetulan yang diperlukan telah dibuat. Daripada ujian rintis yang dijalankan, para peserta menyumbang untuk membentuk semula dan menetapkan semula versi akhir soal selidik.

3.4.7. Kaedah Analisis Oleh Dati

I dati tinjauan yang dikumpul daripada soal selidik tertutup telah dianalisis menggunakan pakej program statistik yang dipanggil SPSS. Banyak jawapan telah dianalisis menggunakan statistik deskriptif. Beberapa soal selidik dikembalikan tidak lengkap. Ini telah dirawat dengan lebih berhati-hati untuk memastikan bahawa i dati hilang bukan akibat daripada ralat kemasukan data, tetapi kerana soalan itu tidak sesuai untuk pendaftar, atau pendaftar memutuskan untuk tidak menjawab satu atau lebih soalan khusus. Jawapan yang hilang ini diabaikan semasa analisis dati dan telah dikodkan sebagai '- 9' untuk memastikan pengecualian mereka daripada proses analisis.

Semasa menyediakan soal selidik, soalan tertutup telah diprakodkan dengan memberikan nombor kepada setiap pilihan. Nombor itu kemudiannya digunakan untuk menyediakan dati semasa analisis (Denscombe 1998, Sapsford dan Jupp 1996). Sebagai contoh, terdapat enam pilihan yang disenaraikan dalam soalan 1 bahagian B: lembaga pengarah, eksekutif kanan, jabatan IT, unit perniagaan, perunding dan lain-lain. Dalam fail daripada dati daripada SPSS, pembolehubah telah dijana untuk menunjukkan 'pemula projek', dengan enam label nilai: '1' untuk 'lembaga pengarah', '2' untuk 'eksekutif kanan' dan seterusnya. Street. Penggunaan skala Likertin dalam beberapa soalan tertutup juga membenarkan pengenalan yang mudah memandangkan penggunaan nilai berangka yang sepadan yang dimasukkan ke dalam SPSS. Untuk soalan dengan jawapan yang tidak lengkap, yang tidak saling eksklusif, setiap pilihan dianggap sebagai pembolehubah tunggal dengan dua label nilai: '1' untuk 'ditanda' dan '2' untuk 'tidak ditanda'.

Soalan terbuka dilayan secara berbeza daripada soalan tertutup. Jawapan kepada soalan-soalan ini tidak dimasukkan ke dalam SPSS. Sebaliknya, mereka dianalisis dengan tangan. Penggunaan soalan jenis ini membolehkan kita memperoleh maklumat tentang idea dan pengalaman peribadi responden secara bebas (Bainbridge 1989, Denscombe 1998). Jika boleh, pengkategorian respons telah dibuat.

Untuk analisis dati, kaedah analisis statistik mudah digunakan, seperti kekerapan tindak balas, min, sisihan piawai dan median (Argyrous 1996, Denscombe 1998).
Ujian Gamma menunjukkan prestasi yang baik untuk mendapatkan ukuran kuantitatif perkaitan antara dati ordinal (Norusis 1983, Argyrous 1996). Ujian ini sesuai kerana skala ordinal yang digunakan tidak mempunyai banyak kategori dan boleh ditunjukkan dalam jadual (Norusis 1983).

3.5 Rumusan

Dalam bab ini, metodologi dan reka bentuk kajian yang digunakan untuk kajian ini telah dibincangkan.

Memilih kaedah penyelidikan yang paling sesuai untuk kajian tertentu mengambil kira
pertimbangan beberapa peraturan, termasuk sifat dan jenis penyelidikan, serta merit dan kelemahan setiap kaedah yang mungkin (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, yin 1989, Hamilton and ives 1992, Galliers 1992, Neuman 1994). Memandangkan kekurangan pengetahuan dan teori sedia ada mengenai penggunaan pergudangan data di Australia, kajian penyelidikan ini memerlukan kaedah penyelidikan interpretif dengan keupayaan penerokaan untuk meneroka pengalaman organisasi Australia. Kaedah penyelidikan yang dipilih telah dipilih untuk mengumpul maklumat mengenai penggunaan konsep pergudangan data oleh organisasi Australia. Soal selidik pos telah dipilih sebagai teknik pengumpulan dati. Justifikasi kaedah penyelidikan dan teknik pengumpulan dati yang dipilih akan disediakan dalam bab ini. Seterusnya perbincangan telah dikemukakan mengenai unit analisis, sampel yang digunakan, peratusan jawapan, kandungan soal selidik, ujian pra soal selidik dan kaedah analisis dati.

Merancang a Gudang Data:

Menggabungkan Perhubungan Entiti dan Pemodelan Dimensi

ABSTRAK
Menyimpan i dati merupakan isu semasa utama bagi banyak organisasi. Isu utama dalam pembangunan storan komputer dati itu rekaan dia.
Reka bentuk mesti menyokong pengesanan konsep dalam gudang data kepada sistem warisan dan sumber lain dati dan juga pemahaman dan kecekapan yang mudah dalam pelaksanaan gudang data.
Kebanyakan kesusasteraan penyimpanan dati mengesyorkan penggunaan pemodelan hubungan entiti atau pemodelan dimensi untuk mewakili reka bentuk gudang data.
Dalam kertas ini kami menunjukkan bagaimana kedua-dua perwakilan boleh digabungkan dalam satu pendekatan untuk melukis gudang data. Pendekatan yang digunakan adalah sistematik

diperiksa dalam kajian kes dan dikenal pasti dalam beberapa implikasi penting dengan pengamal.

PERGUDANGAN DATA

Un gudang data ia biasanya ditakrifkan sebagai "kumpulan data berorientasikan subjek, bersepadu, varian masa, dan tidak meruap untuk menyokong keputusan pengurusan" (Inmon dan Hackathorn, 1994). Berorientasikan subjek dan bersepadu menunjukkan bahawa gudang data direka bentuk untuk merentasi sempadan fungsi sistem Legaci untuk menawarkan perspektif bersepadu dati.
Varian masa mempengaruhi sifat sejarah atau siri masa dati dalam gudang data, yang membolehkan trend dianalisis. Tidak meruap menunjukkan bahawa gudang data ia tidak dikemas kini secara berterusan seperti a pangkalan data daripada OLTP. Sebaliknya ia dikemas kini secara berkala, dengan dati datang dari sumber dalaman dan luaran. The gudang data ia direka khusus untuk carian dan bukannya mengemas kini integriti dan prestasi operasi.
Idea menyimpan i dati bukan baru, ia adalah salah satu tujuan pengurusan dati sejak tahun enam puluhan (The Martin, 1982).
I gudang data mereka menawarkan infrastruktur dati untuk sistem sokongan pengurusan. Sistem sokongan pengurusan termasuk sistem sokongan keputusan (DSS) dan sistem maklumat eksekutif (EIS). DSS ialah sistem maklumat berasaskan komputer yang direka untuk menambah baik pembuatan keputusan manusia. EIS biasanya merupakan sistem penyampaian dati yang membolehkan pemimpin perniagaan mengakses pandangan dengan mudah dati.
Seni bina umum a gudang data menonjolkan peranan gudang data dalam sokongan pengurusan. Serta menawarkan infrastruktur dati untuk EIS dan DSS, al gudang data ia boleh diakses terus melalui pertanyaan. THE dati termasuk dalam a gudang data adalah berdasarkan analisis keperluan maklumat pengurusan dan diperoleh daripada tiga sumber: sistem warisan dalaman, sistem penangkapan data tujuan khas dan sumber data luaran. THE dati dalam sistem warisan dalaman, ia sering berlebihan, tidak konsisten, berkualiti rendah dan disimpan dalam format yang berbeza supaya ia mesti diselaraskan dan dibersihkan sebelum ia boleh dimuatkan ke dalam

gudang data (Inmon, 1992; McFadden, 1996). THE dati datang daripada sistem storan dati ad hoc dan daripada sumber dati luaran selalunya digunakan untuk menambah (kemas kini, menggantikan) i dati daripada sistem warisan.

Terdapat banyak sebab yang menarik untuk membangunkan a gudang data, yang termasuk membuat keputusan yang lebih baik melalui penggunaan lebih banyak maklumat secara berkesan (Ives 1995), sokongan untuk fokus pada keseluruhan urus niaga (Graham 1996), dan pengurangan dalam dati untuk EIS dan DSS (Graham 1996, McFadden 1996).

Kajian empirikal baru-baru ini mendapati, secara purata, pulangan pelaburan untuk gudang data sebanyak 401% selepas tiga tahun (Graham, 1996). Walau bagaimanapun, kajian empirikal yang lain mengenai gudang data menemui masalah yang ketara termasuk kesukaran dalam mengukur dan memberikan faedah, kekurangan tujuan yang jelas, memandang rendah tujuan dan kerumitan proses menyimpan faedah dati, khususnya mengenai sumber dan kebersihan dati. Menyimpan i dati boleh dianggap sebagai penyelesaian kepada masalah pengurusan dati antara organisasi. Manipulasi dati sebagai sumber sosial ia kekal sebagai salah satu masalah utama dalam mengurus sistem maklumat di seluruh dunia selama bertahun-tahun (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Pendekatan popular untuk mengurus dati pada tahun lapan puluhan ia adalah pembangunan model dati sosial. Model dati sosial direka bentuk untuk menawarkan asas yang stabil untuk pembangunan sistem aplikasi baharu dan pangkalan data dan pembinaan semula dan penyepaduan sistem warisan (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kim dan Everest 1994). Walau bagaimanapun, terdapat banyak masalah dengan pendekatan ini, khususnya, kerumitan dan kos setiap tugas, dan masa yang lama yang diperlukan untuk menghasilkan hasil yang ketara (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il gudang data ia adalah pangkalan data berasingan yang wujud bersama pangkalan data lama dan bukannya menggantikannya. Oleh itu, ia membolehkan anda mengarahkan pengurusan dati dan mengelakkan pembinaan semula sistem warisan yang mahal.

PENDEKATAN SEDIA ADA UNTUK REKA BENTUK DATA

WAREHOUSE

Proses membina dan menyempurnakan a gudang data ia harus lebih difahami sebagai proses evolusi dan bukannya kitaran hayat pembangunan sistem tradisional (Keinginan, 1995, Shanks, O'Donnell dan Arnott 1997a). Terdapat banyak proses yang terlibat dalam sesuatu projek gudang data seperti permulaan, perancangan; maklumat yang diperoleh daripada keperluan yang diminta pengurus syarikat; sumber, transformasi, pembersihan dati dan penyegerakan daripada sistem warisan dan sumber lain dati; sistem penyampaian dalam pembangunan; pemantauan terhadap gudang data; dan ketidakpekaan proses evolusi dan pembinaan a gudang data (Stinchi, O'Donnell dan Arnott 1997b). Dalam jurnal ini, kami memberi tumpuan kepada cara melukis dati disimpan dalam konteks proses lain ini. Terdapat beberapa pendekatan yang dicadangkan untuk seni bina gudang data dalam kesusasteraan (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Setiap metodologi ini mempunyai ulasan ringkas dengan analisis kekuatan dan kelemahannya.

Pendekatan Inmon (1994) untuk Gudang Data reka bentuk

Inmon (1994) mencadangkan empat langkah berulang untuk mereka bentuk a gudang data (lihat Rajah 2). Langkah pertama ialah mereka bentuk templat dati sosial untuk memahami bagaimana i dati mereka boleh disepadukan merentasi kawasan berfungsi dalam organisasi dengan memisahkan dati menyimpan di kawasan. Model dati ia dibuat untuk penyimpanan dati berkaitan dengan membuat keputusan, termasuk dati ahli sejarah, dan termasuk dati ditolak dan diagregatkan. Langkah kedua ialah mengenal pasti bidang subjek untuk dilaksanakan. Ini adalah berdasarkan keutamaan yang ditentukan oleh organisasi tertentu. Langkah ketiga melibatkan lukisan a pangkalan data untuk kawasan subjek, beri perhatian khusus untuk memasukkan tahap butiran yang sesuai. Inmon mengesyorkan menggunakan model entiti dan perhubungan. Langkah keempat ialah mengenal pasti sistem sumber dati diperlukan dan membangunkan proses transformasi untuk menangkap, membersihkan dan memformat i dati.

Kekuatan pendekatan Inmon ialah model dati sosial menyediakan asas untuk penyepaduan dati dalam organisasi dan perancangan sokongan untuk pembangunan berulang gudang data. Kelemahannya ialah kesukaran dan kos dalam mereka bentuk model dati sosial, kesukaran memahami model entiti dan hubungan yang digunakan dalam kedua-dua model, itu dati sosial dan daripada dati disimpan mengikut kawasan subjek, dan kesesuaian dati daripada lukisan gudang data untuk merealisasikan pangkalan data hubungan tetapi bukan untuk pangkalan data pelbagai dimensi.

Ives' (1995) Pendekatan kepada Gudang Data reka bentuk

Ives (1995) mencadangkan pendekatan empat langkah untuk mereka bentuk sistem maklumat yang dia percaya boleh digunakan untuk reka bentuk gudang data (lihat Rajah 3). Pendekatan ini sangat berasaskan Kejuruteraan Maklumat untuk pembangunan sistem maklumat (Martin 1990). Langkah pertama ialah menentukan objektif, faktor kritikal dan kejayaan serta petunjuk prestasi utama. Proses perniagaan utama dan maklumat yang diperlukan dimodelkan untuk membawa kita kepada model dati sosial. Langkah kedua melibatkan pembangunan seni bina yang menentukan dati disimpan mengikut kawasan, pangkalan data di gudang data, komponen teknologi yang diperlukan, set sokongan organisasi yang diperlukan untuk melaksanakan dan beroperasi dengan gudang data. Langkah ketiga termasuk memilih pakej perisian dan alatan yang diperlukan. Langkah keempat ialah reka bentuk dan pembinaan terperinci gudang data. Ives mencatatkan bahawa menyimpan dati ia adalah proses berulang yang terhad.

Kekuatan pendekatan Ives ialah penggunaan teknik khusus untuk menentukan keperluan maklumat, penggunaan proses berstruktur untuk menyokong integrasi gudang data, pemilihan perkakasan dan perisian yang sesuai, dan penggunaan teknik perwakilan berbilang untuk gudang data. Kelemahannya adalah wujud dalam kerumitan. Lain-lain termasuk kesukaran membangunkan banyak peringkat pangkalan data Di antara gudang data dalam masa dan kos yang munasabah.

Pendekatan Kimball (1994) untuk Gudang Data reka bentuk

Kimball (1994) mencadangkan lima langkah berulang untuk mereka bentuk a gudang data (lihat Rajah 4). Pendekatannya didedikasikan terutamanya pada reka bentuk solo gudang data dan mengenai penggunaan model dimensi sebagai keutamaan kepada model entiti dan perhubungan. Kimball menganalisis model dimensi tersebut kerana lebih mudah bagi pemimpin perniagaan untuk memahami perniagaan, ia lebih cekap apabila berurusan dengan perundingan yang kompleks, dan reka bentuk pangkalan data fizikal adalah lebih cekap (Kimball 1994). Kimball mengiktiraf bahawa pembangunan a gudang data ia adalah berulang, dan itu gudang data jadual berasingan boleh disepadukan dengan membahagikannya kepada jadual dimensi sepunya.

Langkah pertama ialah mengenal pasti bidang subjek tertentu yang akan disempurnakan. Langkah kedua dan ketiga berkenaan dengan pemodelan dimensi. Dalam langkah kedua, langkah-langkah mengenal pasti perkara yang menarik dalam bidang subjek dan dikumpulkan ke dalam jadual fakta. Sebagai contoh, dalam bidang subjek jualan, ukuran minat mungkin termasuk jumlah item yang dijual dan dolar sebagai mata wang jualan. Langkah ketiga melibatkan mengenal pasti dimensi yang merupakan cara fakta boleh dikumpulkan. Dalam bidang subjek jualan, dimensi yang berkaitan mungkin termasuk item, lokasi dan tempoh masa. Jadual fakta mempunyai kunci berbilang bahagian untuk memautkannya ke setiap jadual dimensi dan biasanya mengandungi bilangan fakta yang sangat besar. Sebaliknya, jadual dimensi mengandungi maklumat deskriptif tentang dimensi dan atribut lain yang boleh digunakan untuk mengumpulkan fakta. Jadual fakta dan dimensi yang dicadangkan berkaitan membentuk apa yang dipanggil skema bintang kerana bentuknya. Langkah keempat melibatkan membina a pangkalan data multidimensi untuk menyempurnakan corak bintang. Langkah terakhir ialah mengenal pasti sistem sumber dati diperlukan dan membangunkan proses transformasi untuk menangkap, membersihkan dan memformat i dati.

Kekuatan pendekatan Kimball termasuk penggunaan model dimensi untuk mewakili dati disimpan yang menjadikannya mudah difahami dan membawa kepada reka bentuk fizikal yang cekap. Model dimensi yang juga mudah menggunakan kedua-dua sistem pangkalan data hubungan boleh disempurnakan atau sistem pangkalan data pelbagai dimensi. Kelemahannya termasuk kekurangan beberapa teknik untuk memudahkan perancangan atau penyepaduan banyak corak bintang dalam a gudang data dan kesukaran mereka bentuk daripada struktur denormalisasi yang melampau kepada model dimensi a dati dalam sistem warisan.

Pendekatan kepada Data McFadden (1996). Reka Bentuk Gudang

McFadden (1996) mencadangkan pendekatan lima langkah untuk mereka bentuk a gudang data (lihat Rajah 5).
Pendekatannya adalah berdasarkan sintesis idea daripada kesusasteraan dan tertumpu pada reka bentuk tunggal gudang data. Langkah pertama melibatkan analisis keperluan. Walaupun spesifikasi teknikal tidak ditetapkan, nota McFadden mengenal pasti entiti tersebut dati spesifikasi dan atribut mereka, dan merujuk kepada pembaca Watson dan Frolick (1993) untuk menangkap keperluan.
Dalam langkah kedua, model perhubungan entiti direka untuk gudang data dan kemudian disahkan oleh pemimpin perniagaan. Langkah ketiga termasuk menentukan pemetaan daripada sistem warisan dan sumber luaran gudang data. Langkah keempat melibatkan proses dalam pembangunan, penggunaan dan penyegerakan dati dalam gudang data. Pada langkah terakhir, penyampaian sistem dibangunkan dengan penekanan khusus pada antara muka pengguna. McFadden menyatakan bahawa proses lukisan biasanya berulang.

Kekuatan pendekatan McFadden menunjukkan penyertaan pemimpin perniagaan dalam menentukan keperluan dan juga kepentingan sumber. dati, pembersihan dan pengumpulan mereka. Kelemahannya termasuk kekurangan proses untuk memecahkan projek besar gudang data dalam banyak peringkat bersepadu, dan

kesukaran memahami entiti dan model perhubungan yang digunakan dalam reka bentuk gudang data.

Bukan hanya mereka yang dekat dengan kita yang memilih kita.

    0/5 (0 Ulasan)
    0/5 (0 Ulasan)
    0/5 (0 Ulasan)

    Ketahui lebih lanjut daripada Agensi Web Dalam Talian

    Langgan untuk menerima artikel terkini melalui e-mel.

    avatar pengarang
    admin CEO
    👍Agensi Web Dalam Talian | Pakar Agensi Web dalam Pemasaran Digital dan SEO. Agensi Web Dalam Talian ialah Agensi Web. Untuk Agenzia Web Online kejayaan dalam transformasi digital adalah berdasarkan asas Iron SEO versi 3. Kepakaran: Integrasi Sistem, Integrasi Aplikasi Perusahaan, Seni Bina Berorientasikan Perkhidmatan, Pengkomputeran Awan, Gudang data, risikan perniagaan, Data Besar, portal, intranet, Aplikasi Web Reka bentuk dan pengurusan pangkalan data hubungan dan multidimensi Mereka bentuk antara muka untuk media digital: kebolehgunaan dan Grafik. Agensi Web Dalam Talian menawarkan syarikat perkhidmatan berikut: -SEO di Google, Amazon, Bing, Yandex; -Analitis Web: Analitis Google, Pengurus Google Tag, Yandex Metrica; -Penukaran pengguna: Google Analitis, Microsoft Clarity, Yandex Metrica; -SEM di Google, Bing, Iklan Amazon; -Pemasaran Media Sosial (Facebook, Linkedin, Youtube, Instagram).
    Privasi Tangkas Saya
    Tapak ini menggunakan kuki teknikal dan profil. Dengan mengklik terima anda membenarkan semua kuki pemprofilan. Dengan mengklik pada tolak atau X, semua kuki pemprofilan ditolak. Dengan mengklik pada suaikan, anda boleh memilih kuki pemprofilan yang ingin diaktifkan.
    Tapak ini mematuhi Akta Perlindungan Data (LPD), Undang-undang Persekutuan Switzerland pada 25 September 2020 dan GDPR, Peraturan EU 2016/679, yang berkaitan dengan perlindungan data peribadi serta pergerakan bebas data tersebut.