fbpx

Pergudangan Data dan ERP | ARKIB DATA PUSAT: SEJARAH DAN EVOLUSI

ARKIB DATA PUSAT: SEJARAH DAN EVOLUSI


Dua tema dominan teknologi korporat pada tahun 90-an ialah
menyatakan i gudang data dan ERP. Untuk masa yang lama kedua-dua berkuasa
semasa telah menjadi sebahagian daripada IT korporat tanpa pernah
persimpangan. Ia hampir seolah-olah ia jirim dan anti jirim. Tetapi
pertumbuhan kedua-dua fenomena tidak dapat dielakkan membawa kepada satu
persimpangan mereka. Hari ini, syarikat menghadapi masalah
apa yang perlu dilakukan dengan ERP e gudang data. Artikel ini akan menggambarkan
apakah masalah dan bagaimana ia ditangani oleh syarikat.
PADA PERMULAANNYA…
Pada mulanya terdapat gudang data. Gudang data dilahirkan untuk
mengatasi sistem aplikasi pemprosesan transaksi.
Pada zaman awal hafalan dati ia dimaksudkan untuk menjadi
hanya titik balas kepada aplikasi pemprosesan komputer
urus niaga. Tetapi pada masa kini terdapat pandangan yang jauh lebih canggih
daripada apa a gudang data. Dalam dunia hari ini
gudang data ia dimasukkan dalam struktur yang boleh
dipanggil Kilang Maklumat Korporat.
KILANG MAKLUMAT KORPORAT
(CIF)
Kilang Maklumat Korporat mempunyai komponen seni bina
standard: tahap transformasi dan penyepaduan kod
yang mengintegrasikan i dati Sementara saya dati mereka bergerak dari persekitaran
aplikasi terhadap alam sekitar gudang data syarikat; a
gudang data syarikat di mana dati
sejarah yang terperinci dan bersepadu. The gudang data syarikat itu berfungsi sebagai
asas di mana semua bahagian lain boleh dibina
alam sekitar gudang data; stor data operasi (ODS).
ODS ialah struktur hibrid yang mengandungi beberapa aspek data
gudang dan aspek lain persekitaran OLTP; data mart, di mana i
Jabatan yang berbeza mungkin mempunyai versi data mereka sendiri
gudang; a gudang data penerokaan di mana i
"Ahli falsafah" syarikat boleh mengemukakan pertanyaan mereka
72 jam tanpa kesan berbahaya pada gudang data; dan sebuah kenangan
berhampiran garisan, di mana dati lama dan dati detail pukal boleh
disimpan dengan murah.
DI MANA ERP BERGABUNG DENGAN LA
KILANG MAKLUMAT KORPORAT
ERP bergabung dengan Kilang Maklumat Korporat di dua tempat.
Pertama sebagai aplikasi asas (baseline) yang menyediakan i
dati daripada permohonan kepada gudang data. Dalam kes ini i dati,
dihasilkan sebagai hasil sampingan daripada proses transaksi,
disepadukan dan dimuatkan ke dalam gudang data syarikat itu. The
titik kedua kesatuan antara ERP dan CIF dan ODS. Malah, ramai
persekitaran ERP digunakan sebagai ODS klasik.
Sekiranya ERP digunakan sebagai aplikasi teras, ia
ERP yang sama juga boleh digunakan dalam CIF sebagai ODS. Dalam
Walau apa pun, jika ERP hendak digunakan dalam kedua-dua peranan, ada
mesti ada perbezaan yang jelas antara kedua-dua entiti. Dalam kata lain,
apabila ERP memainkan peranan aplikasi asas dan ODS, yang
dua entiti seni bina mestilah berbeza. Jika bujang
melaksanakan ERP cuba memenuhi kedua-dua peranan
pada masa yang sama pasti akan timbul masalah dalam
reka bentuk dan pelaksanaan struktur ini.
ODS DAN APLIKASI ASAS BERASINGAN
Terdapat banyak sebab yang membawa kepada pemisahan komponen
seni bina. Mungkin soalan yang paling fasih untuk memisahkan
komponen yang berbeza dalam seni bina ialah setiap komponen
seni bina mempunyai pandangan tersendiri. Permohonan asas diperlukan
untuk tujuan yang berbeza daripada tujuan ODS. Cuba tumpang tindih
pandangan aplikasi asas mengenai dunia ODS atau sebaliknya
Ia bukan cara yang betul untuk bekerja.
Akibatnya, masalah pertama ERP dalam CIF ialah masalah
semak sama ada terdapat perbezaan antara aplikasi garis dasar dan
SDGs.
MODEL DATA DALAM KORPORAT
KILANG MAKLUMAT
Untuk mencapai kesepaduan antara komponen yang berbeza
seni bina CIF, mesti ada model dati. The
model daripada dati Mereka berfungsi sebagai penghubung antara pelbagai komponen
seni bina seperti aplikasi asas dan ODS. THE
model daripada dati menjadi "peta jalan intelek" untuk mempunyai
makna yang betul daripada komponen seni bina yang berbeza CIF.
Berganding bahu dengan tanggapan ini, ideanya ialah perlu
menjadi model yang hebat dan unik dati. Sudah tentu dia terpaksa
menjadi teladan dati untuk setiap komponen dan juga ada
ia mestilah laluan masuk akal yang menghubungkan model yang berbeza.
Setiap komponen seni bina – ODS, aplikasi garis dasar,
gudang data syarikat, dan sebagainya.. – memerlukannya sendiri
model daripada dati. Dan oleh itu mesti ada definisi yang tepat
seperti model-model ini dati mereka antara satu sama lain.
GERAK I DATA ERP PADA TARIKH
WAREHOUSE
Jika asal usul dati ialah aplikasi asas dan/atau ODS, apabila
sisipan ERP i dati dalam gudang data, sisipan ini mesti
berlaku pada tahap "granularity" yang paling rendah. Rekap atau
hanya agregat i dati semasa mereka keluar
daripada aplikasi garis dasar ERP atau daripada ERP ODS bukanlah
perkara yang betul untuk dilakukan. THE dati butiran diperlukan dalam data
gudang untuk membentuk asas proses DSS. begitu dati
mereka akan dibentuk semula dalam pelbagai cara oleh data mart dan penerokaan
yang gudang data.
Anjakan daripada dati daripada persekitaran aplikasi asas
daripada ERP kepada alam sekitar gudang data syarikat dilakukan dalam a
cara yang agak santai. Pergeseran itu berlaku selepas itu
kira-kira 24 jam dari kemas kini atau penciptaan dalam ERP. Hakikatnya
mempunyai pergerakan "malas" daripada dati dalam gudang data
syarikat membenarkan dati datang dari ERP untuk "deposit".
Sekali saya dati disimpan dalam aplikasi garis dasar,
maka anda boleh mengalihkan dengan selamat dati daripada ERP
dalam syarikat. Satu lagi matlamat yang boleh dicapai terima kasih kepada pergerakan
tuhan "malas". dati ialah persempadanan yang jelas antara proses operasi dan
DSS. Dengan pergerakan "pantas" daripada dati garis pemisah
antara DSS dan operasi masih kabur.
Pergerakan dati daripada ERP ODS kepada gudang data
syarikat biasanya dilakukan secara berkala
mingguan atau bulanan. Dalam kes ini pergerakan
dati ia berdasarkan keperluan untuk "membersihkan" yang lama dati ahli sejarah.
Sudah tentu, ODS mengandungi i dati yang lebih terkini
hormat kepada dati ahli sejarah yang ditemui dalam gudang data.
Anjakan daripada dati dalam gudang data ia hampir tidak pernah dilakukan
“borong” (dengan cara pemborong). Salin jadual
daripada persekitaran ERP kepada gudang data ia tidak masuk akal. Satu pendekatan
lebih realistik ialah pergerakan unit terpilih dati.
Hanya yang dati yang telah berubah sejak kemas kini terakhir data
gudang adalah yang harus dipindahkan ke data
gudang. Satu cara untuk mengetahui yang mana satu dati mereka telah diubah suai
kerana kemas kini terakhir adalah untuk melihat cap masa dati
terdapat dalam persekitaran ERP. Pereka bentuk memilih semua perubahan
yang telah muncul sejak kemas kini terakhir. Pendekatan lain
adalah menggunakan teknik perolehan perubahan dati. Dengan
Teknik ini menganalisis log dan pita jurnal untuk
tentukan yang mana satu dati mesti dipindahkan dari persekitaran ERP ke
Itu daripada gudang data. Teknik ini adalah yang terbaik
berapa banyak log dan pita jurnal boleh dibaca daripada fail ERP
tanpa kesan lanjut ke atas sumber ERP lain.
KOMPLIKASI LAIN
Salah satu masalah dengan ERP dalam CIF ialah apa yang berlaku kepada orang lain
sumber aplikasi atau ai dati daripada ODS yang mesti menyumbang kepada
gudang data tetapi mereka bukan sebahagian daripada persekitaran ERP. Memandangkan
sifat tertutup ERP, terutamanya SAP, percubaan untuk mengintegrasikan
kunci daripada sumber luar dati dengan i dati yang datang daripada ERP kepada
masa untuk bergerak i dati dalam gudang data, ia adalah satu cabaran yang besar.
Dan sebenarnya apakah kebarangkalian bahawa i dati daripada permohonan atau
ODS di luar persekitaran ERP akan disepadukan ke dalam data
gudang? Kemungkinan sebenarnya sangat tinggi.
CARI DATA SEJARAH DARI ERP
Satu lagi masalah dengan i dati daripada ERP adalah yang terhasil
daripada keperluan untuk mempunyai dati ahli sejarah dalam gudang data.
Biasanya yang gudang data keperluan dati ahli sejarah. DAN
Teknologi ERP biasanya tidak menyimpannya dati
sejarah, sekurang-kurangnya tidak ke tahap di mana ia perlu dalam data
gudang. Apabila sejumlah besar dati ahli sejarah mula
ditambah kepada persekitaran ERP, persekitaran ini mestilah
dibersihkan. Sebagai contoh, andaikan bahawa a gudang data mesti
dimuatkan dengan lima tahun dati bersejarah manakala ERP menyimpan
maksimum enam bulan ini dati. Asalkan syarikat berpuas hati
mengumpul satu set dati ahli sejarah seiring dengan berlalunya masa,
maka tiada masalah dalam menggunakan ERP sebagai sumber untuk
gudang data. Tetapi apabila gudang data mesti pergi
kembali ke masa lalu dan mengambil tuhan dati ahli sejarah yang tidak
sebelum ini dikumpulkan dan disimpan oleh ERP, kemudian persekitaran ERP
menjadi tidak cekap.
ERP DAN METADATA
Satu lagi pertimbangan yang perlu dibuat tentang ERP e gudang data ialah
pada metadata sedia ada dalam persekitaran ERP. Serta metadata
beralih daripada persekitaran ERP kepada persekitaran IT gudang data, yang
metadata mesti dialihkan dengan cara yang sama. Tambahan pula, i
metadata mesti diubah dalam format dan struktur
diperlukan oleh infrastruktur gudang data. Ada yang besar
perbezaan antara metadata operasi dan metadata DSS. Metadata itu
beroperasi terutamanya untuk pemaju dan untuk
pengaturcara. Metadata DSS adalah terutamanya untuk pengguna
perlawanan akhir. Metadata sedia ada dalam aplikasi ERP atau ODS
mereka mesti ditukar dan penukaran ini tidak selalunya mudah
dan langsung.
MENYUMBER DATA ERP
Jika ERP digunakan sebagai pembekal dati untuk gudang data ci
ia perlu menjadi antara muka yang kukuh yang menggerakkan i dati daripada persekitaran
ERP kepada alam sekitar gudang data. Antara muka mesti:
▪ mudah digunakan
▪ membenarkan akses kepada dati daripada ERP
▪ mengambil maksud dati yang akan dipindahkan
dalam gudang data
▪ mengetahui batasan ERP yang mungkin timbul dalam
saat di mana akses dibuat dati daripada ERP:
▪ integriti rujukan
▪ hubungan hierarki
▪ hubungan logik tersirat
▪ konvensyen permohonan
▪ semua struktur dati disokong oleh ERP, dan sebagainya…
▪ cekap dalam mengakses dati, dengan memperuntukkan:
▪ pergerakan langsung daripada dati
▪ pemerolehan perubahan dati
▪ menyokong akses tepat pada masanya dati
▪ memahami format dati, dan sebagainya…
BERSAMBUNGAN DENGAN SAP
Antara muka boleh terdiri daripada dua jenis, buatan sendiri atau komersial.
Beberapa antara muka dagangan utama termasuk:
▪ SAS
▪ Penyelesaian Prims
▪ D2k, dan seterusnya…
PELBAGAI TEKNOLOGI ERP
Merawat persekitaran ERP seolah-olah ia adalah satu teknologi adalah a
kesilapan besar. Terdapat banyak teknologi ERP, masing-masing mempunyai teknologinya sendiri
kekuatan. Vendor yang paling terkenal di pasaran ialah:
▪ SAP
▪ Oracle Financials
▪ PeopleSoft
▪ JD Edwards
▪ Baan
SAP
SAP ialah perisian ERP terbesar dan paling lengkap. Aplikasi-aplikasi tersebut
SAP termasuk banyak jenis aplikasi dalam banyak bidang. SAP telah
reputasi sebagai:
▪ sangat besar
▪ sangat sukar dan mahal untuk dilaksanakan
▪ memerlukan ramai orang dan perunding untuk menjadi
dilaksanakan
▪ memerlukan orang khusus untuk pelaksanaan
▪ mengambil masa yang lama untuk dilaksanakan
Selain itu, SAP mempunyai reputasi untuk menyimpannya sendiri dati banyak
berhati-hati, menyukarkan seseorang untuk mengaksesnya
orang di luar kawasan SAP. Kekuatan SAP ialah menjadi
mampu menangkap dan menyimpan sejumlah besar dati.
Baru-baru ini SAP mengumumkan hasratnya untuk melanjutkan
aplikasinya kepada gudang data. Terdapat banyak kebaikan dan keburukan
dalam menggunakan SAP sebagai pembekal gudang data.
Kelebihannya ialah SAP sudah dipasang dan kebanyakannya
perunding sudah tahu SAP.
Kelemahan mempunyai SAP sebagai pembekal gudang data mereka
ramai: SAP tidak mempunyai pengalaman dalam dunia gudang data
Jika SAP adalah pembekal gudang data, adalah perlu untuk "mengeluarkan"
i dati dari SAP ke gudang data. Data rekod prestasi SAP tentang
sistem tertutup, tidak mungkin mudah untuk mendapatkan dari SAP ke dalam
ia (???). Terdapat banyak persekitaran warisan yang memberi kuasa kepada SAP,
seperti IMS, VSAM, ADABAS, ORACLE, DB2, dan sebagainya.
SAP menegaskan pendekatan "tidak dicipta di sini". SAP tidak mahu
bekerjasama dengan vendor lain untuk menggunakan atau mencipta gudang data.
SAP berkeras untuk menjana semua perisiannya sendiri.
Walaupun SAP adalah sebuah syarikat yang besar dan berkuasa, hakikatnya
cuba menulis semula teknologi ELT, OLAP, pentadbiran
sistem dan juga kod teras dbms ia hanya gila.
Daripada mengambil sikap bekerjasama dengan pembekal
di gudang data lama, SAP telah mengikuti pendekatan itu
mereka "tahu lebih baik". Sikap ini melambatkan kejayaan
SAP mungkin ada di kawasan gudang data.
Keengganan SAP untuk membenarkan akses vendor luar
dengan segera dan anggun kepada mereka dati. Intipati penggunaan
un gudang data adalah akses mudah dati. Keseluruhan kisah SAP adalah
berdasarkan menyukarkan akses dati.
Kekurangan pengalaman SAP dalam menangani jumlah besar dati;
dalam bidang gudang data terdapat jilid dati tidak pernah dilihat sejak itu
SAP dan untuk menguruskan kuantiti besar ini dati anda perlu mempunyai satu
teknologi yang sesuai. SAP nampaknya tidak dimaklumkan mengenai perkara ini
halangan teknologi yang wujud untuk memasuki medan data
gudang.
Budaya korporat SAP: SAP telah mencipta perniagaan
dalam mendapatkan i dati daripada sistem. Tetapi untuk melakukan ini anda perlu mempunyai
mentaliti yang berbeza. Secara tradisinya, syarikat perisian yang
pandai memasukkan data ke dalam persekitaran belum mahir
mendapatkan data untuk pergi ke arah lain. Kalau SAP boleh buat macam ni
suis akan menjadi syarikat pertama yang berbuat demikian.
Ringkasnya, adalah dipersoalkan sama ada syarikat harus memilih
SAP sebagai pembekal gudang data. Terdapat risiko yang sangat serius
di satu pihak dan sangat sedikit ganjaran di pihak yang lain. Tetapi ada satu lagi
sebab yang tidak menggalakkan pilihan SAP sebagai pembekal data
gudang. Kerana setiap syarikat sepatutnya mempunyai tarikh yang sama
gudang semua syarikat lain? The gudang data ia adalah hati
kelebihan daya saing. Jika setiap syarikat menerima pakai yang sama
gudang data ia akan menjadi sukar, walaupun tidak mustahil,
mencapai kelebihan daya saing. SAP seolah-olah berfikir bahawa a
gudang data boleh dilihat sebagai kuki dan itu adalah a
tanda lanjut mentaliti aplikasi "dapatkan data" mereka
dalam”.
Tiada vendor ERP lain yang dominan seperti SAP.
Tidak dinafikan akan ada syarikat yang mengikuti laluan SAP
untuk mereka gudang data tetapi agaknya tarikh ini
Gudang SAP akan menjadi besar, mahal dan menuntut
masa untuk penciptaan mereka.
Persekitaran ini termasuk aktiviti seperti pemprosesan juruwang bank,
proses tempahan syarikat penerbangan, proses aduan
insurans, dan sebagainya. Sistem transaksi lebih berprestasi,
lebih jelas ialah keperluan untuk pemisahan antara operasi dan proses
DSS (Sistem Sokongan Keputusan). Walau bagaimanapun, dengan sistem sumber
manusia dan peribadi, anda tidak pernah mendapati diri anda berhadapan dengan jumlah besar
urus niaga. Dan, sudah tentu, apabila seseorang diupah
atau meninggalkan syarikat ini adalah rekod transaksi.
Tetapi berbanding dengan sistem lain, sistem sumber manusia dan
peribadi tidak mempunyai banyak transaksi. Oleh itu, dalam
sumber manusia dan sistem kakitangan tidak sepenuhnya jelas bahawa terdapat
memerlukan DataWarehouse. Dalam banyak cara sistem ini
mewakili penggabungan sistem DSS.
Tetapi ada satu lagi faktor yang mesti dipertimbangkan jika anda perlu berbuat demikian
lakukan dengan gudang data dan PeopleSoft. Dalam banyak persekitaran, i dati
sumber manusia dan peribadi adalah kedua kepada perniagaan
ketua syarikat. Kebanyakan syarikat menjalankan
pembuatan, penjualan, penyediaan perkhidmatan dan sebagainya. THE
Sistem HR dan kakitangan biasanya sekunder (atau daripada
sokongan) kepada barisan perniagaan utama syarikat. Oleh itu, ia adalah
samar-samar dan menyusahkan gudang data berasingan untuk
sokongan untuk sumber manusia dan peribadi.
PeopleSoft sangat berbeza daripada SAP dalam hal ini. Dengan SAP, ia adalah
wajib ada a gudang data. Dengan PeopleSoft, ia tidak
maka begitu jelas. Gudang data adalah pilihan dengan PeopleSoft.
Perkara terbaik yang boleh dikatakan untuk i dati PeopleSoft ialah data itu
gudang boleh digunakan untuk mengarkibkan dati berkenaan
sumber manusia dan peribadi lama. Sebab kedua untuk
yang mana satu syarikat ingin menggunakan a gudang data a
memudaratkan persekitaran PeopleSoft ialah membenarkan akses dan
akses percuma kepada alat analisis, ai dati oleh PeopleSoft. Tetapi
Sebagai tambahan kepada sebab-sebab ini, mungkin terdapat kes di mana lebih baik untuk tidak melakukannya
mempunyai gudang data untuk dati PeopleSoft.
Ringkasnya
Terdapat banyak idea mengenai pembinaan data
gudang di dalam perisian ERP.
Antaranya ialah:
▪ Masuk akal untuk mempunyai a gudang data yang menyerupai mana-mana
apa-apa lagi dalam industri?
▪ Betapa fleksibelnya ERP gudang data perisian?
▪ ERP gudang data perisian boleh mengendalikan jumlah
dati yang terletak di agudang data arena"?
▪ Apakah pengelogan jejak yang dilakukan oleh vendor ERP
berhadapan dengan mudah dan murah, dari segi masa, ai dati? (apa
ialah rekod prestasi vendor ERP pada penghantaran yang murah, pada
masa, mudah untuk mengakses data?)
▪ Apakah pemahaman anda tentang seni bina DSS dan
"kilang maklumat korporat" oleh vendor ERP?
▪ Vendor ERP memahami cara mencapainya dati di dalam
alam sekitar, tetapi adakah mereka juga memahami cara mengeksportnya?
▪ Sejauh manakah vendor ERP terbuka kepada alatan data
pergudangan?
Semua pertimbangan ini mesti dibuat dalam menentukan
di mana untuk meletakkan gudang data yang akan menjadi tuan rumah i dati ERP dan lain-lain
dati. Secara umum, melainkan ada sebab yang kukuh untuk
lakukan sebaliknya, adalah disyorkan untuk membina gudang data keluar
daripada persekitaran vendor ERP.
BAB 1
Gambaran Keseluruhan Organisasi BI
Perkara utama:
Repositori maklumat berfungsi sebaliknya
kepada seni bina risikan perniagaan (BI):
Budaya korporat dan IT boleh menghadkan kejayaan dalam
membina organisasi BI.
Teknologi bukan lagi faktor pengehad bagi organisasi BI. The
masalah bagi arkitek dan perancang projek bukan sama ada
teknologi wujud, tetapi jika mereka boleh melaksanakan dengan berkesan
teknologi yang ada.
Bagi banyak syarikat a gudang data ia lebih sedikit daripada sebuah gudang
pasif yang mengedar i dati kepada pengguna yang memerlukannya. THE dati
ia diekstrak daripada sistem sumber dan dihuni ke dalam struktur sasaran
di gudang data. The dati mereka juga boleh dibersihkan dengan semua
rezeki. Walau bagaimanapun tiada nilai tambahan ditambah sama ada
dikumpul oleh dati semasa proses ini.
Pada asasnya, Dw pasif, paling baik, menyampaikan
hanya saya dati bersih dan beroperasi kepada persatuan pengguna. di sana
penciptaan maklumat dan pemahaman analitikal bergantung
sepenuhnya oleh pengguna. Nilai sama ada DW (Gudang data) ialah
kejayaan adalah subjektif. Jika kita menilai kejayaan pada
keupayaan untuk mengumpul, menyepadu dan membersihkan dengan cekap i dati
korporat pada asas yang boleh diramal, maka ya, DW adalah satu kejayaan.
Sebaliknya, jika kita melihat koleksi, penyatuan dan lo
eksploitasi maklumat organisasi secara keseluruhan, maka
DW adalah kegagalan. DW memberikan sedikit atau tiada nilai
maklumat. Akibatnya, pengguna terpaksa melakukan,
sekali gus mewujudkan silo maklumat. Bab ini membentangkan
visi lengkap untuk meringkaskan seni bina BI (Business
Perisikan) syarikat. Mari kita mulakan dengan penerangan tentang BI e
maka kita akan beralih ke perbincangan tentang reka bentuk dan
membangunkan maklumat, berbanding hanya menyediakan i dati
kepada pengguna. Perbincangan kemudiannya tertumpu kepada pengiraan
nilai usaha BI anda. Kami membuat kesimpulan dengan mentakrifkan bagaimana IBM
menangani keperluan seni bina BI organisasi anda.
Penerangan tentang seni bina
organisasi BI
Sistem maklumat berorientasikan transaksi yang berkuasa kini
dalam agenda dalam setiap usaha besar, seperti yang mereka tingkatkan
secara berkesan medan permainan untuk syarikat di seluruh dunia.
Kekal berdaya saing, bagaimanapun, kini memerlukan sistem secara analitikal
berorientasikan yang boleh merevolusikan keupayaan syarikat dengan menemui semula ed
menggunakan maklumat yang telah mereka miliki. Sistem-sistem ini
analisis diperolehi daripada pemahaman daripada kekayaan dati
tersedia. BI boleh meningkatkan prestasi merentas semua maklumat
syarikat itu. Syarikat boleh meningkatkan hubungan pelanggan dengan pelanggan
pembekal, meningkatkan keuntungan produk dan perkhidmatan, menjana
tawaran baharu dan lebih baik, kawal risiko anda dan antara lain-lain lagi
pendapatan mengurangkan perbelanjaan secara mendadak. Dengan BI milik anda
syarikat akhirnya mula menggunakan maklumat pelanggan
sebagai baik kompetitif terima kasih kepada aplikasi yang mempunyai objektif
pasaran.
Mempunyai Perniagaan yang betul bermakna mempunyai jawapan yang pasti
soalan utama seperti:
▪ Yang mana antara kita pelanggan mereka membuat kita mendapat lebih banyak, atau kita
adakah mereka rugi?
▪ Tempat terbaik kami tinggal pelanggan berhubung dengan kedai/
gudang yang sering mereka kunjungi?
▪ Produk dan perkhidmatan kami yang manakah boleh dijual lebih banyak
dengan berkesan dan kepada siapa?
▪ Produk manakah yang boleh dijual paling berkesan dan kepada siapa?
▪ Kempen jualan manakah yang paling berjaya dan mengapa?
▪ Saluran jualan manakah yang paling berkesan untuk produk mana?
▪ Bagaimana kita boleh meningkatkan hubungan dengan orang terbaik kita pelanggan?
Kebanyakan syarikat mempunyai dati kasar nak jawab
soalan-soalan ini.
Sistem operasi menjana sejumlah besar produk, daripada
pelanggan dan daripada dati pasaran daripada tempat jualan, tempahan,
oleh perkhidmatan pelanggan dan sistem sokongan teknikal. Cabarannya ialah
mengekstrak dan mengeksploitasi maklumat ini.
Banyak syarikat hanya mendapat keuntungan daripada sebahagian kecil syarikat mereka dati
untuk analisis strategik.
I dati yang tinggal, sering disertai dengan i dati timbul daripada sumber luar seperti
"laporan kerajaan", dan maklumat lain yang dibeli, adalah satu
lombong emas hanya menunggu untuk diterokai, dan i dati mesti
hanya diperhalusi dalam konteks maklumat anda
organisasi.
Pengetahuan ini boleh digunakan dengan cara yang berbeza, variasi
daripada mereka bentuk strategi korporat keseluruhan kepada
komunikasi peribadi dengan pembekal, melalui pusat panggilan,
invois, Internet dan mata lain. Persekitaran perniagaan hari ini menentukan
bahawa DW dan penyelesaian BI yang berkaitan berkembang di luar
pelaksanaan struktur tradisional dati yang i dati dinormalkan kepada
peringkat atom dan "ladang bintang/kiub".
Apa yang diperlukan untuk kekal berdaya saing adalah gabungan
teknologi tradisional dan canggih dalam usaha menyokong a
landskap analisis yang luas.
Sebagai kesimpulan, persekitaran umum mesti meningkatkan pengetahuan
syarikat secara keseluruhan, memastikan bahawa tindakan yang diambil
sebagai akibat daripada analisis yang dijalankan adalah berguna supaya semua orang boleh
faedah.
Sebagai contoh, katakan anda mengklasifikasikan milik anda pelanggan dalam kategori
berisiko tinggi atau rendah.
Jika maklumat ini dijana daripada model pengekstrakan atau
cara lain, mesti diletakkan dalam Dw dan boleh diakses oleh
sesiapa sahaja, melalui sebarang alat capaian, seperti i
laporan statik, hamparan, jadual atau pemprosesan analitik dalam
talian (OLAP).
Walau bagaimanapun, pada masa ini, banyak jenis maklumat ini
kekal dalam silo dati individu atau jabatan yang mereka jana
analisis itu. Organisasi, secara keseluruhan, mempunyai sedikit atau tiada keterlihatan
untuk kefahaman. Hanya mencampurkan jenis kandungan ini
maklumat dalam DW syarikat anda, anda boleh menghapuskan silo
maklumat dan meningkatkan persekitaran DW anda.
Terdapat dua halangan utama untuk membangunkan sesebuah organisasi
daripada BI.
Pertama, kita mempunyai masalah organisasi itu sendiri
daripada disiplin yang berkaitan.
Walaupun kami tidak dapat membantu dengan perubahan dasar
organisasi, kami boleh membantu memahami komponen
organisasi BI, seni binanya dan bagaimana
Teknologi IBM memudahkan pembangunannya.
Halangan kedua yang perlu diatasi ialah kekurangan teknologi
bersepadu dan pengetahuan tentang kaedah yang mengimbas kembali seluruh ruang
BI berbanding komponen kecil sahaja.
IBM akan menghadapi perubahan teknologi
daripada bersepadu. Adalah menjadi tanggungjawab anda untuk menyediakan reka bentuk
sedar diri. Seni bina ini mesti dibangunkan dengan
teknologi yang dipilih untuk penyepaduan tanpa kekangan, atau sekurang-kurangnya dengan
teknologi yang mematuhi piawaian terbuka. Tambahan pula, milik anda
pengurusan syarikat mesti memastikan bahawa perusahaan Bi adalah
dijalankan mengikut program dan tidak membenarkannya
pembangunan silo maklumat hasil daripada melayan diri sendiri
agenda, atau objektif.
Ini bukan untuk mengatakan bahawa persekitaran BI tidak sensitif
bertindak balas terhadap keperluan dan keperluan pengguna yang berbeza; sebaliknya, ia bermakna
bahawa pelaksanaan keperluan dan keperluan individu tersebut adalah
dilakukan untuk kepentingan seluruh organisasi BI.
Penerangan tentang seni bina organisasi BI boleh
boleh didapati di muka surat 9 dalam rajah 1.1 Seni bina menunjukkan
gabungan yang kaya dengan teknologi dan teknik.
Dari pandangan tradisional, seni bina merangkumi komponen berikut
daripada gudang
Lapisan Atom.
Ini adalah asas, nadi seluruh Dw dan oleh itu
pelaporan strategik.
I dati disimpan di sini akan mengekalkan integriti sejarah, hubungan
dati dan termasuk metrik terbitan, serta bersih,
bersepadu, dan disimpan menggunakan model pengekstrakan.
Semua penggunaan seterusnya ini dati dan maklumat berkaitan ialah
diperoleh daripada struktur ini. Ini adalah sumber yang sangat baik untuk
pengekstrakan daripada dati dan untuk laporan dengan pertanyaan SQL berstruktur
Depoh operasi bagi dati atau laporan berdasarkan
dati(Stor data operasi (ODS) atau pelaporan
pangkalan data.)
Ini adalah struktur dati direka khusus untuk
pelaporan teknikal.
I dati disimpan dan dilaporkan ke atas struktur ini akhirnya boleh
menyebarkan ke dalam gudang melalui zon organisasi (pementasan
kawasan), di mana ia boleh digunakan untuk isyarat strategik.
Kawasan pementasan.
Perhentian pertama untuk kebanyakan orang dati bertujuan untuk alam sekitar
gudang ialah kawasan organisasi.
Disini saya dati mereka disepadukan, dibersihkan dan diubah menjadi dati berguna itu
akan mengisi struktur gudang
Data mart.
Bahagian seni bina ini mewakili struktur dati terpakai
khusus untuk OLAP. Kehadiran datamarts, jika i dati mereka
disimpan dalam skema bintang bertindih dati
multidimensi dalam persekitaran hubungan, atau dalam kabinet pemfailan
di dati sulit yang digunakan oleh teknologi OLAP tertentu, seperti
Pelayan DB2 OLAP, tidak berkaitan.
Satu-satunya kekangan ialah seni bina memudahkan penggunaan dati
pelbagai dimensi.
Seni bina juga termasuk teknologi dan teknik BI yang kritikal
yang dibezakan sebagai:
Analisis ruang
Ruang adalah durian runtuh maklumat untuk penganalisis dan
adalah penting untuk menyelesaikan resolusi. Angkasa boleh
mewakili maklumat tentang orang yang tinggal di tempat tertentu
lokasi, serta maklumat tentang lokasi lokasi tersebut
fizikal berbanding dengan dunia lain.
Untuk menjalankan analisis ini, anda mesti bermula dengan mengikat anda sendiri
maklumat mengenai koordinat latitud dan longitud. Maknanya
dirujuk sebagai "geocoding" dan mesti menjadi sebahagian daripada pengekstrakan,
transformasi, dan proses pemuatan (ETL) pada tahap
atom gudang anda.
Perlombongan data.
Pengekstrakan daripada dati membolehkan syarikat kami berkembang
sebilangan pelanggan, untuk meramalkan arah aliran jualan dan membolehkan
mengurus perhubungan dengan i pelanggan (CRM), antara inisiatif lain daripada
BI.
Pengekstrakan daripada dati Oleh itu, ia mesti disepadukan dengan struktur
dati daripada Dwhouse dan disokong oleh proses gudang untuk
memastikan kedua-dua penggunaan teknologi yang berkesan dan cekap dan
teknik berkaitan.
Seperti yang ditunjukkan dalam seni bina BI, tahap atom bagi
Dwhouse, serta datamarts, adalah sumber yang sangat baik dati
untuk perahan. Struktur yang sama juga mestilah
penerima hasil pengekstrakan untuk memastikan ketersediaan untuk
khalayak terbesar.(khalayak terluas).
Ejen.
Terdapat pelbagai "ejen" untuk memeriksa pelanggan untuk setiap perkara seperti, i
sistem pengendalian syarikat dan dw yang sama. Ejen ini boleh
menjadi rangkaian saraf lanjutan yang dilatih untuk mempelajarinya
trend setiap titik, seperti permintaan masa depan berasaskan produk
mengenai promosi jualan, enjin berasaskan peraturan untuk bertindak balas
un dato set keadaan, atau ejen mudah yang
mereka melaporkan pengecualian kepada "eksekutif atasan". Proses-proses ini ya
hadir secara amnya dalam masa nyata dan, oleh itu, mesti
berganding rapat dengan pergerakan mereka dati.
Semua struktur ini dati, jaminan teknologi dan teknik
bahawa anda tidak akan menghabiskan malam menjana organisasi
BI anda.
Aktiviti ini akan dibangunkan secara berperingkat-peringkat kecil
mata.
Setiap langkah adalah usaha projek bebas, dan dilaporkan
sebagai lelaran dalam inisiatif DW atau BI anda. Lelaran
mungkin termasuk pelaksanaan teknologi baharu, contohnya
mulakan dengan teknik baharu, menambah struktur baharu dati ,
memuatkan i dati tambahan , atau dengan pengembangan analisis
persekitaran anda. Perenggan ini dibincangkan lebih lanjut
secara mendalam dalam bab 3.
Sebagai tambahan kepada struktur tradisional alat DW dan BI terdapat yang lain
fungsi organisasi BI anda yang mana anda mesti
reka bentuk, seperti:
Titik sentuh pelanggan (Sentuhan pelanggan
mata).
Seperti semua organisasi moden terdapat beberapa
titik sentuh pelanggan yang menunjukkan cara untuk mempunyai pengalaman
positif untuk anda pelanggan. Terdapat saluran tradisional seperti i
peniaga, pengendali papan suis, mel terus, multimedia dan percetakan
pengiklanan, serta saluran terkini seperti e-mel dan web, i dati
produk dengan beberapa titik sentuh mesti diperoleh,
diangkut, dibersihkan, diproses dan kemudian dihuni ke kemudahan dati daripada
BI.
Asas daripada dati persatuan operasi dan pengguna (Operasi
pangkalan data dan komuniti pengguna).
Pada penghujung titik hubungan pelanggan asas-asas ditemui dati
aplikasi syarikat dan komuniti pengguna. THE dati sedia ada
mereka dati tradisional yang mesti disatukan dan digabungkan dengan dati yang
mengalir dari titik sentuhan untuk memenuhi keperluan
maklumat.
Penganalisis. (Penganalisis)
Penerima manfaat utama persekitaran BI ialah penganalisis. Dia yang
faedah daripada pengekstrakan semasa dati beroperasi, bersepadu dengan
sumber yang berbeza daripada dati , ditambah dengan ciri seperti analitis
geografi (geocoding) dan dipersembahkan dalam teknologi BI yang
membolehkan anda mengekstrak, OLAP, pelaporan dan analisis SQL lanjutan
geografi. Antara muka utama untuk penganalisis kepada persekitaran
pelaporan ialah portal BI.
Walau bagaimanapun, penganalisis bukan satu-satunya yang mendapat manfaat daripada seni bina
BI.
Pengurus, persatuan pengguna besar, dan juga ahli, pembekal dan
pelanggan mereka harus mencari faedah dalam BI perusahaan.
Gelung suapan belakang.
Seni bina BI ialah persekitaran pembelajaran. Satu prinsip
ciri pembangunan adalah untuk membenarkan struktur yang berterusan daripada dati
untuk dikemas kini menggunakan teknologi BI terpakai dan melalui tindakan
usaha pengguna. Contohnya ialah penilaian terhadap
pelanggan (pemarkahan pelanggan).
Jika jabatan jualan menjalankan model perlombongan
daripada markah pelanggan untuk menggunakan perkhidmatan baharu, maka
jabatan jualan tidak seharusnya menjadi satu-satunya kumpulan penerima
perkhidmatan.
Sebaliknya, model pengekstrakan harus dijalankan sebagai sebahagian
aliran data semula jadi dalam syarikat dan markah pelanggan
harus menjadi bahagian bersepadu dalam konteks maklumat bagi
gudang, boleh dilihat oleh semua pengguna. Suite IBM Bi-bI-centric
termasuk DB2 UDB, DB2 OLAP Server termasuk kebanyakannya
sebahagian daripada komponen teknologi penting, ditakrifkan dalam rajah
1.1.
Kami menggunakan seni bina seperti yang ditunjukkan dalam angka ini dari buku ke
memberi kami tahap kesinambungan dan menunjukkan cara setiap produk
IBM sesuai dengan rangka kerja BI umum.
Menyediakan Kandungan Maklumat (Menyediakan
Kandungan Maklumat)
Mereka bentuk, membangun dan melaksanakan persekitaran BI anda adalah
satu operasi yang sukar. Reka bentuk mesti merangkumi kedua-duanya
keperluan perniagaan semasa dan masa hadapan. Reka bentuk seni bina
mesti lengkap untuk memasukkan semua kesimpulan yang ditemui
semasa fasa reka bentuk. Pelaksanaan mesti kekal
komited kepada satu tujuan: membangunkan seni bina BI
seperti yang dibentangkan secara rasmi dalam lukisan dan berdasarkan keperluan
perniagaan.
Amat sukar untuk berhujah bahawa disiplin akan memastikan
kejayaan relatif.
Ini mudah kerana anda tidak membangunkan keseluruhan persekitaran BI
tiba-tiba, tetapi dilakukan dalam langkah-langkah kecil dari semasa ke semasa.
Walau bagaimanapun, mengenal pasti komponen BI seni bina anda adalah
penting kerana dua sebab: Anda akan membimbing semua keputusan berikutnya
teknik seni bina.
Anda akan dapat merancang secara sedar penggunaan teknologi tertentu
walaupun anda mungkin tidak mendapat pengulangan yang anda perlukan
teknologi selama beberapa bulan.
Memahami keperluan perniagaan anda dengan secukupnya akan mempengaruhi jenis
produk yang akan anda perolehi untuk seni bina anda.
Reka bentuk dan pembangunan seni bina anda memastikan
bahawa gudang anda adalah
bukan peristiwa rawak, sebaliknya "difikirkan dengan baik",
iklan yang dibina dengan teliti opera seni seperti mozek
teknologi campuran.
Reka bentuk kandungan maklumat
Semua perancangan awal mesti memfokus dan mengenal pasti
komponen BI utama yang akan diperlukan oleh alam sekitar
umum sekarang dan akan datang.
Mengetahui keperluan perniagaan adalah penting.
Malah sebelum semua perancangan konvensional bermula, pihak
perancang projek selalunya boleh mengenal pasti satu atau dua
komponen serta-merta.
Baki komponen yang mungkin diperlukan untuk
Seni bina anda, bagaimanapun, tidak dapat ditemui dengan mudah.
Semasa fasa reka bentuk, bahagian utama seni bina
mengaitkan sesi pembangunan aplikasi (JAD) dengan carian
untuk mengenal pasti keperluan perniagaan.
Kadangkala keperluan ini boleh diamanahkan kepada alatan
pertanyaan dan pelaporan.
Sebagai contoh, pengguna menyatakan bahawa jika mereka mahu mengautomasikan
pada masa ini laporan perlu menjana secara manual dengan menyepadukan
dua nisbah semasa dan menambah pengiraan yang diperolehi daripada
gabungan daripada dati.
Walaupun keperluan ini mudah, ia mentakrifkan yang tertentu
kefungsian ciri yang anda mesti sertakan apabila
membeli alat pelaporan untuk organisasi.
Pereka bentuk juga mesti meneruskan keperluan tambahan untuk
dapatkan gambaran yang lengkap. Pengguna ingin melanggan
laporan ini?
Subset laporan dijana dan dihantar melalui e-mel kepada pelbagai
pengguna? Adakah mereka mahu melihat laporan ini dalam portal syarikat?
Semua keperluan ini adalah sebahagian daripada keperluan mudah untuk
menggantikan laporan manual seperti yang diminta oleh pengguna. Faedahnya
daripada jenis keperluan ini ialah semua orang, pengguna dan pereka, mempunyai
pemahaman tentang konsep laporan.
Walau bagaimanapun, terdapat jenis perniagaan lain yang perlu kita rancang.
Apabila keperluan perniagaan dinyatakan dalam bentuk
Soalan strategik perniagaan, mudah untuk pereka pakar
Membezakan ukuran/fakta dan keperluan dimensi.
Rajah 1.2 menggambarkan ukuran dan komponen dimensi a
Masalah perniagaan.
Jika pengguna JAD tidak tahu cara mengisytiharkan keperluan mereka
dalam bentuk masalah perniagaan, pereka sering akan menyediakan
beberapa contoh untuk melangkau-mulakan sesi pengumpulan
keperluan.
Pereka bentuk pakar boleh membantu pengguna memahami bukan sahaja
perdagangan strategik, tetapi juga bagaimana untuk membentuknya.
Pendekatan pengumpulan keperluan dibincangkan dalam bab 3; Untuk
sekarang kami hanya ingin menunjukkan keperluan untuk mereka bentuk untuk semua orang
jenis keperluan BI
Masalah perniagaan strategik adalah, bukan sekadar keperluan
Perniagaan, tetapi juga petunjuk reka bentuk. Jika anda perlu menjawab
kepada soalan multidimensi, maka anda perlu menghafal,
hadir i dati dimensi, dan jika anda perlu menyimpan
dati multidimensi, anda perlu memutuskan jenis teknologi atau
teknik yang akan anda gunakan.
Adakah anda melaksanakan skema bintang kiub terpelihara, atau kedua-duanya?
Seperti yang anda lihat, walaupun masalah perniagaan yang mudah
boleh mempengaruhi reka bentuk dengan ketara. Namun begitu
Jenis keperluan perniagaan ini adalah biasa dan boleh difahami, sekurang-kurangnya
oleh pereka bentuk dan perancang dengan pengalaman projek.
Terdapat cukup perdebatan tentang teknologi dan sokongan
OLAP, dan pelbagai penyelesaian tersedia. Sehingga kini
kami menyebut keperluan untuk mengumpulkan laporan ringkas dengan i
keperluan dimensi perniagaan, dan bagaimana keperluan ini
mempengaruhi keputusan seni bina teknikal.
Tetapi apakah keperluan yang tidak mudah difahami
oleh pengguna atau oleh pasukan DW? Adakah anda memerlukan analitik
spatial (analisis spatiali)?
Model pengekstrakan daripada dati mereka akan menjadi sebahagian daripada anda
masa depan? Siapa tahu?
Adalah penting untuk ambil perhatian bahawa jenis teknologi ini tidak begitu
dikenali oleh komuniti pengguna umum dan ahli pasukan
Dw, sebahagiannya, ini mungkin berlaku kerana ia biasanya
dirawat oleh beberapa pakar teknikal dalaman atau pihak ketiga. Ianya adalah
kes melampau masalah yang dihasilkan oleh jenis teknologi ini. Diri sendiri
pengguna tidak boleh menerangkan keperluan perniagaan atau merangkanya
untuk menyediakan garis panduan kepada pereka, ini boleh
pergi tanpa disedari atau, lebih teruk, hanya diabaikan.
Lebih bermasalah apabila pereka bentuk dan pemaju tidak
boleh mengiktiraf aplikasi salah satu daripada lanjutan ini tetapi
teknologi kritikal.
Seperti yang sering kita dengar Pereka berkata, "baik, kerana
tidakkah kita ketepikan sehingga kita mendapat perkara lain ini?
“Adakah mereka benar-benar berminat dengan keutamaan, atau mereka mengelak sahaja
keperluan yang mereka tidak faham? Kemungkinan besar ia adalah hipotesis terakhir.
Katakan pasukan jualan anda menyampaikan keperluan
perniagaan, seperti yang dinyatakan dalam rajah 1.3, seperti yang anda lihat,
keperluan dirangka dalam bentuk masalah perniagaan. di sana
perbezaan antara masalah ini dan masalah dimensi tipikal ialah
jarak. Dalam kes ini, pasukan jualan ingin tahu,
secara bulanan, jumlah jualan daripada produk, gudang dan
pelanggan yang tinggal dalam lingkungan 5 batu dari gudang tempat mereka
mereka membeli.
Malangnya, pereka atau arkitek boleh
mengabaikan komponen spatial dengan berkata, “kami mempunyai pelanggan, yang
produk dan i dati daripada deposit itu. Jom jaga jarak sampai
lelaran lain.
"Jawapan yang salah. Masalah perniagaan jenis ini membimbangkan
BI sepenuhnya. Ia mewakili pemahaman yang lebih mendalam tentang
perniagaan kami dan ruang analisis yang mantap untuk penganalisis kami.
BI melangkaui pertanyaan mudah atau pelaporan standard, sama ada
walaupun OLAP. Ini bukan untuk mengatakan bahawa teknologi ini tidak
mereka penting untuk BI anda, tetapi mereka sendiri tidak mewakilinya
persekitaran BI.
Reka bentuk untuk konteks maklumat
(Merancang untuk Kandungan Maklumat)
Sekarang kita telah mengenal pasti Keperluan Perniagaan yang menonjol
pelbagai komponen asas mesti disertakan dalam lukisan
seni bina umum. Sebahagian daripada komponen BI adalah sebahagian
usaha awal kami, manakala sebahagiannya tidak akan dilaksanakan untuk
beberapa bulan.
Walau bagaimanapun, semua keperluan yang diketahui ditunjukkan dalam reka bentuk supaya
apabila kita perlu melaksanakan teknologi tertentu, kita
bersiap sedia untuk melakukannya. Sesuatu tentang projek itu akan mencerminkan pemikiran itu
tradisional.
Sebagai contoh, rajah 1.1, pada permulaan bab, menunjukkan data
mart yang menyimpan i dati berdimensi.
Set ini dati digunakan untuk menyokong penggunaan seterusnya
dati dimensi dimensi didorong oleh isu Perniagaan yang
kami telah mengenal pasti. Sebagai dokumen tambahan adalah
dihasilkan, seperti pembangunan reka bentuk dati, kita
kita akan mula merasmikan bagaimana saya dati mereka merebak di persekitaran.
Kami telah memastikan keperluan untuk mewakili i dati begitu
dimensi, membahagikannya (mengikut keperluan khusus
ditentukan) pada data mart.
Soalan seterusnya untuk dijawab ialah: bagaimana ia akan dibina
data mart ini?
Adakah anda membina bintang untuk menyokong kiub, atau hanya kiub, atau hanya bintang?
(atau kiub kanan, atau bintang kanan). Hasilkan seni bina data
dependent mart yang memerlukan lapisan atom untuk semua dati
diperolehi? Benarkan data mart bebas memperoleh i dati
terus daripada sistem pengendalian?
Apakah Teknologi Cube yang akan anda cuba standardkan?
Anda mempunyai kuantiti yang banyak dati diperlukan untuk analisis dimensi
atau anda memerlukan kiub tenaga jualan negara anda pada satu
mingguan atau kedua-duanya? Bina item yang berkuasa
seperti DB2 OLAP Server untuk kewangan atau kiub Cognos
PowerPlay untuk organisasi jualan anda atau kedua-duanya?
Ini adalah keputusan reka bentuk seni bina yang besar
akan menjejaskan persekitaran BI anda mulai sekarang. ya,
anda telah mewujudkan keperluan untuk OLAP. Sekarang bagaimana anda akan melaksanakannya
jenis teknik dan teknologi?
Bagaimana sesetengah teknologi tercanggih mempengaruhi anda
lukisan? Kami menganggap bahawa anda telah mengenal pasti keperluan
ruang dalam organisasi anda. Sekarang anda perlu ingat semula
isu lukisan seni bina walaupun tidak dirancang
menjalankan komponen ruang selama beberapa bulan. Arkitek mesti
reka bentuk hari ini berdasarkan apa yang diperlukan. Jangkakan keperluan untuk
analisis spatial yang menjana, menyimpan, melaksanakan dan menyediakan
akses kepada dati spatial. Ini seterusnya harus berfungsi sebagai
kekangan mengenai jenis teknologi dan spesifikasi
platform perisian yang boleh anda pertimbangkan pada masa ini. Untuk
contoh, sistem pentadbiran bagi pangkalan data hubungan
(RDBMS) yang anda lakukan untuk lapisan atom anda mesti ada
sambungan spatial yang mantap tersedia. Ini akan memastikan
prestasi maksimum apabila menggunakan geometri dan objek
ruang dalam aplikasi analisis anda. Jika RDBMS anda tidak
boleh mengendalikan i dati (spatial-centric) secara dalaman, jadi anda perlu melakukannya
stabilkan una pangkalan data (spatial-centric) luaran. Ini merumitkan
pengurusan isu dan menjejaskan prestasi keseluruhan anda,
apatah lagi masalah tambahan yang dicipta untuk anda
DBA, kerana mereka mungkin mempunyai pemahaman yang minimum
daripada asas dati spatial juga. Sebaliknya, jika enjin anda
RDMBS mengendalikan semua komponen spatial dan yang berkaitan
pengoptimum menyedari keperluan khas (contohnya,
pengindeksan) objek spatial, maka DBA anda boleh mengendalikannya
menguruskan isu dengan segera dan anda boleh meningkatkannya
prestasi.
Selain itu, anda perlu melaraskan kawasan dan lapisan pementasan
persekitaran atom untuk memasukkan pembersihan alamat (a
elemen utama kepada analisis spatial), serta yang berikut
menjimatkan objek ruang. Penggantian edisi daripada
lukisan diteruskan sekarang kerana kami telah memperkenalkan tanggapan pembersihan
alamat. Untuk satu perkara, aplikasi ini akan menentukan jenis
perisian yang diperlukan untuk usaha ETL anda.
Anda memerlukan produk seperti Trillium untuk memberi anda alamat
bersih, atau pembekal ETL yang anda pilih untuk menyediakannya
kefungsian?
Buat masa ini adalah penting untuk anda menghargai tahap reka bentuk
mesti dilengkapkan sebelum anda memulakan persembahan anda
persekitaran (gudang). Contoh di atas sepatutnya
menunjukkan pelbagai keputusan reka bentuk yang mesti diikuti
pengenalpastian mana-mana keperluan perniagaan tertentu. Jika selesai
Betul, keputusan reka bentuk ini maju
saling bergantung antara struktur fizikal persekitaran anda, yang
pemilihan teknologi yang digunakan dan aliran penyebaran
kandungan maklumat. Tanpa seni bina konvensional ini
BI, organisasi anda akan tertakluk kepada campuran
huru-hara teknologi sedia ada, paling baik, bersatu dalam satu cara
tidak tepat untuk memberikan kestabilan yang jelas.
Mengekalkan kandungan maklumat
Membawa nilai maklumat kepada organisasi anda adalah
satu operasi yang sangat sukar. Tanpa pemahaman yang cukup
dan pengalaman, atau perancangan dan lukisan yang mencukupi, malah
pasukan yang lebih baik akan gagal. Sebaliknya, jika anda mempunyai besar
gerak hati dan perancangan terperinci tetapi tiada disiplin untuk
pelaksanaan, anda hanya membuang wang dan masa anda
kerana usaha anda pasti akan gagal. Mesej sepatutnya
jelas: Jika anda kehilangan satu atau lebih daripada ini
kemahiran, pemahaman/pengalaman atau perancangan/lukisan atau
disiplin pelaksanaan, ini akan menyebabkan lumpuh atau
memusnahkan bangunan organisasi BI.
Adakah pasukan anda cukup bersedia? Ada seseorang pada awak
Pasukan BI yang memahami landskap analisis yang luas yang tersedia
dalam persekitaran BI, dalam teknik dan teknologi yang diperlukan
untuk melaksanakan landskap itu? Terdapat seseorang dalam pasukan anda
yang boleh mengenali perbezaan aplikasi antara lanjutan
pelaporan statik dan OLAP, atau perbezaan antara ROLAP dan OLAP? Salah satu daripada
ahli pasukan anda dengan jelas mengenali cara
ekstrak dan bagaimana ia boleh menjejaskan gudang atau bagaimana
Bolehkah gudang mengekalkan prestasi perlombongan? Ahli
daripada pasukan memahami nilai dati ruang atau teknologi
berasaskan ejen? Adakah anda mempunyai seseorang yang menghargai aplikasi unik
alat ETL berbanding teknologi broker
mesej? Jika anda tidak memilikinya, dapatkan satu. BI banyak lagi
besar lapisan atom ternormal, OLAP, skema a
bintang dan ODS.
Mempunyai pemahaman dan pengalaman untuk mengenali keperluan
BI dan penyelesaiannya adalah penting untuk keupayaan anda untuk
memformalkan keperluan dan reka bentuk pengguna dengan betul
dan melaksanakan penyelesaian mereka. Jika komuniti pengguna anda mempunyai
kesukaran untuk menerangkan keperluan, ia adalah tugas pasukan
gudang memberikan pemahaman itu. Tetapi jika pasukan daripada
gudang
tidak mengiktiraf aplikasi khusus BI - contohnya, data
perlombongan- maka ia bukanlah perkara terbaik yang dilakukan oleh persekitaran BI
selalunya terhad kepada deposit pasif. Namun, abaikan perkara ini
teknologi tidak mengurangkan kepentingan dan kesannya
mengenai kemunculan kemungkinan risikan perniagaan anda
organisasi, serta struktur maklumat yang anda reka bentuk
untuk mempromosi.
Perancangan mesti merangkumi tanggapan lukisan, ed
kedua-duanya memerlukan individu yang cekap. Tambahan pula, perancangan
memerlukan falsafah dan pemerhatian rumah simpanan pasukan
daripada piawaian. Sebagai contoh, jika syarikat anda telah menubuhkan a
platform standard atau telah mengenal pasti RDBMS tertentu yang anda
mahu menyeragamkan merentasi platform, adalah menjadi tanggungjawab kita
semua orang dalam pasukan mematuhi piawaian tersebut. Umumnya satu
pasukan mendedahkan keperluan untuk normalisasi (kepada pengguna
communite), tetapi pasukan itu sendiri tidak mahu menyertainya
piawaian juga ditubuhkan di kawasan lain dalam syarikat atau mungkin juga dalam
syarikat yang serupa. Ini bukan sahaja hipokrit, tetapi ia memastikan syarikat tidak
mampu mengeksploitasi sumber dan pelaburan sedia ada. Ia tidak bermakna
bahawa tiada situasi yang menjamin platform atau a
teknologi tidak standard; bagaimanapun, usaha gudang
mereka harus dengan cemburu melindungi piawaian syarikat sehingga
bahawa keperluan perniagaan tidak menentukan sebaliknya.
Komponen utama ketiga diperlukan untuk membina BI
organisasi adalah disiplin.
Ia bergantung secara keseluruhan, sama rata kepada individu dan persekitaran.
Perancang projek, penaja, arkitek dan pengguna mesti menghargai
disiplin yang diperlukan untuk membina struktur maklumat syarikat.
Pereka bentuk mesti mengarahkan usaha reka bentuk mereka sedemikian rupa
menyelesaikan usaha lain yang diperlukan dalam masyarakat.
Sebagai contoh, katakan syarikat anda membina a
Aplikasi ERP yang mempunyai komponen gudang.
Jadi adalah menjadi tanggungjawab pereka ERP untuk bekerjasama dengan
pasukan persekitaran gudang supaya tidak bersaing atau
salin kerja yang telah dimulakan.
Disiplin juga merupakan satu topik yang perlu dijaga
oleh seluruh organisasi dan biasanya ditubuhkan dan diamanahkan kepada a
peringkat eksekutif.
Adakah pengurus bersedia untuk mematuhi pendekatan yang direka bentuk? A
pendekatan yang menjanjikan untuk mencipta kandungan maklumat yang kepada
akhir akan membawa nilai kepada semua bidang syarikat, tetapi mungkin
Adakah ia menjejaskan agenda individu atau jabatan? Ingat pepatah
"Memikirkan segala-galanya adalah lebih penting daripada memikirkan hanya satu perkara."
Pepatah ini benar untuk organisasi BI.
Malangnya, banyak gudang menumpukan usaha mereka
cuba menyasarkan dan membawa nilai kepada jabatan tertentu atau
pengguna tertentu, tanpa mengambil kira organisasi dalam
umum. Katakan pengurus meminta bantuan daripada pasukan
rumah jagaan. Pasukan bertindak balas dengan kerja yang berlangsung selama 90 hari yang
termasuk bukan sahaja penyampaian keperluan pemberitahuan yang ditakrifkan oleh
pengurus tetapi memastikan bahawa semua dati asas dicampur ke dalam lapisan
atom sebelum diperkenalkan ke dalam teknologi kiub
cadangan.
Penambahan kejuruteraan ini memastikan bahawa usaha untuk
rumah jagaan akan mendapat manfaat daripada dati perlu bagi pengurus.
Bagaimanapun, eksekutif itu bercakap dengan firma perunding luar itu
telah mencadangkan permohonan serupa dengan penghantaran dalam masa kurang daripada 4
minggu.
Dengan mengandaikan bahawa pasukan rumah jagaan dalaman adalah cekap, maka
pengurus mempunyai pilihan. Siapa yang boleh menyokong disiplin
kejuruteraan tambahan yang diperlukan untuk mengembangkan aset
perniagaan bermaklumat atau anda boleh memilih untuk mencipta perniagaan anda sendiri
penyelesaian dengan cepat. Yang terakhir nampaknya benar-benar dipilih
terlalu kerap dan hanya berfungsi untuk mencipta bekas maklumat daripada
yang menguntungkan segelintir sahaja atau individu.
Objektif jangka pendek dan panjang
Arkitek dan pereka projek mesti memformalkan a
wawasan jangka panjang seni bina keseluruhan dan rancangan untuk
berkembang dalam organisasi BI. Gabungan ini
keuntungan jangka pendek dan perancangan jangka panjang
mewakili kedua-dua pihak usaha BI. Keuntungan jangka pendek
tarikh akhir ialah aspek BI yang dikaitkan dengan lelaran
gudang anda.
Di sinilah tumpuan perancang, arkitek dan penaja
memenuhi keperluan perniagaan tertentu. Ia adalah pada tahap ini di mana
struktur fizikal dibina, teknologi dibeli dan
teknik dilaksanakan. Mereka tidak dibuat untuk berurusan sama sekali
keperluan khusus seperti yang ditakrifkan oleh komuniti pengguna tertentu.
Semuanya dilakukan untuk memenuhi keperluan tertentu yang ditetapkan
daripada komuniti tertentu.
Perancangan jangka panjang, bagaimanapun, adalah aspek lain
daripada BI. Di sinilah rancangan dan projek memastikannya
membina sebarang struktur fizikal, teknologi terpilih dan
teknik yang dicipta dengan mata ke arah perusahaan. Dan juga
perancangan jangka panjang yang memberikan kesepaduan
perlu untuk memastikan bahawa faedah perniagaan terakru kepada semua
keuntungan jangka pendek yang ditemui.
Wajarkan usaha BI anda
Un gudang data dengan sendirinya ia tidak mempunyai nilai yang wujud. Dalam lain
perkataan, tiada nilai yang wujud di antara teknologi
gudang dan teknik pelaksanaan.
Nilai sebarang usaha gudang didapati dalam tindakan
dilakukan mengikut persekitaran dan kandungan gudang
bermaklumat dipupuk dari semasa ke semasa. Ini adalah perkara kritikal untuk difahami
sebelum anda cuba menganggarkan nilai mana-mana inisiatif
rumah mana.
Terlalu kerap, arkitek dan pereka bentuk cuba menggunakan nilai
komponen fizikal dan teknikal gudang sedangkan sebenarnya nilainya
adalah berdasarkan proses perniagaan yang dipengaruhi secara positif oleh
gudang dan maklumat yang diperoleh dengan baik.
Di sinilah terletaknya cabaran untuk menubuhkan BI: Bagaimanakah anda mewajarkan pelaburan?
Jika rumah kediaman itu sendiri tidak mempunyai nilai intrinsik, pereka bentuk
projek mesti menyiasat, mentakrifkan dan memformalkan faedah
dicapai oleh individu yang akan menggunakan gudang untuk
menambah baik proses perniagaan tertentu atau nilai
maklumat yang dilindungi atau kedua-duanya.
Untuk merumitkan perkara, sebarang proses perniagaan
terjejas oleh usaha gudang boleh memberi faedah
"cukup" atau "sedikit". Kelebihan yang besar memberikan a
metrik ketara untuk mengukur pulangan pelaburan (ROI) – cth
Contohnya, menjadikan inventori sebagai masa tambahan dalam sesuatu tempoh
khusus atau untuk kos penghantaran yang lebih rendah bagi setiap penghantaran. Ia lebih
Sukar untuk mentakrifkan sedikit faedah, seperti peningkatan akses kepada
maklumat, dari segi nilai ketara.
Sambungkan projek anda untuk mengetahui tentang
Permintaan perniagaan
Terlalu kerap, pereka bentuk projek cuba menghubungkan nilai
daripada gudang dengan objektif syarikat amorfus. Mengisytiharkan itu
“Nilai sebuah gudang adalah berdasarkan keupayaan kami untuk
memenuhi permintaan strategik” kami membuka
ucapan. Tetapi ia sahaja tidak mencukupi untuk menentukan sama ada
melabur di gudang masuk akal. Adalah lebih baik untuk menyambung ulangan
gudang dengan permintaan perniagaan yang khusus dan diketahui.
Mengukur ROI
Mengira ROI dalam tetapan gudang boleh
terutamanya sukar. Ia amat sukar jika kelebihan
pokok bagi pengulangan tertentu ialah sesuatu yang tidak ketara atau
mudah untuk diukur. Satu kajian mendapati bahawa pengguna melihat
dua kelebihan utama inisiatif BI:
▪ Cipta keupayaan untuk membuat keputusan
▪ Cipta akses kepada maklumat
Faedah ini adalah faedah lembut (atau ringan). Ia mudah dilihat
bagaimana kita boleh mengira ROI berdasarkan petunjuk keras (atau
lebih besar) seperti mengurangkan kos pengangkutan, tetapi bagaimana
adakah kita mengukur keupayaan untuk membuat keputusan yang lebih baik?
Ini pastinya menjadi cabaran bagi pereka projek apabila
mereka cuba meyakinkan syarikat untuk melabur dalam sesuatu yang tertentu
usaha gudang. Meningkatkan jualan atau mengurangkan kos
mereka bukan lagi tema utama yang memacu persekitaran BI.
Sebaliknya, anda sedang melihat permintaan perniagaan untuk akses
terbaik kepada maklumat supaya jabatan tertentu boleh
membuat keputusan yang lebih cepat. Ini adalah pemacu strategik a
yang kebetulan adalah sama penting kepada perniagaan tetapi
lebih samar-samar dan lebih sukar untuk dicirikan dalam metrik ketara.
Dalam kes ini, pengiraan ROI boleh mengelirukan, jika tidak relevan.
Pereka bentuk projek mesti dapat menunjukkan nilai
ketara supaya pengurus boleh membuat keputusan sama ada untuk melabur dalam
pengulangan tertentu berlaku. Bagaimanapun, kami tidak akan mencadangkan yang baharu
kaedah untuk mengira ROI, kami juga tidak akan membuat sebarang hujah untuk atau
menentangnya.
Terdapat banyak artikel dan buku tersedia yang membincangkan asas-asas untuk
kira ROI. Terdapat cadangan nilai khas sebagai nilai
on Investing (VOI), ditawarkan oleh kumpulan seperti Gartner, yang anda boleh
untuk mengkaji. Sebaliknya, kami akan menumpukan pada aspek teras mana-mana
ROI atau cadangan nilai lain yang perlu anda pertimbangkan.
Menggunakan ROI
Di luar hujah faedah "keras" berbanding faedah "lembut".
berkaitan dengan usaha BI terdapat isu lain yang perlu dipertimbangkan
apabila kita menggunakan ROI. Sebagai contoh:
Atributkan terlalu banyak penjimatan kepada usaha DW yang akan datang
dalam apa jua keadaan
Katakan syarikat anda berasal dari seni bina
kerangka utama kepada persekitaran UNIX teragih. Jadi mana-mana
penjimatan yang mungkin (atau mungkin tidak) dapat direalisasikan daripada usaha itu
tidak boleh dikaitkan secara eksklusif, jika sama sekali (?), kepada
gudang.
Tidak mengambil kira segala-galanya adalah mahal. Dan terdapat banyak perkara yang perlu dilakukan
mengambil kira. Pertimbangkan senarai berikut:
▪ Kos permulaan, termasuk kebolehlaksanaan.
▪ Kos perkakasan khusus dengan storan berkaitan e
komunikasi
▪ Kos perisian, termasuk pengurusan dati dan sambungan
pelanggan/pelayan, perisian ETL, teknologi DSS, alatan
aplikasi visualisasi, pengaturcaraan dan aliran
perisian kerja dan pemantauan, .
▪ Kos reka bentuk struktur dati, dengan kesedaran, dan
pengoptimuman daripada
▪ Kos pembangunan perisian yang dikaitkan secara langsung dengan usaha tersebut
BI
▪ Kos sokongan rumah, termasuk pengoptimuman
prestasi, termasuk kawalan versi perisian dan
membantu operasi
Gunakan ROI "Big-Bang".
Penciptaan gudang sebagai usaha tunggal dan gergasi
pasti gagal, jadi juga hitung ROI untuk inisiatif
syarikat besar Tawaran itu mengejutkan, dan bahawa pereka
terus membuat percubaan lemah untuk menganggarkan nilai keseluruhannya
usaha.
Kerana pereka cuba memberikan nilai wang
atas inisiatif perniagaan jika diketahui dan diterima secara meluas
Adakah menganggarkan wakil tertentu sukar? Bagaimana mungkin? Bukan
mungkin dengan beberapa pengecualian. jangan buat.
Sekarang kita telah menetapkan perkara yang tidak boleh dilakukan semasa mengira
ROI, terdapat beberapa perkara di sini yang akan membantu kami dalam menentukan
proses yang boleh dipercayai untuk menganggar nilai usaha BI anda.
Mendapat konsensus ROI. Tidak kira anda
pilihan teknik untuk menganggar nilai usaha BI anda, mesti
dipersetujui oleh semua pihak, termasuk pereka projek,
penaja dan eksekutif syarikat.
Kurangkan ROI kepada bahagian yang boleh dikenal pasti. Satu langkah yang perlu ke arah
pengiraan munasabah ROI adalah untuk memfokuskan pengiraan itu pada a
projek tertentu. Ini kemudian membolehkan anda menganggarkan nilai
berdasarkan keperluan perniagaan tertentu yang dipenuhi
Tentukan kos. Seperti yang dinyatakan, banyak kos mesti
dipertimbangkan. Tambahan pula, kos mesti termasuk bukan sahaja kos yang berkaitan
kepada lelaran tunggal tetapi juga kepada kos yang berkaitan
untuk memastikan pematuhan dengan piawaian syarikat.
Tentukan faedah. Memautkan ROI kepada keperluan dengan jelas
perniagaan tertentu, kita seharusnya dapat mengenal pasti
kelebihan yang akan membawa kepada memenuhi keperluan.
Kurangkan kos dan faedah dalam keuntungan yang akan berlaku. Ia adalah caranya
terbaik untuk mendasarkan penilaian anda pada nilai semasa bersih
(NPV) berbanding cubaan meramalkan nilai masa hadapan dalam
pendapatan masa hadapan.
Pastikan masa pembahagian ROI anda pada tahap minimum. DAN'
didokumenkan dengan baik sepanjang tempoh masa yang lama ia telah digunakan dalam milik anda
ROI.
Gunakan lebih daripada satu formula ROI. Terdapat banyak kaedah untuk
ramalan ROI dan anda harus merancang sama ada untuk menggunakan satu atau
ditambah, termasuk nilai kini bersih, halaju dalaman pulangan
(IRR) dan pemulihan.
Tentukan proses yang boleh diulang. Ini penting untuk mengira
sebarang nilai jangka panjang. Ia perlu didokumenkan a
proses tunggal yang boleh diulang untuk semua urutan projek a
ikut.
Masalah yang disenaraikan adalah yang paling biasa ditakrifkan oleh pakar
daripada persekitaran rumah jagaan. Desakan pihak pengurusan
mempunyai ROI "Big-Bang" yang dihantar adalah sangat mengelirukan. Jika anda memulakan semua
pengiraan ROI anda dengan mengurangkannya kepada bahagian yang boleh dikenal pasti dan ketara, anda ada
peluang yang baik untuk menganggarkan penilaian ROI yang tepat.
Soalan mengenai faedah ROI
Apa sahaja faedah anda, lembut atau keras, anda boleh menggunakannya
beberapa soalan asas untuk menentukan nilainya. Kepada
contoh menggunakan sistem penskalaan mudah, dari 1 hingga 10, anda
anda boleh menjejaki kesan sebarang usaha menggunakan perkara berikut
soalan:
▪ Bagaimana anda menilai pemahaman tentang dati mengikuti ini
projek syarikat anda?
▪ Bagaimanakah anda menganggarkan peningkatan proses sebagai hasilnya
projek ini?
▪ Bagaimanakah anda mengukur kesan cerapan dan inferens baharu sekarang
disediakan oleh lelaran ini
▪ Apakah kesan persekitaran komputer baharu e
melaksanakan hasil daripada apa yang telah dipelajari?
Jika jawapan kepada soalan-soalan ini sedikit, mungkin begitu
syarikat tidak berbaloi dengan pelaburan yang dibuat. Soalan dengan tinggi
skor menunjukkan kepada keuntungan nilai yang ketara dan sepatutnya
menjadi panduan untuk siasatan lanjut.
Contohnya, skor tinggi untuk penambahbaikan proses
ia harus membawa pereka bentuk untuk meneliti bagaimana proses itu
telah diperbaiki. Anda mungkin mendapati bahawa sebahagian atau semua keuntungan yang anda perolehi
ia adalah ketara dan oleh itu nilai kewangan boleh diperolehi dengan mudah
digunakan.
Memanfaatkan sepenuhnya daripada lelaran pertama
gudang
Hasil terbesar usaha perniagaan anda selalunya dalam
beberapa lelaran pertama. Usaha pertama ini secara tradisional
mewujudkan kandungan maklumat yang paling berguna untuk orang ramai dan
mewujudkan bantuan asas teknologi untuk yang seterusnya
aplikasi BI.
Biasanya setiap susulan berikutnya daripada dati daripada projek
gudang membawa semakin kurang nilai tambahan kepada syarikat
umum. Ini benar terutamanya jika anda tidak mengulangi
menambah topik baharu atau tidak memenuhi keperluan topik baharu
komuniti pengguna.
Ciri penyimpanan ini juga terpakai pada bateri
berkembang daripada dati ahli sejarah. Memandangkan usaha seterusnya memerlukan lebih
dati dan bagaimana lagi dati dituangkan ke dalam gudang dari semasa ke semasa, kebanyakannya
dati menjadi kurang relevan dengan analisis yang digunakan. Ini dati mereka
sering dipanggil dati tidak aktif dan sentiasa mahal untuk menyimpannya kerana
mereka hampir tidak pernah digunakan.
Apakah maksud ini untuk penaja projek? Pada asasnya, i
Penaja awal lebih banyak berkongsi kos pelaburan.
Ini adalah utama kerana ia adalah pendorong untuk mengasaskan lapisan
persekitaran teknologi yang luas dan sumber gudang,
termasuk organik.
Tetapi langkah pertama ini membawa nilai tertinggi dan oleh itu pereka
projek selalunya perlu mewajarkan pelaburan.
Projek yang dilakukan selepas inisiatif BI anda mungkin mempunyai kos
inferior (berbanding dengan yang pertama) dan langsung, tetapi membawa nilai yang kurang
kepada syarikat.
Dan pemilik organisasi perlu mula mempertimbangkan
membuang pengumpulan dati dan teknologi yang kurang relevan.
Perlombongan Data: Pengekstrakan Dati
Banyak komponen seni bina memerlukan variasi
teknologi dan teknik perlombongan data—
sebagai contoh, "ejen" yang berbeza untuk memeriksa tempat menarik
pelanggan, sistem pengendalian syarikat dan untuk dw itu sendiri. Ini
ejen boleh menjadi rangkaian saraf lanjutan yang dilatih
trend periuk, seperti permintaan produk masa hadapan berdasarkan
promosi jualan; enjin berasaskan peraturan untuk
bertindak balas terhadap satu set dato keadaan, sebagai contoh, diagnosis
cadangan perubatan dan rawatan; atau pun ejen mudah
dengan peranan melaporkan pengecualian kepada pengurus kanan (atas
Eksekutif). Secara umumnya proses pengekstrakan ini dati si
sahkan dalam masa nyata; oleh itu, mereka mesti bersatu
sepenuhnya dengan pergerakan dati diri mereka.
Pemprosesan Analitik Dalam Talian
Analitis Dalam Talian
Keupayaan untuk menghiris, memotong dadu, menggulung, menggerudi ke bawah
dan menjalankan analisis
bagaimana jika, berada dalam skop, objektif suite
teknologi IBM. Contohnya, fungsi pemprosesan analisis
dalam talian (OLAP) wujud untuk DB2 yang membawa analisis dimensi ke dalam
enjin daripada pangkalan data sama .
Fungsi menambah utiliti dimensi pada SQL sambil
mereka mengambil kesempatan daripada semua faedah menjadi sebahagian semula jadi DB2. Satu lagi
contoh integrasi OLAP ialah alat pengekstrakan, DB2
Penganalisis Pelayan OLAP. Teknologi ini membolehkan kiub
Pelayan DB2 OLAP menjadi cepat dan automatik
dianalisis untuk mengenal pasti dan melaporkan nilai-nilai dati luar biasa atau tidak dijangka
sepanjang kiub kepada penganalisis perniagaan. Dan akhirnya, fungsi
DW Center menyediakan cara untuk arkitek menyemak, antara
perkara lain, profil kiub pelayan DB2 OLAP sebagai sebahagian
sifat semula jadi proses ETL.
Analisis Spatial Analisis Spatial
Ruang mewakili separuh daripada sauh analitikal (lead).
diperlukan untuk panorama
luas analitikal (masa mewakili separuh lagi). Tahap atom
(tahap atom ) gudang, ditunjukkan dalam Rajah 1.1,
termasuk asas untuk masa dan ruang. Rakaman
Analisis jangka masa untuk maklumat masa dan alamat
analisis sauh dari angkasa. Cap masa
mereka menjalankan analisis tepat pada masanya, dan maklumat hala tuju memimpin
analisis mengikut ruang. Rajah menunjukkan proses geokod
menukar alamat kepada titik pada peta atau titik di angkasa
supaya konsep seperti jarak dan dalam/luar boleh
digunakan dalam analisis-dijalankan pada peringkat atom dan analisis spatial
yang disediakan kepada penganalisis. IBM menyediakan sambungan
angkasa lepas, dibangunkan dengan Institut Penyelidikan Sistem Alam Sekitar (ESRI),
al pangkalan data DB2 supaya objek angkasa boleh
disimpan sebagai bahagian biasa daripada pangkalan data perhubungan. DB2
Spatial Extenders, juga menyediakan semua sambungan SQL untuk
mengeksploitasi analisis spatial. Sebagai contoh, sambungan SQL daripada
soalan tentang
jarak antara alamat atau sama ada titik berada di dalam atau di luar kawasan
poligon yang ditakrifkan, ialah piawaian analitikal dengan Spatial
Extenders. Lihat bab 16 untuk maklumat lanjut.
Pangkalan Data-Alat Alat Penduduk Pangkalan Data-
Penghuni
DB2 mempunyai banyak ciri SQL pemastautin BI yang membantu
dalam tindakan analisis. Ini termasuk:
▪ Rekursi berfungsi untuk melakukan analisis, seperti “cari
semua laluan penerbangan yang mungkin dari San Francisco a New York".
▪ Fungsi analisis untuk pemeringkatan, fungsi kumulatif, kubus
dan rollup untuk memudahkan tugasan yang biasa berlaku
hanya dengan teknologi OLAP, mereka kini menjadi sebahagian semula jadi
enjin daripada pangkalan data
▪ Keupayaan untuk mencipta jadual yang mengandungi hasil
Penjual daripada pangkalan data pemimpin bercampur lebih daripada keupayaan BI
dalam pangkalan data sama.
Pembekal utama bagi pangkalan data mereka bercampur lebih daripada
fungsi BI dalam pangkalan data sama.
Ini memberikan prestasi yang lebih baik dan lebih banyak pilihan larian untuk anda
penyelesaian BI.
Ciri dan fungsi DB2 V8 dibincangkan
secara terperinci dalam bab-bab berikut:
Seni Bina Teknikal dan Asas Pengurusan Data
(Bab 5)
▪ Asas BI DB2 (Bab 6)
▪ Jadual Pertanyaan Terwujud DB2
Jadual) (Bab 7)
▪ Fungsi OLAP DB2 (Bab 13)
▪ Ciri dan fungsi BI Dipertingkat DB2 (BI Dipertingkatkan
Ciri dan Fungsi) (Bab 15)
Sistem Penyampaian Data Ringkas
Sistem penyampaian daripada dati dipermudahkan
Seni bina yang digambarkan dalam Rajah 1.1 merangkumi banyak
struktur dati fizikal. Satu ialah gudang dati operasi.
Secara amnya, ODS adalah berorientasikan objek,
bersepadu dan semasa. Adakah anda akan membina ODS untuk menyokong, mis
contohnya, pejabat jualan. Jualan ODS akan menambah dati
datang daripada pelbagai sistem yang berbeza tetapi hanya akan mengekalkan, mis
contoh, urus niaga hari ini. ODS boleh dikemas kini
walaupun banyak kali sehari. Pada masa yang sama, proses
mereka menolak dati diintegrasikan ke dalam aplikasi lain. Struktur ini adalah
direka khusus untuk mengintegrasikan dati semasa dan dinamik e
akan menjadi calon yang mungkin menyokong analisis masa nyata,
bagaimana untuk menyediakan ejen perkhidmatan pelanggan maklumat jualan
trend semasa pelanggan dengan mengekstrak maklumat trend jualan
dari gudang itu sendiri. Satu lagi struktur yang ditunjukkan dalam Rajah 1.1 ialah
status rasmi untuk dw. Bukan sahaja ini tempat untuk
pelaksanaan integrasi yang diperlukan, kualiti datiDan
daripada transformasi dati stok akan datang tidak lama lagi, tetapi ia juga
kawasan simpanan yang boleh dipercayai dan sementara untuk dati balas itu
boleh digunakan dalam analisis masa nyata. Jika anda memutuskan untuk
gunakan ODS atau kawasan pementasan, satu
alat terbaik untuk mengisi struktur ini dati menggunakan
sumber operasi yang berbeza ialah pertanyaan teragih heterogen DB2.
Keupayaan ini disediakan oleh ciri pilihan DB2
dipanggil DB2 Relational Connect (pertanyaan sahaja) dan melalui DB2
DataJoiner (produk berasingan yang menyampaikan aplikasi,
sisipan, pengemaskinian dan kemungkinan pemadaman a
RDBMS teragih heterogen).
Teknologi ini membolehkan arkitek untuk dati untuk mengikat dati di
pengeluaran dengan proses analisis. Bukan sahaja teknologi boleh
menyesuaikan diri dengan hampir mana-mana permintaan replikasi itu
mereka mungkin muncul dengan analisis masa nyata, tetapi ia
Mereka juga boleh menyambung ke pelbagai pangkalan dati lebih
popular, termasuk DB2, Oracle, Sybase, SQL Server,
Informix dan lain-lain. DB2 DataJoiner boleh digunakan untuk mengisi
sesuatu struktur dati formal seperti ODS atau meja
diwakili secara kekal di gudang yang direka untuk pemulihan
cepat untuk kemas kini segera atau untuk dijual. Sememangnya,
struktur yang sama ini dati boleh dihuni menggunakan
satu lagi teknologi penting yang direka untuk replikasi dati, IBM
DataPropagator Relational. (DataPropagator ialah produk yang berasingan
untuk sistem pusat. DB2 UNIX, Linux, Windows dan OS/2 termasuk
perkhidmatan replikasi dati sebagai ciri standard).
Kaedah lain untuk bergerak dati beroperasi di sekeliling
kepada perusahaan ialah penyepadu aplikasi perusahaan sebaliknya
dikenali sebagai broker mesej.Ini
Teknologi unik membolehkan kawalan tiada tandingan untuk pemusatan
(sasaran) dan bergerak dati sekitar syarikat. IBM mempunyai pengantara
daripada mesej yang paling banyak digunakan, MQSeries, atau variasi
produk yang merangkumi keperluan bagi e-dagang, IBM
WebSphere MQ.
Untuk perbincangan lanjut tentang cara memanfaatkan MQ untuk menyokong a
gudang dan persekitaran BI, lawati laman web daripada buku itu. Buat masa ini, ia adalah
cukuplah untuk mengatakan bahawa teknologi ini adalah cara yang sangat baik untuk
tangkap dan ubah (menggunakan MQSeries Integrator) dati
pengendali berpusat (sasaran) yang diambil untuk penyelesaian BI. di sana
Teknologi MQ telah disepadukan dan dibungkus ke dalam UDB V8, yang
bermakna baris gilir mesej kini boleh diuruskan
seolah-olah ia adalah jadual DB2. Konsep kimpalan daripada
mesej beratur dan alam semesta pangkalan data hubungan diarahkan
ke arah persekitaran penyampaian yang berkuasa dati.
Kependaman Sifar-Latensi Sifar
Matlamat strategik utama untuk IBM ialah analisis kependaman sifar (sifar).
Seperti yang ditakrifkan oleh
Gartner, sistem BI mesti boleh membuat kesimpulan, berasimilasi
dan menyediakan maklumat untuk penganalisis atas permintaan. Cabaran,
sudah tentu, ia adalah dalam cara mencampurkan dati semasa dan dalam masa nyata
dengan maklumat sejarah yang diperlukan, seperti i dati model yang berkaitan.
kecenderungan, atau pemahaman yang diekstrak, sebagai delineasi daripada
pelanggan
Maklumat sedemikian termasuk, sebagai contoh, pengenalan pelanggan ad
berisiko tinggi atau rendah atau produk mana i pelanggan mereka akan membeli banyak
mungkin jika mereka sudah mempunyai keju dalam troli mereka
pemerolehan.
Mendapat kependaman sifar sebenarnya bergantung kepada dua
mekanisme asas:
▪ Kesatuan lengkap dati yang dianalisis dengan
teknik dan alat yang telah ditetapkan yang dicipta oleh BI
▪ Sistem penyampaian bagi dati cekap untuk memastikannya
analisis masa nyata benar-benar tersedia
Prasyarat untuk kependaman sifar ini tidak berbeza daripada keduanya
objektif yang ditetapkan oleh IBM dan diterangkan di atas.
Perkawinan rapat daripada dati adalah sebahagian daripada program tersebut
integrasi lancar yang diatur oleh IBM. Dan buat sistem
penghantaran daripada dati cekap bergantung sepenuhnya kepada
teknologi yang ada yang memudahkan proses penyampaian
dati. Akibatnya, dua daripada tiga matlamat IBM adalah kritikal
untuk membuat yang ketiga. IBM sedang membangunkan sendiri secara sedar
teknologi untuk memastikan kependaman sifar adalah realiti untuk pengguna
usaha gudang.
Ringkasan / Sintesis
Organisasi BI menyediakan peta jalan untuk
cipta persekitaran anda
secara berulang. Ia mesti diselaraskan untuk mencerminkan keperluan
perniagaan anda, semasa dan masa hadapan. Tanpa visi seni bina
luas, ulangan gudang adalah lebih sedikit daripada
pelaksanaan gudang pusat rawak yang tidak banyak membantu
mewujudkan perusahaan yang luas dan bermaklumat.
Halangan pertama bagi pengurus projek ialah bagaimana untuk mewajarkan
pelaburan yang diperlukan untuk pembangunan organisasi BI.
Walaupun pengiraan ROI kekal sebagai sokongan utama
pencapaian gudang, ia menjadi lebih sukar untuk
meramal dengan tepat. Ini telah membawa kepada kaedah lain untuk
menentukan sama ada anda mendapat nilai wang anda. The
nilai atas pelaburan2 (VOI), sebagai contoh, diperoleh
sebagai penyelesaian.
Ia adalah tanggungjawab arkitek dati dan perancang projek
sengaja menjana dan memberi maklumat kepada persatuan
pengguna dan bukan sekadar menyediakan perkhidmatan kepada mereka dati. Ada
perbezaan besar antara keduanya. Maklumat adalah sesuatu yang dilakukan oleh seseorang
perbezaan dalam proses membuat keputusan dan keberkesanan; secara relatif, i
dati mereka membina blok untuk mendapatkan maklumat itu.
Walaupun saya mengkritik sumbernya dati untuk menangani permintaan
komersil, persekitaran BI harus memainkan peranan yang lebih besar
dalam penciptaan kandungan maklumat. Kita kena ambil
langkah tambahan untuk membersihkan, menyepadukan, mengubah atau
sebaliknya mencipta kandungan maklumat mengikut mana yang
pengguna boleh mengambil tindakan, jadi kita perlu memastikan bahawa mereka
tindakan dan keputusan, jika munasabah, disokong
dalam persekitaran BI. Jika kita relegate gudang untuk berkhidmat sahaja dati,
ia dijamin bahawa persatuan pengguna akan mencipta kandungan
maklumat yang diperlukan untuk mengambil tindakan. Ini memastikan bahawa mereka
komuniti akan dapat membuat keputusan yang lebih baik, tetapi perusahaan
mengalami kekurangan pengetahuan yang telah mereka gunakan.
Data bahawa arkitek dan perancang projek memulakan projek
khusus dalam persekitaran BI, mereka tetap bertanggungjawab kepada perusahaan
oleh dan besar. Contoh mudah bagi dua ciri ini
muka lelaran BI ditemui dalam sumber dati. Semua
dati diterima untuk permintaan komersial tertentu mestilah
dihuni dalam lapisan atom pertama. Ini memastikan pembangunan
aset maklumat korporat, serta mengurus, mengarahkan
Permintaan khusus pengguna yang ditakrifkan dalam lelaran.

W hatisa D ata W arehouse ?
Gudang data ia adalah nadi seni bina sistem maklumat
sejak 1990 dan menyokong proses maklumat dengan menawarkan pepejal
platform bersepadu dati ahli sejarah diambil sebagai asas untuk yang seterusnya
analisis. THE gudang data menawarkan kemudahan integrasi ke dalam a
dunia sistem aplikasi yang tidak serasi antara satu sama lain. Tarikh
gudang telah berkembang menjadi trend. Gudang data
menyusun dan menyimpan i dati diperlukan untuk proses maklumat e
analitikal berdasarkan perspektif temporal sejarah yang panjang. Semua
ini melibatkan komitmen yang besar dan berterusan terhadap pembinaan dan
dalam penyelenggaraan gudang data.
Jadi apa itu a gudang data? A gudang data Dan:
▪ berorientasikan subjek
▪ sistem bersepadu
▪ masa variasi
▪ tidak meruap (tidak boleh dipadamkan)
koleksi daripada dati digunakan untuk menyokong keputusan pengurusan dalam
pelaksanaan proses.
I dati dimasukkan ke dalam gudang data timbul dalam kebanyakan
kes daripada persekitaran operasi. The gudang data ia dibuat oleh seorang
unit storan, dipisahkan secara fizikal daripada yang lain
sistem, yang mengandungi dati sebelum ini diubah oleh
aplikasi yang beroperasi pada maklumat yang diperoleh daripada persekitaran
operasi.
Definisi literal a gudang data patut dikaji secara mendalam
penjelasan kerana terdapat motivasi dan maksud penting bagi
latar belakang yang menerangkan ciri-ciri sebuah gudang.
ORIENTASI ORIENTASI SUBJEK
TEMATIK
Ciri pertama a gudang data ialah ia berorientasikan kepada
pemain utama dalam sesebuah syarikat. Panduan ujian melalui
dati ia berbeza dengan kaedah yang lebih klasik yang disediakannya
orientasi aplikasi terhadap proses dan fungsi,
kaedah yang kebanyakannya dikongsi oleh kebanyakan orang
sistem pengurusan lama.
Dunia operasi direka bentuk berdasarkan aplikasi dan fungsi
seperti pinjaman, simpanan, kad bank dan amanah bagi sesebuah institusi
kewangan. Dunia dw disusun mengikut subjek
prinsipal seperti pelanggan, penjual, produk dan perniagaan.
Penjajaran sekitar topik mempengaruhi reka bentuk dan
atas merealisasikan dati terdapat dalam dw. Yang lebih penting,
topik utama mempengaruhi bahagian terpenting dalam
struktur utama.
Dunia aplikasi dipengaruhi oleh kedua-dua reka bentuk data
berdasarkan reka bentuk proses. Dunia daripada
dw tertumpu secara eksklusif pada pemodelan dati Ia dihidupkan
lukisan daripada pangkalan data. Reka bentuk proses (dalam bentuknya
klasik) bukan sebahagian daripada persekitaran dw.
Perbezaan antara pilihan proses/fungsi dan aplikasi
pilihan mengikut subjek juga didedahkan sebagai perbezaan kandungan
daripada dati pada tahap terperinci. THE dati daripada dw tidak termasuk i dati yang
tidak akan digunakan untuk proses DSS semasa permohonan
berorientasikan operasi dati mengandungi i dati untuk memuaskan
segera keperluan fungsian/pemprosesan yang boleh o
kurang mempunyai sebarang kegunaan untuk penganalisis DSS.
Satu lagi cara penting dalam aplikasi berorientasikan operasi
ai dati berbeza daripada dati daripada dw ada dalam laporan dei dati. The dati
operasi mengekalkan hubungan berterusan antara dua atau lebih jadual
berdasarkan peraturan perniagaan yang aktif. THE dati oleh dw
ia merangkumi spektrum masa dan perhubungan yang terdapat dalam dw ialah
ramai. Banyak peraturan perdagangan (dan sejajar dengan itu, banyak
laporan daripada dati ) diwakili dalam gudang dati antara dua o
berbilang jadual.
(Untuk penjelasan terperinci tentang bagaimana hubungan antara dati mereka
dikendalikan dalam DW, kami merujuk kepada Topik Teknologi mengenainya
soalan.)
Tiada perspektif lain selain daripada perbezaan
asas antara pilihan aplikasi berfungsi/proses dan
pilihan subjek, terdapat perbezaan yang lebih besar antara sistem
operasi ei dati dan DW.
INTEGRASI INTEGRASI
Aspek yang paling penting dalam persekitaran dw ialah i dati dijumpai
dalam dw mereka mudah disepadukan. SENTIASA. TANPA
PENGECUALIAN. Intipati persekitaran dw ialah i dati
terkandung dalam had gudang disepadukan.
Integrasi mendedahkan dirinya dalam pelbagai cara - dalam konvensyen
dikenal pasti konsisten, dalam pengukuran pembolehubah konsisten, dalam
struktur terkod yang terdiri, dalam sifat fizikal dati
konsisten, dan sebagainya.
Selama bertahun-tahun pereka bentuk pelbagai aplikasi telah melakukannya
memiliki banyak keputusan tentang bagaimana permohonan harus
dibangunkan. Keputusan gaya dan reka bentuk individu
aplikasi pereka bentuk mendedahkan diri mereka dalam seratus cara: dalam
perbezaan pengekodan, struktur utama, ciri fizikal,
pengenalan konvensyen, dan sebagainya. Kapasiti kolektif ramai
Pereka bentuk aplikasi mencipta aplikasi yang tidak konsisten
ia adalah legenda. Rajah 3 memaparkan beberapa lagi perbezaan
penting dalam cara aplikasi direka bentuk.
Pengekodan: Pengekodan:
Pereka aplikasi memilih pengekodan medan -
seks- dengan cara yang berbeza. Seorang pereka mewakili seks sebagai
satu “m” dan “f”. Pereka lain mewakili seks sebagai "1"
dan "0". Pereka lain mewakili seks sebagai "x" dan
“y”. Pereka lain mewakili seks sebagai "lelaki" dan
"perempuan". Tidak kira bagaimana jantina masuk ke dalam DW. Mereka"
dan "F" mungkin sama baiknya dengan semua
perwakilan.
Apa yang penting ialah dari mana pun asal usul bidang seks,
medan itu tiba di DW dalam keadaan bersepadu yang konsisten. daripada
akibat apabila medan dimuatkan ke dalam DW dari
aplikasi yang telah diwakili dalam format
“M” dan “F”, i dati mesti ditukar kepada format DW.
Pengukuran Atribut: Pengukuran
Atribut:
Pereka bentuk aplikasi memilih untuk mengukur saluran paip
pelbagai cara dalam kursus
Beberapa tahun. Seorang pereka menyimpan dati daripada saluran paip dalam
sentimeter. Pereka bentuk aplikasi lain menyimpan dati
saluran paip dari segi inci. Seorang lagi pereka
kedai aplikasi i dati saluran paip dalam juta kaki padu
sesaat. Dan pereka lain menyimpan maklumat
saluran paip dari segi ela. Walau apa pun sumbernya, apabila
maklumat saluran paip tiba di DW ia mesti
diukur dengan cara yang sama.
Menurut petunjuk dalam rajah 3, isu integrasi
ia mempengaruhi hampir setiap aspek projek – ciri
tuhan fizikal dati, dilema mempunyai lebih daripada satu sumber dati, yang
isu sampel yang dikenal pasti tidak konsisten, format bagi dati
tidak konsisten, dan sebagainya.
Walau apa pun topik reka bentuk, hasilnya adalah sama -
i dati mesti disimpan dalam DW dalam bentuk tunggal e
cara yang boleh diterima secara global walaupun sistem pengendalian daripada
bawah mereka menyimpan secara berbeza i dati.
Apabila penganalisis DSS melihat DW, objektif penganalisis
ia sepatutnya menjadi eksploitasi dati yang ada di dalam gudang,
daripada tertanya-tanya tentang kredibiliti atau konsistensi
dati.
VARIANSI MASA
Semua i dati dalam DW mereka tepat pada satu ketika.
Ciri asas ini dati dalam DW ia sangat berbeza daripada yang dati
terdapat dalam persekitaran operasi. THE dati daripada persekitaran operasi ialah
tepat seperti pada saat akses. Dalam kata lain,
dalam persekitaran operasi apabila pemacu diakses dati, ya
tunggu sehingga ia mencerminkan nilai yang tepat seperti pada masa akses.
Kerana saya dati dalam DW adalah tepat seperti pada satu ketika dalam
masa (iaitu, bukan "sekarang"), dikatakan bahawa i dati terdapat dalam DW
ia adalah "perbezaan masa".
Varian masa bagi dati oleh DW dirujuk dalam pelbagai cara.
Cara paling mudah ialah i dati daripada wakil DW dati ianya adalah
jangka masa panjang - lima hingga sepuluh tahun. Cakrawala
jangka masa yang diwakili untuk persekitaran operasi adalah lebih pendek
▪ daripada nilai semasa hari ini daripada sehingga enam puluh sembilan puluh
Aplikasi yang perlu berfungsi dengan baik dan perlu
tersedia untuk pemprosesan transaksi mesti membawa
kuantiti minimum dati jika mereka mengakui apa-apa darjah
fleksibiliti. Jadi aplikasi operasi mempunyai ufuk
skala masa yang singkat, sebagai topik reka bentuk
aplikasi audio.
Cara kedua 'varian masa' muncul dalam DW adalah dalam
struktur utama. Setiap struktur utama dalam DW mengandungi,
secara tersirat atau tersurat, unsur masa, seperti
hari, minggu, bulan dan sebagainya. Unsur masa hampir selalu ada
di bahagian bawah kunci bercantum yang terdapat dalam DW. Dalam ini
masa, unsur masa akan wujud secara tersirat, seperti peluang
di mana keseluruhan fail diduplikasi pada akhir bulan atau suku tahun.
Cara ketiga varians masa dipaparkan ialah i dati yang
DW, sebaik sahaja didaftarkan dengan betul, tidak boleh
dikemas kini. THE dati DW adalah, untuk semua tujuan praktikal, panjang
siri syot kilat. Sudah tentu jika gambar itu
telah diambil secara salah, maka syot kilat mungkin
diubahsuai. Tetapi dengan mengandaikan syot kilat diambil
dengan betul, ia tidak diubah suai sebaik sahaja ia dibuat. Di sesetengah
kes ia mungkin tidak beretika atau bahkan tidak sah bahawa syot kilat dalam
DW diubah suai. THE dati beroperasi, tepat seperti dalam
masa log masuk, mereka boleh dikemas kini apabila ia datang
keperluan.
TIDAK MENURUN
Ciri penting keempat DW ialah ia tidak meruap.
Kemas kini, sisipan, pemadaman dan pengubahsuaian dibuat
secara berkala untuk persekitaran operasi rekod demi rekod. Tetapi
manipulasi asas dati yang diperlukan dalam DW adalah lebih banyak lagi
ringkas. Terdapat hanya dua jenis operasi yang berlaku dalam
DW – pemuatan awal bagi dati dan akses kepada dati. Tidak ada
tiada kemas kini dati (dalam erti kata umum
kemas kini) dalam DW sebagai operasi pemprosesan biasa.
Terdapat beberapa akibat yang sangat kuat dari perbezaan ini
asas antara pemprosesan operasi dan pemprosesan DW. Di peringkat
mengikut reka bentuk, keperluan untuk berhati-hati tentang peningkatan
tidak normal bukan faktor dalam DW, sejak kemas kini dati bukan
dijalankan. Ini bermakna pada peringkat reka bentuk fizikal,
kebebasan boleh diambil untuk mengoptimumkan akses kepada dati,
khususnya dalam menangani topik penyeragaman dan
denormalisasi fizikal. Satu lagi akibat kesederhanaan
operasi DW adalah dalam teknologi asas yang digunakan untuk
menjalankan persekitaran DW. Perlu menyokong kemas kini
rekod mengikut rekod sebaris (seperti yang sering berlaku dengan
pemprosesan operasi) teknologi diperlukan untuk mempunyai beberapa
asas yang sangat kompleks di bawah kesederhanaan yang jelas.
Teknologi yang menyokong sandaran dan pemulihan, transaksi
dan integriti dati dan pengesanan dan pembetulan keadaan kebuntuan adalah
agak kompleks dan tidak perlu untuk pemprosesan DW.
Ciri-ciri DW, orientasi reka bentuk,
integrasi daripada dati dalam DW, varians masa dan kesederhanaan
daripada pengurusan dati, semuanya membawa kepada persekitaran yang sangat-sangat
berbeza daripada persekitaran operasi klasik. Sumber hampir semua
dati DW ialah persekitaran operasi. Ia menggoda untuk berfikir
bahawa terdapat lebihan besar-besaran dati antara dua persekitaran.
Malah, tanggapan pertama yang ada pada ramai orang ialah
lebihan besar daripada dati antara persekitaran operasi dan persekitaran bagi
DW. Tafsiran sedemikian adalah dangkal dan menunjukkan satu
kurang memahami apa yang berlaku dalam DW.
Malah terdapat minimum redundansi dati antara persekitaran operasi
dan daripada dati daripada DW. Mari kita pertimbangkan perkara berikut:
▪ Saya dati mereka ditapis dato yang berlalu dari persekitaran operasi
kepada persekitaran DW. banyak dati mereka tidak pernah lalu di luar
daripada persekitaran operasi. Kecuali i dati yang perlu untuk
Pemprosesan DSS mencari arah mereka dalam persekitaran
▪ ufuk masa bagi dati ia sangat berbeza dengan persekitaran
kepada yang lain. THE dati dalam persekitaran operasi mereka sangat segar. THE dati
dalam DW mereka jauh lebih tua. Hanya dari perspektif
bagi ufuk masa, terdapat sangat sedikit pertindihan
antara persekitaran operasi dan DW.
▪ DW mengandungi dati ringkasan yang tidak pernah ditemui
dalam persekitaran
▪ Saya dati menjalani transformasi asas daripada
saat mereka beralih ke Rajah 3 menggambarkan bahawa kebanyakan
sebahagian daripada dati berubah dengan ketara dalam keadaan
untuk dipilih dan dipindahkan ke DW. Dengan kata lain, yang
kebanyakan daripada dati diubah suai secara fizikal dan
secara radikal bagaimana ia dipindahkan ke DW. Dari sudut pandangan
integrasi tidak sama dati yang menetap
dalam persekitaran operasi.
Berdasarkan faktor ini, redundansi daripada dati antara dua persekitaran ialah
peristiwa yang jarang berlaku, membawa kepada kurang daripada 1% lebihan antara kedua-duanya
persekitaran.
STRUKTUR GUDANG
DW mempunyai struktur yang berbeza. Terdapat pelbagai peringkat ringkasan dan
butiran yang membezakan DW.
Pelbagai komponen DW ialah:
▪ Metadata
Dati butiran semasa
Dati daripada butiran lama
Dati diringkaskan sedikit
Dati sangat diringkaskan
Setakat ini kebimbangan utama adalah untuk dati terperinci
arus. Ia adalah kebimbangan utama kerana:
▪ Saya dati butiran semasa mencerminkan peristiwa terkini,
yang sentiasa menarik minat dan
▪ i dati butiran semasa adalah besar kerana ia adalah
disimpan pada tahap kebutiran yang paling rendah e
▪ i dati Butiran semasa hampir selalu disimpan
storan cakera, yang cepat untuk diakses, tetapi mahal dan
kompleks daripada
I dati terperinci semakin tua mereka dati yang disimpan pada
beberapa kenangan massa. Ia mempunyai akses secara sporadis dan adalah
disimpan pada tahap perincian yang serasi dengan dati terperinci
arus. Walaupun tidak wajib disimpan pada medium
penyimpanan alternatif, disebabkan oleh jumlah besar dati bersatu dengan
akses sporadis bagi dati, sokongan ingatan untuk dati di
Butiran lama biasanya tidak disimpan pada cakera.
I dati diringkaskan sedikit ialah dati yang disuling dari bawah
tahap perincian yang terdapat pada tahap perincian semasa. ini
Tahap DW hampir selalu disimpan pada storan cakera. THE
masalah reka bentuk yang timbul untuk arkitek dati
dalam pembinaan tahap DW ini ialah:
▪ Apakah unit masa ringkasan yang dibuat di atas
▪ Kandungan mana, atribut akan meringkaskan sedikit
kandungan daripada dati
Peringkat seterusnya dati yang terdapat dalam DW ialah daripada dati altamente
ringkasan. THE dati sangat diringkaskan adalah padat dan mudah
boleh diakses. THE dati sangat diringkaskan kadangkala dijumpai
dalam persekitaran DW dan dalam kes lain i dati sangat diringkaskan adalah
ditemui di luar dinding terdekat teknologi yang menempatkan DW.
(dalam apa jua keadaan, i dati sangat diringkaskan adalah sebahagian daripada DW
tidak kira di mana i dati ditempatkan secara fizikal).
Komponen akhir DW ialah metadata. Dalam banyak hal
metadata terletak dalam dimensi yang berbeza daripada yang lain dati
DW, kerana metadata tidak mengandungi sebarang dato terus
diambil dari persekitaran operasi. Metadata mempunyai peranan khas e
sangat penting dalam DW. Metadata digunakan sebagai:
▪ direktori untuk membantu penganalisis DSS mencari
kandungan DW,
▪ panduan untuk memetakan dati bagaimana saya dati sudah
berubah daripada persekitaran operasi kepada persekitaran DW,
▪ panduan kepada algoritma yang digunakan untuk meringkaskan antara dati di
butiran semasa ei dati diringkaskan sedikit, i dati altamente
ringkasan,
Metadata memainkan peranan yang lebih besar dalam persekitaran DW
daripada yang pernah mereka alami dalam persekitaran operasi
MEDIUM PENYIMPANAN BUTIRAN LAMA
Pita magnet boleh digunakan untuk menyimpan jenis itu
dati. Sebenarnya terdapat pelbagai jenis alat penyimpanan yang
mereka harus dipertimbangkan untuk pemeliharaan yang lama dati di
perincian.
Bergantung kepada isipadu dati, kekerapan akses, kos
alat dan jenis akses, kemungkinan besar
bahawa alat lain memerlukan tahap perincian lama
dalam DW.
ALIRAN DATA
Terdapat aliran normal dan boleh diramalkan dati di dalam DW.
I dati mereka memasuki DW dari persekitaran operasi. (NOTA: ada
beberapa pengecualian yang sangat menarik untuk peraturan ini. Walau bagaimanapun, hampir
semua dati masukkan DW dari persekitaran operasi). Data bahawa saya dati
mereka memasuki DW dari persekitaran operasi, ia berubah seperti yang telah berlaku
diterangkan sebelum ini. Dengan syarat memasuki DW, i dati mereka memasuki
tahap perincian semasa, seperti yang ditunjukkan. Ia tinggal di sana dan digunakan
sehingga satu daripada tiga peristiwa berlaku:
▪ disucikan,
▪ diringkaskan, dan/atau
▪ ialah
Proses usang di dalam DW bergerak i dati butiran semasa
a dati butiran lama, berdasarkan umur dati. Prosesnya
ringkasan menggunakan butiran daripada dati untuk mengira i dati
ringkasan sedikit dan tahap diringkaskan tinggi bagi dati. Disana ada
beberapa pengecualian kepada aliran yang ditunjukkan (akan dibincangkan kemudian).
Walau bagaimanapun, biasanya, untuk sebahagian besar dati dijumpai
dalam DW, aliran daripada dati ia adalah seperti yang digambarkan.
MENGGUNAKAN DATAWAREHOUSE
Tidak hairanlah pelbagai peringkat dati dalam DW tidak
menerima tahap penggunaan yang berbeza. Sebagai peraturan, semakin tinggi tahap
ringkasan, tambah i dati mereka digunakan.
Banyak kegunaan berlaku dalam dati sangat diringkaskan, manakala yang lama
dati perincian hampir tidak pernah digunakan. Terdapat sebab yang baik dalam
menggerakkan organisasi kepada paradigma penggunaan sumber. Lebih banyak yang dia ada
rumusan i dati, lebih cepat dan lebih cekap untuk sampai ke dati. Jika
un kedai mendapati ia melakukan banyak pemprosesan pada tahap perincian DW,
kemudian sejumlah besar sumber mesin yang sepadan
dimakan. Ia adalah demi kepentingan semua orang untuk mendakwa
seperti dalam tahap rumusan yang tinggi secepat mungkin.
Bagi kebanyakan kedai, penganalisis DSS dalam persekitaran pra-DW telah menggunakan
dati pada tahap perincian. Dalam banyak hal ketibaan di dati terperinci
ia menyerupai selimut keselamatan, walaupun ia tersedia
peringkat ringkasan yang lain. Salah satu aktiviti arkitek dati è
menghentikan pengguna DSS daripada penggunaan berterusan dati di peringkat tertinggi
perincian rendah. Terdapat dua sebab yang tersedia
daripada arkitek dati:
▪ memasang sistem caj balik, di mana pengguna akhir membayar
sumber yang digunakan e
▪ yang menunjukkan bahawa masa tindak balas boleh menjadi sangat baik
diperoleh apabila tingkah laku dengan i dati ia berada pada tahap yang tinggi
ringkasan, manakala masa tindak balas yang lemah datang daripada
tingkah laku daripada dati pada tahap yang rendah
PERHIMPUNAN LAIN
Terdapat beberapa pertimbangan pembinaan dan pengurusan lain
DW.
Pertimbangan pertama ialah indeks. THE dati pada tahap tertinggi
ringkasan boleh diindeks secara bebas, manakala i dati
pada tahap perincian yang lebih rendah ia adalah sebulu yang boleh
diindeks secara berjimat. Daripada token yang sama, i dati pada tahap yang tinggi
perincian boleh diubahsuai dengan mudah,
manakala isipadu dati di peringkat bawah ia adalah sangat besar sehingga i dati tidak
mereka boleh diubah suai dengan mudah. Sehubungan itu, model
daripada dati dan kerja formal yang dilakukan oleh reka bentuk menimbulkan
asas untuk DW digunakan hampir secara eksklusif pada tahap
terperinci semasa. Dengan kata lain, aktiviti pemodelan bagi
dati ia tidak digunakan pada tahap ringkasan, dalam hampir setiap kes.
Satu lagi pertimbangan struktur ialah pembahagian
dati oleh DW.
Pembahagian boleh dilakukan pada dua peringkat – pada tahap dbms dan al
peringkat permohonan. Dalam bahagian di peringkat dbms, yang dbms è
dimaklumkan mengenai bahagian dan memantaunya dengan sewajarnya. Dalam kes
bahagian di peringkat aplikasi, hanya pengaturcara sahaja
dimaklumkan tentang bahagian dan tanggungjawab mereka
pentadbiran diserahkan kepadanya
Di bawah paras dbms, banyak kerja dilakukan secara automatik. Terdapat
banyak ketidakfleksibelan yang berkaitan dengan pentadbiran automatik
bahagian. Dalam kes pembahagian di peringkat permohonan dati yang
gudang data, banyak kerja membebankan pengaturcara, tetapi
keputusan akhir ialah fleksibiliti dalam pentadbiran dati dalam tarikh
gudang
ANOMALI LAIN
Manakala komponen dalam gudang data Mereka bekerja seperti yang diterangkan
untuk hampir semua dati, terdapat beberapa pengecualian berguna yang mesti
dibincangkan. Pengecualian adalah daripada dati ringkasan awam
(data ringkasan awam). Ini adalah dati ringkasan yang
dikira daripada gudang data tetapi ia digunakan oleh masyarakat. THE dati
Ringkasan awam disimpan dan diuruskan dalam gudang data,
walaupun seperti yang dinyatakan sebelum ini mereka dikira keluar. THE
akauntan bekerja untuk menghasilkan ini setiap suku tahun dati sebagai
pendapatan, perbelanjaan suku tahunan, keuntungan suku tahunan, dan sebagainya. Kerja
dilakukan oleh akauntan adalah luaran kepada gudang data. Walau bagaimanapun, i dati mereka
digunakan "secara dalaman" dalam syarikat - daripada pemasaran, jualan, dsb.
Satu lagi anomali, yang tidak akan dibincangkan, ialah dati luaran.
Satu lagi jenis yang luar biasa dati yang boleh didapati dalam sesuatu yang diberikan
gudang ialah data butiran kekal. Ini menyebabkan
perlu menyimpan secara kekal i dati pada satu tahap
terperinci atas sebab etika atau undang-undang. Jika syarikat mempamerkan i
pekerja berkaitan dengan bahan berbahaya ada keperluan untuk dati
terperinci dan kekal. Jika syarikat mengeluarkan produk yang
melibatkan keselamatan awam, apa bahagian kapal terbang, yang ada
keperluan untuk dati tetap terperinci, serta jika sebuah syarikat
memasuki kontrak berbahaya.
Masyarakat tidak mampu untuk mengabaikan butiran kerana
dalam beberapa tahun akan datang, sekiranya berlaku tuntutan mahkamah, panggilan balik, a
kecacatan pembinaan yang dipertikaikan, dsb. pendedahan syarikat
ia boleh menjadi besar. Akibatnya terdapat jenis yang unik dati
dikenali sebagai data butiran kekal.
RINGKASAN
Un gudang data ialah berorientasikan objek, bersepadu, varian daripada
masa, koleksi dati tidak menentu untuk menyokong keperluan
keputusan pentadbiran. Setiap fungsi yang menonjol bagi
un gudang data mempunyai implikasinya. Tambahan pula ada empat
peringkat dati yang gudang data:
▪ Perincian lama
▪ Butiran semasa
Dati sedikit dirumuskan semula
Dati sangat diringkaskan
Metadata juga merupakan bahagian penting dalam gudang data.
ABSTRAK
Konsep penyimpanan bagi dati baru-baru ini diterima
banyak perhatian dan telah menjadi trend tahun 90an. Ini adalah
kerana kapasiti a gudang data untuk mengatasi mereka
batasan sistem sokongan pentadbiran seperti i
sistem sokongan keputusan (DSS) dan sistem maklumat
eksekutif (EIS).
Walaupun konsep gudang data kelihatan menjanjikan,
melaksanakan i gudang data boleh bermasalah kerana
proses pergudangan berskala besar. Walaupun
kerumitan projek pergudangan dati, ramai pembekal
dan perunding pergudangan dati mereka mendakwa bahawa
penyimpanan daripada dati semasa tidak menyebabkan sebarang masalah.
Namun, pada permulaan projek penyelidikan ini, hampir tiada
penyelidikan bebas, teliti dan sistematik telah dijalankan. daripada
Akibatnya sukar untuk mengatakan apa yang sebenarnya berlaku
dalam industri apabila ia dibina gudang data.
Kajian ini meneroka amalan pergudangan bagi dati
sezaman yang bertujuan untuk mengembangkan pemahaman yang lebih kaya
amalan Australia. Analisis literatur menyediakan
konteks dan asas untuk kajian empirikal.
Terdapat beberapa dapatan daripada kajian ini. Pertama
tempat, kajian ini mendedahkan aktiviti yang berlaku
semasa pembangunan gudang data. Dalam banyak kawasan, i dati berkumpul
mengesahkan amalan yang dilaporkan dalam literatur. Kedua
tapak, isu dan masalah yang mungkin memberi kesan kepada
pembangunan gudang data telah dikenalpasti melalui kajian ini.
Akhir sekali, faedah yang diperoleh daripada organisasi Australia yang berkaitan dengannya
penggunaan gudang data telah didedahkan.
Bab 1
Konteks penyelidikan
Konsep pergudangan data telah mendapat pengiktirafan yang meluas
pendedahan dan telah bertukar menjadi trend baru muncul dalam
90-an (McFadden 1996, TDWI 1996, Shah dan Milstein 1997,
Shanks et al. 1997, Eckerson 1998, Adelman dan Oates 2000). Itu dia
dapat dilihat daripada semakin banyak artikel mengenai data tersebut
pergudangan dalam penerbitan perdagangan (Little dan Gibson 1999).
Banyak artikel (lihat, sebagai contoh, Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett dan King 1996, Graham et al. 1996,
Sakaguchi dan Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997, McCarthy 1997, O' Donnell 1997, Edwards 1998, TDWI
1999) telah melaporkan manfaat ketara yang diperoleh daripada organisasi
yang melaksanakan i gudang data. Mereka menyokong teori mereka
dengan bukti anekdot pelaksanaan yang berjaya, pulangan yang tinggi
mengenai angka pelaburan (ROI) dan, juga, menyediakan panduan
rujukan atau metodologi untuk pembangunan gudang data
(Shanks et al. 1997, Seddon dan Benjamin 1998, Little dan Gibson
1999). Dalam kes yang melampau, Graham et al. (1996) telah
melaporkan pulangan purata ke atas pelaburan tiga tahun sebanyak 401%.
Kebanyakan kesusasteraan semasa, bagaimanapun, telah mengabaikan
kerumitan yang terlibat dalam melaksanakan projek tersebut. Projek-projek daripada
gudang data mereka biasanya kompleks dan berskala besar dan
oleh itu mereka membayangkan kebarangkalian yang tinggi untuk gagal jika mereka tidak
dikawal dengan teliti (Shah dan Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs dan Clymer 1998, Rao
1998). Mereka memerlukan sejumlah besar manusia dan sumber
kewangan dan, masa dan usaha untuk membinanya (Hill 1998, Crofts 1998). The
masa biasa dan cara kewangan yang diperlukan masing-masing
kira-kira dua tahun dan dua atau tiga juta dolar (Braly 1995, Foley
1997b, Bort 1998, Humphries et al. 1999). Masa dan cara ini
institusi kewangan dikehendaki mengawal dan menyatukan banyak aspek
perbezaan dalam pergudangan data (Cafasso 1995, Hill 1998). Di sebelah
pertimbangan perkakasan dan perisian, fungsi lain, yang berbeza-beza
daripada pengekstrakan daripada dati kepada proses pemuatan dati, dari
kapasiti memori untuk mengurus kemas kini dan data meta dati
untuk latihan pengguna, mesti dipertimbangkan.
Pada masa projek penyelidikan ini bermula, terdapat sangat sedikit
penyelidikan akademik yang dijalankan dalam bidang pergudangan data,
terutamanya di Australia. Ini terbukti daripada kekurangan barangan
diterbitkan pada pergudangan data oleh akhbar atau tulisan lain
ahli akademik pada masa itu. Banyak tulisan akademik
tersedia menerangkan pengalaman AS. Kekurangan
penyelidikan akademik di kawasan sl data warehousing telah menyebabkan
memerlukan penyelidikan dan kajian empirikal yang teliti (McFadden 1996,
Shanks et al. 1997, Little dan Gibson 1999). Khususnya, kajian
penyelidikan mengenai proses pelaksanaan gudang data
perlu dijalankan untuk meluaskan ilmu
umum mengenai pelaksanaan gudang data e
akan menjadi asas untuk kajian penyelidikan masa depan (Shanks ed
yang lain. 1997, Little dan Gibson 1999).
Oleh itu, tujuan kajian ini adalah untuk mengkaji apa sebenarnya
Ia berlaku apabila organisasi menyelenggara dan menggunakan data
gudang di Australia. Secara khusus, kajian ini akan melibatkan
analisis keseluruhan proses pembangunan a gudang data,
bermula daripada permulaan dan perancangan melalui reka bentuk dan
pelaksanaan dan penggunaan seterusnya dalam organisasi
Australia. Di samping itu, kajian ini juga akan menyumbang kepada amalan semasa
mengenal pasti kawasan di mana amalan itu boleh dikembangkan lagi
bertambah baik dan ketidakcekapan serta risiko boleh diminimumkan atau
elakkan. Tambahan pula, ia akan menjadi asas kepada kajian lain mengenai gudang data in
Australia dan akan mengisi jurang yang wujud dalam kesusasteraan pada masa ini.
Soalan kajian
Objektif kajian ini adalah untuk mengkaji aktiviti yang terlibat
dalam pelaksanaan gudang data dan penggunaannya oleh
organisasi Australia. Khususnya, unsur-unsur dikaji
mengenai perancangan projek, pembangunan,
operasi, penggunaan dan risiko yang terlibat. Jadi soalan
kajian ini ialah:
“Apakah amalan semasa gudang data di Australia?"
Untuk bertindak balas secara berkesan kepada masalah ini, a
bilangan soalan penyelidikan subsidiari tertentu. Khususnya, tiga
sub-soalan telah dikenalpasti daripada literatur iaitu
dibentangkan dalam bab 2, untuk membimbing projek penyelidikan ini:
Bagaimana ia dilaksanakan i gudang data oleh organisasi
Australia? Apakah masalah yang anda hadapi?
Apakah faedah yang dialami?
Dalam menjawab soalan-soalan ini, lukisan telah digunakan
penyelidikan penerokaan menggunakan tinjauan. Bagaimana saya belajar
penerokaan, jawapan kepada soalan di atas tidak lengkap
(Shanks et al. 1993, Denscombe 1998). Dalam kes ini, ia adalah
triangulasi diperlukan untuk menambah baik tindak balas kepada ini
permintaan. Bagaimanapun, siasatan akan menyediakan asas yang kukuh untuk
kerja masa depan mengkaji soalan-soalan ini. Yang terperinci
perbincangan tentang justifikasi dan reka bentuk kaedah penyelidikan
dibentangkan dalam bab 3.
Struktur projek penyelidikan
Projek penyelidikan ini dibahagikan kepada dua bahagian: kajian kontekstual
konsep pergudangan data dan penyelidikan empirikal (lihat
rajah 1.1), setiap satunya dibincangkan di bawah.
Bahagian I: Kajian kontekstual
Bahagian pertama penyelidikan terdiri daripada mengkaji semula
literatur semasa tentang pelbagai jenis pergudangan data termasuk i
sistem sokongan keputusan (DSS), sistem maklumat
eksekutif (EIS), kajian kes bagi gudang data dan konsep tarikh
gudang. Tambahan pula, hasil forum gudang data dan tuhan-tuhan
kumpulan mesyuarat untuk pakar dan profesional yang dikendalikan oleh kumpulan
Penyelidikan Monash DSS, menyumbang kepada fasa kajian ini
yang bertujuan untuk mendapatkan maklumat tentang amalan data
gudang dan untuk mengenal pasti risiko yang terlibat dalam penerimaan mereka.
Dalam tempoh kajian kontekstual ini, pemahaman
kawasan masalah telah ditubuhkan untuk memberi pengetahuan tentang
asas untuk penyiasatan empirikal seterusnya. Walau bagaimanapun, ini
ia adalah satu proses yang berterusan semasa kajian dijalankan
penyelidikan.
Bahagian II: Penyelidikan empirikal
Konsep pergudangan data yang agak baru, esp
di Australia, mewujudkan keperluan untuk menjalankan tinjauan untuk
dapatkan gambaran luas tentang pengalaman menggunakan. ini
bahagian telah dijalankan sebaik sahaja domain masalah adalah
telah ditubuhkan melalui tinjauan literatur yang meluas. Konsep itu
data-warehousing yang terbentuk semasa fasa kajian kontekstual ialah
digunakan sebagai input untuk soal selidik awal kajian ini.
Selepas ini, soal selidik telah diteliti. Anda pakar tarikh
gudang mengambil bahagian dalam ujian. Tujuan ujian
Soal selidik awal adalah untuk menyemak kesempurnaan dan ketepatan
beberapa soalan. Berdasarkan keputusan ujian, soal selidik adalah
telah diubah suai dan versi yang diubah suai telah dihantar ke
peserta tinjauan. Soal selidik yang dikembalikan kemudian adalah
dianalisis untuk i dati dalam jadual, rajah dan format lain. THE
keputusan analisis daripada dati membentuk gambar segera
amalan pergudangan data di Australia.
TINJAUAN PERGUDANGAN DATA
Konsep pergudangan data telah berkembang dengan penambahbaikan
daripada teknologi komputer.
Ia bertujuan untuk mengatasi masalah yang dihadapi oleh kumpulan
sokongan aplikasi seperti Decision Support System (DSS) e
Sistem Maklumat Eksekutif (EIS).
Pada masa lalu halangan utama aplikasi ini ialah
ketidakupayaan aplikasi ini untuk menyediakan a pangkalan data
perlu untuk analisis.
Ini terutamanya disebabkan oleh sifat kerja
pengurusan. Kepentingan pengurusan syarikat berbeza-beza
sentiasa bergantung pada kawasan yang dirawat. Oleh itu i dati
asas untuk aplikasi ini mesti dapat
berubah dengan cepat bergantung pada bahagian yang perlu dirawat.
Ini bermakna i dati mesti ada dalam bentuk
mencukupi untuk analisis yang diperlukan. Malah, kumpulan sokongan daripada
aplikasi mendapati ia sangat sukar pada masa lalu untuk mengumpul ed
untuk mengintegrasikan dati daripada sumber yang kompleks dan pelbagai.
Selebihnya bahagian ini membentangkan gambaran keseluruhan konsep
pergudangan data dan berurusan dengan bagaimana gudang data boleh mengatasi
Isu kumpulan sokongan aplikasi.
Istilah "Gudang Data” telah dikeluarkan oleh William Inmon pada tahun 1990.
Takrifannya yang sering disebut melihat Gudang Data bagaimana
koleksi dati berorientasikan subjek, bersepadu, tidak meruap dan berubah-ubah
dari semasa ke semasa, untuk menyokong keputusan pengurusan.
Menggunakan definisi ini Inmon menyerlahkan bahawa i dati penduduk
dalam gudang data mesti memiliki perkara berikut 4
ciri-ciri:
▪ Berorientasikan subjek
▪ Bersepadu
▪ Tidak meruap
▪ Berubah mengikut masa
Dengan Inmon berorientasikan subjek bermakna i dati dalam tarikh
gudang di kawasan organisasi terbesar yang telah
ditakrifkan dalam model dati. Contohnya semua dati berkenaan i pelanggan
terkandung dalam bidang subjek PELANGGAN. Begitu juga semua
dati berkaitan dengan produk terkandung dalam bidang subjek
PRODUK.
Dengan Inmon Bersepadu bermakna i dati datang dari berbeza
platform, sistem dan lokasi digabungkan dan disimpan dalam
tempat tunggal. Akibatnya dati serupa mesti diubah
dalam format yang konsisten supaya ia boleh ditambah dan dibandingkan
dengan mudah.
Contohnya jantina lelaki dan perempuan diwakili
dengan huruf M dan F dalam satu sistem, dan dengan 1 dan 0 dalam sistem lain. Untuk
mengintegrasikannya dengan cara yang betul, satu atau kedua-dua format mesti
diubah supaya kedua-dua format adalah sama. Di dalam ini
kes kita boleh menukar M kepada 1 dan F kepada 0 atau sebaliknya. Berorientasikan kepada
subjek dan Bersepadu menunjukkan bahawa gudang data ia direka untuk
menyediakan penglihatan berfungsi dan melintang dati ketepikan
syarikat itu.
Dengan Non-volatile dia bermaksud bahawa i dati dalam gudang data mereka kekal
konsisten dan mengemas kini daripada dati ia tidak perlu. Sebaliknya, setiap
tukar masuk dati asal ditambah pada pangkalan data daripada tarikh tersebut
gudang. Ini bermakna bahawa dei sejarah dati terkandung dalam
gudang data.
Untuk Pembolehubah dengan masa Inmon menunjukkan bahawa i dati dalam gudang data
sentiasa mengandungi penunjuk masa ei dati biasanya
merentasi ufuk masa tertentu. Contohnya a
gudang data boleh mengandungi 5 tahun nilai sejarah pelanggan dal
1993 hingga 1997. Ketersediaan sejarah dan siri masa
daripada dati membolehkan anda menganalisis trend.
Un gudang data dia boleh kumpul sendiri dati daripada sistem
OLTP; dari asal dati luar organisasi dan/atau oleh pakar lain
projek sistem tangkapan dati.
I dati ekstrak boleh melalui proses pembersihan,dalam
kes ini i dati mereka diubah dan disepadukan sebelum menjadi
disimpan dalam pangkalan data yang gudang data. Kemudian saya dati
penduduk di dalam pangkalan data yang gudang data disediakan
kepada akses pengguna akhir dan alatan pemulihan. menggunakan
alatan ini pengguna akhir boleh mengakses paparan bersepadu
daripada organisasi dati.
I dati penduduk di dalam pangkalan data yang gudang data mereka
disimpan secara terperinci dan dalam format ringkasan.
Tahap ringkasan mungkin bergantung pada sifat dati. The dati
terperinci mungkin terdiri daripada dati semasa e dati ahli sejarah
I dati royalti tidak termasuk dalam gudang data sehingga saya dati
dalam gudang data dikemas kini.
Selain menyimpan i dati sendiri, a gudang data boleh juga
menyimpan jenis yang berbeza dato dipanggil METADATA yang
huraikan i dati penduduk di rumahnya pangkalan data.
Terdapat dua jenis metadata: metadata pembangunan dan metadata pembangunan
analisis.
Metadata pembangunan digunakan untuk mengurus dan mengautomasikan
proses pengekstrakan, pembersihan, pemetaan dan pemuatan dati dalam
gudang data.
Maklumat yang terkandung dalam metadata pembangunan boleh mengandungi
butiran sistem pengendalian, butiran elemen untuk diekstrak, yang
model dati yang gudang data dan peraturan syarikat untuk
penukaran daripada dati.
Jenis metadata kedua, dikenali sebagai metadata analitik
membolehkan pengguna akhir meneroka kandungan data
gudang untuk mencari dati tersedia dan maksudnya dari segi istilah
jelas dan bukan teknikal.
Oleh itu metadata analitik berfungsi sebagai jambatan antara data
gudang dan aplikasi pengguna akhir. Metadata ini boleh
mengandungi model perniagaan, penerangan tentang dati wartawan
kepada model perniagaan, pertanyaan dan laporan yang telah ditetapkan,
maklumat untuk log masuk pengguna dan indeks.
Metadata analisis dan pembangunan mesti digabungkan menjadi satu
pembendungan metadata bersepadu untuk berfungsi dengan baik.
Malangnya banyak alat yang ada mempunyai sendiri
metadata dan pada masa ini tiada piawaian sedia ada yang
membenarkan alat pergudangan data untuk menyepadukan ini
metadata. Untuk membetulkan keadaan ini ramai peniaga
alat pergudangan data utama telah membentuk Data Meta
Majlis yang kemudiannya menjadi Meta Data Coalition.
Tujuan gabungan ini adalah untuk membina set metadata
standard yang membolehkan alat pergudangan data yang berbeza untuk
menukar metadata
Usaha mereka menghasilkan kelahiran Meta
Spesifikasi Pertukaran Data (MDIS) yang akan membenarkan pertukaran
maklumat antara arkib Microsoft dan fail MDIS yang berkaitan.
Kewujudan dati kedua-dua ringkasan / diindeks dan memberikan terperinci
pengguna kemungkinan untuk menjalankan DRILL DROWN
(penggerudian) ayuh dati diindeks kepada yang terperinci dan sebaliknya.
Kewujudan dati sejarah terperinci membolehkan penciptaan
analisis trend dari semasa ke semasa. Di samping itu metadata analisis boleh
digunakan sebagai direktori pangkalan data yang gudang data untuk
membantu pengguna akhir mencari i dati perlu.
Berbanding dengan sistem OLTP, dengan keupayaan mereka untuk menyokong
analisis terhadap dati dan pelaporan, yang gudang data ia dilihat sebagai satu sistem
lebih sesuai untuk proses maklumat seperti membuat dan
menjawab pertanyaan dan menghasilkan laporan. Bahagian seterusnya
akan menyerlahkan perbezaan kedua-dua sistem secara terperinci.
GUDANG DATA TERHADAP SISTEM OLTP
Banyak sistem maklumat dalam organisasi
Mereka bertujuan untuk menyokong operasi harian. Ini
sistem yang dikenali sebagai OLTP SYSTEMS, menangkap transaksi
dikemas kini secara berterusan setiap hari.
I dati dalam sistem ini ia sering diubah suai, ditambah atau
dipadamkan. Sebagai contoh, alamat pelanggan hampir tidak berubah
dia bergerak dari satu tempat ke satu tempat. Dalam kes ini alamat baharu
akan didaftarkan dengan mengubah suai medan alamat bagi pangkalan data.
Objektif utama sistem ini adalah untuk mengurangkan kos
transaksi dan pada masa yang sama mengurangkan masa pemprosesan.
Contoh Sistem OLTP termasuk tindakan kritikal seperti menulis
perakaunan pesanan, senarai gaji, invois, pembuatan, perkhidmatan ai pelanggan.
Tidak seperti sistem OLTP, yang dicipta setiap proses
berdasarkan urus niaga dan peristiwa, i gudang data mereka dicipta
untuk memberikan sokongan kepada proses berasaskan analisis bagi dati dan pada
proses keputusan.
Ini biasanya dicapai dengan menyepadukan i dati daripada pelbagai sistem
OLTP dan luaran dalam satu "bekas". dati,seperti yang dibincangkan
dalam bahagian sebelumnya.
Model Proses Pergudangan Data Monash
Model proses untuk gudang data Monash telah dibangunkan oleh
penyelidik dari Kumpulan Penyelidikan Monash DSS, adalah berdasarkan
kesusasteraan daripada gudang data, mengenai pengalaman dalam menyokong
pembangunan bidang sistem, mengenai perbincangan dengan vendor
aplikasi untuk digunakan pada gudang data, pada sekumpulan pakar
dalam penggunaan gudang data.
Fasa tersebut ialah: Permulaan, Perancangan, Pembangunan, dan Operasi
Penjelasan. Rajah menerangkan sifat berulang atau
perkembangan evolusi a gudang data proses menggunakan
anak panah dua hala diletakkan di antara fasa yang berbeza. Di dalam ini
Konteks "berulang" dan "evolusi" bermaksud bahawa, pada setiap satu
langkah proses, aktiviti pelaksanaan boleh dilakukan
sentiasa merambat ke belakang ke peringkat sebelumnya. Ini adalah
disebabkan sifat projek a gudang data di mana
permintaan tambahan timbul pada bila-bila masa
daripada pengguna akhir. Contohnya, semasa fasa pembangunan a
proses daripada gudang data, satu diminta oleh pengguna akhir
dimensi baru atau kawasan subjek, yang bukan milik
pelan asal, ini mesti ditambah pada sistem. ini
menyebabkan perubahan dalam projek. Hasilnya ialah pasukan daripada
reka bentuk mesti mengubah keperluan dokumen yang dibuat setakat ini
semasa fasa reka bentuk. Dalam banyak kes, keadaan semasa
projek mesti kembali ke fasa reka bentuk di mana
permintaan baharu mesti ditambah dan didokumenkan. Pengguna
akhir mesti dapat melihat dokumentasi khusus disemak ei
perubahan yang dilakukan dalam fasa pembangunan. Pada akhir
kitaran pembangunan ini projek mesti mendapat maklum balas yang hebat daripada
kedua-dua pasukan, pasukan pembangunan dan pasukan pengguna. THE
maklum balas kemudiannya digunakan semula untuk menambah baik projek masa hadapan.
Perancangan kapasiti
Dw cenderung bersaiz sangat besar dan membesar
sangat cepat (Best 1995, Rudin 1997a) berikutan
jumlah dati sejarah yang mereka simpan dari tempoh mereka. di sana
pertumbuhan juga boleh disebabkan oleh dati item tambahan yang diminta oleh
pengguna untuk meningkatkan nilai dati yang mereka sudah ada. daripada
akibatnya, keperluan penyimpanan untuk dati boleh
dipertingkatkan dengan ketara (Eckerson 1997). Jadi ia adalah
penting untuk memastikan, dengan menjalankan perancangan bagi
kapasiti, yang sistem yang akan dibina boleh berkembang dengannya
pertumbuhan keperluan (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
Dalam merancang untuk skalabiliti dw, seseorang mesti mengetahui
pertumbuhan dijangka dalam saiz inventori, jenis soalan
mungkin akan dijalankan, dan bilangan pengguna akhir yang disokong (Best
1995, Rudin 1997b, Foley 1997a). Bina aplikasi berskala
memerlukan gabungan teknologi dan teknik pelayan boleh skala
mereka bentuk aplikasi berskala (Best 1995, Rudin 1997b.
Kedua-duanya adalah perlu semasa membuat aplikasi
sangat berskala. Teknologi pelayan boleh skala boleh
menjadikannya mudah dan berfaedah untuk menambah storan, ingatan dan
CPU tanpa merendahkan prestasi (Lang 1997, Telephony 1997).
Terdapat dua teknologi pelayan berskala utama: pengiraan
berbilang simetri (SMP) dan pemprosesan besar-besaran
selari (MPP) ) (IDC 1997, Humphries et al. 1999). Pelayan
SMP biasanya mempunyai berbilang pemproses yang berkongsi satu memori,
sistem bas dan sumber lain (IDC 1997, Humphries et al. 1999).
Pemproses tambahan boleh ditambah untuk penambahan
miliknya kuasa pengiraan. Kaedah lain untuk meningkatkan
kuasa kuasa pengiraan pelayan SMP, adalah untuk menggabungkan banyak
mesin SMP. Teknik ini dikenali sebagai pengelompokan (Humphries
et al. 1999). Pelayan MPP, sebaliknya, mempunyai berbilang pemproses setiap satu
dengan ingatan sendiri, sistem bas dan sumber lain (IDC 1997,
Humphries et al. 1999). Setiap pemproses dipanggil nod. A
peningkatan dalam kuasa pengiraan boleh dicapai
menambah nod tambahan pada pelayan MPP (Humphries et al.
1999).
Kelemahan pelayan SMP ialah terlalu banyak operasi input-output
(I/O) boleh menyesakkan sistem bas (IDC 1997). ini
masalah tidak berlaku dalam pelayan MPP sejak setiap
pemproses mempunyai sistem bas sendiri. Walau bagaimanapun, keterkaitan
antara setiap nod mereka secara amnya jauh lebih perlahan daripada sistem bas
daripada SMP. Selain itu, pelayan MPP boleh menambah lapisan
kerumitan tambahan untuk pembangun aplikasi (IDC
1997). Oleh itu, pilihan antara pelayan SMP dan MPP boleh dipengaruhi
oleh banyak faktor, termasuk kerumitan soalan, hubungan
harga/prestasi, kapasiti rawatan yang diperlukan, yang
menghalang aplikasi dw dan peningkatan saiz pangkalan data
daripada dw dan dalam bilangan pengguna akhir.
Banyak teknik reka bentuk aplikasi boleh skala
boleh digunakan dalam perancangan kapasiti. satu
menggunakan pelbagai tempoh pemberitahuan seperti hari, minggu, bulan dan tahun.
Mempunyai pelbagai tempoh pemberitahuan, yang pangkalan data boleh dibahagikan kepada
kepingan dikumpulkan bersama dengan mudah (Inmon et al. 1997). Yang lagi satu
teknik ialah menggunakan jadual ringkasan yang dibina
menjumlahkan dati da dati terperinci. Jadi saya dati ringkasan adalah lebih
padat daripada terperinci, yang memerlukan lebih sedikit ruang memori.
Jadi dati butiran boleh disimpan dalam pemacu
storan yang lebih murah, yang menjimatkan lebih banyak storan.
Walaupun menggunakan jadual ringkasan boleh menjimatkan ruang
ingatan, mereka memerlukan banyak usaha untuk memastikan mereka dikemas kini dan masuk
selaras dengan keperluan komersial. Walau bagaimanapun, teknik ini adalah
digunakan secara meluas dan sering digunakan bersama-sama dengan teknik
sebelumnya(Terbaik 1995, Inmon 1996a, Chauduri dan Dayal
1997).
Menetapkan Gudang Data Teknikal
Senibina Definisi teknik
seni bina dw
Penerima pakai awal pergudangan data terutamanya difikirkan
pelaksanaan berpusat dw di mana semua dati, disertakan
i dati luaran, diintegrasikan ke dalam satu,
penyimpanan fizikal (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Kelebihan utama pendekatan ini ialah pengguna akhir
Saya dapat mengakses pandangan pada skala keusahawanan
(pandangan seluruh perusahaan) dei dati organisasi (Ovum 1998). Satu lagi
kelebihannya ialah ia menawarkan penyeragaman dati melalui
organisasi, yang bermaksud hanya terdapat satu versi atau
definisi bagi setiap istilah yang digunakan dalam deposit dw
(repositi) metadata (Flanagan dan Safdie 1997, Ovum 1998). The
kelemahan pendekatan ini, sebaliknya, adalah mahal dan sukar
akan dibina (Flanagan dan Safdie 1997, Ovum 1998, Inmon et al.
1998). Tidak lama selepas seni bina storan dati
berpusat menjadi popular, konsep pengekstrakan berkembang
daripada subset terkecil daripada dati untuk menyokong keperluan
aplikasi khusus (Varney 1996, IDC 1997, Berson dan Smith
1997, burung merak 1998). Sistem kecil ini diperoleh daripada yang lebih
besar gudang data berpusat. Mereka dipanggil tarikh
gudang jabatan bergantung atau mart data bergantung.
Seni bina data mart bergantung dikenali sebagai
seni bina tiga peringkat di mana peringkat pertama terdiri daripada data
gudang berpusat, yang kedua terdiri daripada gudang dati
jabatan dan yang ketiga terdiri daripada akses kepada dati dan daripada alatan
analisis (Demarest 1994, Inmon et al. 1997).
Data mart biasanya dibina selepas gudang data
berpusat dibina untuk memenuhi keperluan
unit tertentu (White 1995, Varney 1996).
Data marts menyimpan dati sangat relevan berkaitan dengan butiran
perpaduan (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
Kelebihan kaedah ini ialah tidak akan ada dato tidak
bersepadu dan bahawa i dati ia akan menjadi kurang lewah dalam data
mart sejak semua dati mereka datang dari gudang dati bersepadu.
Kelebihan lain ialah terdapat sedikit sambungan antara setiap satu
data mart dan sumber berkaitan dati kerana setiap data mart sahaja ada
sumber daripada dati. Ditambah dengan seni bina ini, pengguna
peringkat akhir masih boleh mengakses gambaran keseluruhan dati
organisasi korporat. Kaedah ini dikenali sebagai
kaedah atas ke bawah, di mana data mart dibina selepas data
gudang (peacock 1998, Goff 1998).
Meningkatkan keperluan untuk menunjukkan hasil awal, beberapa
organisasi telah mula membina data mart bebas
(Flanagan dan Safdie 1997, White 2000). Dalam kes ini, data mart
mereka mengambil milik mereka dati terus dari asas dati OLTP dan bukan dari
penyimpanan berpusat dan bersepadu, sekali gus menghapuskan keperluan untuk
mempunyai storan pusat di tapak.
Setiap data mart memerlukan sekurang-kurangnya satu pautan ke sumbernya
di dati. Satu kelemahan mempunyai berbilang pautan untuk setiap tarikh
mart ialah, berbanding dengan dua seni bina sebelumnya, yang
kelimpahan dati meningkat dengan ketara.
Setiap data mart mesti menyimpan semua dati diminta secara tempatan untuk
tidak mempunyai kesan ke atas sistem OLTP. Ini menyebabkan i dati
ia disimpan dalam data mart yang berbeza (Inmon et al. 1997).
Satu lagi kelemahan seni bina ini ialah ia membawa kepada
penciptaan interkoneksi yang kompleks antara data mart dan mereka
sumber daripada dati yang sukar untuk dijalankan dan dikawal (Inmon ed
yang lain. 1997).
Satu lagi kelemahan ialah pengguna akhir tidak boleh kuasa
mengakses gambaran keseluruhan maklumat syarikat seperti i dati
daripada data mart yang berbeza tidak disepadukan (Ovum 1998).
Satu lagi kelemahan ialah mungkin terdapat lebih daripada satu
definisi untuk setiap istilah yang digunakan dalam data mart yang dijananya
ketidakselarasan daripada dati dalam organisasi (Ovum 1998).
Walaupun kelemahan yang dibincangkan di atas, data mart bebas
mereka masih menarik minat banyak organisasi (IDC 1997).
Satu faktor yang menjadikan mereka menarik ialah mereka lebih cepat berkembang
dan memerlukan lebih sedikit masa dan sumber (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Sehubungan itu, mereka terutamanya berkhidmat
sebagai projek ujian yang boleh digunakan untuk mengenal pasti
dengan cepat faedah dan/atau ketidaksempurnaan dalam projek (Parsaye
1995, Braly 1995, Newing 1996). Dalam kes ini, bahagian dari
melaksanakan dalam projek perintis mestilah kecil tetapi penting
untuk organisasi (Newing 1996, Mansell-Lewis 1996).
Dengan meneliti prototaip, pengguna akhir dan pentadbiran boleh
memutuskan sama ada untuk meneruskan atau menghentikan projek tersebut (Flanagan dan Safdie
1997).
Jika keputusan itu mahu diteruskan, data mart untuk sektor lain
mereka harus dibina satu demi satu. Terdapat dua pilihan untuk
pengguna akhir berdasarkan keperluan mereka dalam pembinaan data
matr bebas: bersepadu/bersekutu dan tidak bersepadu (Ovum
1998)
Dalam kaedah pertama, setiap data mart baharu perlu dibina
berdasarkan data mart dan model semasa dati digunakan
oleh firma itu (Varney 1996, Berson dan Smith 1997, Peacock 1998).
Keperluan untuk menggunakan model dati syarikat menjadikannya perlu
memastikan bahawa hanya terdapat satu definisi bagi setiap istilah
digunakan melalui data mart, ini juga untuk memastikan data itu
Pasaran yang berbeza boleh digabungkan untuk memberikan gambaran keseluruhan
maklumat korporat (Bresnahan 1996). Kaedah ini adalah
dipanggil bottom-up dan paling baik apabila terdapat kekangan pada
kewangan dan masa (Flanagan dan Safdie 1997, Ovum 1998,
burung merak 1998, Goff 1998). Dalam kaedah kedua, data mart
dibina hanya dapat memenuhi keperluan unit tertentu.
Satu varian data mart bersekutu ialah gudang data diedarkan
di mana pangkalan data middleware pelayan hub digunakan untuk menyertai banyak
data mart dalam satu repositori dati diedarkan (White 1995). Dalam
kes ini, i dati syarikat diedarkan di beberapa data mart.
Permintaan pengguna akhir dimajukan kepada pangkalan data
middleware hab pelayan, yang mengekstrak semua dati diminta oleh data
mart dan mengembalikan hasilnya kepada aplikasi pengguna akhir. ini
kaedah menyediakan maklumat perniagaan kepada pengguna akhir. Walau bagaimanapun,
Masalah data mart masih tidak dihapuskan
bebas. Terdapat satu lagi seni bina yang boleh digunakan iaitu
memanggil gudang data maya (White 1995). Walau bagaimanapun, ini
seni bina, yang diterangkan dalam rajah 2.9, bukanlah seni bina
daripada penyimpanan dati nyata kerana ia tidak menggerakkan beban
daripada sistem OLTP kepada gudang data (Demarest 1994).
Malah, permintaan daripada dati oleh pengguna akhir telah berpindah ke
Sistem OLTP yang mengembalikan hasil selepas pemprosesan
permintaan pengguna. Walaupun seni bina ini membenarkan pengguna
akhir untuk menjana laporan dan merumuskan permintaan, tidak dapat menyediakan i
dati sejarah dan gambaran keseluruhan maklumat syarikat seperti i dati
daripada sistem OLTP yang berbeza tidak disepadukan. Jadi, yang ini
seni bina tidak dapat memenuhi analisis dati kompleks seperti
contoh ramalan.
Pemilihan akses dan aplikasi capaian
pemulihan daripada dati
Tujuan pembinaan a gudang data adalah untuk menghantar
maklumat kepada pengguna akhir (Inmon et al 1997, Poe 1996,
McFadden 1996, Shanks et al 1997, Hammergren 1998); satu atau
berbilang akses dan aplikasi pemulihan dati mesti disediakan. Kepada
Hari ini, terdapat pelbagai jenis aplikasi ini untuk dipilih oleh pengguna
pilih (Hammergren 1998, Humphries et al. 1999). The
aplikasi terpilih menentukan kejayaan usaha
daripada penyimpanan dati dalam sesebuah organisasi kerana
aplikasi adalah bahagian yang paling ketara gudang data kepada pengguna
akhir (Inmon et al. 1997, Poe 1996). Untuk menjayakan tarikh
gudang, mesti boleh menyokong aktiviti analisis bagi dati
daripada pengguna akhir (Poe 1996, Seddon dan Benjamin 1998, Eckerson
1999). Jadi "tahap" apa yang pengguna akhir mahukan mestilah
dikenal pasti (Poe 1996, Mattison 1996, Inmon et al 1997,
Humphries et al. 1999).
Secara umumnya, pengguna akhir boleh dikumpulkan kepada tiga
kategori: pengguna eksekutif, penganalisis perniagaan dan pengguna kuasa (Poe
1996, Humphries et al. 1999). Pengguna eksekutif perlukan
akses mudah kepada set laporan yang dipratentukan (Humphries ed
lain 1999). Laporan ini boleh dicapai dengan mudah dengan
navigasi menu (Poe 1996). Tambahan pula, laporan sepatutnya
mempersembahkan maklumat menggunakan perwakilan grafik
seperti jadual dan templat untuk mengangkut dengan cepat
maklumat (Humphries et al. 1999). Penganalisis perniagaan, yang tidak
mereka mungkin mempunyai kemungkinan teknikal untuk membangunkan hubungan daripada
sifar sendiri, mereka perlu boleh mengubah suai perhubungan semasa untuk
memenuhi keperluan khusus mereka (Poe 1996, Humphries et al
1999). Pengguna kuasa, sebaliknya, adalah jenis pengguna akhir yang
mempunyai keupayaan untuk menjana dan menulis permintaan dan laporan daripada
sifar (Poe 1996, Humphries et al. 1999). Mereka adalah orang-orang yang
membangunkan laporan untuk jenis pengguna lain (Poe 1996, Humphries
dan lain-lain 1999).
Setelah ditentukan keperluan pengguna akhir mesti dilakukan
pilihan akses dan aplikasi pemulihan dati antara semua
yang ada (Poe 1996, Inmon et al. 1997).
Akses kepada dati dan alat mendapatkan semula boleh
dikelaskan kepada 4 jenis: alat OLAP, alat EIS/DSS, alat pertanyaan dan
pelaporan dan alat perlombongan data.
Alat OLAP membolehkan pengguna membuat pertanyaan ad hoc serta
yang dibuat pada pangkalan data yang gudang data. Tambahan pula produk-produk ini
membolehkan pengguna menelusuri dari dati umum kepada mereka
terperinci.
Alat EIS/DSS menyediakan pelaporan eksekutif sebagai analisis "bagaimana jika".
dan akses kepada laporan tersusun menu. Laporan mestilah
dipratentukan dan digabungkan dengan menu untuk navigasi yang lebih mudah.
Alat pertanyaan dan pelaporan membolehkan pengguna menghasilkan laporan
yang telah ditetapkan dan khusus.
Alat perlombongan data digunakan untuk mengenal pasti hubungan yang
boleh memberi penerangan baharu tentang operasi yang terlupa dalam dati yang
Gudang Data.
Di samping mengoptimumkan keperluan setiap jenis pengguna, i
Alat yang dipilih mestilah intuitif, cekap dan mudah digunakan.
Ia juga mesti serasi dengan bahagian lain seni bina e
mampu bekerja dengan sistem sedia ada. Ia juga dicadangkan untuk
pilih akses data dan alatan mendapatkan semula dengan harga dan prestasi
munasabah. Kriteria lain yang perlu dipertimbangkan termasuk komitmen
vendor alat tersebut dalam menyokong produk mereka dan perkembangannya
yang sama akan ada dalam keluaran akan datang. Untuk memastikan penglibatan pengguna
dalam menggunakan gudang data, pasukan pembangunan melibatkan
pengguna dalam proses pemilihan alat. Dalam kes ini
penilaian pengguna yang praktikal perlu dijalankan.
Untuk meningkatkan nilai gudang data pasukan pembangunan boleh
juga menyediakan akses web ke gudang data mereka. A
Gudang data yang didayakan web membolehkan pengguna mengakses dati
dari tempat terpencil atau semasa dalam perjalanan. Tambahan pula maklumat boleh
disediakan pada kos yang lebih rendah melalui pengurangan kos
latihan di.
2.4.3 Gudang Data Fasa Operasi
Fasa ini terdiri daripada tiga aktiviti: Menentukan strategi tarikh
menyegarkan semula, mengawal aktiviti gudang data dan pengurusan
keselamatan gudang data.
Definisi strategi penyegaran data
Selepas pemuatan awal, i dati dalam pangkalan data daripada gudang data
mesti disegarkan secara berkala untuk memainkan
perubahan yang dibuat pada dati asal. Oleh itu kita mesti membuat keputusan
bila hendak menyegarkan, berapa kerap
menyegarkan dan cara menyegarkan semula dati. Adalah dicadangkan untuk melakukan
segarkan dei dati apabila sistem boleh dibawa ke luar talian. di sana
Kadar muat semula ditentukan oleh pasukan pembangunan berasaskan
atas keperluan pengguna. Terdapat dua pendekatan untuk menyegarkan
gudang data: muat semula lengkap dan pemuatan berterusan
perubahan.
Pendekatan pertama, muat semula penuh, memerlukan muat semula
semua dati dari awal. Ini bermakna semua dati dikehendaki mesti
diekstrak, dibersihkan, diubah dan disepadukan dalam setiap penyegaran. ini
pendekatan harus, seboleh-bolehnya, dielakkan kerana
Ia memerlukan banyak masa dan sumber.
Pendekatan alternatif adalah dengan terus memuatkan i
perubahan. Ini menambah i dati yang telah diubah
sejak kitaran segar semula gudang data terakhir. Pengenalpastian bagi
rekod baru atau diubah suai dengan ketara mengurangkan jumlah
dati yang mesti disebarkan ke gudang data dalam setiap
kemas kini kerana hanya ini dati akan ditambah kepada pangkalan data
daripada gudang data.
Terdapat sekurang-kurangnya 5 pendekatan yang boleh digunakan untuk menarik diri
i dati baharu atau diubah suai. Untuk mendapatkan strategi yang cekap
segarkan dei dati campuran pendekatan ini boleh berguna
mengambil semua perubahan dalam sistem.
Pendekatan pertama, yang menggunakan cap masa, menganggap ia datang
ditugaskan kepada semua dati diedit dan dikemas kini cap waktu jadi
untuk dapat mengenal pasti semua dengan mudah dati diubah suai dan baharu.
Pendekatan ini, bagaimanapun, tidak digunakan secara meluas dalam kebanyakan
sebahagian daripada sistem pengendalian hari ini.
Pendekatan kedua ialah menggunakan fail delta yang dihasilkan oleh
aplikasi yang mengandungi hanya perubahan yang dibuat kepada dati.
Menggunakan fail ini juga menguatkan kitaran kemas kini.
Walau bagaimanapun, walaupun kaedah ini tidak digunakan dalam banyak
aplikasi.
Pendekatan ketiga ialah mengimbas fail log, yang
pada asasnya mengandungi maklumat yang serupa dengan fail delta. Hanya satu
perbezaannya ialah fail log dicipta untuk proses pemulihan dan
ia boleh menjadi sukar untuk difahami.
Pendekatan keempat ialah mengubah suai kod aplikasi.
Walau bagaimanapun kebanyakan kod aplikasi adalah lama dan
rapuh; oleh itu teknik ini harus dielakkan.
Pendekatan terakhir ialah membandingkan dati sumber dengan fail
tuhan-tuhan utama dati.
Kawalan aktiviti gudang data
Sebaik sahaja gudang data telah dikeluarkan kepada pengguna, ia adalah
perlu untuk memantaunya dari semasa ke semasa. Dalam kes ini, pentadbir
daripada gudang data boleh menggunakan satu atau lebih alat pengurusan dan
kawalan untuk memantau penggunaan gudang data. khususnya
maklumat tentang manusia dan cuaca boleh dikumpul
yang mana mereka mengakses gudang data. Ayuh dati tanaman boleh dibuat
profil kerja yang dilakukan yang boleh digunakan sebagai input
dalam melaksanakan caj balik pengguna. Caj Balik
membolehkan pengguna dimaklumkan tentang kos pemprosesan
Gudang Data.
Tambahan pula, kawalan gudang data juga boleh digunakan untuk
mengenal pasti jenis pertanyaan, saiznya, bilangan pertanyaan setiap
hari, masa respons kepada pertanyaan, sektor yang dicapai dan kuantiti
di dati telah di proses. Satu lagi tujuan melakukan pemeriksaan
gudang data adalah untuk mengenal pasti dati yang tidak digunakan. Ini dati
mereka boleh dialih keluar dari gudang data untuk menambah baik masa
tindak balas pelaksanaan pertanyaan dan memantau pertumbuhan
dati yang tinggal di dalam pangkalan data daripada gudang data.
Pengurusan keselamatan gudang data
Sebuah gudang data mengandungi dati bersepadu, kritikal, sensitif itu
boleh dicapai dengan mudah. Atas sebab ini ia sepatutnya
dilindungi daripada pengguna yang tidak dibenarkan. Satu cara untuk
melaksanakan keselamatan adalah dengan menggunakan fungsi del DBMS
untuk memberikan keistimewaan yang berbeza kepada jenis pengguna yang berbeza. Di dalam ini
cara, profil mesti dikekalkan untuk setiap jenis pengguna
akses. Satu lagi cara untuk melindungi gudang data anda ialah menyulitkannya
seperti yang tertulis dalam pangkalan data daripada gudang data. Akses kepada
dati dan alat mendapatkan semula mesti menyahsulit dati sebelum menghantar i
hasil kepada pengguna.
2.4.4 Gudang Data Fasa Penyerahan
Ia adalah fasa terakhir dalam kitaran pelaksanaan gudang data. The
aktiviti yang akan dijalankan dalam fasa ini termasuk latihan
pengguna untuk menggunakan gudang data dan membuat ulasan
daripada gudang data.
Latihan pengguna
Latihan pengguna harus dilakukan terlebih dahulu
daripada akses kepada dati daripada gudang data dan penggunaan alatan
mendapatkan semula. Secara amnya, sesi harus bermula dengan
pengenalan kepada konsep penyimpanan bagi datiPada
kandungan gudang data, ai meta dati dan ciri asas
daripada alatan tersebut. Kemudian, pengguna yang lebih maju juga boleh mengkaji
jadual fizikal dan ciri pengguna capaian data dan alatan
mendapatkan semula.
Terdapat banyak pendekatan untuk melakukan latihan pengguna. Satu daripada
ini melibatkan pemilihan ramai pengguna atau penganalisis yang dipilih oleh a
kumpulan pengguna, berdasarkan kepimpinan dan keupayaan mereka
komunikasi. Ini dilatih dalam kapasiti peribadi pada
semua yang mereka perlu tahu untuk membiasakan diri dengan
sistem. Setelah latihan selesai, mereka kembali ke tempat kerja mereka dan
mereka mula mengajar pengguna lain cara menggunakan sistem. Pada
berdasarkan apa yang telah mereka pelajari, pengguna lain boleh mula
meneroka gudang data.
Pendekatan lain ialah melatih ramai pengguna dalam perkara yang sama
masa, seolah-olah anda sedang mengikuti kursus kelas. Kaedah ini
Ia sesuai apabila terdapat ramai pengguna yang perlu dilatih
pada masa yang sama. Kaedah lain ialah melatih
setiap pengguna secara individu, satu demi satu. Kaedah ini adalah
sesuai apabila terdapat sedikit pengguna.
Tujuan latihan pengguna adalah untuk membiasakan anda
dengan akses kepada dati dan alat mendapatkan semula serta kandungan
Gudang Data. Walau bagaimanapun, sesetengah pengguna mungkin terharu
dengan jumlah maklumat yang diberikan semasa sesi
latihan. Jadi beberapa perkara perlu dilakukan
sokongan berterusan dan sesi penyegaran untuk bertindak balas
kepada soalan-soalan tertentu. Dalam beberapa kes, kumpulan dibentuk
pengguna untuk menyediakan jenis sokongan ini.
Mengumpul maklum balas
Setelah gudang data telah dilancarkan, pengguna boleh
gunakan i dati yang berada di dalam gudang data untuk pelbagai tujuan.
Kebanyakannya, penganalisis atau pengguna menggunakan i dati dalam
gudang data untuk:
1 Kenal pasti trend syarikat
2 Menganalisis profil pembelian bagi pelanggan
3 Bahagi i pelanggan dan daripada
4 Memberi perkhidmatan yang terbaik kepada pelanggan – menyesuaikan perkhidmatan
5 Merangka strategi pemasaran
6 Sediakan sebut harga kompetitif untuk analisis dan bantuan kos
kawalan
7 Menyokong pembuatan keputusan strategik
8 Kenal pasti peluang untuk menonjol
9 Meningkatkan kualiti proses perniagaan semasa
10 Semak keuntungan
Mengikut arahan pembangunan gudang data, mereka boleh
Menjalankan satu siri semakan sistem untuk mendapatkan maklum balas
kedua-dua daripada pasukan pembangunan dan daripada komuniti
pengguna terakhir.
Keputusan yang diperolehi boleh diambil kira untuk
kitaran pembangunan seterusnya.
Oleh kerana gudang data mempunyai pendekatan tambahan,
adalah penting untuk belajar daripada kejayaan dan kesilapan yang terdahulu
perkembangan.
2.5 Rumusan
Dalam bab ini pendekatan yang terdapat dalam telah dibincangkan
sastera. Dalam bahagian 1 konsep telah dibincangkan
gudang data dan peranannya dalam sains keputusan. Di dalam
bahagian 2 perbezaan utama antara
gudang data dan sistem OLTP. Dalam bahagian 3 kita membincangkan
Model gudang data Monash yang digunakan
dalam bahagian 4 untuk menerangkan aktiviti yang terlibat dalam proses tersebut
pembangunan gudang data, tesis ini tidak berdasarkan
penyelidikan yang rapi. Apa yang berlaku dalam realiti boleh jadi
sangat berbeza daripada apa yang dilaporkan oleh literatur, namun ini
keputusan boleh digunakan untuk mencipta bagasi asas yang
menekankan konsep gudang data untuk penyelidikan ini.
Bab 3
Kaedah penyelidikan dan reka bentuk
Bab ini membincangkan kaedah penyelidikan dan reka bentuk untuk
kajian ini. Bahagian pertama menunjukkan pandangan generik kaedah
penyelidikan yang tersedia untuk mendapatkan maklumat, lebih-lebih lagi
kriteria untuk memilih kaedah terbaik untuk satu dibincangkan
kajian tertentu. Dua kaedah kemudian dibincangkan dalam bahagian 2
dipilih dengan kriteria yang telah ditetapkan; daripada ini akan dipilih dan
menerima pakai satu dengan alasan yang dinyatakan dalam seksyen 3 di mana mereka berada
sebab-sebab pengecualian kriteria lain juga dijelaskan. di sana
bahagian 4 membentangkan reka bentuk penyelidikan dan bahagian 5 membentangkannya
kesimpulan.
3.1 Penyelidikan dalam sistem maklumat
Penyelidikan dalam sistem maklumat tidak hanya terhad
kepada bidang teknologi tetapi juga mesti diperluaskan untuk merangkumi
matlamat mengenai tingkah laku dan organisasi.
Kami berhutang ini kepada tesis pelbagai disiplin yang terdiri daripada
sains sosial kepada yang semula jadi; ini membawa kepada keperluan untuk a
spektrum kaedah penyelidikan tertentu yang melibatkan kaedah kuantitatif
dan kualitatif untuk digunakan untuk sistem maklumat.
Semua kaedah penyelidikan yang ada adalah penting, malah beberapa
penyelidik seperti Jenkins (1985), Nunamaker et al. (1991), dan Galliers
(1992) berpendapat bahawa tiada kaedah universal yang khusus
untuk menjalankan penyelidikan dalam pelbagai bidang sistem maklumat; Sesungguhnya
sesuatu kaedah mungkin sesuai untuk penyelidikan tertentu tetapi tidak
untuk yang lain. Ini membawa kita keperluan untuk memilih kaedah yang
sesuai untuk projek penyelidikan kami: untuk ini
pilihan Benbasat et al. (1987) menyatakan bahawa mereka harus dipertimbangkan
sifat dan tujuan penyelidikan.
3.1.1 Sifat penyelidikan
Pelbagai kaedah berdasarkan sifat penyelidikan boleh
diklasifikasikan kepada tiga tradisi yang diketahui secara meluas dalam sains
maklumat: penyelidikan positivis, interpretatif dan kritikal.
3.1.1.1 Penyelidikan positivistik
Penyelidikan positivis juga dikenali sebagai kajian saintifik atau
empirikal. Ia cuba untuk: “menerangkan dan meramalkan apa yang akan berlaku dalam
dunia sosial dengan melihat keteraturan dan hubungan sebab-akibat
antara elemen yang membentuknya” (Shanks et al 1993).
Penyelidikan positivis juga dicirikan oleh kebolehulangan,
penyederhanaan dan penolakan. Tambahan pula, penyelidikan positivis mengakui
wujudnya hubungan priori antara fenomena yang dikaji.
Menurut Galliers (1992) taksonomi ialah kaedah penyelidikan
termasuk dalam paradigma positivis, yang bagaimanapun tidak terhad kepada ini,
sebenarnya ada ujikaji makmal, ujikaji lapangan,
kajian kes, pembuktian teorem, ramalan dan simulasi.
Menggunakan kaedah ini penyelidik mengakui bahawa fenomena
yang dipelajari boleh diperhatikan secara objektif dan teliti.
3.1.1.2 Penyelidikan interpretatif
Penyelidikan tafsiran, yang sering dipanggil fenomenologi atau
anti-positivisme digambarkan oleh Neuman (1994) sebagai “analisis
sistematik makna sosial tindakan melalui langsung dan
pemerhatian terperinci orang dalam situasi semula jadi, mengikut urutan
untuk sampai kepada pemahaman dan tafsiran bagaimana
orang mencipta dan mengekalkan dunia sosial mereka." Kajian
kaedah tafsiran menolak andaian bahawa fenomena yang diperhatikan
dapat diperhatikan secara objektif. Malah mereka berasaskan
pada tafsiran subjektif. Tambahan pula, penyelidik tafsiran tidak
mereka mengenakan makna priori terhadap fenomena yang mereka kaji.
Kaedah ini termasuk kajian subjektif/argumentatif, tindakan
penyelidikan, kajian deskriptif/interpretatif, penyelidikan masa depan dan permainan
peranan. Sebagai tambahan kepada penyiasatan dan kajian kes ini boleh
termasuk dalam pendekatan ini kerana mereka berkenaan dengan kajian tentang
individu atau organisasi dalam situasi yang kompleks
daripada dunia sebenar.
3.1.1.3 Penyelidikan kritis
Siasatan kritikal ialah pendekatan yang paling kurang diketahui dalam sains
sosial tetapi baru-baru ini mendapat perhatian daripada penyelidik
dalam bidang sistem maklumat. Andaian falsafah bahawa
realiti sosial secara sejarah dihasilkan dan diterbitkan semula oleh orang,
serta sistem sosial dengan tindakan dan interaksi mereka. mereka
keupayaan, walau bagaimanapun, dimediasi oleh sejumlah pertimbangan
sosial, budaya dan politik.
Sama seperti penyelidikan tafsiran, penyelidikan kritikal mengekalkan bahawa
penyelidikan positivis tidak ada kena mengena dengan konteks sosial dan mengabaikannya
pengaruhnya terhadap tindakan manusia.
Penyelidikan kritis pula mengkritik penyelidikan tafsiran untuk
terlalu subjektif dan kerana ia tidak bertujuan untuk membantu
manusia untuk memperbaiki kehidupan mereka. Perbezaan terbesar antara
penyelidikan kritikal dan dua pendekatan lain ialah dimensi penilaiannya.
Manakala objektiviti tradisi positivis dan interpretatif adalah untuk
meramal atau menjelaskan status quo atau realiti sosial, penyelidikan kritikal
bertujuan untuk menilai secara kritis dan mengubah realiti sosial yang mendasari
studio.
Penyelidik kritikal biasanya menentang status quo untuk
menghapuskan perbezaan sosial dan memperbaiki keadaan sosial. di sana
penyelidikan kritikal mempunyai komitmen terhadap pandangan proses
fenomena yang menarik dan, oleh itu, biasanya membujur.
Contoh kaedah penyelidikan ialah kajian sejarah jangka panjang dan
kajian etnografi. Penyelidikan kritikal, bagaimanapun, belum
digunakan secara meluas dalam penyelidikan sistem maklumat
3.1.2 Tujuan penyelidikan
Bersama-sama dengan sifat carian, tujuannya boleh digunakan
untuk membimbing pengkaji dalam memilih kaedah tertentu
penyelidikan. Tujuan projek penyelidikan adalah berkait rapat
kepada kedudukan carian berbanding kitaran carian yang terdiri daripada
tiga fasa: pembinaan teori, ujian teori, dan penghalusan teori
teori. Jadi, berdasarkan momentum berkenaan dengan kitaran carian, a
projek penyelidikan boleh mempunyai penjelasan, deskriptif, tujuan
penerokaan atau ramalan.
3.1.2.1 Penyelidikan penerokaan
Penyelidikan penerokaan bertujuan untuk menyiasat sesuatu topik
benar-benar baru dan merumuskan persoalan kajian dan hipotesis
masa hadapan. Penyelidikan jenis ini digunakan dalam pembinaan
teori untuk mendapatkan rujukan awal dalam bidang baru.
Biasanya, kaedah penyelidikan kualitatif, seperti kes, digunakan
kajian atau kajian fenomenologi.
Walau bagaimanapun, ia juga mungkin untuk menggunakan teknik kuantitatif seperti
penyiasatan atau eksperimen penerokaan.
3.1.3.3 Penyelidikan deskriptif
Penyelidikan deskriptif bertujuan untuk menganalisis dan menghuraikan sebahagian besarnya
memperincikan situasi atau amalan organisasi tertentu. ini
sesuai untuk pembinaan teori dan juga boleh digunakan untuk
mengesahkan atau mempertikaikan hipotesis. Penyelidikan deskriptif biasanya
termasuk penggunaan ukuran dan sampel. Kaedah penyelidikan yang paling sesuai
termasuk penyiasatan dan analisis anteseden.
3.1.2.3 Penyelidikan penerangan
Penyelidikan penjelasan cuba menjelaskan mengapa sesuatu berlaku.
Ia dibina berdasarkan fakta yang telah dikaji dan cuba dicari
sebab-sebab fakta ini.
Jadi penyelidikan penjelasan biasanya dibina atas penyelidikan
penerokaan atau deskriptif dan adalah sampingan kepada ujian dan penapisan
teori-teori tersebut. Penyelidikan penjelasan biasanya menggunakan kajian kes
atau kaedah penyelidikan berasaskan tinjauan.
3.1.2.4 Penyelidikan pencegahan
Penyelidikan pencegahan bertujuan untuk meramalkan peristiwa dan tingkah laku
di bawah pemerhatian yang sedang dikaji (Marshall dan Rossman
1995). Ramalan adalah ujian saintifik standard kebenaran.
Jenis penyelidikan ini biasanya menggunakan tinjauan atau analisis
dati ahli sejarah. (Yin 1989)
Perbincangan di atas menunjukkan bahawa terdapat beberapa
kaedah penyelidikan yang mungkin boleh digunakan dalam sesuatu kajian
khususnya. Namun, mesti ada kaedah khusus yang lebih sesuai
orang lain untuk jenis projek penyelidikan tertentu. (Galliers
1987, Yin 1989, De Vaus 1991). Oleh itu, setiap penyelidik mempunyai
perlu menilai dengan teliti kekuatan dan kelemahan
pelbagai kaedah, untuk mencapai penggunaan kaedah penyelidikan yang paling sesuai e
serasi dengan projek penyelidikan. (Jenkins 1985, Pervan dan Klass
1992, Bonomia 1985, Yin 1989, Himilton dan Ives 1992).
3.2. Kaedah penyelidikan yang mungkin
Matlamat projek ini adalah untuk mengkaji pengalaman dalam
Pertubuhan Australia dengan i dati disimpan dengan satu
pembangunan gudang data. Data yang, pada masa ini, terdapat satu
kekurangan penyelidikan di kawasan pergudangan data di Australia,
projek penyelidikan ini masih dalam fasa teori kitaran
penyelidikan dan mempunyai tujuan penerokaan. Meneroka pengalaman dalam
Organisasi Australia mengguna pakai pergudangan data
memerlukan tafsiran masyarakat sebenar. Akibatnya,
andaian falsafah yang mendasari projek penyelidikan berikut
tafsiran tradisional.
Selepas pemeriksaan rapi terhadap kaedah yang ada, mereka telah dikenalpasti
dua kaedah penyelidikan yang mungkin: tinjauan dan kajian kes
(kajian kes), yang boleh digunakan untuk penyelidikan
penerokaan (Shanks et al. 1993). Galliers (1992) berpendapat bahawa
kesesuaian kedua-dua kaedah ini untuk kajian khusus ini di
taksonominya yang disemak mengatakan bahawa ia sesuai untuk pembinaan
secara teori. Dua subseksyen berikut membincangkan setiap kaedah dalam
perincian.
3.2.1 Kaedah kajian tinjauan
Kaedah kajian tinjauan berasal daripada kaedah purba
bancian. Banci terdiri daripada mengumpul maklumat daripada
keseluruhan penduduk. Kaedah ini mahal dan tidak praktikal
terutamanya jika populasinya ramai. Jadi, berbanding dengan
bancian, tinjauan biasanya tertumpu pada
mengumpul maklumat untuk sebilangan kecil, atau sampel, daripada
wakil penduduk (Fowler 1988, Neuman 1994). A
sampel mencerminkan populasi dari mana ia diambil, dengan berbeza
tahap ketepatan, mengikut struktur sampel, yang
saiz dan kaedah pemilihan yang digunakan (Fowler 1988, Babbie
1982, Neuman 1994).
Kaedah penyiasatan ditakrifkan sebagai "gambaran amalan,
situasi atau pandangan pada masa tertentu, yang dilakukan menggunakan
soal selidik atau temu bual, daripada mana inferens mungkin
dibuat” (Galliers 1992:153) [gambar segera amalan,
situasi atau pandangan pada masa tertentu, diambil menggunakan
soal selidik atau temu bual, daripada mana inferens boleh dibuat]. The
penyiasatan berkaitan dengan pengumpulan maklumat mengenai aspek tertentu
kajian, oleh sebilangan peserta tertentu, membuat
soalan (Fowler 1988). Malah soal selidik dan temu bual ini, yang
termasuk telefon bersemuka dan temu bual berstruktur,
adalah teknik pengumpulan dati paling biasa digunakan dalam
penyiasatan (Blalock 1970, Nachmias dan Nachmias 1976, Fowler
1988), pemerhatian dan analisis boleh digunakan (Gable
1994). Daripada semua kaedah mengumpul ini dati, penggunaan
soal selidik adalah teknik yang paling popular, kerana ia memastikan bahawa i dati
dikumpul adalah berstruktur dan diformat, dan oleh itu memudahkan
pengelasan maklumat (Hwang 1987, de Vaus 1991).
Semasa menganalisis i dati, strategi penyiasatan sering menggunakan
teknik kuantitatif, seperti analisis statistik, tetapi mereka boleh
teknik kualitatif juga digunakan (Galliers 1992, Pervan
dan Kelas 1992, Gable 1994). Biasanya, i dati dikumpul adalah
digunakan untuk menganalisis taburan dan corak persatuan
(Fowler 1988).
Walaupun tinjauan umumnya sesuai untuk penyelidikan
yang berurusan dengan soalan 'apa?' (apa) atau daripadanya
terbitan, seperti 'berapa banyak' dan 'berapa banyak', mereka
boleh ditanya melalui soalan 'mengapa' (Sonquist dan
Dunkelberg 1977, Yin 1989). Menurut Sonquist dan Dunkelberg
(1977), penyiasatan penyelidikan bertujuan untuk hipotesis yang sukar, program
penilaian, menerangkan populasi dan membangunkan model
tingkah laku manusia. Selain itu, tinjauan boleh digunakan
untuk mengkaji pendapat tertentu tentang populasi, keadaan,
pendapat, ciri, jangkaan dan juga tingkah laku masa lalu
atau sekarang (Neuman 1994).
Penyiasatan membolehkan penyelidik menemui hubungan antara
populasi dan hasilnya biasanya lebih generik daripada
kaedah lain (Sonquist dan Dunkelberg 1977, Gable 1994). The
tinjauan membolehkan penyelidik meliputi kawasan geografi
lebih luas dan mencapai banyak pengisytihar (Blalock 1970,
Sonquist dan Dunkelberg 1977, Hwang dan Lin 1987, Gable 1994,
Neuman 1994). Akhir sekali, tinjauan boleh memberikan maklumat
yang tidak tersedia di tempat lain atau dalam bentuk yang diperlukan untuk analisis
(Fowler 1988).
Walau bagaimanapun, terdapat beberapa batasan dalam menjalankan tinjauan. satu
kelemahannya ialah pengkaji tidak dapat memperoleh banyak maklumat
berkenaan objek yang dikaji. Ini disebabkan oleh fakta bahawa
penyiasatan dijalankan hanya pada masa tertentu dan, oleh itu,
terdapat bilangan pembolehubah dan orang yang terhad yang pengkaji boleh
kajian (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Satu lagi kelemahan ialah menjalankan tinjauan
sangat mahal dari segi masa dan sumber, terutamanya jika
melibatkan temu bual secara bersemuka (Fowler 1988).
3.2.2. Kaedah Penyelidikan Inkuiri
Kaedah penyelidikan inkuiri melibatkan kajian mendalam tentang
situasi tertentu dalam konteks sebenar dalam a
tempoh masa yang ditetapkan, tanpa sebarang campur tangan di pihak
penyelidik (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Terutamanya kaedah ini digunakan untuk menggambarkan hubungan antara
pembolehubah yang sedang dikaji dalam situasi tertentu
(Galliers 1992). Siasatan mungkin melibatkan kes individu atau
berbilang, bergantung kepada fenomena yang dianalisis (Franz dan Robey 1987,
Eisenhardt 1989, Yin 1989).
Kaedah penyelidikan inkuiri ditakrifkan sebagai “satu inkuiri
kajian empirikal yang mengkaji fenomena kontemporari dalam
konteks sebenar relatif, menggunakan pelbagai sumber yang dikumpulkan daripada satu atau
pelbagai entiti seperti orang, kumpulan, atau organisasi” (Yin 1989).
Tiada pemisahan yang jelas antara fenomena dan konteksnya e
tiada kawalan atau manipulasi eksperimen bagi pembolehubah (Yin
1989, Benbasat et al. 1987).
Terdapat pelbagai teknik untuk mengumpul dati bahawa mereka boleh
digunakan dalam kaedah siasatan, yang termasuk
pemerhatian langsung, semakan rekod arkib, soal selidik,
semakan dokumentasi dan temu bual berstruktur. mempunyai
pelbagai teknik penuaian dati, penyiasatan
membolehkan penyelidik menangani kedua-duanya dati kualitatif itu
kuantiti pada masa yang sama (Bonoma 1985, Eisenhardt 1989, Yin
1989, Gable 1994). Seperti yang berlaku dengan kaedah tinjauan, a
penyelidik inkuiri bertindak sebagai pemerhati atau penyelidik dan bukan
sebagai peserta aktif dalam organisasi yang dikaji.
Benbasat et al.(1987) menegaskan bahawa kaedah inkuiri ialah
amat sesuai untuk penyelidikan pembinaan teori, yang
mulakan dengan soalan kajian dan teruskan dengan latihan
sesuatu teori semasa proses mengumpul dati. Menjadi
juga sesuai untuk pentas
pembinaan teori, Franz dan Robey (1987) mencadangkan bahawa
Kaedah inkuiri juga boleh digunakan untuk kompleks
fasa teori. Dalam kes ini, berdasarkan bukti yang dikumpul, satu
teori atau hipotesis yang diberikan disahkan atau disangkal. Tambahan pula, siasatan adalah
juga sesuai untuk penyelidikan yang berkaitan dengan soalan 'bagaimana' atau 'bagaimana'
'mengapa' (Yin 1989).
Berbanding dengan kaedah lain, tinjauan membolehkan penyelidik
menangkap maklumat penting dengan lebih terperinci (Galliers
1992, Shanks et al 1993). Tambahan pula, siasatan membolehkan
penyelidik untuk memahami sifat dan kerumitan proses yang dikaji
(Benbasat et al. 1987).
Terdapat empat kelemahan utama yang berkaitan dengan kaedah tersebut
penyiasatan. Yang pertama ialah kekurangan potongan terkawal. di sana
subjektiviti penyelidik boleh mengubah keputusan dan kesimpulan
kajian (Yin 1989). Kelemahan kedua ialah kekurangan
pemerhatian terkawal. Tidak seperti kaedah eksperimen, kaedah
penyelidik inkuiri tidak dapat mengawal fenomena yang dikaji
kerana ia diperiksa dalam konteks semula jadi mereka (Gable 1994). The
kelemahan ketiga ialah kekurangan kebolehulangan. Ini disebabkan oleh fakta
bahawa penyelidik tidak mungkin memerhatikan peristiwa yang sama, dan
tidak boleh mengesahkan keputusan kajian tertentu (Lee 1989).
Akhirnya, sebagai akibat daripada ketidakbolehtiruan, ia adalah sukar
generalisasi keputusan yang diperoleh daripada satu atau lebih penyiasatan (Galliers
1992, Shanks et al 1993). Semua masalah ini, bagaimanapun, tidak
tidak dapat diatasi dan sebenarnya boleh diminimumkan oleh
penyelidik mengaplikasikan tindakan yang sesuai (Lee 1989).
3.3. Mewajarkan metodologi penyelidikan
diterima pakai
Daripada dua kaedah kajian yang mungkin untuk kajian ini, kaedah
penyiasatan dianggap paling sesuai. Itu penyiasatan adalah
telah dibuang berikutan pertimbangan yang teliti terhadap yang berkaitan
kebaikan dan kelemahan. Kemudahan atau ketidaksesuaian masing-masing
kaedah untuk kajian ini dibincangkan di bawah.
3.3.1. Ketidaksesuaian kaedah penyelidikan
penyiasatan
Kaedah inkuiri memerlukan kajian mendalam tentang satu
situasi tertentu dalam satu atau lebih organisasi untuk a
tempoh masa (Eisenhardt 1989). Dalam kes ini, tempoh boleh
melebihi jangka masa yang diberikan untuk kajian ini. Satu lagi
sebab untuk tidak menggunakan kaedah tinjauan adalah bahawa keputusan
mereka boleh mengalami kekurangan ketegasan (Yin 1989). Subjektif
pengkaji boleh mempengaruhi keputusan dan kesimpulan. Satu lagi
sebab kaedah ini lebih sesuai untuk kajian soalan
daripada jenis 'bagaimana' atau 'mengapa' (Yin 1989), manakala persoalan kajian
untuk kajian ini adalah dari jenis 'apa'. Last but not least
Yang penting, sukar untuk menyamaratakan penemuan daripada hanya satu atau
beberapa penyiasatan (Galliers 1992, Shanks et al 1993). Atas dasar
penjelasan rasional ini, kaedah penyelidikan inkuiri tidak
dipilih kerana tidak sesuai untuk kajian ini.
3.3.2. Kemudahan kaedah carian bagi
penyiasatan
Semasa penyelidikan ini dijalankan, amalan pergudangan data
tidak diterima pakai secara meluas oleh
organisasi Australia. Jadi, tidak ada banyak maklumat
mengenai pelaksanaannya dalam
organisasi Australia. Maklumat yang ada datang
daripada organisasi yang telah melaksanakan atau menggunakan data
gudang. Dalam kes ini, kaedah kajian tinjauan adalah yang paling banyak
sesuai kerana ia membolehkan anda memperoleh maklumat yang tidak
tersedia di tempat lain atau dalam bentuk yang diperlukan untuk analisis (Fowler 1988).
Selain itu, kaedah kajian tinjauan membolehkan pengkaji untuk
mendapatkan pandangan yang baik tentang amalan, situasi atau
dilihat pada masa tertentu (Galliers 1992, Denscombe 1998).
Pandangan keseluruhan diperlukan untuk meningkatkan
Pengetahuan tentang pengalaman pergudangan data Australia.
Sekali lagi, Sonquist dan Dunkelberg (1977) menyatakan bahawa hasil daripada
Kajian tinjauan adalah lebih umum daripada kaedah lain.
3.4. Reka Bentuk Kajian Tinjauan
Penyiasatan terhadap amalan pergudangan data telah dijalankan pada tahun 1999.

Penduduk sasaran terdiri daripada organisasi
Orang Australia berminat dalam kajian pergudangan data, begitu juga
mungkin sudah dimaklumkan tentang i dati yang mereka simpan dan,
oleh itu, ia dapat memberikan maklumat yang berguna untuk kajian ini. di sana
populasi sasaran dikenal pasti dengan tinjauan awal terhadap
semua ahli Australia 'The Data Warehousing Institute' (Tdwiaap).
Bahagian ini membincangkan reka bentuk fasa penyelidikan
bukti empirikal kajian ini.
3.4.1. Teknik penuaian dati
Daripada tiga teknik yang biasa digunakan dalam kajian tinjauan
(iaitu soal selidik pos, temu bual telefon dan temu bual
peribadi) (Nachmias 1976, Fowler 1988, de Vaus 1991), untuk
kajian ini menggunakan soal selidik mel. Yang pertama
sebab untuk menerima pakai yang kedua ialah ia boleh mencapai a
populasi yang tersebar secara geografi (Blalock 1970, Nachmias e
Nachmias 1976, Hwang dan Lin 1987, de Vaus 1991, Gable 1994).
Kedua, soal selidik pos adalah sesuai untuk peserta
berpendidikan tinggi (Fowler 1988). Soal selidik mel untuk ini
kajian telah ditujukan kepada penaja projek pergudangan data,
pengarah dan/atau pengurus projek. Ketiga, soal selidik jauh
mel adalah sesuai apabila anda mempunyai senarai selamat
alamat (Salant dan Dilman 1994). TDWI, dalam kes ini, satu
persatuan pergudangan data yang dipercayai menyediakan senarai alamat
daripada ahli Australianya. Satu lagi kelebihan soal selidik
melalui mel berbanding soal selidik telefon atau temu bual
peribadi ialah ia membolehkan pendaftar untuk bertindak balas lebih
ketepatan, terutamanya apabila pendaftar perlu berunding
nota atau bincangkan soalan dengan orang lain (Fowler
1988).
Kelemahan yang berpotensi mungkin adalah masa yang diperlukan untuk
menjalankan soal selidik melalui surat. Biasanya, soal selidik pergi
mel dijalankan dalam urutan ini: hantar surat, tunggu
maklum balas dan pengesahan hantar (Fowler 1988, Bainbridge 1989).
Oleh itu, jumlah masa mungkin lebih lama daripada masa yang diperlukan
temu duga peribadi atau untuk temu duga telefon. Walau bagaimanapun
jumlah masa boleh diketahui lebih awal (Fowler 1988,
Denscombe 1998). Masa yang digunakan untuk menjalankan temuduga
data peribadi tidak boleh diketahui terlebih dahulu kerana ia berbeza dari
satu temu bual dengan yang lain (Fowler 1988). Temu bual telefon
boleh lebih cepat daripada soal selidik pos dan
temu bual peribadi tetapi boleh mempunyai kadar hilang yang tinggi
tindak balas kerana ketiadaan sesetengah orang (Fowler 1988).
Selain itu, temu bual telefon biasanya terhad kepada senarai
soalan yang agak pendek (Bainbridge 1989).
Satu lagi kelemahan soal selidik mel ialah kadar yang tinggi bagi
kekurangan tindak balas (Fowler 1988, Bainbridge 1989, Neuman
1994). Walau bagaimanapun, tindakan balas telah diambil, mengaitkan
kajian ini dengan institusi yang dipercayai dalam bidang data
pergudangan (iaitu TDWI) (Bainbridge 1989, Neuman 1994),
yang menghantar dua surat peringatan kepada mereka yang tidak menjawab
(Fowler 1988, Neuman 1994) dan juga termasuk surat
suplemen menjelaskan tujuan kajian (Neuman 1994).
3.4.2. Unit analisis
Tujuan kajian ini adalah untuk mendapatkan maklumat tentang
pelaksanaan pergudangan data dan penggunaannya
dalam organisasi Australia. Penduduk sasaran
terdiri daripada semua organisasi Australia yang mempunyai
dilaksanakan, atau sedang melaksanakan, i gudang data. dalam
organisasi individu kemudiannya didaftarkan. soal selidik tersebut
ia dihantar melalui pos kepada organisasi yang berminat untuk diterima pakai
di gudang data. Kaedah ini memastikan bahawa maklumat
dikumpul datang daripada sumber yang paling sesuai bagi setiap organisasi
peserta.
3.4.3. Sampel tinjauan
"senarai mel" peserta tinjauan diperoleh daripada
TDWI. Daripada senarai ini, 3000 organisasi Australia
dipilih sebagai asas persampelan. A
surat tambahan menjelaskan projek dan tujuan penyiasatan,
bersama kertas jawapan dan sampul surat prabayar untuk
menghantar semula soal selidik yang telah lengkap dihantar kepada sampel.
Daripada 3000 organisasi, 198 bersetuju untuk mengambil bahagian dalam
belajar. Sebilangan kecil jawapan telah dijangkakan dato il
sebilangan besar organisasi Australia yang mereka miliki ketika itu
memeluk atau menerima strategi tarikh
pergudangan dalam organisasi mereka. Jadi
Populasi sasaran untuk kajian ini hanya terdiri daripada 198 orang
organisasi.
3.4.4. Kandungan soal selidik
Struktur soal selidik adalah berdasarkan model tarikh
Pergudangan Monash (dibincangkan sebelum ini dalam bahagian 2.3). The
kandungan soal selidik adalah berdasarkan analisis terhadap
literatur yang dibentangkan dalam bab 2. Salinan soal selidik
dihantar kepada peserta tinjauan boleh didapati
dalam Lampiran B. Soal selidik mengandungi enam bahagian, iaitu
fasa model yang dibincangkan mengikuti. Enam perenggan berikut
mereka meringkaskan secara ringkas kandungan setiap bahagian.
Bahagian A: Maklumat asas tentang organisasi
Bahagian ini mengandungi soalan berkaitan profil
organisasi yang mengambil bahagian. Tambahan pula, beberapa soalan ialah
berkaitan dengan keadaan projek pergudangan data
peserta. Maklumat sulit seperti nama anda
organisasi tidak didedahkan dalam analisis tinjauan.
Bahagian B: Permulaan
Soalan dalam bahagian ini adalah berkaitan dengan aktiviti permulaan
pergudangan data. Soalan-soalan ditanya untuk berapa lama
melibatkan pemula projek, penjamin, kemahiran dan pengetahuan
permintaan, objektif pembangunan pergudangan data dan
jangkaan pengguna akhir.
Bahagian C: Reka Bentuk
Bahagian ini mengandungi soalan berkaitan aktiviti
perancangan daripada gudang data. Khususnya, soalannya ialah
nyatakan tentang skop pelaksanaan, tempoh projek, kos
projek dan analisis kos/faedah.
Bahagian D: Pembangunan
Dalam bahagian pembangunan terdapat soalan yang berkaitan dengan aktiviti
pembangunan gudang data: pengumpulan keperluan pengguna
akhir, sumber-sumber dati, model logik bagi dati, prototaip, yang
perancangan kapasiti, seni bina teknikal dan pemilihan
alat pembangunan pergudangan data.
Bahagian E: Operasi
Soalan operasi berkaitan operasi ed
kepada kebolehlanjutan daripada gudang data, bagaimana ia berkembang dalam
fasa pembangunan seterusnya. di sana kualiti data, strategi daripada
segarkan dei dati, kebutiran daripada dati, kebolehskalaan data
gudang dan masalah keselamatan gudang data mereka berada di antara
jenis soalan yang ditanya.
Bahagian F: Pembangunan
Bahagian ini mengandungi soalan berkaitan penggunaan data
gudang oleh pengguna akhir. Pengkaji tertarik
kepada tujuan dan kegunaan gudang data, semakan dan strategi
latihan yang diterima pakai dan strategi kawalan data
gudang diterima pakai.
3.4.5. Kadar tindakbalas
Walaupun tinjauan mel dikritik kerana mempunyai kadar
tindak balas yang rendah, langkah telah diambil untuk meningkatkan
kadar pulangan (seperti yang dibincangkan sebelum ini sebahagiannya
3.4.1). Istilah 'kadar tindak balas' merujuk kepada peratusan
orang dalam sampel tinjauan tertentu bertindak balas kepada
soal selidik (Denscombe 1998). Yang berikut telah digunakan
formula untuk mengira kadar tindak balas bagi kajian ini:
Bilangan orang yang menjawab
Kadar tindak balas =
——————————————————————————— X 100
Jumlah bilangan soal selidik yang dihantar
3.4.6. Ujian Juruterbang
Sebelum soal selidik dihantar kepada sampel, soalan-soalannya ialah
telah diperiksa dengan menjalankan ujian perintis, seperti yang dicadangkan oleh Luck
dan Rubin (1987), Jackson (1988), dan de Vaus (1991). Tujuan
ujian rintis adalah untuk mendedahkan semua yang janggal, samar-samar dan ekspresi
soalan yang sukar untuk ditafsir, untuk menjelaskan mana-mana
definisi dan istilah yang digunakan dan untuk mengenal pasti anggaran masa
diperlukan untuk melengkapkan soal selidik (Warwick dan Lininger 1975,
Jackson 1988, Salant dan Dilman 1994). Ujian perintis adalah
dijalankan dengan memilih mata pelajaran yang mempunyai ciri-ciri yang serupa dengannya
daripada mata pelajaran akhir, seperti yang dicadangkan Davis e Cosenza (1993). In
kajian ini, enam profesional pergudangan data telah
dipilih sebagai mata pelajaran rintis. Selepas setiap ujian rintis, mereka
pembetulan yang diperlukan telah dibuat. Daripada ujian rintis yang dijalankan, i
peserta membantu membentuk semula dan menetapkan semula
versi akhir soal selidik.
3.4.7. Kaedah Analisis Oleh Dati
I dati penyiasatan yang dikumpul daripada soal selidik tertutup ialah
telah dianalisis menggunakan pakej perisian statistik
dipanggil SPSS. Banyak jawapan telah dianalisis
menggunakan statistik deskriptif. Sebilangan soal selidik
mereka kembali tidak lengkap. Mereka ini dirawat dengan lebih besar
perhatian untuk memastikan bahawa i dati yang hilang bukan satu
akibat daripada ralat kemasukan data, tetapi mengapa soalan tidak
sesuai untuk pengisytihar, atau pengisytihar memutuskan untuk tidak
menjawab satu atau lebih soalan khusus. Jawapan ini
hilang diabaikan semasa analisis dati dan mereka
dikodkan sebagai '- 9' untuk memastikan pengecualian mereka daripada proses
analisis.
Dalam penyediaan soal selidik, soalan telah ditutup
diprakodkan dengan memberikan nombor kepada setiap pilihan. Jumlah
kemudian ia digunakan untuk menyediakan i dati semasa analisis
(Denscombe 1998, Sapsford dan Jupp 1996). Sebagai contoh, terdapat
enam pilihan yang disenaraikan dalam soalan 1 bahagian B: nasihat
lembaga, eksekutif kanan, jabatan IT, unit
perniagaan, perunding dan banyak lagi. Dalam fail daripada dati daripada SPSS, ialah
pembolehubah dijana untuk menunjukkan 'pemula projek',
dengan enam label nilai: '1' untuk 'lembaga pengarah', '2'
untuk 'the high-level executive' dan sebagainya. Penggunaan skala Likertin
dalam beberapa soalan tertutup ia juga dibenarkan
pengenalan yang tidak memerlukan usaha memandangkan penggunaan nilai
nombor yang sepadan dimasukkan ke dalam SPSS. Untuk soalan dengan
jawapan yang tidak lengkap, yang tidak saling eksklusif,
setiap pilihan dianggap sebagai pembolehubah tunggal dengan dua
label nilai: '1 ' untuk 'ditanda' dan '2 ' untuk 'tidak bertanda'.
Soalan terbuka dilayan secara berbeza daripada soalan
tertutup. Jawapan kepada soalan-soalan ini belum dimasukkan
SPSS. Sebaliknya, mereka dianalisis dengan tangan. Penggunaan ini
jenis soalan membolehkan anda mendapatkan maklumat tentang idea
diluahkan secara bebas dan pengalaman peribadi responden
(Bainbridge 1989, Denscombe 1998). Jika boleh, ia telah dilakukan
pengkategorian jawapan.
Untuk analisis dati, kaedah analisis statistik mudah digunakan,
seperti kekerapan tindak balas, min, sisihan piawai
min dan median (Argyrous 1996, Denscombe 1998).
Ujian Gamma berkesan untuk mendapatkan ukuran kuantitatif
daripada persatuan antara dati ordinal (Norusis 1983, Argyrous 1996).
Ujian ini sesuai kerana skala ordinal yang digunakan tidak
mereka mempunyai banyak kategori dan boleh ditunjukkan dalam jadual
(Norusis 1983).
3.5 Rumusan
Dalam bab ini, metodologi kajian dan
reka bentuk yang digunakan untuk kajian ini.
Memilih kaedah penyelidikan yang paling sesuai untuk a
kajian tertentu mengambil dalam
pertimbangan beberapa peraturan, termasuk sifat dan jenis
penyelidikan, serta merit dan kelemahan setiap kemungkinan
kaedah (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987,
yin 1989, Hamilton and ives 1992, Galliers 1992, neuman 1994). Lihat
kekurangan pengetahuan dan teori sedia ada mengenainya
penggunaan pergudangan data di Australia, kajian ini oleh
penyelidikan memerlukan kaedah penyelidikan interpretif dengan kemahiran
penerokaan untuk meneroka pengalaman organisasi
Australia. Kaedah kajian yang dipilih telah dipilih untuk
mengumpul maklumat mengenai penggunaan konsep tarikh
gudang oleh organisasi Australia. A
soal selidik pos telah dipilih sebagai teknik pengumpulan dati. yang
justifikasi bagi kaedah penyelidikan dan teknik pengumpulan dati
yang dipilih akan disediakan dalam bab ini. Juga ia adalah
membentangkan perbincangan mengenai unit analisis, sampel
digunakan, peratusan jawapan, kandungan soal selidik, yang
ujian pra soal selidik dan kaedah analisis bagi dati.

Merancang a Gudang Data:
Menggabungkan Perhubungan Entiti dan Pemodelan Dimensi
ABSTRAK
Menyimpan i dati Ia adalah isu semasa utama bagi ramai orang
organisasi. Masalah utama dalam pembangunan
daripada penyimpanan dati itu rekaan dia.
Reka bentuk mesti menyokong pengesanan konsep dalam data
gudang kepada sistem warisan dan sumber lain dati dan juga satu
pemahaman yang mudah dan kecekapan dalam pelaksanaan data
gudang.
Kebanyakan kesusasteraan penyimpanan dati disyorkan
penggunaan pemodelan hubungan entiti atau pemodelan dimensi untuk
mewakili reka bentuk gudang data.
Dalam makalah ini kami menunjukkan bagaimana kedua-duanya
perwakilan boleh digabungkan menjadi satu pendekatan untuk
lukisan daripada gudang data. Pendekatan yang digunakan adalah sistematik
diperiksa dalam kajian kes dan dikenal pasti dalam beberapa
implikasi penting dengan profesional.
PERGUDANGAN DATA
Un gudang data biasanya ditakrifkan sebagai "berorientasikan subjek,
pengumpulan data bersepadu, varian masa dan tidak meruap dalam sokongan
keputusan pengurusan” (Inmon dan Hackathorn, 1994).
Berorientasikan subjek dan bersepadu menunjukkan bahawa gudang data è
direka untuk merentasi sempadan fungsi sistem warisan untuk
menawarkan perspektif bersepadu bagi dati.
Varian masa mempengaruhi sifat sejarah atau siri masa dati in
un gudang data, yang membolehkan trend dianalisis.
Tidak meruap menunjukkan bahawa gudang data ia tidak berterusan
dikemas kini sebagai a pangkalan data daripada OLTP. Sebaliknya ia dikemas kini
secara berkala, dengan dati datang dari sumber dalaman dan luaran. The
gudang data ia direka khusus untuk penyelidikan
bukannya untuk integriti kemas kini dan prestasi
operasi.
Idea menyimpan i dati ia bukan baru, ia adalah salah satu tujuan
daripada pengurusan dati sejak tahun enam puluhan (The Martin, 1982).
I gudang data mereka menawarkan infrastruktur dati untuk pengurusan
sistem sokongan. Sistem sokongan pengurusan termasuk keputusan
sistem sokongan (DSS) dan sistem maklumat eksekutif (EIS).
DSS ialah sistem maklumat berasaskan komputer iaitu
direka untuk menambah baik proses dan seterusnya cengkaman
keputusan manusia. EIS biasanya merupakan sistem penyampaian
dati yang membolehkan eksekutif perniagaan mengakses paparan dengan mudah
daripada dati.
Seni bina umum a gudang data menonjolkan peranan
gudang data dalam sokongan pengurusan. Selain menawarkan
infrastruktur tersebut dati untuk EIS dan DSS, al gudang data adalah mungkin
akses terus melalui pertanyaan. THE dati dimasukkan dalam tarikh
gudang adalah berdasarkan analisis keperluan maklumat
pengurusan dan diperoleh daripada tiga sumber: sistem warisan dalaman,
sistem penangkapan data tujuan khas dan sumber data luaran. THE
dati dalam sistem legasi dalaman, ia sering berlebihan,
tidak konsisten, berkualiti rendah dan disimpan dalam pelbagai format
jadi mereka perlu didamaikan dan dibersihkan sebelum anda boleh memuatkannya ke dalam
gudang data (Inmon, 1992; McFadden, 1996). THE dati daripada
daripada sistem storan dati ad hoc dan daripada sumber dati
luaran selalunya digunakan untuk menambah (kemas kini, menggantikan) i
dati daripada sistem warisan.
Terdapat banyak sebab yang menarik untuk membangunkan a gudang data,
yang termasuk membuat keputusan yang lebih baik melalui penggunaan
lebih berkesan maklumat (Ives 1995), sokongan untuk fokus
pada perniagaan yang lengkap (Graham 1996), dan pengurangan kos bagi
peruntukan dati untuk EIS dan DSS (Graham 1996, McFadden
1996).
Kajian empirikal baru-baru ini mendapati, secara purata, pulangan daripada
pelaburan untuk i gudang data sebanyak 401% selepas tiga tahun (Graham,
1996). Walau bagaimanapun, kajian empirikal yang lain mengenai gudang data mempunyai
menemui masalah yang ketara termasuk kesukaran dalam mengukur ed
memberikan faedah, kekurangan tujuan yang jelas, meremehkannya
tujuan dan kerumitan proses penyimpanan i dati, Dalam
khususnya mengenai sumber dan kebersihan dati.
Menyimpan i dati boleh dianggap sebagai penyelesaian
kepada masalah pengurusan dati antara organisasi. di sana
manipulasi dati sebagai sumber sosial ia kekal sebagai salah satu daripada
isu utama dalam mengurus sistem maklumat merentasi
dunia selama bertahun-tahun (Brancheau et al. 1996, Galliers et al. 1994,
Niederman et al. 1990, Pervan 1993).
Pendekatan popular untuk mengurus dati pada tahun lapan puluhan itu
membangunkan model dati sosial. Model dati sosial adalah
direka untuk menawarkan asas yang stabil untuk pembangunan sistem baharu
aplikasi e pangkalan data dan membina semula dan menyepadukan warisan
sistem (Brancheau et al.
1989, Goodhue et al. 1988:1992, Kim dan Everest 1994).
Walau bagaimanapun, terdapat banyak masalah dengan pendekatan ini, dalam
khususnya, kerumitan dan kos setiap tugas, dan masa yang panjang
diperlukan untuk mempunyai hasil yang ketara (Beynon-Davies 1994, Earl
1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997).
Il gudang data ia adalah pangkalan data berasingan yang wujud bersama dengan pangkalan data lama
pangkalan data dan bukannya menggantikannya. Oleh itu, ia membolehkan anda
mengarahkan pengurusan dati dan mengelakkan pembinaan semula yang mahal
sistem warisan.
PENDEKATAN SEDIA ADA UNTUK REKA BENTUK DATA
WAREHOUSE
Proses membina dan menyempurnakan a gudang data
seharusnya lebih difahami sebagai proses evolusi dan bukannya a
kitaran hayat pembangunan sistem tradisional (Keinginan, 1995, Shanks,
O'Donnell dan Arnott 1997a). Terdapat banyak proses yang terlibat dalam a
projek daripada gudang data seperti permulaan, perancangan;
maklumat yang diperoleh daripada keperluan yang diminta pengurus syarikat;
sumber, transformasi, pembersihan dati dan penyegerakan daripada warisan
sistem dan sumber lain daripada dati; sistem penyampaian dalam pembangunan;
pemantauan terhadap gudang data; dan kebodohan proses
evolusi dan pembinaan a gudang data (Stinches, O'Donnell
dan Arnott 1997b). Dalam jurnal ini, kami memberi tumpuan kepada bagaimana
lukis i dati disimpan dalam konteks proses lain ini.
Terdapat beberapa pendekatan yang dicadangkan untuk seni bina data
gudang dalam kesusasteraan (Inmon 1994, Ives 1995, Kimball 1994
McFadden 1996). Setiap metodologi ini mempunyai ringkasan
mengkaji semula dengan analisis kekuatan dan kelemahan mereka.
Pendekatan Inmon (1994) untuk Gudang Data
reka bentuk
Inmon (1994) mencadangkan empat langkah berulang untuk melukis data
gudang (lihat Rajah 2). Langkah pertama ialah mereka bentuk templat
dati sosial untuk memahami bagaimana i dati boleh diintegrasikan
merentas kawasan fungsian dalam sesebuah organisasi
membahagi i dati menyimpan di kawasan. Model dati ia dibuat untuk
untuk menyimpan dati berkaitan dengan membuat keputusan, termasuk dati
ahli sejarah, dan termasuk dati disimpulkan dan diagregatkan. Langkah kedua ialah
mengenal pasti bidang mata pelajaran untuk dilaksanakan. Ini adalah berasaskan
mengenai keutamaan yang ditentukan oleh organisasi tertentu. Ketiga
langkah melibatkan lukisan a pangkalan data untuk kawasan subjek, pose
beri perhatian khusus untuk memasukkan tahap butiran yang sesuai.
Inmon mengesyorkan menggunakan model entiti dan perhubungan. Keempat
langkah adalah untuk mengenal pasti sistem sumber dati diperlukan dan berkembang
proses transformasi untuk menangkap, membersihkan dan memformat i dati.
Kekuatan pendekatan Inmon ialah model dati sosial
menawarkan asas untuk penyepaduan dati dalam organisasi
dan sokongan perancangan untuk pembangunan data berulang
gudang. Kelemahannya ialah kesukaran dan kos lukisan
model dati sosial, kesukaran memahami model entiti dan
hubungan yang digunakan dalam kedua-dua model, itu dati sosial dan daripada dati
disimpan mengikut kawasan subjek, dan kesesuaian dati yang
lukisan daripada gudang data untuk merealisasikan pangkalan data
hubungan tetapi bukan untuk pangkalan data pelbagai dimensi.
Ives' (1995) Pendekatan kepada Gudang Data
reka bentuk
Ives (1995) mencadangkan pendekatan empat langkah untuk mereka bentuk a
sistem maklumat yang beliau anggap boleh digunakan untuk reka bentuk sesuatu data
gudang (lihat Rajah 3). Pendekatan ini sangat berdasarkan
Kejuruteraan Maklumat untuk pembangunan sistem maklumat
(Martin 1990). Langkah pertama ialah menentukan objektif, faktor
kritikal dan berjaya dan petunjuk prestasi utama. THE
proses perniagaan utama dan maklumat yang diperlukan adalah
dimodelkan untuk membawa kita kepada model dati sosial. Langkah kedua
melibatkan pembangunan seni bina yang menentukan dati
disimpan mengikut kawasan, pangkalan data di gudang data, komponen
teknologi yang diperlukan, set sokongan organisasi
diperlukan untuk melaksanakan dan beroperasi dengan gudang data. Ketiga
langkah termasuk memilih pakej perisian dan alatan yang diperlukan.
Langkah keempat ialah reka bentuk dan pembinaan terperinci
gudang data. Ives mencatatkan bahawa menyimpan dati dia seorang lelaki terikat
proses berulang.
Kekuatan pendekatan Ives ialah penggunaan teknik khusus untuk
menentukan keperluan maklumat, penggunaan berstruktur
proses untuk menyokong integrasi gudang data,
pemilihan perkakasan dan perisian yang sesuai, dan penggunaan berbilang
teknik perwakilan untuk gudang data. kelemahannya
mereka wujud dalam kerumitan. Lain-lain termasuk kesukaran dalam
membangunkan banyak peringkat pangkalan data Di antara gudang data in
masa dan kos yang munasabah.
Pendekatan Kimball (1994) untuk Gudang Data
reka bentuk
Kimball (1994) mencadangkan lima langkah berulang untuk melukis data
gudang (lihat Rajah 4). Pendekatan beliau adalah terutamanya
khusus untuk reka bentuk hanya satu gudang data dan mengenai penggunaan model
dimensi dalam keutamaan kepada model entiti dan perhubungan. Kimball
menganalisis model dimensi tersebut kerana ia lebih mudah untuk saya fahami
urusan eksekutif perniagaan, ia lebih cekap apabila berurusan
perundingan yang kompleks, dan reka bentuk pangkalan data fizikal adalah lebih
cekap (Kimball 1994). Kimball mengiktiraf bahawa pembangunan a
gudang data ia adalah berulang, dan itu gudang data berpisah mereka boleh
disepadukan melalui pembahagian ke dalam jadual dimensi
biasa.
Langkah pertama ialah mengenal pasti bidang subjek tertentu
disempurnakan. Langkah kedua dan ketiga berkenaan dengan pembentukan
berdimensi. Dalam langkah kedua pengukuran mengenal pasti perkara
minat dalam bidang subjek dan dikumpulkan ke dalam jadual fakta.
Sebagai contoh, dalam bidang subjek jualan ukuran minat
boleh termasuk jumlah barang yang dijual dan dolar
sebagai mata wang jualan. Langkah ketiga melibatkan mengenal pasti
dimensi yang merupakan cara bagaimana ia boleh dikumpulkan i
fakta. Dalam bidang subjek jualan, dimensi yang berkaitan
boleh termasuk item, lokasi dan tempoh masa. di sana
jadual fakta mempunyai kunci berbilang bahagian untuk dipautkan kepada setiap satu
jadual dimensi dan biasanya mengandungi nombor yang sangat banyak
penuh dengan fakta. Sebaliknya, jadual dimensi mengandungi
maklumat deskriptif tentang dimensi dan atribut lain yang
boleh digunakan untuk mengumpulkan fakta. Jadual fakta e
dimensi yang berkaitan dengan borang cadangan apa yang dipanggil satu
corak bintang kerana bentuknya. Langkah keempat melibatkan
pembinaan a pangkalan data multidimensi untuk menyempurnakannya
corak bintang. Langkah terakhir ialah mengenal pasti sistem sumber dati
diperlukan dan membangunkan proses transformasi untuk memperoleh, bersih
dan format i dati.
Kekuatan pendekatan Kimball termasuk penggunaan model
dimensi untuk mewakili i dati disimpan yang membuatnya
mudah difahami dan membawa kepada reka bentuk fizikal yang cekap. A
model dimensi yang juga mudah menggunakan kedua-duanya
sistem pangkalan data hubungan boleh disempurnakan atau sistem
pangkalan data pelbagai dimensi. Kelemahannya termasuk kekurangan
beberapa teknik untuk memudahkan perancangan atau penyepaduan
banyak corak bintang dalam satu gudang data dan
kesukaran dalam mereka bentuk daripada struktur tidak normal yang melampau dalam a
model dimensi a dati dalam sistem warisan.
Pendekatan kepada Data McFadden (1996).
Reka Bentuk Gudang
McFadden (1996) mencadangkan pendekatan lima langkah untuk
Lukis gudang data (lihat Rajah 5).
Pendekatan beliau adalah berdasarkan sintesis idea daripada kesusasteraan
dan tertumpu kepada reka bentuk satu sahaja gudang data. Yang pertama
langkah melibatkan analisis keperluan. Walaupun spesifik
teknik tidak ditetapkan, nota McFadden mengenal pasti
entiti dati spesifikasi dan atributnya, dan merujuk kepada pembaca Watson
dan Frolick (1993) untuk tangkapan keperluan.
Dalam langkah kedua, model perhubungan entiti direka untuk
gudang data dan kemudian disahkan oleh pemimpin perniagaan. Ketiga
langkah termasuk menentukan pemetaan daripada sistem warisan
dan sumber luar gudang data. Langkah keempat melibatkan
proses dalam pembangunan, penggunaan dan penyegerakan dati dalam
gudang data. Pada langkah terakhir, sistem dihantar
dibangunkan dengan penekanan khusus pada antara muka pengguna.
McFadden menunjukkan bahawa proses lukisan secara amnya
berulang.
Kekuatan pendekatan McFadden menunjukkan penyertaan
oleh pemimpin perniagaan dalam menentukan keperluan dan juga
kepentingan sumber dati, pembersihan dan pengumpulan mereka. dia
kelemahan melibatkan kekurangan proses untuk membahagikan a
projek hebat oleh gudang data dalam banyak peringkat bersepadu, dan
kesukaran memahami entiti dan model perhubungan yang digunakan dalam reka bentuk
gudang data.

    0/5 (0 Ulasan)
    0/5 (0 Ulasan)
    0/5 (0 Ulasan)

    Ketahui lebih lanjut daripada Agensi Web Dalam Talian

    Langgan untuk menerima artikel terkini melalui e-mel.

    avatar pengarang
    admin CEO
    👍Agensi Web Dalam Talian | Pakar Agensi Web dalam Pemasaran Digital dan SEO. Agensi Web Dalam Talian ialah Agensi Web. Untuk Agenzia Web Online kejayaan dalam transformasi digital adalah berdasarkan asas Iron SEO versi 3. Kepakaran: Integrasi Sistem, Integrasi Aplikasi Perusahaan, Seni Bina Berorientasikan Perkhidmatan, Pengkomputeran Awan, Gudang data, risikan perniagaan, Data Besar, portal, intranet, Aplikasi Web Reka bentuk dan pengurusan pangkalan data hubungan dan multidimensi Mereka bentuk antara muka untuk media digital: kebolehgunaan dan Grafik. Agensi Web Dalam Talian menawarkan syarikat perkhidmatan berikut: -SEO di Google, Amazon, Bing, Yandex; -Analitis Web: Analitis Google, Pengurus Google Tag, Yandex Metrica; -Penukaran pengguna: Google Analitis, Microsoft Clarity, Yandex Metrica; -SEM di Google, Bing, Iklan Amazon; -Pemasaran Media Sosial (Facebook, Linkedin, Youtube, Instagram).
    Privasi Tangkas Saya
    Tapak ini menggunakan kuki teknikal dan profil. Dengan mengklik terima anda membenarkan semua kuki pemprofilan. Dengan mengklik pada tolak atau X, semua kuki pemprofilan ditolak. Dengan mengklik pada suaikan, anda boleh memilih kuki pemprofilan yang ingin diaktifkan.
    Tapak ini mematuhi Akta Perlindungan Data (LPD), Undang-undang Persekutuan Switzerland pada 25 September 2020 dan GDPR, Peraturan EU 2016/679, yang berkaitan dengan perlindungan data peribadi serta pergerakan bebas data tersebut.