fbpx

Data Warehousing at ERP | CENTRAL DATA ARCHIVE: KASAYSAYAN AT EBOLUSYON

ARKIBO DATA CENTRAL : KASAYSAYAN AT EBOLUSYON


Ang dalawang nangingibabaw na tema ng corporate technology noong dekada 90 ay
nagsasaad ng i data bodega at ang ERP. Sa mahabang panahon ang dalawang makapangyarihang ito
Ang mga alon ay naging mga bahagi ng corporate IT nang hindi kailanman nagkakaroon
mga panulukan. Ito ay halos bilang kung sila ay bagay at anti-materya. Pero
ang paglago ng parehong phenomena ay hindi maaaring hindi humantong sa isa
kanilang intersection. Ngayon ang mga kumpanya ay nahaharap sa problema ng
ano ang gagawin sa ERP e data bodega. Ang artikulong ito ay maglalarawan
ano ang mga problema at paano sila tinutugunan ng mga kumpanya.
SA SIMULA…
Sa simula ay mayroong data bodega. Bodega ng data ay ipinanganak para sa
kontrahin ang sistema ng aplikasyon sa pagproseso ng transaksyon.
Sa mga unang araw ng pagsasaulo ng data ito ay sinadya upang maging
isang counterpoint lamang sa mga aplikasyon sa pagpoproseso ng email
mga transaksyon. Ngunit sa kasalukuyan ay may mas sopistikadong mga pangitain
ng kung ano ang magagawa ng isang data bodega. Sa panahon ngayon ang
data bodega ay ipinasok sa loob ng isang istraktura na maaaring
tinatawag na Corporate Information Factory.
ANG CORPORATE INFORMATION FACTORY
(CIF)
Ang Corporate Information Factory ay may mga bahaging arkitektura
pamantayan: isang antas ng pagbabago at pagsasama ng code
na nagsasama-sama ng i data habang ako data lumipat sila mula sa kapaligiran ng
aplikasyon sa kapaligiran data bodega ng kumpanya; a
data bodega ng kumpanya kung saan i data
detalyado at pinagsama-samang mga kasaysayan. Ang data bodega ng kumpanya ang nagsisilbing
pundasyon kung saan maaaring itayo ang lahat ng iba pang bahagi
ng kapaligiran ng data bodega; isang operational data store (ODS).
Ang ODS ay isang hybrid na istraktura na naglalaman ng ilang aspeto ng data
bodega at iba pang aspeto ng isang kapaligiran ng OLTP; data marts, kung saan i
maaaring magkaroon ng sariling bersyon ng data ang iba't ibang departamento
bodega; a data bodega ng eksplorasyon kung saan i
Ang mga "pilosopo" ng kumpanya (mga nag-iisip) ay maaaring magsumite ng kanilang mga tanong tungkol sa
72 oras na walang nakakapinsalang epekto sa data bodega; at isang alaala
malapit sa linya, kung saan data matanda at data maramihang detalye ay maaaring
nakaimbak na mura.
KUNG SAAN KASAMA ANG ERP SA
PABRIKA NG IMPORMASYON NG CORPORATE
Ang ERP ay pinagsama sa Corporate Information Factory sa dalawang lugar.
Pangunahin bilang baseline application na nagbibigay ng i
data ng aplikasyon sa data bodega. Sa kasong ito i data,
nabuo bilang isang by-product ng isang proseso ng transaksyon,
ay isinama at ikinakarga sa data bodega ng kumpanya. Ang
pangalawang punto ng unyon sa pagitan ng ERP at CIF at ng ODS. Sa katunayan, marami
mga kapaligiran na ginagamit ang ERP bilang isang klasikong ODS.
Kung sakaling ang ERP ay ginamit bilang isang pangunahing aplikasyon, ito
ang parehong ERP ay maaari ding gamitin sa CIF bilang ODS. Sa
gayunpaman, kung ang ERP ay gagamitin sa parehong mga tungkulin, doon
dapat mayroong malinaw na pagkakaiba sa pagitan ng dalawang entity. Sa ibang salita,
kapag ang ERP ay gumaganap ng papel ng base application at ODS, le
dalawang entidad ng arkitektura ang dapat makilala. Kung single
ang pagpapatupad ng isang ERP ay sumusubok na gampanan ang parehong mga tungkulin
kasabay nito ay hindi maiiwasang magkaroon ng mga problema sa
disenyo at pagpapatupad ng istrukturang ito.
HIWALAY NA ODS AT MGA BATAYANG APPLICATION
Mayroong maraming mga kadahilanan na humahantong sa mga paghahati ng bahagi
arkitektura. Marahil ang pinaka mahusay na tanong upang paghiwalayin ang
iba't ibang bahagi ng isang arkitektura ay ang bawat bahagi
Ang arkitektura ay may sariling pananaw. Nagsisilbi ang baseline application
para sa ibang layunin kaysa sa ODS. Subukang mag-overlap
isang baseline application view sa mundo ng isang ODS o vice versa
hindi ito tamang paraan para magtrabaho.
Dahil dito, ang unang problema ng isang ERP sa CIF ay ang sa
suriin kung mayroong pagkakaiba sa pagitan ng mga baseline application at ng
Mga SDG.
MGA MODELONG DATA SA CORPORATE
PABRIKA NG IMPORMASYON
Upang makamit ang pagkakaisa sa pagitan ng iba't ibang bahagi
ng arkitektura ng CIF, dapat mayroong isang modelo ng data. Ako
mga modelo ng data nagsisilbi silang ugnayan sa pagitan ng iba't ibang sangkap
arkitektura tulad ng mga baseline application at ODS. ANG
mga modelo ng data maging “intelektwal na mapa ng daan” upang magkaroon ng
tamang kahulugan mula sa iba't ibang bahagi ng arkitektura ng CIF.
Kasabay ng ideyang ito, ang ideya ay dapat
maging isang mahusay at natatanging modelo ng data. Syempre kailangan niya
maging modelo ng data para sa bawat isa sa mga bahagi at higit pa doon
ito ay dapat na isang makabuluhang landas na nagkokonekta sa iba't ibang mga modelo.
Ang bawat bahagi ng arkitektura – ODS, baseline application,
data bodega ng kumpanya, at iba pa .. – nangangailangan ng sarili nitong
modelo ng data. At kaya dapat mayroong isang tiyak na kahulugan ng
tulad ng mga modelong ito ng data interface sila sa isa't isa.
MOVE I DATA NG ERP DATE
WAREHOUSE
Kung ang pinagmulan ng data ay isang baseline application at/o isang ODS, kapag
ang ERP inserts i data sa data bodega, ang entry na ito ay dapat
magaganap sa pinakamababang antas ng granularity. Recap o
basta pinagsama-samang i data habang lumalabas sila
mula sa ERP baseline application o ERP ODS ay wala doon
tamang gawin. ANG data kailangan ang mga detalye sa datos
bodega upang maging batayan ng proseso ng DSS. ganyan data
sila ay muling hubugin sa maraming paraan ng data marts at paggalugad
del data bodega.
Ang paglilipat ng data mula sa baseline application environment
ng ERP sa kapaligiran ng data bodega ng kumpanya ay ginagawa sa a
makatwirang nakakarelaks na paraan. Ang paglilipat na iyon ay nangyayari pagkatapos nito
humigit-kumulang 24 na oras mula sa pag-update o paglikha sa ERP. Ang katotohanan ng
magkaroon ng "tamad" na paggalaw ng data sa data bodega
ng kumpanya ay nagpapahintulot sa data na nagmumula sa ERP upang "tumira".
Sa sandaling i data ay idineposito sa baseline application,
pagkatapos ay maaari mong ligtas na ilipat i data ng ERP
sa negosyo. Isa pang layunin na maaaring makamit salamat sa paggalaw
"tamad" na mga diyos data ay ang malinaw na delimitasyon sa pagitan ng mga proseso ng pagpapatakbo at
extension ng DS. Sa pamamagitan ng "mabilis" na paggalaw ng data ang linya ng demarkasyon
sa pagitan ng DSS at pagpapatakbo ay nananatiling malabo.
Il Movimento dei data mula sa ODS ng ERP hanggang data bodega
ng kumpanya ay ginagawa pana-panahon, kadalasan
lingguhan o buwanan. Sa kasong ito ang paggalaw ng
data ito ay batay sa pangangailangang "linisin" ang luma data mga mananalaysay.
Natural, ang ODS ay naglalaman ng i data na mas bago
respeto kay data mga mananalaysay na matatagpuan sa data bodega.
Ang paglilipat ng data sa data bodega halos hindi na tapos
“pamakyaw” (sa paraang mamamakyaw). Kumopya ng table
mula sa kapaligiran ng ERP hanggang data bodega wala itong saysay. Isang diskarte
higit na makatotohanan ang paggalaw ng mga piling yunit ng data.
Ang data na nagbago mula noong huling pag-update ng data
Ang bodega ay ang mga dapat ilipat sa data
bodega. Isang paraan para malaman kung alin data sila ay binago
dahil ang huling update ay upang tingnan ang mga timestamp ng data
matatagpuan sa kapaligiran ng ERP. Pinipili ng taga-disenyo ang lahat ng mga pagbabago
na lumitaw mula noong huling pag-update. Isa pang diskarte
ay ang paggamit ng mga diskarte sa pagkuha ng pagbabago data. May
sinusuri ng mga pamamaraang ito ang mga log at journal tape upang
tukuyin kung alin data dapat ilipat mula sa kapaligiran ng ERP sa
Iyon sa data bodega. Ang mga diskarteng ito ay pinakamahusay sa
kung paano mababasa ang mga log at journal tape mula sa ERP file
na walang karagdagang epekto sa iba pang mapagkukunan ng ERP.
IBA PANG KOMPLIKASYON
Isa sa mga problema sa ERP sa CIF ay kung ano ang nangyayari sa iba
mga mapagkukunan ng aplikasyon o ai data ng ODS na dapat mag-ambag sa
data bodega ngunit hindi sila bahagi ng kapaligiran ng ERP. I-date ang
saradong kalikasan ng ERP, lalo na ang SAP, ang pagtatangka na isama ang
mga susi mula sa mga panlabas na mapagkukunan ng data kasama ko data na nanggaling sa ERP al
oras na para lumipat i data sa data bodega, ito ay isang malaking hamon.
At ano nga ba ang mga probabilidad na i data ng mga aplikasyon o
Ang ODS sa labas ng kapaligiran ng ERP ay isasama sa data
bodega? Ang mga posibilidad ay talagang napakataas.
HANAPIN DATA MGA KASAYSAYAN MULA SA ERP
Isa pang problema sa data ng ERP ang resulta
mula sa pangangailangan na magkaroon data makasaysayan sa loob ng data bodega.
Karaniwan ang data bodega mga pangangailangan data mga mananalaysay. AT
Karaniwang hindi iniimbak ng teknolohiya ng ERP ang mga ito data
makasaysayan, hindi bababa sa hindi sa lawak na ito ay kinakailangan sa petsa
bodega. Kapag malaking halaga ng data sinimulan ng mga mananalaysay ang ad
upang maidagdag sa kapaligiran ng ERP, ang kapaligiran na iyon ay dapat
nilinis. Halimbawa, ipagpalagay na a data bodega dapat
ma-load ng limang taon ng data makasaysayang habang pinanghahawakan ng ERP
maximum na anim na buwan ng mga ito data. Hangga't ang kumpanya ay nasiyahan sa
mangolekta ng isang serye ng data kasaysayan habang lumilipas ang panahon,
pagkatapos ay walang problema sa paggamit ng ERP bilang isang mapagkukunan para sa
data bodega. Ngunit kapag ang data bodega Dapat pumunta
bumalik sa panahon at kumuha ng mga diyos data mga mananalaysay na hindi pa
dating nakolekta at nai-save ng ERP, pagkatapos ay ang kapaligiran ng ERP
nagiging inefficient ito.
ERP AT METADATA
Isa pang pagsasaalang-alang na dapat gawin tungkol sa ERP at data bodega iyan ba
sa umiiral na metadata sa kapaligiran ng ERP. Pati na rin ang metadata
lumipat sila mula sa kapaligiran ng ERP patungo sa del data bodega, Ang
Ang metadata ay dapat ilipat sa parehong paraan. Higit pa rito, i
ang metadata ay dapat mabago sa format at istraktura
kinakailangan ng imprastraktura ng data bodega. May malaki
pagkakaiba sa pagitan ng operational metadata at DSS metadata. Ang metadata
ang pagpapatakbo ay pangunahing para sa developer at para sa
programmer. Pangunahing para sa iyo ang metadata ng DSS
ang pangwakas. Umiiral na metadata sa mga ERP application o ODS
kailangan nilang ma-convert at ang pagbabagong ito ay hindi laging madali
at direktang.
PAG-SOURCING NG ERP DATA
Kung ang ERP ay ginagamit bilang tagapagbigay ng data para sa data bodega ci
dapat ay isang solidong interface na gumagalaw i data mula sa kapaligiran
ERP sa kapaligiran data bodega. Ang interface ay dapat:
▪ maging madaling gamitin
▪ payagan ang pag-access sa data ng ERP
▪ kunin ang kahulugan ng data na malapit nang malipat
sa data bodega
▪ malaman ang mga limitasyon ng ERP na maaaring lumitaw sa
sandali kung kailan ginawa ang pag-access data ng ERP:
▪ integridad ng referential
▪ hierarchical na relasyon
▪ mga implicit na lohikal na relasyon
▪ kumbensyon ng aplikasyon
▪ lahat ng istruktura ng data suportado ng ERP, at iba pa ...
▪ maging mahusay sa pag-access data, sa pamamagitan ng pagbibigay ng:
▪ direktang paggalaw ng data
▪ pagkuha ng pagbabago data
▪ sumusuporta sa napapanahong pag-access sa data
▪ maunawaan ang format ng data, at iba pa…
INTERFACE SA SAP
Ang interface ay maaaring may dalawang uri, homegrown o komersyal.
Ang ilan sa mga pangunahing komersyal na interface ay kinabibilangan ng:
▪ SAS
▪ Mga Pangunahing Solusyon
▪ D2k, at iba pa…
MARAMING ERP TECHNOLOGIES
Ang pagtrato sa kapaligiran ng ERP na parang ito ay isang teknolohiya ay a
Malaking pagkakamali. Mayroong maraming mga teknolohiya ng ERP, bawat isa ay may sarili nitong
lakas. Ang mga kilalang vendor sa merkado ay:
▪ SAP
▪ Oracle Financials
▪ PeopleSoft
JD Edwards
▪ Mga Baan
Panghinain
Ang SAP ay ang pinakamalaki at pinakakomprehensibong ERP software. Ang mga aplikasyon
ng SAP ay sumasaklaw sa maraming uri ng mga aplikasyon sa maraming lugar. May SAP
ang reputasyon ng pagiging:
▪ napakalaki
▪ napakahirap at mahal na ipatupad
▪ nangangailangan ng maraming tao at consultant
ipinatupad
▪ nangangailangan ng mga dalubhasang tao para sa pagpapatupad
▪ nangangailangan ng maraming oras para ipatupad
Gayundin ang SAP ay may reputasyon sa pag-iimbak nito data molto
maingat, na ginagawang mahirap para sa isa na ma-access ang mga ito
tao sa labas ng SAP area. Ang lakas ng SAP
may kakayahang kumuha at mag-imbak ng malaking halaga ng data.
Kamakailan ay inihayag ng SAP ang kanilang intensyon na palawigin ang
mga aplikasyon nito sa data bodega. Maraming kalamangan at kahinaan
sa paggamit ng SAP bilang tagapagbigay ng data bodega.
Ang isang kalamangan ay ang SAP ay naka-install na at ang karamihan sa mga
alam na ng mga consultant ang SAP.
Ang mga disadvantage ng pagkakaroon ng SAP bilang supplier ng data bodega ay
marami: walang karanasan si SAP sa mundo ng data bodega
Kung ang SAP ang supplier ng data bodega, kailangang "ilabas"
i data mula sa SAP al data bodega. Dato track record ng SAP ng
closed system, malamang na hindi madaling makuha ang i mula sa SAP
ito (???). Maraming mga legacy na kapaligiran na nagpapagana sa SAP,
tulad ng IMS, VSAM, ADABAS, ORACLE, DB2, at iba pa.
Iginiit ng SAP ang isang "hindi imbento dito" na diskarte. Ayaw ni SAP
makipagtulungan sa iba pang mga vendor upang gamitin o gawin ang data bodega.
Ang SAP ay nagpipilit sa pagbuo ng lahat ng sarili nitong software mismo.
Bagama't ang SAP ay isang malaki at makapangyarihang kumpanya, ang katotohanan ng
subukang muling isulat ang teknolohiya ng ELT, OLAP, pangangasiwa ng
system at maging ang codebase ng dbms nakakabaliw lang.
Sa halip na magpatibay ng isang kooperatiba na saloobin sa mga supplier
di data bodega matagal na, sinunod ng SAP ang diskarte na
sila ay "mas nakakaalam". Pinipigilan ng saloobing ito ang tagumpay na iyon
Maaaring mayroon ang SAP sa lugar ng data bodega.
Ang pagtanggi ng SAP na payagan ang mga external na vendor na ma-access
kaagad at maganda sa kanila data. Ang pinaka kakanyahan ng paggamit
un data bodega ay madaling ma-access data. Ang buong kwento ng SAP ay
batay sa pagpapahirap sa pag-access data.
Ang kakulangan ng karanasan ng SAP sa pagharap sa malalaking volume ng data;
sa larangan ng data bodega may mga volume ng data hindi na nakita mula noon
SAP at upang pamahalaan ang malalaking dami ng data dapat meron ka
angkop na teknolohiya. Ang SAP ay tila hindi alam ito
teknolohikal na hadlang na umiiral upang makapasok sa larangan ng data
bodega.
Ang kultura ng korporasyon ng SAP: Lumikha ng negosyo ang SAP
sa pagkuha ng i data mula sa sistema. Ngunit para magawa ito dapat mayroon ka
ibang mindset. Ayon sa kaugalian, ang mga kumpanya ng software noon
mahusay sa pagkuha ng data sa isang kapaligiran ay hindi naging mahusay sa
pagkuha ng data upang pumunta sa ibang paraan. Kung kayang gawin ng SAP ang ganitong uri
switch ang magiging unang kumpanya na gagawa nito.
Sa madaling salita, ito ay kaduda-dudang kung ang isang kumpanya ay dapat pumili
SAP bilang supplier ng data bodega. May mga napakaseryosong panganib
sa isang panig at napakakaunting gantimpala sa kabilang panig. Pero may isa pa
dahilan na pumipigil sa pagpili ng SAP bilang tagapagtustos ng data
bodega. Dahil ang bawat kumpanya ay dapat magkaroon ng parehong petsa
bodega ng lahat ng iba pang kumpanya? Ang data bodega ito ay ang puso
ng competitive advantage. Kung pareho ang pinagtibay ng bawat kumpanya
data bodega magiging mahirap, bagaman hindi imposible,
makamit ang competitive advantage. Mukhang iniisip ni SAP na a
data bodega ay makikita bilang isang biskwit at iyon ay a
isa pang palatandaan ng kanilang “kunin ang datos
sa".
Walang ibang ERP vendor ang kasing dominante ng SAP.
Walang alinlangan na may mga kumpanyang pupunta sa paraan ng SAP
para sa kanila data bodega ngunit marahil ang mga petsang ito
Ang mga bodega ng SAP ay magiging malaki, mahal at mangangailangan ng marami
oras para sa kanilang paglikha.
Kasama sa mga kapaligirang ito ang mga aktibidad gaya ng pagproseso ng bank teller,
mga proseso ng pagpapareserba ng eroplano, mga proseso ng reklamo
insurance, at iba pa. Ang sistema ng transaksyon ay mas mahusay,
mas malinaw ay ang pangangailangan para sa paghihiwalay sa pagitan ng pagpapatakbo at proseso
DSS (Decision Support System). Gayunpaman, sa mga sistema ng mapagkukunan
tao at personal, hindi kailanman nahaharap ang isang tao sa malalaking volume ng
mga transaksyon. At, siyempre, kapag ang isang tao ay tinanggap
o umalis sa kumpanya ito ay isang talaan ng isang transaksyon.
Ngunit may kaugnayan sa iba pang mga sistema, mga sistema ng HR at
wala lang masyadong transaction ang personals. Samakatuwid, sa
human resources at personnel systems hindi lubos na halata na meron
kailangan ng DataWarehouse. Sa maraming paraan ang mga sistemang ito
kumakatawan sa pagkakaisa ng mga sistema ng DSS.
Ngunit may isa pang kadahilanan na dapat isaalang-alang kung kailangan mo
gawin sa datawarehouse at sa PeopleSoft. Sa maraming lupon, i data
Ang HR at mga personal na mapagkukunan ay pangalawa sa negosyo
pinuno ng kumpanya. Karamihan sa mga kumpanya ay gumaganap
pagmamanupaktura, pagbebenta, pagbibigay ng mga serbisyo at iba pa. ANG
Ang mga sistema ng HR at tauhan ay karaniwang pangalawa (o ng
suporta) sa pangunahing linya ng negosyo ng kumpanya. Samakatuwid, ito ay
malabo at hindi maginhawa a data bodega hiwalay para sa
suporta sa human at personal resources.
Ang PeopleSoft ay ibang-iba sa SAP sa bagay na ito. Sa SAP, ito ay
ipinag-uutos na mayroong a data bodega. Sa PeopleSoft, hindi
tapos sobrang linaw. Ang isang data warehouse ay opsyonal sa PeopleSoft.
Ang pinakamagandang bagay na masasabi para sa data PeopleSoft ay iyon ang data
bodega ay maaaring gamitin sa pag-imbak i data patungkol sa
lumang tao at personal na yaman. Ang pangalawang dahilan para sa
na gustong gamitin ng isang kumpanya a data bodega a
Ang kawalan ng kapaligiran ng PeopleSoft ay ang payagan ang pag-access at
libreng access sa mga tool sa pagsusuri, ai data ng PeopleSoft. Pero
bilang karagdagan sa mga kadahilanang ito, maaaring may mga kaso kung saan mas mainam na huwag
magkaroon ng data warehouse para sa data PeopleSoft.
Sa buod
Mayroong maraming mga ideya tungkol sa pagbuo ng isang data
bodega sa loob ng isang ERP software.
Ilan sa mga ito ay:
▪ Makatuwirang magkaroon ng a data bodega na parang kahit ano
iba sa industriya?
▪ Gaano ka-flexible ang isang ERP data bodega software?
▪ Isang ERP data bodega maaaring hawakan ng software ang dami ng
data na matatagpuan sa isang "data bodega arena"?
▪ Ano ang trace logging na ginagawa ng ERP vendor
nahaharap sa madali at mura, nakakaubos ng oras, ai data? (Ano
ay ang ERP vendors track record sa paghahatid ng mura, sa
oras, madaling ma-access ang data?)
▪ Ano ang pagkaunawa sa arkitektura ng DSS at ang
"pabrika ng impormasyon ng korporasyon" ng vendor ng ERP?
▪ Naiintindihan ng mga vendor ng ERP kung paano kumuha data all'interno
ng kapaligiran, ngunit nauunawaan din kung paano i-export ang mga ito?
▪ Gaano kabukas ang vendor ng ERP sa mga tool sa data
bodega?
Ang lahat ng mga pagsasaalang-alang na ito ay dapat gawin sa pagtukoy
kung saan ilalagay ang data bodega na magho-host i data ERP at iba pa
data. Sa pangkalahatan, maliban na lang kung may matibay na dahilan para
upang gawin kung hindi man, inirerekumenda na magtayo data bodega sa
mula sa kapaligiran ng vendor ng ERP.
KABANATA 1
Pangkalahatang-ideya ng Organisasyon ng BI
Pangunahing puntos:
Ang mga imbakan ng impormasyon ay gumagana sa kabaligtaran na paraan
sa business intelligence (BI) architecture:
Maaaring limitahan ng kultura ng korporasyon at IT ang tagumpay sa
pagbuo ng mga organisasyon ng BI.
Hindi na ang teknolohiya ang limiting factor para sa mga organisasyon ng BI. Ang
problema para sa mga arkitekto at tagaplano ng proyekto ay hindi kung ang
umiiral ang teknolohiya, ngunit kung mabisa nilang maipapatupad ang
magagamit na teknolohiya.
Para sa maraming kumpanya a data bodega ito ay higit pa sa isang deposito
passive na namamahagi i data sa mga gumagamit na nangangailangan nito. ANG data
kinukuha ang mga ito mula sa mga source system at nilalagay sa mga target na istruktura
di data bodega. Ako data maaari din silang linisin ng buo
swerte. Gayunpaman, walang karagdagang halaga ang idinagdag
kinolekta ng data sa panahon ng prosesong ito.
Mahalaga, ang passive Dw, sa pinakamahusay, naghahatid
tanging i data malinis at gumagana sa mga asosasyon ng gumagamit. doon
ang paglikha ng impormasyon at pag-unawa sa analitikal ay nakasalalay
ganap ng mga gumagamit. Paghusga kung ang DW (Bodega ng data) ay
ang tagumpay ay subjective. Kung hahatulan natin ang tagumpay sa
kakayahan sa mahusay na pagkolekta, pagsasama-sama at paglilinis i data
corporate sa isang predictable na batayan, pagkatapos ay oo, ang DW ay isang tagumpay.
Sa kabilang banda, kung titingnan natin ang koleksyon, consolidation at lo
pagsasamantala ng impormasyon sa organisasyon sa kabuuan, kung gayon
ang DW ay isang kabiguan. Ang isang DW ay nagbibigay ng kaunti o walang halaga
impormasyon. Bilang resulta, ang mga gumagamit ay napipilitang gumawa,
kaya lumilikha ng mga silos ng impormasyon. Ang kabanatang ito ay naglalahad
isang komprehensibong view upang muling i-recap ang arkitektura ng BI(Business
Intelligence) ng mga kumpanya. Magsimula tayo sa isang paglalarawan ng BI at
pagkatapos ay magpapatuloy tayo sa mga talakayan tungkol sa disenyo at sa
pagbuo ng impormasyon, kumpara sa simpleng pagbibigay ng i data
sa mga gumagamit. Ang mga talakayan pagkatapos ay nakatuon sa pagkalkula ng
halaga ng iyong mga pagsisikap sa BI. Nagtatapos kami sa pamamagitan ng pagtukoy kung paano ang IBM
naaalala ang mga kinakailangan sa arkitektura ng BI ng iyong organisasyon.
Paglalarawan ng arkitektura ng
organisasyon ng BI
Napakahusay na mga sistema ng impormasyon na nakatuon sa transaksyon ngayon
sa agenda sa bawat malaking negosyo, habang sila ay nasa antas
epektibong larangan ng paglalaro para sa mga korporasyon sa mundo.
Ang pananatiling mapagkumpitensya, gayunpaman, ngayon ay nangangailangan ng mga system nang analytical
na nakatuon sa na maaaring baguhin ang kakayahan ng kumpanya sa pamamagitan ng muling pagtuklas ng ed
gamit ang impormasyong mayroon na sila. Ang mga sistemang ito
analitikal na nakukuha sa pag-unawa sa yaman ng data
magagamit. Maaaring pahusayin ng BI ang pagganap sa lahat ng impormasyon
ng enterprise. Maaaring pahusayin ng mga negosyo ang relasyon ng customer-to-customer
supplier, mapabuti ang kita ng mga produkto at serbisyo, bumuo
bago at pinakamahusay na mga alok, suriin ang panganib at sa marami pang iba
kapansin-pansing binabawasan ng mga kita ang mga gastos. Sa BI mo
ang kumpanya sa wakas ay nagsimulang gumamit ng impormasyon ng customer
bilang isang mapagkumpitensyang asset salamat sa mga application na may mga layunin ng
merkado.
Ang pagkakaroon ng tamang paraan ng negosyo ay nangangahulugan ng pagkakaroon ng mga tiyak na sagot sa
mga pangunahing katanungan tulad ng:
▪ Alin sa atin mga customer pinapalaki nila tayo, o doon
talo ba sila?
▪ Kung saan nakatira ang pinakamaganda natin mga customer Kaugnay sa tindahan/
warehouse na madalas nilang pinupuntahan?
▪ Alin sa aming mga produkto at serbisyo ang mas mabebenta
mabisa at kanino?
▪ Anong mga produkto ang pinakamabisang ibenta at kanino?
▪ Aling kampanya sa pagbebenta ang mas matagumpay at bakit?
▪ Aling mga channel sa pagbebenta ang pinakaepektibo para sa aling mga produkto?
▪ Paano namin mapapabuti ang mga relasyon sa aming pinakamahusay mga customer?
Karamihan sa mga kumpanya ay mayroon data matigas na sagot
itong mga katanungan.
Ang mga operating system ay bumubuo ng malalaking dami ng produkto, ng
customer at ng data ng merkado mula sa mga punto ng pagbebenta, mula sa mga reserbasyon,
mula sa serbisyo sa customer at mga technical support system. Ang hamon ay
kunin at pagsamantalahan ang impormasyong ito.
Maraming mga kumpanya ang kumikita lamang mula sa maliliit na bahagi ng kanila data
para sa mga estratehikong pagsusuri.
I data natitira, madalas na kasama sa i data nagmula sa mga panlabas na mapagkukunan tulad ng i
"mga ulat ng gobyerno" , at iba pang biniling impormasyon, ay isa
ang minahan ng ginto ay naghihintay lamang na tuklasin, ei data dapat
mapino lamang sa konteksto ng impormasyon sa iyo
organisasyon.
Ang kaalamang ito ay maaaring magamit sa iba't ibang paraan, pagkakaiba-iba
mula sa pagdidisenyo ng pangkalahatang diskarte sa korporasyon hanggang
personal na komunikasyon sa mga supplier, sa pamamagitan ng mga call center,
pag-invoice, internet at iba pang mga punto. Ang kapaligiran ng negosyo ngayon ay nagdidikta
na ang DW at ang mga kaugnay na solusyon sa BI ay lalong umuunlad
ang pagpapatupad ng mga tradisyonal na istruktura ng data na i data na-normalize sa
atomic-level at "star/cube farms".
Ang kailangan upang manatiling mapagkumpitensya ay isang pagsasanib ng
tradisyonal at advanced na teknolohiya sa pagsisikap na suportahan ang a
malawak na analytic landscape.
Sa wakas, ang pangkalahatang kapaligiran ay dapat mapabuti ang kaalaman
ng negosyo sa kabuuan, na tinitiyak na ang mga aksyon na ginawa
bilang kinahinatnan ng isinagawang pag-aaral ang mga ito ay magagamit upang ang lahat ay
benepisyo.
Halimbawa, sabihin nating niraranggo mo ang sa iyo mga customer sa mga kategorya
mataas o mababang panganib.
Kung ang impormasyong ito ay nabuo ng isang modelo ng pagmimina o
ibang paraan, dapat itong ilagay sa Dw at gawing accessible sa
sinuman, sa pamamagitan ng anumang paraan ng pag-access, tulad ng i
mga static na ulat, spreadsheet, talahanayan, o analytical processing sa
linya (OLAP).
Gayunpaman, sa kasalukuyan, maraming ganitong uri ng impormasyon
nananatili sila sa silos ng data ng mga indibidwal o departamentong kanilang nabuo
ang pagsusuri. Ang organisasyon sa kabuuan ay may kaunti o walang visibility
para sa pang-unawa. Sa pamamagitan lamang ng paghahalo ng ganitong uri ng nilalaman
impormasyon sa iyong negosyo dw maaari mong alisin ang mga silos ng
impormasyon at iangat ang iyong kapaligiran sa Dw.
Mayroong dalawang pangunahing hadlang sa pagbuo ng isang organisasyon
ng BI.
Una, mayroon tayong problema sa mismong organisasyon
ng kaugnay na disiplina.
Kahit na hindi kami makakatulong sa mga pagbabago sa patakaran
ng organisasyon, makakatulong tayo na maunawaan ang mga bahagi ng
isang organisasyon ng BI, ang arkitektura nito at kung paano
Pinapadali ng teknolohiya ng IBM ang pag-unlad nito.
Ang pangalawang hadlang na malalagpasan ay ang kakulangan ng teknolohiya
pinagsama-sama at kaalaman sa isang pamamaraan na tumatawag sa buong espasyo
ng BI kumpara sa isang maliit na bahagi lamang.
Ang IBM ay tumutugon sa mga pagbabago sa teknolohiya
ng pinagsama-samang. Responsibilidad mong magbigay ng disenyo
mulat sa sarili. Ang arkitektura na ito ay dapat na binuo gamit ang
teknolohiya na pinili para sa pagsasama nang walang mga hadlang, o hindi bababa sa, sa
teknolohiya na sumusunod sa bukas na mga pamantayan. Gayundin, sa iyo
Dapat tiyakin ng pamamahala ng kumpanya na ang negosyo ni Bi ay
isinasagawa ayon sa programa at hindi upang payagan ito
pagbuo ng mga silo ng impormasyon na nagmumula sa paglilingkod sa sarili
mga agenda, o mga layunin.
Hindi ito nangangahulugan na ang kapaligiran ng BI ay hindi sensitibo sa
tumugon sa iba't ibang pangangailangan at pangangailangan ng iba't ibang gumagamit; sa halip, ibig sabihin
na ang pagpapatupad ng mga indibidwal na pangangailangan at pangangailangan ay
ginawa para sa kapakanan ng buong organisasyon ng BI.
Ang isang paglalarawan ng arkitektura ng BI ng organisasyon ay maaaring
ay matatagpuan sa pahina 9 sa figure 1.1. Ang arkitektura ay nagpapakita
isang mayamang halo ng mga teknolohiya at pamamaraan.
Mula sa tradisyonal na pananaw, ang arkitektura ay kinabibilangan ng mga sumusunod na bahagi
ng bodega
Layer ng Atomic.
Ito ang pundasyon, ang puso ng buong Dw at samakatuwid ng
estratehikong pag-uulat.
I data na nakaimbak dito ay mananatili sa makasaysayang integridad, mga ulat ng
data at isama ang nagmula na sukatan, gayundin ang pagiging malinis,
isinama, at iniimbak gamit ang mga template ng pagmimina.
Lahat ng kasunod na paggamit ng mga ito data at kaugnay na impormasyon ay
nagmula sa istrukturang ito. Ito ay isang mahusay na mapagkukunan para sa
pagkuha ng data at para sa mga ulat na may structured SQL query
Operasyong deposito ng data o base ng ulat ng
data(Operational data store (ODS) o pag-uulat
database.)
Ito ay isang istraktura ng data partikular na idinisenyo para sa
teknikal na pag-uulat.
I data na nakaimbak at naiulat sa itaas ng mga istrukturang ito sa wakas
magpalaganap sa bodega sa pamamagitan ng staging zone (staging
lugar), kung saan maaari itong magamit para sa estratehikong pagsenyas.
Lugar ng pagtatanghal ng dula.
Ang unang hinto para sa karamihan data nilayon para sa kapaligiran ng
ang bodega ay ang zone ng organisasyon.
Dito i data sila ay isinama, nililinis at binago sa data kapaki-pakinabang na
pupunuin nila ang istraktura ng bodega
Date marts.
Ang bahaging ito ng arkitektura ay kumakatawan sa istruktura ng data ginamit na
partikular para sa OLAP. Ang pagkakaroon ng datamarts, kung i data ay
nakaimbak sa mga star schema na kanilang na-overlay data
multidimensional sa isang relational na kapaligiran, o sa mga filing cabinet
di data pagmamay-ari na ginagamit ng partikular na teknolohiya ng OLAP, gaya ng
DB2 OLAP server, hindi ito nauugnay.
Ang tanging hadlang ay ang arkitektura ay nagpapadali sa paggamit ng data
multidimensional.
Kasama rin sa arkitektura ang mga kritikal na teknolohiya at pamamaraan ng Bi
na nakikilala bilang:
Spatial na pagsusuri
Ang espasyo ay isang windfall ng impormasyon para sa analyst at
ito ay kritikal para sa kumpletong resolusyon. Pwedeng space
kumakatawan sa impormasyon ng mga taong nakatira sa isang tiyak
lokasyon, pati na rin ang impormasyon tungkol sa kung nasaan ang lokasyong iyon
pisikal kumpara sa ibang bahagi ng mundo.
Upang maisagawa ang pagsusuri na ito, dapat kang magsimula sa pamamagitan ng pagtali sa iyo
latitude at longitude coordinate na impormasyon. Ibig sabihin ano
tinutukoy bilang "geocoding" at dapat ay bahagi ng pagkuha,
pagbabagong-anyo, at ng proseso ng pag-load (ETL) sa antas
atomic number ng iyong bodega.
Pagmimina ng data.
Ang pagkuha ng data nagbibigay-daan sa aming mga kumpanya na palaguin ang
bilang ng mga customer, upang mahulaan ang mga uso sa pagbebenta at paganahin
pamamahala ng relasyon sa mga customer (CRM), bukod sa iba pang mga inisyatiba ng
BI.
Ang pagkuha ng data ito ay dapat samakatuwid ay isinama sa mga istruktura ng
data ng Dwhouse at sinusuportahan ng mga proseso ng bodega para sa
tiyakin ang parehong mabisa at mahusay na paggamit ng teknolohiya at
mga kaugnay na pamamaraan.
Tulad ng ipinahiwatig sa arkitektura ng BI, ang atomic na antas ng
Ang Dwhouse, tulad ng datamarts, ay isang mahusay na mapagkukunan ng data
para sa pagkuha. Ang parehong mga istraktura ay dapat din
mga tatanggap ng mga resulta ng pagkuha upang matiyak ang pagkakaroon sa
pinakamalaking madla.(pinakamalawak na madla).
Mga ahente.
Mayroong iba't ibang "ahente" upang i-screen ang customer para sa anumang punto tulad ng, i
mga operating system ng kumpanya at ang dw mismo. Maaari itong mga ahente
maging mga advanced na neural network na sinanay upang malaman ang tungkol
trend ng bawat punto, tulad ng hinaharap na demand ng produkto batay
sa mga pag-promote sa pagbebenta, mga engine na nakabatay sa mga panuntunan upang tumugon sa
un dato hanay ng mga pangyayari, o kahit simpleng mga ahente na
itinuturo nila ang mga eksepsiyon sa "mga nangungunang executive". Ang mga prosesong ito ay oo
sa pangkalahatan ay naroroon sa real time at, samakatuwid, dapat
maging malapit na isinama sa kanilang paggalaw data.
Ang lahat ng mga istrukturang ito ng data, garantiya ng mga teknolohiya at pamamaraan
na hindi ka magpapalipas ng gabi sa pagbuo ng isang organisasyon ng
iyong BI.
Ang aktibidad na ito ay bubuo sa mga incremental na hakbang, para sa mga maliliit
punta.
Ang bawat hakbang ay isang independiyenteng pagsisikap ng proyekto, at iniulat
bilang isang pag-ulit sa iyong dw o BI na inisyatiba. Ang mga pag-ulit
maaaring isama ang pagpapatupad ng mga bagong teknolohiya, para sa
magsimula sa mga bagong pamamaraan, pagdaragdag ng mga bagong istruktura ng data ,
naglo-load i data pandagdag , o kasama ng pagsusuri sa pagpapalawak ng
iyong kapaligiran. Ang talatang ito ay higit na tinalakay
nang detalyado sa kabanata 3.
Bukod sa mga tradisyunal na istruktura ng Dw at Bi tool ay may iba pa
mga function ng iyong organisasyon ng BI kung saan mo inutang
disenyo, tulad ng:
Mga touch point ng customer (Customer touch
puntos).
Tulad ng lahat ng modernong organisasyon mayroong isang bilang ng
mga touchpoint ng customer na nagsasaad kung paano magkaroon ng karanasan
positibo para sa iyo mga customer. Mayroong mga tradisyonal na channel tulad ng i
merchant, switchboard operator, direct mail, multimedia at print
advertising, pati na rin ang pinakabagong mga channel tulad ng email at web, i data
ang mga produkto na may ilang punto ng pakikipag-ugnay ay dapat makuha,
dinadala, nililinis, binago at pagkatapos ay naninirahan sa mga istruktura ng data ng
BI.
Mga pangunahing kaalaman sa data operational at user associations (Operational
mga database at komunidad ng gumagamit).
Sa dulo ng mga contact point ng mga customer makikita mo ang mga pangunahing kaalaman ng data
aplikasyon ng kumpanya at mga komunidad ng gumagamit. ANG data umiiral
ay data tradisyonal na dapat pagsama-samahin at pagsamahin sa data na
dumadaloy sila mula sa mga touchpoint upang matupad ang kinakailangan
impormasyon.
Mga analyst. (Analysts)
Ang pangunahing benepisyaryo ng kapaligiran ng BI ay ang analyst. Siya ang
benepisyo mula sa kasalukuyang pagkuha ng data pagpapatakbo, isinama sa
iba't ibang pinagmumulan ng data , na dinagdagan ng mga feature gaya ng analytics
heograpikal (geocoding) at ipinakita sa mga teknolohiyang BI na
payagan ang pagmimina, OLAP, advanced na pag-uulat at pagsusuri ng SQL
heograpikal. Ang pangunahing interface para sa analyst sa kapaligiran
ang pag-uulat ay ang BI portal.
Gayunpaman, hindi lamang ang analyst ang makikinabang sa arkitektura ng
BI.
Mga executive, malalaking asosasyon ng gumagamit, at maging mga kasosyo, mga supplier at i
mga customer dapat silang makahanap ng mga benepisyo sa enterprise BI.
Back feed loop.
Ang arkitektura ng BI ay isang kapaligiran sa pag-aaral. Isang prinsipyo
katangian ng pag-unlad ay upang payagan ang patuloy na mga istruktura ng data
na ma-update ng ginamit na teknolohiya ng BI at ng mga aksyon
mga gawain ng gumagamit. Ang isang halimbawa ay ang pagsusuri ng
customer (pagmamarka ng customer).
Kung ang departamento ng pagbebenta ay nagsasagawa ng isang modelo ng pagmimina
ng mga marka ng customer kung paano gumamit ng bagong serbisyo, pagkatapos ay ang
Ang departamento ng pagbebenta ay hindi dapat ang tanging pangkat na makikinabang
ng serbisyo.
Sa halip, ang modelo ng pagmimina ay dapat gumanap bilang bahagi
likas na katangian ng daloy ng data sa loob ng kumpanya at mga marka ng customer
dapat maging isang pinagsamang bahagi ng kapaligiran ng impormasyon ng
bodega, makikita ng lahat ng gumagamit. Ang Bi-bI-centric na IBM Suite
kabilang ang DB2 UDB, DB2 OLAP Server ang karamihan
bahagi ng mahahalagang bahagi ng teknolohiya, na tinukoy sa figure
1.1.
Ginagamit namin ang arkitektura tulad ng ipinapakita sa figure ng aklat na ito para sa
bigyan kami ng antas ng pagpapatuloy at ipakita kung paano ang bawat produkto
ng IBM ay umaangkop sa pangkalahatang pattern ng BI.
Pagbibigay ng Nilalaman ng Impormasyon (Pagbibigay
Nilalaman ng Impormasyon)
Idisenyo, bumuo at ipatupad ang iyong kapaligiran sa BI
isang mahirap na gawain. Ang disenyo ay dapat yakapin pareho ang
kasalukuyan at hinaharap na mga kinakailangan sa negosyo. Ang disenyo ng arkitektura
dapat kumpleto upang maisama ang lahat ng konklusyon na natagpuan
sa panahon ng yugto ng disenyo. Ang pagpapatupad ay dapat manatili
nakatuon sa iisang layunin: bumuo ng arkitektura ng BI
bilang pormal na ipinakita sa pagguhit at batay sa mga kinakailangan ng
negosyo.
Ito ay partikular na mahirap na magtaltalan na ang disiplina ay titiyakin ang
relatibong tagumpay.
Ito ay simple dahil hindi ka gumagawa ng BI environment para sa lahat
biglaan, ngunit ito ay nagaganap sa maliliit na hakbang sa paglipas ng panahon.
Gayunpaman, ang pagtukoy sa mga bahagi ng BI ng iyong arkitektura ay
mahalaga sa dalawang dahilan: Gagabayan mo ang lahat ng kasunod na desisyon
mga diskarte sa arkitektura.
Magagawa mong sinasadya na magdisenyo ng isang partikular na paggamit ng teknolohiya
kahit na maaaring hindi ka maulit na kailangan nito
teknolohiya sa loob ng ilang buwan.
Ang sapat na pag-unawa sa iyong mga kinakailangan sa negosyo ay makakaimpluwensya sa uri
ng mga produktong makukuha mo para sa iyong arkitektura.
Tinitiyak ng pagpaplano at pagpapaunlad ng iyong arkitektura
na ang iyong bodega ay
hindi isang random na kaganapan, ngunit sa halip ay isang "pinag-isipang mabuti",
maingat na ginawang patalastas opera ng sining tulad ng isang mosaic ng
pinaghalong teknolohiya.
Idisenyo ang nilalaman ng impormasyon
Ang lahat ng paunang disenyo ay dapat tumuon at tukuyin ang
pangunahing bahagi ng BI na kakailanganin ng iyong kapaligiran
pangkalahatan sa kasalukuyan at sa hinaharap.
Ang pag-alam sa Mga Kinakailangan sa Negosyo ay mahalaga.
Bago pa man magsimula ang lahat ng pormal na pagpaplano, ang
Ang tagaplano ng proyekto ay madalas na matukoy ang isa o dalawa
component kaagad.
Ang balanse ng mga bahagi na maaaring kailanganin para sa
ang iyong arkitektura, gayunpaman, ay hindi madaling matagpuan.
Sa yugto ng disenyo, ang pangunahing bahagi ng arkitektura
nagbubuklod sa application development session (JAD) sa isang paghahanap
upang matukoy ang mga kinakailangan sa negosyo.
Minsan ang mga kinakailangang ito ay maaaring i-outsource sa mga tool
mga katanungan at pag-uulat.
Halimbawa, sinasabi ng mga user na kung gusto nilang mag-automate
kasalukuyang isang ulat ay kailangang bumuo ng manu-manong pagsasama
dalawang kasalukuyang ratios at pagdaragdag ng mga kalkulasyon na nagmula sa
kumbinasyon ng data.
Bagama't simple ang pangangailangang ito, tinutukoy nito ang isang tiyak
functionality ng feature na dapat mong isama kung kailan
bumili ng mga tool sa pag-uulat para sa organisasyon.
Dapat ding ituloy ng taga-disenyo ang mga karagdagang kinakailangan para sa
kumuha ng kumpletong larawan. Gustong mag-subscribe ng mga user
Ang ulat na ito?
Ang mga subset ng ulat ay nabuo at ipinadala sa pamamagitan ng email sa iba't-ibang
mga gumagamit? Gustong makita ang ulat na ito sa portal ng kumpanya?
Ang lahat ng mga kinakailangang ito ay bahagi ng simpleng pangangailangan
palitan ang isang manu-manong ulat gaya ng hinihiling ng mga user. Sa kapakinabangan
sa mga ganitong uri ng mga kinakailangan ay mayroon ang lahat, mga user at developer
pag-unawa sa konsepto ng mga ulat.
Mayroong iba pang mga uri ng negosyo, gayunpaman, na kailangan nating magplano.
Kapag ang mga pangangailangan sa negosyo ay nakasaad sa anyo ng
Mga madiskarteng tanong sa negosyo, madali para sa may karanasang tagaplano
matukoy ang mga kinakailangan sa dimensyon at sukat/katotohanan.
Ang Figure 1.2 ay naglalarawan ng laki at dimensional na bahagi ng a
problema sa negosyo.
Kung hindi alam ng mga gumagamit ng JAD kung paano ideklara ang kanilang mga kinakailangan
sa anyo ng isang problema sa negosyo, ang taga-disenyo ay madalas na maghahatid
mga halimbawa para sa paglaktaw-pagsisimula ng session ng pangongolekta ng data
mga kinakailangan.
Matutulungan ng ekspertong taga-disenyo ang mga user na maunawaan hindi lamang ang
estratehikong kalakalan, ngunit kung paano ito mabubuo.
Ang diskarte sa pangangalap ng mga kinakailangan ay tinalakay sa kabanata 3; Para sa
ngayon gusto lang naming ituro ang pangangailangan na magdisenyo para sa lahat
ang mga uri ng mga kinakailangan sa BI
Ang isang madiskarteng isyu sa negosyo ay, hindi lamang isang kinakailangan
Negosyo, ngunit isa ring pahiwatig ng disenyo. Kung kailangan mong sagutin
sa isang multidimensional na tanong, pagkatapos ay kailangan mong isaulo,
isumite i data mga sukat, at kung kailangan mong mag-imbak ng i
data multidimensional, kailangan mong magpasya kung anong uri ng teknolohiya o
teknik na iyong gagamitin.
Nagpapatupad ka ba ng nakalaan na cube star schema, o pareho?
Tulad ng nakikita mo, kahit isang simpleng problema sa negosyo
maaaring malaki ang impluwensya sa disenyo. Gayunpaman
ang mga uri ng mga kinakailangan sa negosyo ay karaniwan at siyempre, hindi bababa sa
ng mga may karanasang tagaplano at taga-disenyo ng proyekto.
Nagkaroon ng sapat na debate tungkol sa mga teknolohiya at suporta ng
OLAP, at maraming iba't ibang solusyon ang magagamit. Hanggang ngayon
binanggit namin ang pangangailangang pagsama-samahin ang simpleng pag-uulat sa i
mga kinakailangan sa laki ng negosyo, at kung paano ang mga kinakailangang ito
nakakaimpluwensya sa mga teknikal na desisyon sa arkitektura.
Ngunit ano ang mga kinakailangan na hindi madaling maunawaan
ng mga user o ng Dw team? Kakailanganin mo ang pagsusuri
spatial(spatial analysis)?
Ang mga modelo ng pagmimina ng data sila ay magiging isang kinakailangang bahagi ng sa iyo
kinabukasan? Sino ang nakakaalam?
Mahalagang tandaan na ang mga ganitong uri ng teknolohiya ay hindi gaanong
kilala ng mga pangkalahatang komunidad ng gumagamit at mga miyembro ng koponan ng
Dw, sa isang bahagi, maaaring mangyari ito dahil karaniwan sila
ay pinangangasiwaan ng ilang internal o third-party na teknikal na eksperto. Ito ay
borderline case ng mga problemang nabubuo ng mga ganitong uri ng teknolohiya. Sarili
hindi maaaring ilarawan ng mga user ang mga kinakailangan sa negosyo o i-frame ang mga ito
para makapagbigay ng mga alituntunin sa mga designer, magagawa nila
hindi napapansin o, mas malala, binabalewala lang.
Mas nagiging problema ito kapag nabigo ang taga-disenyo at developer
maaaring makilala ang aplikasyon ng isa sa mga advanced ngunit
mga kritikal na teknolohiya.
Gaya ng madalas nating marinig na sinasabi ng mga Designer, “well, bakit
hindi ba natin ito isinasantabi hanggang sa makuha natin ang ibang bagay na ito?
"Talaga bang interesado sila sa mga priyoridad, o iniiwasan lang nila i
requirements na hindi nila naiintindihan? Ito ay malamang na ang huling pagpapalagay.
Sabihin nating ang iyong koponan sa pagbebenta ay nagpahayag ng isang kinakailangan
ng negosyo, gaya ng nakasaad sa figure 1.3, gaya ng makikita mo, ang
ang pangangailangan ay nakabalangkas sa anyo ng isang problema sa negosyo. doon
pagkakaiba sa pagitan ng problemang ito at ang karaniwang problemang dimensyon ay
ang distansya. Sa kasong ito, gustong malaman ng sales team,
sa isang buwanang batayan, ang kabuuang benta mula sa mga produkto, bodega at
mga customer na nakatira sa loob ng 5 milya mula sa bodega kung saan sila
bumili sila.
Nakalulungkot, kaya lang ng mga designer o arkitekto
huwag pansinin ang spatial na bahagi sa pagsasabing, “mayroon kaming kliyente, ang
produkto at i data ng deposito. Naglalayo kami hanggang sa
isa pang pag-ulit.
"Maling sagot. Ang ganitong uri ng problema sa negosyo ay nababahala
ganap na BI. Ito ay kumakatawan sa isang mas malalim na pag-unawa sa
ang aming negosyo at isang matatag na puwang sa pagsusuri para sa aming mga analyst.
Ang BI ay lampas sa simpleng pagtatanong o karaniwang pag-uulat, alinman
kahit OLAP. Hindi ito nangangahulugan na nabigo ang mga teknolohiyang ito
sila ay mahalaga sa iyong BI, ngunit sa kanilang sarili ay hindi sila
kapaligiran ng BI.
Disenyo para sa konteksto ng impormasyon
(Pagdidisenyo para sa Nilalaman ng Impormasyon)
Ngayong natukoy na namin ang Mga Kinakailangan sa Negosyo na namumukod-tangi
iba't ibang mga pangunahing bahagi, ay dapat na kasama sa isang disenyo
pangkalahatang arkitektura. Ang ilan sa mga bahagi ng BI ay bahagi
ng aming mga unang pagsisikap, habang ang ilan ay hindi ipapatupad para sa
ilang buwan.
Gayunpaman, ang lahat ng kilalang mga kinakailangan ay makikita sa disenyo upang iyon
kapag kailangan nating ipatupad ang isang partikular na teknolohiya, tayo ay
humanda ka para gawin ito. Isang bagay tungkol sa proyekto ang magpapakita ng kaisipan
Tradisyunal na.
Halimbawa, ang figure 1.1, sa simula ng kabanata, ay nagpapakita ng data
mart na nagpapanatili ng i data dimensional.
Itong set ng data ay ginagamit upang suportahan ang mga huling paggamit ng
data dimensional na hinihimok ng mga isyu sa Negosyo na
nakilala namin. Tulad ng mga karagdagang dokumento ay
nabuo, tulad ng pagbuo ng disenyo ng data, kami
magsisimula tayong gawing pormal kung paano i data kumalat sila sa kapaligiran.
Natiyak namin ang pangangailangang kumatawan sa i data kaya
dimensional, hinahati ang mga ito (ayon sa mga partikular na pangangailangan
tinutukoy) sa data marts.
Ang susunod na tanong na sasagutin ay kung paano sila itatayo
itong mga data mart?
Binubuo mo ba ang mga bituin upang suportahan ang mga cube, o mga cube lamang, o mga bituin lamang?
(o kanang mga cube, o kanang mga bituin). Bumuo ng arkitektura para sa data
dependent mart na nangangailangan ng atomic layer para sa lahat data
aquisites? Payagan ang mga independiyenteng data mart na makakuha data
direkta mula sa mga operating system?
Anong teknolohiya ng kubo ang susubukan mong i-standardize?
Mayroon kang napakalaking dami ng mga diyos data kinakailangan para sa dimensional analysis
o kailangan mo ba ang mga cube ng iyong pambansang puwersa ng pagbebenta sa isa
weekly basis o pareho? Bumuo ng isang malakas na item
gaya ng DB2 OLAP Server for Finance o Cognos cube
PowerPlay para sa iyong organisasyon sa pagbebenta o pareho?
Ito ang mga malalaking desisyon sa disenyo ng arkitektura
maaapektuhan nila ang iyong kapaligiran sa BI sa hinaharap. Oo,
natukoy mo ang pangangailangan para sa OLAP. Ngayon paano mo isasagawa iyon
uri ng teknik at teknolohiya?
Paano nakakaapekto sa iyo ang ilan sa mga pinaka-advanced na teknolohiya
mga guhit? Ipagpalagay natin na natukoy mo ang isang pangangailangan
espasyo sa iyong organisasyon. Ngayon ay kailangan mong tawagan ang
architectural drawing editions kahit hindi planado ng
magsagawa ng mga bahagi ng espasyo sa loob ng ilang buwan. Ang arkitekto ay dapat
disenyo ngayon batay sa kung ano ang kailangan. Asahan ang pangangailangan para sa
spatial analysis na bumubuo, nag-iimbak, gumaganap at naghahatid
access sa data spatial. Ito naman ay dapat magsilbing a
pagpilit tungkol sa uri ng teknolohiya at mga pagtutukoy
software platform na maaari mong kasalukuyang isinasaalang-alang. Para sa
halimbawa, ang sistema ng pangangasiwa ng base ng datos pamanggit
(RDBMS) na iyong ginagawa para sa iyong atomic layer ay dapat mayroon
magagamit ang isang matatag na spatial na lawak. Titiyakin nito ang
maximum na pagganap kapag gumagamit ng geometry at mga bagay
space sa iyong mga analytical application. Kung ang iyong RDBMS ay hindi
kayang i data (spatial-centric) sa loob, kaya kakailanganin mo
magpakatatag una base ng datos (spatial-centric) panlabas. Ginagawa nitong kumplikado ang
pamamahala ng isyu at makakaapekto sa iyong pangkalahatang pagganap,
hindi banggitin ang mga karagdagang problemang nilikha para sa iyo
Mga DBA, dahil malamang na may kaunting pag-unawa ang mga ito
ng mga pundasyon ng data spatial din. Sa kabilang banda, kung ang iyong makina
Pinangangasiwaan ng RDMBS ang lahat ng spatial na bahagi at nauugnay
alam ng optimizer ang mga espesyal na pangangailangan (halimbawa,
pag-index) ng mga spatial na bagay, kung gayon ang iyong mga DBA ay maaaring humawak
agad na pamahalaan ang mga isyu at maaari mong iangat ang mga ito
pagganap
Gayundin, kailangan mong ayusin ang staging area at layer
ng atomic na kapaligiran upang isama ang paglilinis ng address (un
pangunahing elemento sa spatial analysis), pati na rin ang susunod
pag-save ng mga bagay sa espasyo. Ang sunod-sunod na mga edisyon ng
Ang pagguhit ay nagpapatuloy ngayon na ipinakilala natin ang paniwala ng paglilinis
address. Sa isang bagay, ang application na ito ay magdidikta ng uri ng
kinakailangang software para sa iyong pagsisikap sa ETL.
Kailangan mo ng mga produkto tulad ng Trillium para mabigyan ka ng address
malinis, o isang ETL vendor na gusto mong ibigay iyon
functionality?
Sa ngayon, mahalagang pahalagahan mo ang pamantayan ng disenyo
dapat makumpleto bago mo simulan ang pagpapatupad ng sa iyo
kapaligiran (warehouse). Ang mga halimbawa sa itaas ay dapat
ipakita ang maraming pagguhit ng mga desisyon na dapat sundin
ang pagkakakilanlan ng anumang partikular na pangangailangan sa negosyo. Kung tapos na
tama, itinataguyod ng mga desisyong ito sa disenyo
ang pagtutulungan sa pagitan ng mga pisikal na istruktura ng iyong kapaligiran, ang
pagpili ng teknolohiyang ginamit at ang daloy ng pagpapalaganap ng
nilalaman ng impormasyon. Kung wala itong maginoo na arkitektura
ng BI, ang iyong organisasyon ay sasailalim sa isang halo
magulo ng mga umiiral na teknolohiya, sa pinakamaganda, nagkakaisa sa isang paraan
hindi tumpak upang magbigay ng maliwanag na katatagan.
Panatilihin ang nilalaman ng impormasyon
Ang pagdadala ng halaga ng impormasyon sa iyong organisasyon ay
isang napakahirap na operasyon. Nang walang sapat na pang-unawa
at karanasan, o wastong pagpaplano at disenyo, maging ang
mabibigo ang mas mahusay na mga koponan. Sa kabilang banda, kung mayroon kang isang mahusay
intuwisyon at detalyadong pagpaplano ngunit walang disiplina para sa
execution, sinayang mo lang ang pera at oras mo
dahil ang iyong pagsisikap ay tiyak na mabibigo. Ang mensahe ay dapat
maging malinaw: Kung kulang ka ng isa o higit pa sa mga ito
kasanayan, pag-unawa/karanasan o pagpaplano/pagguhit o
pagpapatupad ng disiplina, ito ay hahantong sa pagkaparalisa o
sirain ang gusali ng organisasyon ng BI.
Ang iyong koponan ba ay sapat na handa? Mayroong isang tao sa iyong
BI team na nauunawaan ang malawak na analytic landscape na magagamit
sa mga kapaligiran ng BI, sa mga kinakailangang pamamaraan at teknolohiya
upang maapektuhan ang landscape na iyon? Mayroong isang tao sa iyong koponan
na maaaring makilala ang pagkakaiba ng aplikasyon sa pagitan ng advanced
static na pag-uulat at OLAP, o ang mga pagkakaiba sa pagitan ng ROLAP at OLAP? Isa sa mga
malinaw na kinikilala ng mga miyembro ng iyong koponan ang paraan ng
extract at kung paano ito maaaring makaapekto sa bodega o kung paano
maaari bang suportahan ng bodega ang pagganap ng pagmimina? Isang miyembro
naiintindihan ng pangkat ang halaga ng data espasyo o teknolohiya
batay sa ahente? Mayroon ka bang isang taong pinahahalagahan ang natatanging aplikasyon
ng mga tool ng ETL laban sa teknolohiya ng broker
mensahe? Kung wala ka nito, kumuha ka ng isa. Higit pa ang BI
malaki ng isang normalized atomic layer, ng OLAP, ng mga scheme a
bituin at isang ODS.
Magkaroon ng pag-unawa at karanasan upang makilala ang mga kinakailangan
ng BI at ang kanilang mga solusyon ay mahalaga sa iyong kakayahan
wastong gawing pormal ang mga pangangailangan ng mga gumagamit at magdisenyo
at ipatupad ang kanilang mga solusyon. Kung mayroon ang iyong komunidad ng gumagamit
kahirapan sa paglalarawan ng mga kinakailangan, ito ay ang gawain ng pangkat ng
bodega ay nagbibigay ng pag-unawa. Ngunit kung ang pangkat ng
bodega
hindi kinikilala ang partikular na aplikasyon ng BI - halimbawa, data
pagmimina- kung gayon hindi ito ang pinakamagandang bagay na ginagawa ng mga kapaligiran ng BI
kadalasang nililimitahan ang kanilang mga sarili sa pagiging passive na deposito. Gayunpaman, huwag pansinin ang mga ito
hindi binabawasan ng mga teknolohiya ang kahalagahan nito at ang epekto nito
sa paglitaw ng iyong sariling mga posibilidad ng katalinuhan sa negosyo
organisasyon, pati na rin ang istraktura ng impormasyon na iyong idinisenyo
para i-promote.
Ang pagpaplano ay dapat isama ang paniwala ng pagguhit, ed
parehong nangangailangan ng karampatang indibidwal. Dagdag pa, pagdidisenyo
nangangailangan ito ng pilosopiya at obserbasyon ng werehouse team
ng mga pamantayan. Halimbawa, kung ang iyong kumpanya ay nagtatag ng a
karaniwang platform o may natukoy na partikular na RDBMS na ikaw
Nais mag-standardize sa buong platform, ito ay nalalapit na
lahat sa pangkat ay sumusunod sa mga pamantayang iyon. Sa pangkalahatan isa
Inilalantad ng koponan ang pangangailangan para sa normalisasyon (sa user
communites), ngunit ang koponan mismo ay ayaw sumali sa
itinakda rin ang mga pamantayan sa ibang mga lugar sa kumpanya o maaaring maging sa
mga katulad na kumpanya. Hindi lamang ito mapagkunwari, ngunit tinitiyak nito na ang kompanya ay hindi
ay kayang gamitin ang mga kasalukuyang mapagkukunan at pamumuhunan. Hindi ibig sabihin
na walang mga sitwasyong ginagarantiyahan ang isang plataporma o a
hindi pamantayang teknolohiya; gayunpaman, ang mga pagsisikap ng bodega
dapat na mainggit na bantayan ang mga pamantayan ng negosyo hanggang sa
na ang mga kinakailangan sa negosyo ay hindi nagdidikta kung hindi man.
Ang ikatlong pangunahing bahagi na kailangan upang bumuo ng isang BI
organisasyon ang disiplina.
Ito ay nakasalalay sa kabuuan, pantay sa mga indibidwal at sa kapaligiran.
Dapat pahalagahan ng mga tagaplano ng proyekto, sponsor, arkitekto, at user ang
disiplina na kinakailangan upang mabuo ang istraktura ng impormasyon ng kumpanya.
Dapat idirekta ng mga taga-disenyo ang kanilang mga pagsisikap sa disenyo sa paraang iyon
kumpletuhin ang iba pang kinakailangang pagsisikap sa lipunan.
Halimbawa, sabihin nating ang iyong kumpanya ay nagtatayo ng isang
ERP application na mayroong bahagi ng warehouse.
Kaya responsibilidad ng mga taga-disenyo ng ERP na makipagtulungan sa
warehouse environment team para hindi makipagkumpetensya o
i-duplicate ang gawaing nasimulan na.
Ang disiplina ay isa ring paksa na kailangang maging abala
ng buong organisasyon at kadalasang itinatag at ipinagkatiwala sa a
antas ng ehekutibo.
Handa ba ang mga executive na sumunod sa isang dinisenyong diskarte? A
diskarte na nangangako na lumikha ng nilalaman ng impormasyon na
kalaunan ay magdadala ito ng halaga sa lahat ng mga lugar ng negosyo, ngunit marahil
Nakokompromiso ba nito ang mga indibidwal o departamentong agenda? Tandaan ang kasabihan
"Ang pag-iisip tungkol sa lahat ay mas mahalaga kaysa sa pag-iisip tungkol sa isang bagay lamang."
Totoo ang kasabihang ito para sa mga organisasyon ng BI.
Sa kasamaang palad, maraming mga bodega ang nakatuon sa kanilang mga pagsisikap
naghahanap upang magmaneho at magbigay ng halaga sa isang partikular na departamento o a
mga partikular na user, na may maliit na pagsasaalang-alang sa organisasyon sa
pangkalahatan. Ipagpalagay na ang manager ay humiling ng tulong mula sa koponan sa
bahay-bahayan. Ang koponan ay tumugon sa isang 90-araw na trabaho na
kasama hindi lamang ang paghahatid ng mga kinakailangan sa abiso na tinukoy ng
manager ngunit sinisiguro na ang lahat data base ay halo-halong sa antas
atomic bago ipinakilala sa teknolohiyang kubo
panukala.
Tinitiyak ng karagdagan sa engineering na ito na ang tagumpay ng
werehouse ay makikinabang sa data kailangan para sa manager.
Gayunpaman, ang ehekutibo ay nakipag-usap sa mga kumpanya ng pagkonsulta sa labas na
ay nagmungkahi ng isang katulad na aplikasyon sa paghahatid sa mas mababa sa 4
linggo.
Ipagpalagay na ang panloob na pangkat ng werehouse ay may kakayahan, ang
may pagpipilian ang manager. Sino ang maaaring sumuporta sa disiplina ng
karagdagang inhinyero na kailangan para sakahan ang balon
pang-impormasyon na negosyo o maaaring piliing gumawa ng kanilang sarili
mabilis na solusyon. Ang huli ay tila napiling tunay
masyadong madalas at nagsisilbi lamang upang lumikha ng mga lalagyan ng impormasyon ng
kung saan ang iilan o ang indibidwal ay nakikinabang.
Maikli at pangmatagalang layunin
Dapat gawing pormal ng mga arkitekto at tagaplano ng proyekto ang a
pangmatagalang pananaw ng pangkalahatang arkitektura at mga plano para sa
lumago sa isang organisasyong BI. Ang kumbinasyong ito ng
panandaliang tubo at pangmatagalang pagpaplano
kumakatawan sa dalawang mukha ng pagsisikap BI. Panandaliang pakinabang
ang expiration ay ang facet ng BI na nauugnay sa mga pag-ulit ng
iyong bodega.
Dito nakatuon ang mga tagaplano, arkitekto at sponsor
matugunan ang mga partikular na pangangailangan sa negosyo. Ito ay sa antas na ito kung saan ang
ang mga pisikal na istruktura ay itinayo, ang teknolohiya ay binili at ang
ipinatupad ang mga teknik. Hindi naman sila nakaharap
mga partikular na kinakailangan gaya ng tinukoy ng mga partikular na komunidad ng gumagamit.
Ginagawa ang lahat upang matugunan ang tinukoy na mga tiyak na kinakailangan
mula sa isang partikular na komunidad.
Ang pangmatagalang pagpaplano, gayunpaman, ay ang iba pang aspeto
ng BI. Ito ay kung saan ang mga plano at disenyo ay natiyak na ito ay
bumuo ng anumang pisikal na istraktura, ang mga teknolohiyang napili at ang
natanto ang mga diskarte na ginawa sa isang mata patungo sa negosyo. At ang
pangmatagalang pagpaplano na nagbibigay ng pagkakaisa
kinakailangan upang matiyak na ang mga benepisyo ng negosyo ay maiipon sa lahat
ang mga panandaliang pakinabang na natagpuan.
I-justify ang iyong pagsisikap sa BI
Un data bodega sa sarili nito ay wala itong taglay na halaga. Sa iba
salita, walang likas na halaga sa pagitan ng mga teknolohiya
bodega at mga diskarte sa pagpapatupad.
Ang halaga ng anumang pagsisikap sa bodega ay makikita sa mga aksyon
isinagawa bilang resulta ng kapaligiran at nilalaman ng warehouse
impormasyong nalilinang sa paglipas ng panahon. Ito ay isang kritikal na punto upang maunawaan
bago mo subukang tantyahin ang halaga ng anumang inisyatiba sa pamamagitan ng
bahay.
Kadalasan, sinusubukan ng mga arkitekto at tagaplano na maglapat ng halaga
warehouse pisikal at teknikal na mga bahagi kapag sa katunayan ang halaga ay
natagpuan sa mga proseso ng negosyo na positibong naaapektuhan ng
bodega at mahusay na nakuhang impormasyon.
Dito nakasalalay ang hamon sa pagtatatag ng BI: Paano mo binibigyang-katwiran ang pamumuhunan?
Kung ang wherehouse mismo ay walang intrinsic na halaga, ang mga designer ng
dapat imbestigahan, tukuyin at gawing pormal ng proyekto ang mga benepisyo
nakamit ng mga indibidwal na gagamit ng bodega para sa
mapabuti ang mga partikular na proseso ng negosyo o ang halaga ng
protektadong impormasyon o pareho.
Upang gawing kumplikado ang mga paksa, anumang proseso ng negosyo
maaapektuhan ng mga pagsisikap sa bodega ay maaaring magbigay ng mga benepisyo
"konsiderable" o "slight". Malaking pakinabang ang nagbibigay ng a
tangible metric para sukatin ang return on investment (ROI) – hal
halimbawa, pagbabalik ng imbentaryo ng karagdagang oras sa isang panahon
tiyak o para sa mas mababang halaga ng transportasyon sa bawat kargamento. Ito ay higit pa
Mahirap i-pin down ang mga bahagyang benepisyo, gaya ng pinahusay na access sa
impormasyon, sa mga tuntunin ng nasasalat na halaga.
Ikonekta ang iyong proyekto upang malaman ang
Mga kahilingan sa negosyo
Kadalasan, sinusubukan ng mga taga-disenyo ng proyekto na ikonekta ang halaga
ng warehouse na may mga amorphous na layunin ng enterprise. nagsasaad na
“Ang halaga ng isang bodega ay nakabatay sa ating kakayahan
satisfy strategic requests” malugod naming binuksan ang
talumpati. Ngunit iyon lamang ay hindi sapat upang matukoy kung
may saysay ang pamumuhunan sa bodega. Mas mainam na ikonekta ang mga pag-uulit
ng bodega na may mga partikular na kahilingan sa komersyo at mga tala.
Sukatin ang ROI
Ang pagkalkula ng ROI sa isang setting ng warehouse ay maaaring
partikular na mahirap. Ito ay lalong mahirap kung ang lead
punong-guro ng isang partikular na pag-uulit ay isang bagay na hindi mahahawakan o
madaling sukatin. Nalaman ng isang pag-aaral na nakikita ng mga gumagamit
ang dalawang pangunahing benepisyo ng mga inisyatiba ng BI:
▪ Lumikha ng kakayahang gumawa ng mga desisyon
▪ Lumikha ng access sa impormasyon
Ang mga benepisyong ito ay malambot (o banayad) na mga benepisyo. Madaling makita
paano natin makalkula ang isang ROI batay sa isang hard edge (o
mas malaki) tulad ng pagbabawas ng gastos sa transportasyon, ngunit paano
sinusukat ba natin ang kakayahang gumawa ng mas mahusay na mga desisyon?
Ito ay talagang isang hamon para sa mga tagaplano ng proyekto kapag
sinusubukan nilang makuha ang kumpanya na mamuhunan sa isang partikular
pagsisikap sa bodega. Pagtaas ng benta o pagbaba ng gastos
hindi na sila ang mga sentral na tema na nagtutulak sa kapaligiran ng BI.
Sa halip, naghahanap ka ng access sa mga kahilingan sa negosyo
pinakamahusay sa impormasyon upang ang isang partikular na departamento ay maaaring
gumawa ng mga desisyon nang mas mabilis. Ito ang mga madiskarteng driver a
na mangyayari na parehong mahalaga sa kompanya ngunit ay
mas malabo at mas mahirap ilarawan sa isang tiyak na sukatan.
Sa kasong ito, ang pagkalkula ng ROI ay maaaring mapanlinlang, kung hindi nauugnay.
Dapat na maipakita ng mga taga-disenyo ng proyekto ang halaga
tangible para sa mga executive upang magpasya kung ang pamumuhunan sa
ang isang partikular na pag-uulit ay binibilang. Gayunpaman, hindi kami magmumungkahi ng bago
paraan para sa pagkalkula ng ROI, at hindi rin kami gagawa ng anumang pro o argumento
laban dito.
Mayroong maraming mga artikulo at aklat na magagamit na tumatalakay sa mga pangunahing kaalaman para sa
kalkulahin ang ROI. May mga espesyal na proposisyon ng halaga tulad ng halaga
on Investment (VOI), na inaalok ng mga grupo tulad ng Gartner, na magagawa mo
magsaliksik. Sa halip, tututuon natin ang mga pangunahing aspeto ng anuman
ROI o iba pang value proposition na kailangan mong isaalang-alang.
Paglalapat ng ROI
Bilang karagdagan sa argumento tungkol sa "mahirap" na benepisyo kumpara sa "malambot" na mga benepisyo
Kaugnay ng mga pagsisikap ng BI ay may iba pang mga isyu na dapat isaalang-alang
kapag nag-apply kami ng ROI. Halimbawa:
Ang pag-uugnay ng masyadong maraming pagtitipid sa mga pagsisikap ng DW na darating
sa anumang kaso
Sabihin nating lumipat ang iyong kumpanya mula sa isang arkitektura ng
mainframe sa isang distributed UNIX environment. Kaya kahit ano
mga pagtitipid na maaaring (o maaaring hindi) matanto sa pamamagitan ng pagsisikap na iyon
hindi dapat iugnay ng eksklusibo, kung sa lahat (?), sa
bodega.
Hindi accounting para sa lahat ay mahal. At maraming bagay ang dapat gawin
isaalang-alang. Isaalang-alang ang sumusunod na listahan:
▪ Gastos ng pagsisimula, kabilang ang pagiging posible.
▪ Halaga ng nakalaang hardware na may kaugnay na storage e
komunikasyon
▪ Halaga ng software, kabilang ang pamamahala ng data at mga extension
client/server, ETL software, mga teknolohiya ng DSS, mga tool
visualization, scheduling at flow applications
software sa trabaho at pagsubaybay, .
▪ Gastos sa disenyo ng istraktura data, kasama ang pagsasakatuparan, at
ang pag-optimize ng
▪ Gastos sa pagpapaunlad ng software na direktang nauugnay sa pagsisikap
BI
▪ Halaga ng suporta sa bahay, kabilang ang pag-optimize ng
pagganap, kabilang ang kontrol sa bersyon ng software e
tulong sa mga operasyon
Ilapat ang "Big-Bang" ROI.
Ang pagsasakatuparan ng bodega bilang isang solong at napakalaking pagsisikap
ay tiyak na mabibigo, kaya kalkulahin din ang ROI para sa isang inisyatiba
ng malaking enterprise Ang alok ay nakakagulat, at na ang mga designer
patuloy na gumawa ng mahinang pagtatangka upang tantiyahin ang halaga ng kabuuan
pagsisikap
Dahil sinusubukan ng mga taga-disenyo na magbigay ng halaga ng pera
sa enterprise initiative kung ito ay malawak na kilala at tinatanggap na
mahirap bang tantyahin ang mga tiyak na pag-uulit? Paano ito posible? Hindi ito
posible na may ilang mga pagbubukod. Huwag gawin ito.
Ngayon na naitatag namin kung ano ang hindi dapat gawin kapag nagkalkula
ROI, narito ang ilang mga punto na makakatulong sa amin sa pagtukoy
isang maaasahang proseso para sa pagtatantya ng halaga ng iyong mga pagsusumikap sa BI.
Pagkuha ng pahintulot sa ROI. Hindi alintana sa iyo
pagpili ng pamamaraan upang matantya ang halaga ng iyong mga pagsisikap sa BI, dapat
sumang-ayon ng lahat ng partido, kabilang ang mga tagaplano ng proyekto,
mga sponsor at executive ng korporasyon.
Hatiin ang ROI sa mga makikilalang bahagi. Isang kinakailangang hakbang patungo sa
makatwirang pagkalkula ng isang ROI ay upang ituon ang pagkalkula na iyon sa a
tiyak na proyekto. Binibigyang-daan ka nitong tantyahin ang isang halaga
batay sa mga partikular na pangangailangan sa negosyo na natutugunan
Tukuyin ang mga gastos. Tulad ng nabanggit, maraming mga gastos ang dapat
isinasaalang-alang. Higit pa rito, ang mga gastos ay dapat isama hindi lamang ang mga nauugnay na gastos
sa iisang pag-ulit ngunit gayundin sa mga nauugnay na gastos
upang matiyak ang pagsunod sa mga pamantayan ng korporasyon.
Tukuyin ang mga benepisyo. Sa pamamagitan ng malinaw na pagli-link ng ROI sa mga kinakailangan
tiyak na mga kalakalan, dapat nating matukoy ang
mga benepisyo na hahantong sa pagtugon sa mga kinakailangan.
Bawasan ang mga gastos at benepisyo sa napipintong mga pakinabang. Ito ang paraan
pinakamahusay na paraan upang ibase ang iyong mga valuation sa net present value
(NPV) hindi tulad ng pagsubok na hulaan ang hinaharap na halaga sa
hinaharap na kita.
Panatilihin ang oras upang hatiin ang iyong ROI sa pinakamababa. AT'
mahusay na dokumentado sa mahabang panahon na ito ay ginamit sa iyo
ROI.
Gumamit ng higit sa isang ROI formula. Mayroong maraming mga pamamaraan para sa
hula sa ROI at dapat mong planuhin kung gagamit ng isa o
plus, kasama ang net present value, ang panloob na bilis ng feedback
(IRR) at pagbawi.
Tukuyin ang paulit-ulit na proseso. Ito ay mahalaga para sa pagkalkula
anumang pangmatagalang halaga. Dapat itong idokumento a
nag-iisang nauulit na proseso para sa lahat ng mga pagkakasunod-sunod ng proyekto a
upang sundin.
Ang mga problemang nakalista ay ang pinakakaraniwang problema na tinukoy ng mga eksperto
ng kapaligiran ng werehouse. Giit ng management sa
ang pagkakaroon ng isang "Big-Bang" na paghahatid ng ROI ay lubhang nakalilito. Kung sisimulan mo ang lahat ng
ang iyong mga kalkulasyon ng ROI sa pamamagitan ng paghahati-hati sa mga ito sa mga makikilala, nasasalat na bahagi, mayroon ka
isang magandang pagkakataon upang matantya ang isang tumpak na pagsusuri sa ROI.
Mga tanong tungkol sa mga benepisyo ng ROI
Anuman ang iyong mga benepisyo, malambot o matigas, maaari mong gamitin
ilang mga pangunahing katanungan upang matukoy ang kanilang halaga. Upang
halimbawa gamit ang isang simpleng sistema ng sukat, mula 1 hanggang 10, ikaw
masusubaybayan mo ang epekto ng anumang pagsisikap gamit ang sumusunod
mga katanungan:
▪ Paano mo ire-rate ang pag-unawa sa data sumusunod dito
proyekto ng iyong kumpanya?
▪ Paano mo tatantyahin ang mga pagpapabuti ng proseso bilang resulta ng
proyektong ito?
▪ Paano mo susukatin ang epekto ng mga bagong insight at hinuha ngayon
ginawang available sa pamamagitan ng pag-ulit na ito
▪ Ano ang naging epekto ng mga bagong kapaligiran sa computer e
gumaganap bilang resulta ng natutunan?
Kung kakaunti ang mga sagot sa mga tanong na ito, posible iyon
ang negosyo ay hindi katumbas ng puhunan na ginawa. Mga tanong na may mataas na
puntos ay tumuturo sa makabuluhang mga nadagdag na halaga at dapat
nagsisilbing gabay para sa karagdagang pagsisiyasat.
Halimbawa, isang mataas na marka para sa mga pagpapabuti ng proseso
dapat itong humantong sa mga taga-disenyo upang tingnan kung paano ang mga proseso
napabuti. Maaari mong makita na ang ilan o lahat ng mga nadagdag ay nagawa
ang mga ito ay nasasalat at samakatuwid ay isang halaga ng pera ay maaaring kaagad
inilapat.
Nasusulit ang unang pag-ulit ng
bodega
Ang pinakamalaking resulta ng iyong pagsusumikap sa negosyo ay madalas sa
unang ilang mga pag-ulit. Ang mga maagang pagsisikap na ito ayon sa kaugalian
itatag ang pinakakapaki-pakinabang na nilalaman ng impormasyon para sa publiko e
nagtatatag ng tulong sa pundasyon ng teknolohiya para sa ibang pagkakataon
Mga aplikasyon ng BI.
Karaniwan ang bawat kasunod na kasunod ng data ng proyekto ng
ang mga bodega ay nagdadala ng mas kaunting karagdagang halaga sa negosyo
pangkalahatan. Ito ay totoo lalo na kung ang pag-ulit ay nabigo
nagdaragdag ng mga bagong argumento o hindi nakakatugon sa pangangailangan para sa bago
komunidad ng gumagamit.
Nalalapat din ang tampok na pag-iimbak na ito sa mga tambak
lumalaki sa pamamagitan ng data mga mananalaysay. Dahil ang mga kasunod na pagsisikap ay nangangailangan ng higit pa
data at kung paano pa data ay ibinubuhos sa bodega sa paglipas ng panahon, ang karamihan sa
data ito ay nagiging hindi gaanong nauugnay sa pagsusuri na ginamit. Ang mga ito data ay
madalas na tinatawag na data tulog at laging mahal ang pag-iingat sa kanila dahil
sila ay halos hindi na ginagamit.
Ano ang ibig sabihin nito para sa mga sponsor ng proyekto? Mahalaga, i
ang mga unang sponsor ay nagbabahagi ng higit sa mga gastos sa pamumuhunan.
Pangunahin ito dahil sila ang impetus para sa pagtatatag ng layer
malaking mapagkukunan ng bodega at kapaligiran ng teknolohiya,
kabilang ang organic.
Ngunit ang mga unang hakbang na ito ay nagdadala ng pinakamataas na halaga at samakatuwid ay ang mga taga-disenyo
ng proyekto ay dapat madalas na bigyang-katwiran ang pamumuhunan.
Maaaring may mga gastos ang mga proyektong ginawa pagkatapos ng iyong BI initiative
mababa (kumpara sa una) at direkta, ngunit nagdadala ng mas kaunting halaga
sa enterprise.
At kailangang magsimulang mag-isip ang mga may-ari ng organisasyon
itapon ang akumulasyon ng data at hindi gaanong nauugnay na mga teknolohiya.
Pagmimina ng Data: Pagmimina Dati
Maraming mga bahagi ng arkitektura ang nangangailangan ng mga pagkakaiba-iba ng
mga teknolohiya at pamamaraan ng data mining—
halimbawa, ang iba't ibang "ahente" para sa pagsusuri ng mga punto ng interes ng
mga customer, mga operating system ng kumpanya at para sa parehong dw. Ang mga ito
ang mga ahente ay maaaring mga advanced na neural network na sinanay
pot trend, gaya ng hinaharap na demand ng produkto batay sa
mga promosyon sa pagbebenta; rules-based na mga makina para sa
reaksyon sa isang set dato ng mga pangyayari, halimbawa, diagnosis
mga rekomendasyong medikal at paggamot; o kahit simpleng ahente
na may tungkuling mag-ulat ng mga pagbubukod sa mga senior manager (top
mga executive). Karaniwan ang mga proseso ng pagkuha na ito data si
i-verify sa real time; samakatuwid, dapat silang magkaisa
ganap sa paggalaw ng data stessi
Online Analytic Processing Processing
Online na Analytics
Ang kakayahang maghiwa, mag-dice, gumulong, mag-drill down
at isagawa ang pagsusuri
what-if, is within the scope, ang layunin ng suite
teknolohiya ng IBM. Halimbawa, analytical treatment functions
online (OLAP) ay umiiral para sa DB2 na nagdadala ng dimensional na pagsusuri sa
makina ng database pareho .
Ang mga function ay nagdaragdag ng dimensional na utility sa SQL habang
samantalahin ang lahat ng mga benepisyo ng pagiging natural na bahagi ng DB2. Isa pa
halimbawa ng OLAP integration ay ang extraction tool, DB2
Server ng OLAP Analyzer. Pinapayagan ng teknolohiyang ito ang mga cube ng
DB2 OLAP server upang maging mabilis at awtomatiko
sinuri upang hanapin at iulat ang mga halaga ng data hindi pangkaraniwan o hindi inaasahan
para sa lahat ng cube sa trading analyst. At sa wakas, ang mga pag-andar ng
Nagbibigay ang DW Center ng mga paraan para masuri ng mga arkitekto, bukod sa iba pa
iba pang mga bagay, i-profile ang isang DB2 OLAP server cube bilang bahagi
kalikasan ng mga proseso ng ETL.
Spatial na Pagsusuri Spatial na Pagsusuri
Ang espasyo ay kumakatawan sa kalahati ng mga analytical anchor (conductions).
kailangan para sa isang panorama
malawak na analitikal (kinakatawan ng oras ang iba pang kalahati). Ang atomic na antas
(atomic-level ) ng bodega, na kinakatawan sa Figure 1.1,
kasama ang mga batayan para sa parehong oras at espasyo. Ang mga pag-record
Time-based anchor analysis para sa impormasyon sa oras at address
pagsusuri ng anchor mula sa kalawakan. Mga timestamp
magsagawa ng pagsusuri sa oras, at tugunan ang mga lead ng impormasyon
spatial na pagsusuri. Ang diagram ay nagpapakita ng geocoding–proseso ng
pag-convert ng mga address sa mga punto sa mapa o mga punto sa kalawakan
upang ang mga konsepto tulad ng distansya at loob/labas ay maaaring
ginagamit sa pagsusuri–isinasagawa sa atomic level at spatial analysis
na ginawang magagamit sa analyst. Nagbibigay ang IBM ng mga extension
space, na binuo kasama ang Environmental System Research Institute (ESRI),
al database DB2 upang ang mga spatial na bagay ay maaaring maging
pinanatili bilang isang normal na bahagi ng database pamanggit. DB2
Mga Spatial Extenders, nagbibigay din sila ng lahat ng SQL extension para sa
samantalahin ang spatial analysis. Halimbawa, ang mga extension ng SQL mula sa
tanong tungkol sa
distansya sa pagitan ng mga address o kung ang isang punto ay nasa loob o labas ng isang lugar
tinukoy na polygonal, ay isang analytical na pamantayan sa Spatial
mga extender. Tingnan ang kabanata 16 para sa higit pang impormasyon.
Database-Mga Tool sa Resident Tool Database-
naninirahan
Ang DB2 ay may maraming mga tampok na tumutulong sa SQL BI-resident
sa pagkilos ng pagsusuri. Kabilang dito ang:
▪ Gumagana ang recursion upang magsagawa ng pagsusuri, gaya ng “hanapin
lahat ng posibleng landas ng paglipad mula sa San Francisco a New York".
▪ Analytical function para sa ranking, cumulative function, cube
at mga rollup upang mapadali ang mga gawain na karaniwang nangyayari
lamang sa teknolohiyang OLAP, ay natural na bahagi na ngayon ng
makina ng database
▪ Ang kakayahang lumikha ng mga talahanayan na naglalaman ng mga resulta
Mga nagbebenta ng database ang mga pinuno ay naghahalo ng higit sa kakayahan ng BI
sa database stesso
Ang pangunahing mga supplier ng base ng datos sila ay naghahalo ng higit sa
functionality ng BI sa database stesso
Nagbibigay ito ng pinakamahusay na pagganap at higit pang mga opsyon sa pagpapatupad para sa les
Mga solusyon sa BI.
Tinatalakay ang mga feature at function ng DB2 V8
nang detalyado sa mga sumusunod na kabanata:
Teknikal na Arkitektura at Mga Pundasyon sa Pamamahala ng Data
(Kabanata 5)
▪ DB2 BI Fundamentals (Kabanata 6)
▪ DB2 Materialized Query Tables (Materialized Query
Mga Talahanayan) (Kabanata 7)
▪ Mga Function ng DB2 OLAP (Kabanata 13)
▪ Mga feature at function ng DB2 Enhanced BI (Pinahusay na BI
Mga Tampok at Pag-andar) (Kabanata 15)
Pinasimpleng Sistema ng Paghahatid ng Data
Sistema ng paghahatid ng data pinasimple
Ang arkitektura na inilalarawan sa Figure 1.1 ay may kasamang ilan
mga istruktura data pisikal. Ang isa ay ang bodega ng data pagpapatakbo.
Sa pangkalahatan, ang isang ODS ay nakatuon sa object,
pinagsama-sama at kasalukuyang. Bubuo ka ba ng ODS para suportahan, hal
halimbawa, ang opisina ng pagbebenta. Ang mga benta ng ODS ay makakadagdag data
mula sa maraming iba't ibang sistema ngunit mananatili lamang, hal
halimbawa, ang mga transaksyon ngayon. Maaaring ma-update ang ODS
kahit ilang beses sa isang araw. Kasabay nito, ang mga proseso
itulak i data isinama sa iba pang mga application. Ang pasilidad na ito ay
partikular na idinisenyo upang pagsamahin data kasalukuyan at dinamiko e
ay malamang na kandidato na suportahan ang real-time na analytics,
kung paano magbigay ng mga ahente ng serbisyo mga customer impormasyon sa pagbebenta
agos ng customer sa pamamagitan ng pagkuha ng impormasyon sa trend ng pagbebenta
mula sa bodega mismo. Ang isa pang istraktura na ipinapakita sa figure 1.1 ay
isang pormal na katayuan para sa dw. Hindi lamang ito ang lugar para sa
ang pagpapatupad ng kinakailangang pagsasama, kalidad ng dataAt
ng pagbabago ng data ng stock na darating, ngunit ito rin
isang maaasahan at pansamantalang lugar ng imbakan para sa data gayahin mo yan
maaaring magamit sa real-time na analytics. Kung magpasya kang
gumamit ng ODS o staging area, isa
ng pinakamahusay na mga tool upang punan ang mga istrukturang ito data paggamit
Ang iba't ibang mga mapagkukunan ng pagpapatakbo ay ang heterogenous na ipinamamahaging query ng DB2.
Ang kakayahang ito ay inihahatid ng opsyonal na tampok ng DB2
tinatawag na DB2 Relational Connect (mga query lang) at sa pamamagitan ng DB2
DataJoiner (isang hiwalay na produkto na naghahatid ng tanong,
ang insert, ang pag-update at ang posibilidad ng pagkansela a
heterogeneously distributed RDBMSs).
Ang teknolohiyang ito ay nagpapahintulot sa mga arkitekto na data upang itali data di
produksyon na may analytical na proseso. Hindi lang pwede ang teknolohiya
umangkop sa halos alinman sa mga kahilingan sa pagtitiklop na iyon
maaari silang makabuo ng real-time na pagsusuri, ngunit ito
maaari din silang kumonekta sa isang malawak na iba't ibang mga base data pa
sikat, kabilang ang DB2, Oracle, Sybase, SQL Server,
Informix at iba pa. Maaaring gamitin ang DB2 DataJoiner para mag-populate
isang istraktura data pormal tulad ng isang ODS o kahit isang mesa
permanenteng kinakatawan sa bodega na idinisenyo para sa pagpapanumbalik
mabilis na mga instant update o para sa pagbebenta. natural,
ang parehong mga istruktura data maaaring ma-populate gamit ang
isa pang pangunahing teknolohiya na idinisenyo para sa pagtitiklop ng data, IBM
DataPropagator Relational. (Ang DataPropagator ay isang hiwalay na produkto
para sa mga sentral na sistema. Kasama sa DB2 UNIX, Linux, Windows at OS/2
mga serbisyo ng pagtitiklop ng data bilang isang karaniwang tampok).
Isa pang paraan para sa paglipat ng data nagpapatakbo sa paligid
sa enterprise ay isang enterprise application integrator kung hindi man
kilala bilang isang message broker. Ito
Ang natatanging teknolohiya ay nagbibigay-daan sa walang kaparis na kontrol sa gitna
(pag-target) at ilipat data sa paligid ng kumpanya. Nasa IBM ang broker
ng pinakamalawak na ginagamit na mensahe, MQSeries, o isang variation
ng produkto na kinabibilangan ng mga kinakailangan ng e-commerce, IBM
WebSphere MQ.
Para sa higit pang talakayan kung paano gamitin ang MQ upang suportahan ang a
bodega at isang kapaligiran ng BI, bisitahin Website ng aklat. Sa ngayon, ito ay
sapat na upang sabihin na ang teknolohiyang ito ay isang mahusay na daluyan para sa
pagkuha at pagbabago (gamit ang MQSeries Integrator) data
mga target na operatiba na na-recruit para sa mga solusyon sa BI. doon
Ang teknolohiya ng MQ ay isinama at nakabalot sa UDB V8, na
nangangahulugan na ang mga pila ng mensahe ay maaari na ngayong pamahalaan
parang mga DB2 table sila. Ang konsepto ng hinang ng
nakapila na mga mensahe at ang uniberso ng database mga pamanggit na ulo
patungo sa isang malakas na kapaligiran ng paghahatid ng data.
Zero-Latency Zero latency
Ang pinakahuling madiskarteng layunin para sa IBM ay zero latency analysis.
Tulad ng tinukoy ng
Gartner, ang isang BI system ay dapat makapag-infer, mag-assimilate
at magbigay ng impormasyon sa mga analyst kapag hiniling. Ang hamon,
siyempre, ito ay nakasalalay sa kung paano ihalo data kasalukuyan at sa totoong oras
na may kinakailangang impormasyon sa kasaysayan, tulad ng i data kaugnay na modelo/ng
tendency, o ang nakuhang pag-unawa, bilang delineasyon ng
customer
Kasama sa naturang impormasyon, halimbawa, ang pagkakakilanlan ng mga customer ad
mataas o mababa ang panganib o kung aling mga produkto i mga customer marami silang bibilhin
marahil kung mayroon na silang ilang keso sa kanilang mga kariton
mga acquisition.
Ang pagkuha ng zero latency ay talagang nakadepende sa dalawa
pangunahing mekanismo:
▪ Kumpletuhin ang pagsasanib ng data which are parsed with the
itinatag na mga diskarte at gamit ang mga tool na binuo ng BI
▪ Isang sistema ng paghahatid ng data mabisa upang matiyak iyon
Ang real-time na pagsusuri ay talagang magagamit
Ang mga kinakailangang ito para sa zero latency ay hindi naiiba sa dalawa
mga layunin na itinatag ng IBM at inilarawan sa itaas.
Ang mahigpit na pagkakabit ng mga data ay bahagi ng programa
walang putol na pagsasama na inayos ng IBM. At lumikha ng isang sistema
ng paghahatid ng data ang kahusayan ay ganap na nakasalalay sa
magagamit na teknolohiya na nagpapasimple sa proseso ng paghahatid ng
data. Bilang resulta, ang dalawa sa tatlong layunin ng IBM ay kritikal
upang gawin ang pangatlo. Ang IBM ay sinasadya na bumuo ng sarili nitong
teknolohiya upang matiyak na ang zero latency ay isang katotohanan para sa
pagsisikap sa bodega.
Buod / Synthesis
Ang organisasyon ng BI ay nagbibigay ng roadmap para sa
lumikha ng iyong kapaligiran
paulit-ulit. Dapat itong ayusin upang maipakita ang mga pangangailangan ng
iyong negosyo, sa kasalukuyan at sa hinaharap. Nang walang pananaw sa arkitektura
malawak, ang mga stock rep ay higit pa sa
mga random na pagpapatupad ng central warehouse na hindi gaanong nagagawa
lumikha ng isang malawak, pang-impormasyon na negosyo.
Ang unang balakid para sa mga tagapamahala ng proyekto ay kung paano bigyang-katwiran ang
mga pamumuhunan na kinakailangan para sa pagpapaunlad ng organisasyon ng BI.
Habang ang pagkalkula ng ROI ay nanatiling pangunahing batayan para sa
warehouse achievements, ito ay nagiging mas mahirap na
hulaan nang eksakto. Ito ay humantong sa iba pang mga pamamaraan para sa
pagpapasiya kung nakukuha mo ang halaga ng iyong pera. Ang
halaga sa investment2 (VOI), halimbawa, ay binili
bilang solusyon.
Ito ay tungkulin ng mga arkitekto ng data at sa mga tagaplano ng proyekto
sadyang bumuo at magbigay ng impormasyon sa mga asosasyon ng
mga gumagamit at hindi lamang nagbibigay ng serbisyo ng sui data. Meron isang
malaking pagkakaiba ng dalawa. Ang impormasyon ay isang bagay na ginagawa ng isang tao
pagkakaiba sa mga proseso ng paggawa ng desisyon at pagiging epektibo; medyo, i
data sila ay bumubuo ng mga bloke para sa pagkuha ng impormasyong iyon.
Bagama't kritikal sa pinagmulan data upang matugunan ang mga kahilingan
negosyo, ang kapaligiran ng BI ay dapat magsilbi ng mas malaking papel
sa paglikha ng nilalaman ng impormasyon. Kailangan nating kunin
ang mga karagdagang hakbang sa paglilinis, pagsasama-sama, pagbabago o
kung hindi man ay lumikha ng nilalaman ng impormasyon ayon sa kung saan ang
maaaring kumilos ang mga user, kaya kailangan nating tiyakin na ang mga iyon
mga aksyon at mga desisyong iyon, kung saan makatwiran, ay may feedback
sa kapaligiran ng BI. Kung i-relegate natin ang bodega upang magsilbi lamang sa data,
tinitiyak na ang mga asosasyon ng gumagamit ay gagawa ng nilalaman
impormasyong kailangan upang kumilos. Tinitiyak nito na ang kanilang
ang komunidad ay makakagawa ng mas mahusay na mga desisyon, ngunit ang negosyo
naghihirap mula sa kakulangan ng kaalaman na kanilang ginamit.
Dato na ang mga arkitekto at tagaplano ng proyekto ay nagpasimula ng mga proyekto
tiyak sa kapaligiran ng BI, nananatili silang nananagot sa negosyo
sa pangkalahatan. Isang simpleng halimbawa ng tampok na twosome na ito
Ang mga mukha ng mga pag-ulit ng BI ay matatagpuan sa pinagmulan data. Lahat
data natanggap para sa mga partikular na komersyal na kahilingan ay dapat na
naninirahan sa unang atomic layer. Tinitiyak nito ang pag-unlad ng
corporate information asset, pati na rin ang pamamahala, ruta ang
mga partikular na kahilingan ng user na tinukoy sa pag-ulit.

W hatisa D ata W arehouse ?
Bodega ng data ito ang puso ng arkitektura ng mga sistema ng impormasyon
mula noong 1990 at sumusuporta sa mga proseso ng impormasyon sa pamamagitan ng pag-aalok ng solid
pinagsamang platform ng data makasaysayang kinuha bilang batayan para sa ibang pagkakataon
mga pagsusuri. ANG data bodega nag-aalok ng kadalian ng pagsasama sa a
mundo ng mga hindi tugmang sistema ng aplikasyon. Petsa
ang bodega ay naging isang uso. Bodega ng data
nag-aayos at nag-iimbak i data kailangan para sa mga proseso ng impormasyon e
analitikal batay sa isang mahabang makasaysayang temporal na pananaw. Lahat
ito ay nagsasangkot ng isang malaki at patuloy na pagsisikap sa konstruksyon at
sa pagpapanatili ng data bodega.
Kaya ano ang a data bodega? A data bodega ito ay:
▪ nakatuon sa paksa
▪ pinagsamang sistema
▪ pagkakaiba-iba ng oras
▪ non-volatile (hindi nagkansela)
isang koleksyon ng data ginagamit sa pagsuporta sa mga desisyon sa pamamahala sa
pagpapatupad ng mga proseso.
I data ipinasok sa data bodega lumitaw sa karamihan ng
mga kaso mula sa mga kapaligiran sa pagpapatakbo. Ang data bodega ay ginawa ng isa
storage unit, pisikal na nakahiwalay sa iba pang bahagi ng
sistema, na naglalaman ng data naunang naproseso ng
mga application na nagpapatakbo sa impormasyong nagmula sa kapaligiran
pagpapatakbo.
Ang literal na kahulugan ng a data bodega nararapat sa masusing pagsisiyasat
pagpapaliwanag dahil may mahahalagang motibasyon at kahulugan ng
pondo na naglalarawan sa mga katangian ng isang bodega.
ORIENTASYON NG PAKSA
THEMATIC
Ang unang katangian ng a data bodega ay na ito ay naglalayon sa
pangunahing manlalaro sa isang kumpanya. Ang gabay ng mga proseso sa pamamagitan ng
data ito ay kabaligtaran sa mas klasikong pamamaraan na nakikita
ang oryentasyon ng mga aplikasyon patungo sa mga proseso at pag-andar,
paraan na kadalasang ibinabahagi ng karamihan
mas lumang mga sistema ng direksyon.
Ang operating mundo ay dinisenyo sa paligid ng mga application at function
tulad ng mga pautang, savings, bankcards at trust para sa isang institusyon
pananalapi. Ang mundo ng dw ay nakaayos sa paligid ng mga paksa
mga punong-guro tulad ng customer, nagbebenta, produkto at aktibidad.
Ang pagkakahanay sa paligid ng mga paksa ay nakakaapekto sa disenyo at
sa paggawa ng data matatagpuan sa dw. Higit sa lahat,
ang pangunahing paksa ay nakakaapekto sa pinakamahalagang bahagi ng
pangunahing istraktura.
Ang mundo ng application ay parehong naiimpluwensyahan ng disenyo ng data
batayan kaysa sa disenyo ng proseso. Ang mundo ng
Ang dw ay nakatuon lamang sa pagmomodelo ng video data at sa
pagguhit ng database. Ang disenyo ng proseso (sa anyo nito
classical) ay hindi bahagi ng dw environment.
Ang mga pagkakaiba sa pagitan ng pagpili ng proseso/pag-andar ng aplikasyon at
Ang pagpili para sa paksa ay inihayag din bilang mga pagkakaiba sa nilalaman
ng data sa isang detalyadong antas. ANG data del dw huwag isama ang i data na
hindi sila gagamitin para sa proseso ng DSS, habang ang mga aplikasyon
operational oriented sa data naglalaman ng i data upang masiyahan
kaagad ang functional/processing requirements na maaaring o
hindi bababa sa anumang paggamit para sa DSS analyst.
Isa pang mahalagang paraan kung saan ang mga application na nakatuon sa pagpapatakbo
ai data naiiba sa data ng dw ay nasa mga ulat ng data. Ako data
ang mga operatiba ay nagpapanatili ng isang patuloy na relasyon sa pagitan ng dalawa o higit pang mga talahanayan
batay sa isang panuntunan sa negosyo na aktibo. ANG data ni dw
sumasaklaw sila sa isang spectrum ng oras at ang mga ratios na matatagpuan sa dw ay
marami. Maraming mga patakaran sa kalakalan (at naaayon, marami
mga ulat ng data ) ay kinakatawan sa bodega ng data sa pagitan ng dalawa o
maramihang mga talahanayan.
(Para sa isang detalyadong paliwanag kung paano ang mga ugnayan sa pagitan ng data ay
pinamamahalaan sa DW, tinutukoy namin ang Tech Topic tungkol doon
tanong.)
Mula sa walang ibang pananaw maliban sa pagkakaiba
pangunahing sa pagitan ng pagpili ng functional/proseso at aplikasyon
isang pagpipilian ng paksa, may mas malaking pagkakaiba sa pagitan ng mga system
pagpapatakbo at data at ang DW.
PAGSASAMA PAGSASAMA
Ang pinakamahalagang aspeto ng kapaligiran ng dw ay ang i data natagpuan
sa loob ng dw madali silang isinama. LAGI. WALANG
EXCEPTIONS. Ang pinaka esensya ng dw environment ay ang i data
nakapaloob sa loob ng mga limitasyon ng bodega ay isinama.
Ang pagsasama ay nagpapakita ng sarili nito sa maraming iba't ibang paraan - sa mga kombensiyon
natukoy na pare-pareho, sa lawak ng pare-parehong mga variable, sa
pare-parehong mga istrukturang na-codify, sa mga pisikal na katangian ng data
pare-pareho, at iba pa.
Sa paglipas ng mga taon, ginawa ito ng mga taga-disenyo ng ilang mga aplikasyon
pagmamay-ari ng maraming desisyon tungkol sa kung paano dapat ang isang aplikasyon
mapaunlad. Mga desisyon sa istilo at indibidwal na disenyo
ng mga application ng mga taga-disenyo ay ipinahayag sa isang daang paraan: sa
mga pagkakaiba sa coding, pangunahing istruktura, katangiang pisikal,
mga kumbensyon sa pagkakakilanlan, at iba pa. Ang kolektibong kapasidad ng marami
mga taga-disenyo ng application upang lumikha ng mga hindi tugmang aplikasyon
ito ay maalamat. Inilalantad ng Figure 3 ang ilan sa higit pang mga pagkakaiba
mahalaga sa mga paraan kung paano idinisenyo ang mga application.
Encoding: Encode:
Pinili ng mga taga-disenyo ng aplikasyon ang field coding -
sex- sa iba't ibang paraan. Ang isang taga-disenyo ay kumakatawan sa sex bilang
isang "m" at "f". Kinakatawan ng isa pang taga-disenyo ang kasarian bilang isang "1"
at isang "0". Ang isa pang taga-disenyo ay kumakatawan sa kasarian bilang isang "x" at
"y". Kinakatawan ng isa pang taga-disenyo ang kasarian bilang "lalaki" at
"babae". Talagang hindi mahalaga kung paano napupunta ang kasarian sa DW. Sila"
at ang "F" ay malamang na kasing ganda ng lahat
representasyon.
Ang mahalaga ay mula sa anumang pinanggalingan ng larangan ng kasarian,
ang field na iyon ay dumating sa DW sa isang pare-parehong pinagsamang estado. Mula sa
kahihinatnan kapag na-load ang field sa DW mula sa
isang application kung saan ito ay naisip sa format
"M" at "F", i data dapat i-convert sa DW format.
Pagsukat ng mga Katangian: Pagsukat ng
Mga Katangian:
Pinili ng mga taga-disenyo ng application na sukatin ang pipeline
iba't ibang paraan sa kurso
Ilang taon. Isang designer stores i data ng pipeline sa
sentimetro. Isa pang application designer ang nag-iimbak ng data
ng pipeline sa mga tuntunin ng pulgada. Isa pang designer ng
mga tindahan ng aplikasyon i data ng pipeline sa milyong kubiko talampakan
bawat segundo. At isa pang taga-disenyo ang nag-iimbak ng impormasyon ng
pipeline sa mga tuntunin ng mga yarda. Anuman ang pinagmulan, kapag ang
Dumarating ang impormasyon ng pipeline sa DW dapat sila
sinusukat sa parehong paraan.
Ayon sa mga indikasyon ng figure 3 ang mga isyu sa pagsasama
nakakaapekto ang mga ito sa halos lahat ng aspeto ng disenyo – ang mga tampok
mga pisikal na diyos data, ang dilemma ng pagkakaroon ng higit sa isang pinagmulan ng data, Ang
bagay ng hindi tugmang natukoy na mga sample, mga format ng data
hindi pare-pareho, at iba pa.
Anuman ang argumento ng disenyo, pareho ang resulta -
i data dapat na naka-imbak sa DW sa isang isahan e
pandaigdigang katanggap-tanggap na paraan kahit na ang mga operating system ng
iba ang tindahan ng pondo i data.
Kapag tinitingnan ng DSS analyst ang DW, ang lens ng analyst
dapat ay ang pagsasamantala ng data na nasa bodega,
sa halip na magtaka tungkol sa kredibilidad o pagkakapare-pareho ng
data.
VARIANCY NG ORAS
Lahat data sa DW ang mga ito ay tumpak sa ilang sandali sa oras.
Ang pangunahing tampok na ito ng data sa DW ito ay ibang-iba sa data
matatagpuan sa operating environment. ANG data ng operating environment ay
tumpak tulad ng sa oras ng pag-access. Sa ibang salita,
sa operating environment kapag ina-access ang isang unit data, doon oo
hintayin itong magpakita ng mga tumpak na halaga tulad ng sa oras ng pag-access.
Bakit ako data sa DW ay tumpak tulad ng sa ilang oras sa
oras (i.e., hindi "ngayon"), i data matatagpuan sa DW
sila ay "time variance".
Ang pagkakaiba-iba ng oras ng data Ang DW ay tinutukoy sa maraming paraan.
Ang pinakasimpleng paraan ay i data ng isang DW na kumakatawan data sa a
long time horizon – lima hanggang sampung taon. Ang abot-tanaw
ang oras na kinakatawan para sa operating environment ay mas maikli
▪ mula sa kasalukuyang mga halaga mula hanggang animnapu't siyamnapu
Mga application na kailangang gumana nang maayos at kailangang maging
magagamit para sa pagproseso ng transaksyon ay dapat magdala ng
pinakamababang halaga ng data kung umamin sila sa anumang antas ng
kakayahang umangkop. Kaya ang mga application sa pagpapatakbo ay may abot-tanaw
maikling time frame, bilang argumento ng disenyo ng
sound application.
Ang pangalawang paraan na lumilitaw ang 'time variancy' sa DW ay sa
pangunahing istraktura. Ang bawat pangunahing istraktura sa DW ay naglalaman ng,
implicitly o tahasang, isang elemento ng oras, tulad ng
araw, linggo, buwan, atbp. Ang elemento ng oras ay halos palaging
sa ibaba ng pinagsama-samang susi na makikita sa DW. Sa mga ito
mga pagkakataon, ang elemento ng oras ay iiral nang hindi malinaw, tulad ng pagkakataon
kung saan ang isang buong file ay nadoble sa katapusan ng buwan o quarter.
Ang ikatlong paraan ng pagkakaiba-iba ng oras ay ipinapakita ay ang i data del
DW, maayos lang na nakarehistro, hindi pwede
na-update. ANG data ng DW ay, para sa lahat ng praktikal na layunin, isang mahaba
serye ng mga snapshot (snapshot). Siyempre kung ang mga snapshot ay
kinuha nang hindi tama, kung gayon ang mga snapshot ay maaaring
binago. Ngunit ipagpalagay na ang mga snapshot ay tapos na
tama, hindi sila nababago sa sandaling ito ay ginawa. Sa ilang
kaso maaaring hindi etikal o hindi wasto ang mga snapshot sa
Ang DW ay binago. ANG data pagpapatakbo, pagiging tumpak tulad ng sa
sandali ng pag-access, maaari silang ma-update ayon sa lalabas
ang pangangailangan.
HINDI VOLATILE
Ang pang-apat na mahalagang katangian ng DW ay ang pagiging non-volatile nito.
Ginagawa ang mga pag-update, pagpapasok, pagtanggal at pagbabago
regular para sa record-by-record na mga kapaligiran sa pagpapatakbo. Ngunit ang
pangunahing pagmamanipula ng data mas kailangan sa DW
simple lang. Mayroon lamang dalawang uri ng mga operasyon na nagaganap sa
DW – ang paunang pagkarga ng data at access sa data. Walang
walang update ng data (sa pangkalahatang kahulugan ng
update) sa DW bilang isang normal na operasyon sa pagpoproseso.
Mayroong ilang napakalakas na kahihinatnan ng pagkakaibang ito
batayan sa pagitan ng operational processing at DW processing. Sa antas
sa pamamagitan ng disenyo, ang pangangailangan na maging maingat tungkol sa pag-upgrade
abnormal ay hindi kadahilanan sa DW, dahil ang pag-update ng data hindi ito
isinagawa. Nangangahulugan ito na sa pisikal na antas ng disenyo,
maaaring kunin ang mga kalayaan upang ma-optimize ang pag-access sa data,
partikular sa pagharap sa mga paksa ng estandardisasyon at ng
pisikal na denormalisasyon. Isa pang kahihinatnan ng pagiging simple
ng mga operasyon ng DW ay nasa pinagbabatayan na teknolohiyang ginagamit para sa
patakbuhin ang kapaligiran ng DW. Kailangang suportahan ang mga update
record by record inline (tulad ng kadalasang nangyayari sa
operational processing) ang teknolohiya ay kinakailangang magkaroon ng ilan
napaka kumplikadong mga pundasyon sa ilalim ng isang maliwanag na pagiging simple.
Ang teknolohiyang sumusuporta sa backup at pagbawi, mga transaksyon
at integridad ng data at ang pagtuklas at lunas ng pagkapatas ay
medyo kumplikado at hindi kinakailangan para sa pagproseso ng DW.
Ang mga katangian ng isang DW, oryentasyon ng disenyo,
integrasyon ng data sa loob ng DW, pagkakaiba-iba ng oras at pagiging simple
ng pamamahala ng data, lahat ay humahantong sa isang kapaligiran na napaka, napaka
naiiba sa klasikong operating environment. Ang pinagmulan ng halos lahat
data ng DW ay ang operating environment. Nakakatuwang isipin
na mayroong napakalaking redundancy ng data sa pagitan ng dalawang kapaligiran.
Sa katunayan, ang unang impresyon na mayroon ang maraming tao ay ang sa
malaking kalabisan ng data sa pagitan ng operating environment at ng
DW extension. Ang ganitong interpretasyon ay mababaw at nagpapatunay a
kawalan ng pag-unawa kung ano ang nangyayari sa DW.
Sa katunayan mayroong isang minimum na redundancy ng data sa pagitan ng operating environment
at data ng DW. Isinasaalang-alang namin ang mga sumusunod:
▪ Ako data ay sinasala dato na pumasa ka mula sa operating environment
sa kapaligiran ng DW. marami data hindi sila nawalan ng malay
mula sa operating environment. Iyon lamang data na kailangan para sa
Hinahanap ng pagproseso ng DSS ang kanilang direksyon sa kapaligiran
▪ ang abot-tanaw ng oras ng data ibang-iba ito sa kapaligiran
sa iba. ANG data sa kapaligiran ng operating ang mga ito ay napaka-sariwa. ANG data
sa DW mas matanda sila. Mula lamang sa pananaw
sa abot-tanaw ng oras, napakakaunting magkakapatong
sa pagitan ng operating environment at ng DW.
▪ Ang DW ay naglalaman ng data ng buod na hindi kailanman matatagpuan
sa kapaligiran
▪ Ako data sumailalim sa isang pangunahing pagbabago mula noon
sandali na dumaan sila sa Figure 3 ay naglalarawan na karamihan
bahagi ng data ay makabuluhang binago kung ibinigay
upang mapili at ilipat sa DW. Sa madaling salita, ang
karamihan ng data ay pisikal na binago e
radikal habang inililipat ito sa DW. Sa pala-palagay
ng integration ay hindi pareho data na naninirahan
sa operating environment.
Dahil sa mga salik na ito, ang redundancy ng data sa pagitan ng dalawang kapaligiran ay
isang bihirang pangyayari, na humahantong sa mas mababa sa 1% na kalabisan sa pagitan ng dalawa
kapaligiran.
ANG STRUCTURE NG WAREHOUSE
Ang mga DW ay may natatanging istraktura. Mayroong iba't ibang antas ng buod at ng
detalyeng naghahati sa mga DW.
Ang iba't ibang bahagi ng isang DW ay:
▪ Metadata
Dati kasalukuyang mga detalye
Dati ng lumang detalye
Dati bahagyang summarized
Dati mataas ang buod
Sa ngayon ang pangunahing pag-aalala ay para sa i data ng detalye
agos. Ito ang pangunahing alalahanin dahil:
▪ Ako data ang mga kasalukuyang detalye ay sumasalamin sa pinakabagong mga kaganapan,
na laging may malaking interes at
▪ i data ng kasalukuyang detalye ay napakalaki dahil ito ay
nakaimbak sa pinakamababang antas ng granularity e
▪ i data ang mga kasalukuyang detalye ay halos palaging nakaimbak sa
disk memory, na mabilis ma-access, ngunit mahal at
kumplikado mula sa
I data mas lumang mga detalye ay data na nakaimbak sa
ilang alaala ng masa. Ito ay may access nang paminsan-minsan at ito ay
nakaimbak sa isang antas ng detalye na katugma sa data detalyado
agos. Habang hindi ipinag-uutos na mag-imbak sa isang daluyan ng
alternatibong memorya, dahil sa malaking volume ng data nagkakaisa sa
kalat-kalat na pag-access ng data, ang memory medium para sa data di
ang mas lumang detalye ay hindi karaniwang nakaimbak sa disk.
I data buod nang basta-basta ay data na ibabang dalisay
antas ng detalye na matatagpuan sa kasalukuyang antas ng detalye. Ito
Ang antas ng DW ay halos palaging nakaimbak sa memorya ng disk. ANG
mga problema ng disenyo na nagpapakita ng kanilang mga sarili sa arkitekto ng data
sa pagbuo ng antas na ito ng DW ay:
▪ Anong yunit ng oras ang ginawang pagbubuod sa itaas
▪ Anong nilalaman, mga katangian ang bahagyang magbubuod sa
nilalaman ng data
Ang susunod na antas ng data na matatagpuan sa DW ay ang sa data mataas na
buod. ANG data ang mataas na buod ay compact at madali
naa-access. ANG data ang mataas na buod ay kung minsan ay matatagpuan
sa kapaligiran ng DW at sa ibang mga kaso i data highly summarized sila
na matatagpuan sa labas ng mga agarang pader ng teknolohiyang nagtataglay ng DW.
(sa anumang kaso, i data ang lubos na buod ay bahagi ng DW
hindi alintana kung saan ako data ay pisikal na matatagpuan).
Ang huling bahagi ng DW ay ang bahagi ng metadata. Sa maraming aspeto
Ang metadata ay nasa ibang dimensyon kaysa sa iba data
ng DW, dahil walang laman ang metadata dato direkta
kinuha mula sa operating environment. May espesyal na tungkulin ang metadata e
napakahalaga sa DW. Ginagamit ang metadata bilang:
▪ isang direktoryo upang matulungan ang DSS analyst na mahanap ang
nilalaman ng DW,
▪ isang gabay sa pagmamapa ng data ng kung paano i data Sila ay
binago mula sa operating environment patungo sa DW environment,
▪ isang gabay sa mga algorithm na ginagamit para sa pagbubuod sa pagitan ng i data di
kasalukuyang detalye ei data bahagyang buod, i data mataas na
buod,
Ang metadata ay gumaganap ng mas malaking papel sa kapaligiran ng DW
kumpara sa kung ano ang mayroon sila sa operating environment
LUMANG DETALYE STORAGE MEDIUM
Maaaring gamitin ang magnetic tape upang mag-imbak ng ganoong uri ng
data. Sa katunayan mayroong isang malawak na pagkakaiba-iba ng storage media na
dapat isaalang-alang para sa pangangalaga ng luma data di
detalye.
Depende sa dami ng data, dalas ng pag-access, gastos
ng mga tool at ang uri ng pag-access, ito ay lubos na malamang
na ang ibang mga tool ay mangangailangan ng lumang antas ng detalye
sa DW.
DALOY NG DATA
Mayroong normal at mahuhulaan na daloy ng mga diyos data sa loob ng DW.
I data pumasok sila sa DW mula sa operating environment. (NOTE: meron
ilang napaka-kagiliw-giliw na mga pagbubukod sa panuntunang ito. Gayunpaman, halos
lahat data ipasok ang DW mula sa operating environment). Dato na ako data
pumapasok sila sa DW mula sa operating environment, ito ay nabago tulad ng dati
inilarawan dati. Kung ipasok mo ang DW, i data pumasok sila sa
kasalukuyang antas ng detalye, tulad ng ipinapakita. Ito ay naninirahan doon at ginagamit
hanggang sa mangyari ang isa sa tatlong kaganapan:
▪ ay dinadalisay,
▪ ay buod, at/o
▪ ay
Hindi na ginagamit na proseso sa loob ng isang DW moves i data kasalukuyang mga detalye
a data ng lumang detalye, ayon sa edad ng data. Ang proseso
ang pagbubuod ay gumagamit ng detalye ng data upang makalkula i data
bahagyang summarized at highly summarized mga antas ng data. Meron
ilang mga pagbubukod sa daloy na ipinakita (tatalakayin sa ibang pagkakataon).
Gayunpaman, kadalasan, para sa karamihan ng data natagpuan
sa loob ng isang DW, ang daloy ng data ay tulad ng nakalarawan.
GAMIT ANG DATAWAREHOUSE
Hindi nakakagulat ang iba't ibang antas ng data sa loob ng DW hindi
makatanggap ng iba't ibang antas ng paggamit. Bilang isang tuntunin, mas mataas ang antas ng
pagbubuod, kasama ang i data ginagamit ang mga ito.
Maraming gamit ang nagaganap sa data mataas ang buod, habang ang luma
data ng detalye ay halos hindi na ginagamit. May magandang dahilan sa
ilipat ang organisasyon sa paradigm sa paggamit ng mapagkukunan. Marami pang meron
buod i data, mas mabilis at mas mahusay na makarating sa data. kung
un tindahan hanapin na gumagawa ito ng maraming detalye sa pagpoproseso ng antas ng mga DW,
pagkatapos ay isang katumbas na malaking halaga ng mga mapagkukunan ng makina
ay natupok. Para sa ikabubuti ng lahat na pumunta sa paglilitis
tulad ng sa isang mataas na antas ng pagbubuod sa lalong madaling panahon.
Para sa maraming mga tindahan, ginamit ang DSS analyst sa isang pre-environment DW
data sa antas ng detalye. Sa maraming aspeto ang pagdating a data detalyado
ay kahawig ng isang kumot ng seguridad, kahit na magagamit ang mga ito
iba pang antas ng pagbubuod. Isa sa mga gawain ng arkitekto ng data è
alisin ang DSS user mula sa patuloy na paggamit ng data nasa plus level
mababang detalye. Mayroong dalawang dahilan na magagamit
ng arkitekto ng data:
▪ pag-install ng chargeback system, kung saan binabayaran ng end user ang
pinagkukunang yaman e
▪ nagsasaad na napakahusay na oras ng pagtugon ay maaaring
nakuha kapag ang pag-uugali na may i data ito ay nasa mataas na pamantayan
ng pagbubuod, habang ang mahinang oras ng pagtugon ay nagmumula sa
pag-uugali ng data sa mababang antas ng
IBANG KONSIDERASYON
Mayroong ilang iba pang mga pagsasaalang-alang sa pagtatayo at pamamahala
DW extension.
Ang unang pagsasaalang-alang ay ang mga indeks. ANG data sa pinakamataas na antas ng
malayang ma-index ang buod, habang i data
sa mas mababang antas ng detalye, napakalaki ng mga ito
matipid na na-index. Mula sa parehong token, i data sa matataas na antas ng
ang detalye ay madaling maibalik,
habang ang dami ng data sa mas mababang antas ito ay napakalaki na i data hindi
madali silang mai-refurbish. Dahil dito, ang modelo
ng data at ang pormal na gawaing ginawa ng disenyo ay nagpapakita ng
pundasyon para sa DW inilapat halos eksklusibo sa antas
kasalukuyang detalye. Sa madaling salita, ang mga aktibidad sa pagmomolde ng
data hindi sila nalalapat sa mga antas ng pagbubuod, sa halos lahat ng kaso.
Ang isa pang structural consideration ay ang subdivision ng
data ng DW.
Ang paghahati ay maaaring gawin sa dalawang antas - sa antas ng dbms at upang
antas ng aplikasyon. Sa dibisyon sa antas dbms, ang dbms è
alam ang tungkol sa mga dibisyon at kinokontrol ang mga ito nang naaayon. Sa kaso ng
dibisyon sa antas ng aplikasyon, ang programmer lamang ang
alam ang tungkol sa mga dibisyon at ang responsibilidad ng mga ito
ang administrasyon ay naiwan sa kanya
Sa ibaba ng antas dbms, maraming trabaho ang awtomatikong ginagawa. meron
magkano ang inflexibility na nauugnay sa awtomatikong pangangasiwa ng
mga dibisyon. Sa kaso ng division-level na aplikasyon ng data del
data bodega, maraming trabaho ang nahuhulog sa programmer, ngunit ang
ang resulta ay ang kakayahang umangkop sa pangangasiwa ng data sa petsa
bodega
IBANG ANOMALIYA
Habang ang mga bahagi ng data bodega gumagana ang mga ito tulad ng inilarawan
para sa halos lahat data, may ilang kapaki-pakinabang na pagbubukod na dapat
pag-usapan. Ang isang pagbubukod ay ang sa data pampublikong buod
(pampublikong buod ng data). Ang mga ito ay data mga buod na naging
kalkulado sa labas ng data bodega ngunit ginagamit sila ng lipunan. ANG data
ang mga pampublikong buod ay iniimbak at pinamamahalaan sa data bodega,
bagama't gaya ng nabanggit sa itaas ay napag-isipan na nila. ANG
nagtatrabaho ang mga accountant upang makagawa ng gayong quarterly data tulad ng
kita, quarterly na gastos, quarterly profit, at iba pa. Ang trabaho
ginawa ng mga accountant ay panlabas sa data bodega. Gayunpaman, i data ay
ginamit "panloob" sa loob ng kumpanya - mula sa marketing, benta, atbp.
Ang isa pang anomalya, na hindi tatalakayin, ay ang tungkol sa data panlabas.
Isa pang mahusay na uri ng data na makikita sa isang datos
Ang bodega ay ang permanenteng data ng detalye. Ang mga ito ay nagiging sanhi ng
kailangang mag-imbak ng permanente i data sa isang antas
detalyado para sa etikal o legal na dahilan. Kung ang isang kumpanya ay nagpapakita ng i
may kaugnayan sa mga manggagawa sa mga mapanganib na sangkap na kailangan data
detalyado at permanente. Kung ang isang kumpanya ay gumagawa ng isang produkto na
nagsasangkot ng kaligtasan ng publiko, kung anong mga bahagi ng isang eroplano, mayroon
ang kailangan upang data permanenteng detalyado, pati na rin kung isang kumpanya
gumawa ng mga mapanganib na kontrata.
Hindi kayang balewalain ng kumpanya ang mga partikular na dahilan
sa mga susunod na taon, kung sakaling magkaroon ng kaso, isang pagpapabalik, a
pinagtatalunang depekto sa konstruksiyon, atbp. pagkakalantad ng kumpanya
maaaring malaki ito. Bilang resulta mayroong isang natatanging uri ng data
kilala bilang permanenteng data ng detalye.
SUMMARY
Un data bodega ito ay isang object oriented, integrated, variant ng
oras, isang koleksyon ng data non-volatile sa pagsuporta sa mga pangangailangan ng
desisyon ng administrasyon. Ang bawat isa sa mga kapansin-pansing katangian ng
un data bodega may mga implikasyon nito. Plus mayroong apat
antas ng data del data bodega:
▪ Mga lumang detalye
▪ Kasalukuyang detalye
Dati bahagyang summarized
Dati mataas ang buod
Ang metadata ay isa ring mahalagang bahagi ng data bodega.
ABSTRAK
Ang konsepto ng imbakan ng data kamakailang natanggap
maraming atensyon at naging uso ito noong dekada 90. Ibig sabihin
dahil sa kakayahan ng a data bodega upang mapagtagumpayan ang
mga limitasyon ng mga sistema ng suporta sa pamamahala tulad ng i
mga sistema ng suporta sa desisyon (DSS) at mga sistema ng impormasyon
mga executive (EIS).
Bagama't ang konsepto ng data bodega mukhang may pag-asa,
ipatupad i data bodega maaaring maging problema dahil
ng malakihang proseso ng warehousing. Sa kabila ng
pagiging kumplikado ng mga proyekto sa warehousing data, maraming supplier
at mga consultant na nag-stock data inaangkin nila iyon
ang imbakan ng data present walang problema.
Gayunpaman, sa pagsisimula ng proyektong pananaliksik na ito, halos wala
independyente, mahigpit at sistematikong pananaliksik ang isinagawa. Mula sa
Dahil dito mahirap sabihin, kung ano talaga ang nangyayari
sa industriya kapag sila ay nagtatayo data bodega.
Sinaliksik ng pag-aaral na ito ang warehousing practice ng data
kontemporaryo na naglalayong bumuo ng mas mayamang pag-unawa
ng pagsasanay sa Australia. Ang pagsusuri sa panitikan ay nagbigay ng
konteksto at pundasyon para sa empirikal na pag-aaral.
Mayroong ilang mga resulta mula sa pananaliksik na ito. Una
lugar, isiniwalat ng pag-aaral na ito ang mga aktibidad na naganap
sa panahon ng pag-unlad ng data bodega. Sa maraming lugar, i data natipon
nakumpirma ang pagsasanay na iniulat sa panitikan. Pangalawa
site, ang mga isyu at problemang maaaring maapektuhan nito
pag-unlad ng data bodega ay natukoy ng pag-aaral na ito.
Panghuli, mga benepisyong nakuha mula sa mga organisasyong Australian na konektado sa
ang gamit ng data bodega ay nahayag.
Kabanata 1
Konteksto ng pananaliksik
Ang konsepto ng data warehousing ay nakatanggap ng malawakang pagtanggap
pagkakalantad at naging isang umuusbong na kalakaran sa
90s (McFadden 1996, TDWI 1996, Shah at Milstein 1997,
Shanks at iba pa. 1997, Eckerson 1998, Adelman at Oates 2000). Yan ay
makikita mula sa dumaraming bilang ng mga artikulo sa datos
bodega sa mga publikasyong pangkalakalan (Little at Gibson 1999).
Maraming mga artikulo (tingnan, halimbawa, Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett at King 1996, Graham et al. 1996,
Sakaguchi at Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997, McCarthy 1997, O'Donnell 1997, Edwards 1998, TDWI
1999) ay nag-ulat ng mga makabuluhang benepisyo sa mga organisasyon
na nagpapatupad ng i data bodega. Sinuportahan nila ang kanilang teorya
na may anecdotal na katibayan ng matagumpay na pagpapatupad, ang mataas na pagbabalik
sa investment figures (ROI) at, gayundin, pagbibigay ng gabay ng
sanggunian o pamamaraan para sa pagbuo ng data bodega
(Shanks et al. 1997, Seddon at Benjamin 1998, Little at Gibson
1999). Sa isang matinding kaso, Graham et al. (1996) mayroon
nag-ulat ng isang average na kita sa isang tatlong taong pamumuhunan na 401%.
Karamihan sa kasalukuyang panitikan, gayunpaman, ay nakaligtaan ang
mga kumplikadong kasangkot sa pagsasagawa ng mga naturang proyekto. Ang mga proyekto ng
data bodega ay karaniwang kumplikado at malakihan at
samakatuwid ang mga ito ay nagpapahiwatig ng mataas na posibilidad na mabigo kung sila ay hindi
maingat na sinuri (Shah at Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs at Clymer 1998, Rao
1998). Nangangailangan sila ng malaking halaga ng kapwa tao at yamang tao
pananalapi at oras at pagsisikap upang maitayo ang mga ito (Hill 1998, Crofts 1998). Ang
karaniwang oras at pinansiyal na paraan na kinakailangan ay ayon sa pagkakabanggit ng
mga dalawang taon at dalawa o tatlong milyong dolyar (Braly 1995, Foley
1997b, Bort 1998, Humphries et al. 1999). Ang mga oras at paraan na ito
ang mga instrumento sa pananalapi ay kinakailangan upang kontrolin at pagsamahin ang maraming aspeto
iba sa data warehousing (Cafasso 1995, Hill 1998). Sa gilid
ng mga pagsasaalang-alang sa hardware at software, iba pang mga function, na iba-iba
mula sa pagkuha ng data sa mga proseso ng paglo-load ng data, mula sa
kapasidad ng memorya upang pamahalaan ang mga update at magbigay ng meta data
para sa pagsasanay ng gumagamit, dapat silang isaalang-alang.
Sa oras na nagsimula ang proyektong pananaliksik na ito, napakakaunti
akademikong pananaliksik na isinagawa sa larangan ng data warehousing,
lalo na sa Australia. Ito ay maliwanag sa kakulangan ng mga item
inilathala sa data warehousing ng mga pahayagan o iba pang banal na kasulatan
akademya noong panahong iyon. Marami sa mga akademikong sulatin
available na inilarawan ang karanasan sa US. Ang kakulangan ng
akademikong pananaliksik sa sl area data warehousing ay naging sanhi ng
nangangailangan ng mahigpit na pananaliksik at empirikal na pag-aaral (McFadden 1996,
Shanks at iba pa. 1997, Little at Gibson 1999). Sa partikular, pag-aaral
pananaliksik sa proseso ng pagpapatupad data bodega
kailangang gawin upang mapalawak ang kaalaman
pangkalahatan tungkol sa pagpapatupad ng data bodega e
ay magsisilbing batayan para sa isang pag-aaral sa hinaharap na pananaliksik (Shanks ed
iba pa. 1997, Little at Gibson 1999).
Ang layunin ng pag-aaral na ito, samakatuwid, ay pag-aralan kung ano talaga ito
ito ay nangyayari kapag ang mga organisasyon ay nagpapanatili at gumagamit ng data
bodega sa Australia. Sa partikular, ang pag-aaral na ito ay kasangkot
isang pagsusuri ng isang buong proseso ng pag-unlad ng a data bodega,
simula sa pagsisimula at disenyo sa pamamagitan ng disenyo at
pagpapatupad at kasunod na paggamit sa loob ng mga organisasyon
Australian. Bilang karagdagan, ang pag-aaral ay makakatulong din sa kasalukuyang pagsasanay
pagtukoy sa mga lugar kung saan ang pagsasanay ay maaaring higit pa
napabuti at ang mga inefficiencies at mga panganib ay maaaring mabawasan o
iniiwasan. Higit pa rito, ito ay magsisilbing batayan para sa iba pang pag-aaral sa data bodega in
Australia at pupunan ang puwang na kasalukuyang umiiral sa panitikan.
Mga tanong sa pananaliksik
Ang layunin ng pananaliksik na ito ay pag-aralan ang mga aktibidad na kasangkot
sa pagpapatupad ng data bodega at ang kanilang paggamit sa pamamagitan ng
mga organisasyong Australian. Sa partikular, pinag-aaralan ang mga elemento
patungkol sa pagpaplano ng proyekto, pagpapaunlad, al
operasyon, paggamit at mga panganib na kasangkot. Kaya naman ang tanong
ng pananaliksik na ito ay:
“Paano ang kasalukuyang practice ng data bodega sa Australia?"
Upang mabisang tumugon sa problemang ito, a
bilang ng mga subsidiary na katanungan sa pananaliksik. Sa partikular, tatlo
ang mga sub-tanong ay natukoy mula sa panitikan, ibig sabihin
ipinakita sa kabanata 2, upang gabayan ang proyektong ito ng pananaliksik:
Paano ipinatupad i data bodega ng mga organisasyon
Australian? Ano ang mga problemang nararanasan?
Ano ang mga benepisyong nararanasan?
Sa pagsagot sa mga tanong na ito, ginamit ang isang guhit
eksplorasyong pananaliksik na gumagamit ng pagsisiyasat. Kung paano ako nag-aaral
eksplorasyon, ang mga sagot sa mga tanong sa itaas ay hindi kumpleto
(Shanks et al. 1993, Denscombe 1998). Sa kasong ito, ito ay
Kinakailangan ang triangulation upang mapabuti ang mga tugon sa mga ito
mga kahilingan. Gayunpaman, ang pagsisiyasat ay magbibigay ng matibay na pundasyon para sa
gawain sa hinaharap na sinusuri ang mga tanong na ito. Isang detalyadong
talakayan tungkol sa katwiran ng pamamaraan ng pananaliksik at sa disenyo
ay ipinakita sa kabanata 3.
Istraktura ng proyekto ng pananaliksik
Ang proyektong pananaliksik na ito ay nahahati sa dalawang bahagi: ang kontekstwal na pag-aaral
ng konsepto ng data warehousing at empirical research (tingnan
Figure 1.1), ang bawat isa ay tinalakay sa ibaba.
Bahagi I: Pag-aaral sa konteksto
Ang unang bahagi ng pananaliksik ay binubuo sa pagsusuri ng
Kasalukuyang literatura sa iba't ibang uri ng data warehousing kabilang ang i
mga sistema ng suporta sa desisyon (DSS), mga sistema ng impormasyon
executive (EIS), ang mga case study ng data bodega at mga konsepto ng petsa
bodega. Gayundin, ang mga resulta ng mga forum sa data bodega at
pulong ng mga grupo para sa mga eksperto at propesyonal na pinamumunuan ng grupo ng
Monash DSS research, nag-ambag sa yugtong ito ng pag-aaral
na nilayon upang makuha ang impormasyon tungkol sa pagsasanay ng data
bodega at upang matukoy ang mga panganib na kasangkot sa kanilang pag-aampon.
Sa panahong ito ng kontekstwal na pag-aaral, pag-unawa
ng lugar ng problema ay naitatag upang magbigay ng kaalaman sa
batayan para sa kasunod na empirikal na pagsisiyasat. Gayunpaman, ito
ay isang patuloy na proseso habang isinasagawa ang pag-aaral
pananaliksik.
Bahagi II: Empirical Research
Ang medyo bagong konsepto ng data warehousing, lalo na
sa Australia, ay lumikha ng pangangailangan na magsagawa ng pagsisiyasat para sa
makakuha ng malawak na larawan ng karanasan sa paggamit. Ito
bahagi ay ginawa kapag ang problema domain ay
naitatag sa pamamagitan ng malawakang pagsusuri sa panitikan. Ang konsepto
ng data-warehousing format sa panahon ng contextual study phase ay
ginamit bilang input sa paunang talatanungan ng pag-aaral na ito.
Pagkatapos nito, sinuri ang talatanungan. Dalubhasa kayo sa pakikipag-date
bodega ay lumahok sa pagsubok. Ang layunin ng pagsubok sa
ang paunang talatanungan ay upang suriin ang pagkakumpleto at katumpakan
ilang katanungan. Batay sa mga resulta ng pagsusulit, ang talatanungan ay
na-edit at naipadala na ang na-edit na bersyon sa
mga kalahok sa survey. Ang mga questionnaire ay ibinalik noon ay
sinuri para sa i data sa mga talahanayan, diagram at iba pang mga format. ANG
resulta ng pagsusuri ng data bumuo ng isang snapshot ng
pagsasanay ng data warehousing sa Australia.
PANGKALAHATANG-IDEYA NG DATA WAREHOUSING
Ang konsepto ng data warehousing ay umunlad sa mga pagpapabuti
ng teknolohiya sa kompyuter.
Ito ay naglalayong malampasan ang mga suliraning kinakaharap ng mga grupo
suporta sa aplikasyon tulad ng Decision Support System (DSS) e
Executive Information System (EIS).
Sa nakaraan ang pinakamalaking balakid ng mga application na ito ay
ang kawalan ng kakayahan ng mga application na ito na magbigay ng a base ng datos
kailangan para sa pagsusuri.
Ito ay kadalasang sanhi ng likas na katangian ng trabaho
pamumuno. Iba-iba ang mga interes ng pamamahala ng isang kumpanya
patuloy na depende sa lugar na ginagamot. Samakatuwid, ako data
pangunahing sa mga application na ito ay dapat na magagawang
mabilis magbago depende sa bahaging gagamutin.
Nangangahulugan ito na i data dapat na available sa form
sapat para sa mga kinakailangang pagsusuri. Sa katunayan, ang mga grupo ng suporta ng
natagpuan ng mga application ang maraming kahirapan sa nakaraan upang mangolekta ng ed
upang isama data mula sa kumplikado at magkakaibang mga mapagkukunan.
Ang natitirang bahagi ng seksyong ito ay nagpapakita ng isang pangkalahatang-ideya ng konsepto ng
data warehousing at kung paano ang data bodega maaaring lumampas sa
Mga isyu sa Application Support Group.
Ang salitang "Warehouse ng Dataay inilabas ni William Inmon noong 1990.
Ang madalas na sinipi na kahulugan ay nakikita ang Warehouse ng Data Dumating
koleksyon ng data subject-oriented, integrated, non-volatile, at variable
sa paglipas ng panahon, bilang suporta sa mga desisyon ng pamamahala.
Gamit ang kahulugang ito, itinuturo ni Inmon na i data mga residente
sa a data bodega dapat taglayin ang sumusunod 4
tampok:
▪ Nakatuon sa paksa
▪ Pinagsama
▪ Hindi pabagu-bago ng isip
▪ Variable sa paglipas ng panahon
Sa pamamagitan ng subject-oriented Inmon ay nangangahulugan na i data sa petsa
bodega sa pinakamalaking lugar ng organisasyon na naging
tinukoy sa modelo data. Halimbawa lahat data tungkol sa mga customer
ay nakapaloob sa lugar ng paksa MGA CUSTOMER. Ganun din lahat
data na may kaugnayan sa mga produkto ay nakapaloob sa paksa
MGA PRODUKTO.
Sa pamamagitan ng Integrati Inmon ay nangangahulugan na i data galing sa iba't ibang
pinagsama-sama at iniimbak ang mga platform, system at lokasyon
tanging lugar. Dahil dito data katulad ay dapat na mabago
sa pare-parehong mga format na idaragdag at ihahambing
madali
Halimbawa ay kinakatawan ang kasarian ng lalaki at babae
sa pamamagitan ng mga titik M at F sa isang sistema, at may 1 at 0 sa isa pa. Para sa
isama ang mga ito sa tamang paraan, dapat ang isa o parehong mga format
mabago upang ang dalawang format ay pareho. Dito sa
kaso maaari naming baguhin ang M sa 1 at F sa 0 o vice versa. I-orient ang iyong sarili sa
paksa at Pinagsanib ay nagpapahiwatig na ang data bodega ay dinisenyo para sa
magbigay ng functional at transversal vision ng data sa isang tabi
ng kumpanya
Non-volatile ay nangangahulugan na i data sa data bodega manatili
pare-pareho at pag-update ng data hindi naman kailangan. Sa halip, bawat
pagbabago sa data ang mga orihinal ay idinagdag sa database ng petsa
bodega. Nangangahulugan ito na ang mananalaysay ng data ay nakapaloob sa
data bodega.
Para sa mga Variable sa Paglipas ng Panahon Isinasaad ng Inmon na i data sa data bodega
laging naglalaman ng mga time marker at i data normal
sumasaklaw sa isang tiyak na abot-tanaw ng oras. Halimbawa a
data bodega maaaring magkaroon ng 5 taon ng mga makasaysayang halaga ng mga customer dal
1993 hanggang 1997. Ang pagkakaroon ng makasaysayang data at isang serye ng oras
ng data nagbibigay-daan sa iyo upang pag-aralan ang mga uso.
Un data bodega kaya niyang kolektahin ang sarili niya data mula sa mga sistema
OLTP;mula sa pinanggalingan data panlabas sa organisasyon at/o ng iba pang espesyal
pagkuha ng mga proyekto ng system data.
I data ang mga extract ay maaaring dumaan sa proseso ng paglilinis, sa
kasong ito i data sila ay binago at isinama bago maging
naka-imbak sa database del data bodega. Tsaka ako data
naninirahan sa loob ng database del data bodega ay ginawang magagamit
access ng end-user at mga tool sa pagbawi. Gamit
ang mga tool na ito ay maaaring ma-access ng end user ang integrated view
ng organisasyon ng data.
I data naninirahan sa loob ng database del data bodega ay
nakaimbak sa parehong detalyado at buod na mga format.
Ang antas ng buod ay maaaring depende sa katangian ng data. Ako data
ang detalyado ay maaaring binubuo ng data kasalukuyang at data mga mananalaysay
I data real ay hindi kasama sa data bodega hanggang ako ay data
sa data bodega ay muling na-update.
Bilang karagdagan sa pag-iimbak ng data kanilang sarili, a data bodega pwede din
mag-imbak ng ibang uri ng dato tinatawag na METADATA na
ilarawan i data naninirahan sa kanyang database.
Mayroong dalawang uri ng metadata: development metadata at ayon sa metadata
mga pagsusuri.
Ang metadata ng pag-unlad ay ginagamit upang pamahalaan at i-automate ang
mga proseso ng pagkuha, paglilinis, pagmamapa at pagkarga ng data sa
data bodega.
Maaaring naglalaman ang impormasyong nasa metadata ng development
mga detalye ng mga operating system, mga detalye ng mga elementong kukunin, ang
modelo data del data bodega at ang mga patakaran ng kumpanya para sa
conversion ng data.
Ang pangalawang uri ng metadata, na kilala bilang analytics metadata
nagbibigay-daan sa end user na galugarin ang nilalaman ng data
bodega upang mahanap ang data magagamit at ang kanilang kahulugan sa mga tuntunin
malinaw at hindi teknikal.
Samakatuwid ang metadata ng pagsusuri ay gumagana bilang isang tulay sa pagitan ng data
bodega at mga aplikasyon ng end-user. Maaari itong metadata
naglalaman ng modelo ng negosyo, mga paglalarawan ng data tugma
sa modelo ng negosyo, mga paunang natukoy na query at ulat,
impormasyon para sa mga login at index ng user.
Dapat pagsamahin ang metadata ng pagsusuri at pagbuo sa isa
integrated metadata containment upang gumana nang maayos.
Sa kasamaang palad, marami sa mga umiiral na tool ay may sariling
metadata at sa kasalukuyan ay walang umiiral na mga pamantayan na
pinapayagan nila ang mga tool sa warehousing ng data na isama ang mga ito
metadata. Upang malunasan ang sitwasyong ito ng maraming mangangalakal ng
Ang mga pangunahing tool sa warehousing ng data ay nabuo ang Meta Data
Konseho na kalaunan ay naging Meta Data Coalition.
Ang layunin ng koalisyon na ito ay bumuo ng isang set ng metadata
pamantayan na nagbibigay-daan sa iba't ibang mga tool sa pag-iimbak ng data na
i-convert ang metadata
Ang kanilang mga pagsisikap ay nagresulta sa pagsilang ni Meta
Data Interchange Specification (MDIS) na magbibigay-daan sa pagpapalitan
ng impormasyon sa pagitan ng mga archive ng Microsoft at ng mga kaugnay na MDIS file.
Ang pagkakaroon ng data parehong summarized/index at detalyadong nagbibigay
ang user ang posibilidad na magsagawa ng DRILL DROWN
(pagbabarena) halika data na-index sa mga detalyado at vice versa.
Ang pagkakaroon ng data ang detalyadong kasaysayan ay nagbibigay-daan sa pagsasakatuparan ng
pagsusuri ng trend sa paglipas ng panahon. Bilang karagdagan, ang metadata ng pagsusuri ay maaari
gamitin bilang del directory database del data bodega para
tulungan ang mga end user na mahanap ang i data kailangan.
Kung ihahambing sa mga OLTP system, na may kakayahang sumuporta
pagsusuri ng data at pag-uulat, ang data bodega ito ay nakikita bilang isang sistema
mas angkop para sa mga proseso ng impormasyon tulad ng pagsasagawa at
sagutin ang mga tanong at gumawa ng mga ulat. Ang susunod na seksyon
ay i-highlight ang mga pagkakaiba ng dalawang sistema nang detalyado.
DATA WAREHOUSE LABAN SA OLTP SYSTEMS
Marami sa mga sistema ng impormasyon sa loob ng mga organisasyon
nilayon ang mga ito na suportahan ang pang-araw-araw na operasyon. Ang mga ito
system na kilala bilang OLTP SYSTEMS, kumukuha ng mga transaksyon
patuloy na ina-update araw-araw.
I data sa loob ng mga sistemang ito ay madalas na binago, idinagdag o
tinanggal. Halimbawa halos hindi nagbabago ang address ng isang customer
palipat-lipat siya ng lugar. Sa kasong ito ang bagong address
ay irerehistro sa pamamagitan ng pagpapalit ng address field ng database.
Ang pangunahing layunin ng mga sistemang ito ay bawasan ang mga gastos ng
mga transaksyon at sa parehong oras upang mabawasan ang mga oras ng pagproseso.
Kasama sa mga halimbawa ng mga OLTP system ang mga kritikal na aksyon tulad ng pagsusulat
order accounting, payroll, invoice, manufacturing, ai services mga customer.
Hindi tulad ng mga OLTP system, na nilikha ng proseso
batay sa mga transaksyon at kaganapan, i data bodega sila ay nilikha
upang magbigay ng suporta sa mga prosesong nakabatay sa analytics ng data at pataas
mga proseso ng pagpapasya.
Ito ay karaniwang nakakamit sa pamamagitan ng pagsasama ng i data mula sa iba't ibang sistema
OLTP at panlabas sa isang "lalagyan". data,gaya ng tinalakay
sa nakaraang seksyon.
Modelo ng Proseso ng Monash Data Warehousing
Ang modelo ng proseso para sa data bodega Si Monash ay binuo ni
mga mananaliksik mula sa Monash DSS Research Group, ay batay sa
mga panitikan ng data bodega, sa karanasan sa pagsuporta sa
pagbuo ng mga system field, sa mga talakayan sa mga vendor ng
mga aplikasyon para sa paggamit sa data bodega, sa isang pangkat ng mga eksperto
sa paggamit ng data bodega.
Ang mga yugto ay: Inception, Planning, Development, at Operations
Mga paliwanag. Ang diagram ay nagpapaliwanag ng umuulit na katangian o
ebolusyonaryong pag-unlad ng a data bodega proseso gamit
dalawang-daan na mga arrow na inilagay sa pagitan ng iba't ibang yugto. Dito sa
Ang konteksto ng "iterative" at "evolutionary" ay nangangahulugang, sa bawat isa
hakbang ng proseso, ang mga aktibidad sa pagpapatupad ay maaaring gawin
palaging nagpapalaganap pabalik sa nakaraang yugto. Ito ay
dahil sa katangian ng proyekto a data bodega kung saan
dumarating ang mga karagdagang kahilingan anumang oras
ng end user. Halimbawa, sa yugto ng pag-unlad ng a
proseso ng data bodega, ang isa ay hinihiling ng end user
bagong dimensyon o lugar ng paksa, na hindi kabilang sa
orihinal na plano, dapat itong idagdag sa system. Ito
nagdudulot ng pagbabago sa proyekto. Ang resulta ay ang pangkat ng
dapat baguhin ng disenyo ang mga kinakailangan ng mga dokumentong nilikha sa ngayon
sa yugto ng disenyo. Sa maraming pagkakataon, ang kasalukuyang kalagayan ng
proyekto ay dapat bumalik sa yugto ng disenyo kung saan
ang bagong kahilingan ay dapat idagdag at idokumento. Ang gumagamit
final ay dapat na makita ang tiyak na dokumentasyon na nasuri ei
mga pagbabagong ginawa sa yugto ng pag-unlad. Sa dulo ng
ang siklo ng pag-unlad na ito ang proyekto ay dapat makakuha ng mahusay na feedback mula sa
parehong team, ang development team at ang user team. ANG
ang feedback ay muling ginagamit upang mapabuti ang isang proyekto sa hinaharap.
Pagpaplano ng kapasidad
Ang Dw ay madalas na napakalaki sa laki at lumalaki
napakabilis (Best 1995, Rudin 1997a) kasunod ng
halaga ng mga data mga kasaysayang pinanatili nila mula sa kanilang tagal. doon
ang paglago ay maaari ding sanhi ng data karagdagang mga item na hiniling ng
mga gumagamit upang mapataas ang halaga ng data na mayroon na sila. Mula sa
dahil dito, ang mga kinakailangan sa imbakan para sa data posono
makabuluhang mapahusay (Eckerson 1997). Kaya ito ay
mahalaga upang matiyak, sa pamamagitan ng pagsasagawa ng pagpaplano ng
kapasidad, kung saan maaaring lumaki ang sistemang itatayo
paglago ng mga pangangailangan (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
Sa pagpaplano para sa dw scalability, dapat malaman ng isa ang
inaasahang paglaki sa laki ng imbentaryo, mga uri ng tanong
malamang na isasagawa, at ang bilang ng mga end user na sinusuportahan (Pinakamahusay
1995, Rudin 1997b, Foley 1997a). Bumuo ng mga scalable na application
nangangailangan ng kumbinasyon ng mga nasusukat na teknolohiya at pamamaraan ng server
ng pagdidisenyo ng mga nasusukat na aplikasyon (Best 1995, Rudin 1997b.
Parehong kinakailangan kapag gumagawa ng isang application
lubhang nasusukat. Ang mga nasusukat na teknolohiya ng server ay maaari
gawin itong madali at kapaki-pakinabang upang magdagdag ng imbakan, memorya at
CPU nang walang nagpapababang pagganap (Lang 1997, Telephony 1997).
Mayroong dalawang pangunahing scalable na teknolohiya ng server: compute
simetriko maramihang (SMP) at napakalaking pagproseso
parallel (MPP) ) (IDC 1997, Humphries et al. 1999). Isang server
Karaniwang mayroong maraming processor ang SMP na nagbabahagi ng isang memorya,
sistema ng bus at iba pang mapagkukunan (IDC 1997, Humphries et al. 1999).
Maaaring magdagdag ng mga karagdagang processor para sa pagpapalaki
kanyang kapangyarihan computational. Ang isa pang paraan upang madagdagan ang
kapangyarihan computational kapangyarihan ng SMP server, ay upang pagsamahin ang marami
Mga makina ng SMP. Ang pamamaraan na ito ay kilala bilang clustering (Humphries
et al. 1999). Ang isang MPP server, sa kabilang banda, ay may maraming mga processor bawat isa
na may sariling memorya, sistema ng bus at iba pang mapagkukunan (IDC 1997,
Humphries et al. 1999). Ang bawat processor ay tinatawag na node. A
pagtaas sa kapangyarihan maaaring makuha ang computational
pagdaragdag ng mga karagdagang node sa mga MPP server (Humphries et al.
1999).
Ang isang kahinaan ng mga server ng SMP ay masyadong maraming mga pagpapatakbo ng input-output
(I/O) ay maaaring masikip ang sistema ng bus (IDC 1997). Ito
hindi nangyayari ang problema sa loob ng mga server ng MPP dahil sa bawat
Ang processor ay may sariling sistema ng bus. Gayunpaman, ang mga pagkakaugnay
sa pagitan ng bawat node sa pangkalahatan sila ay mas mabagal kaysa sa sistema ng bus
ng mga SMP. Bilang karagdagan, ang mga MPP server ay maaaring magdagdag ng isang layer
karagdagang kumplikado para sa mga developer ng application (IDC
1997). Kaya, ang pagpili sa pagitan ng SMP at MPP server ay maaaring maimpluwensyahan
sa pamamagitan ng maraming mga kadahilanan, kabilang ang pagiging kumplikado ng mga tanong, ang relasyon
presyo/pagganap, ang kinakailangang kapasidad ng paggamot, ang
pinigilan ang mga dw application at ang pagtaas ng laki ng database
ng dw at sa bilang ng mga end user.
Maraming scalable na mga diskarte sa disenyo ng application
maaaring gamitin sa pagpaplano ng kapasidad. Isa
gumagamit ng iba't ibang panahon ng notification gaya ng mga araw, linggo, buwan at taon.
Ang pagkakaroon ng iba't ibang panahon ng notification, ang database maaaring hatiin sa
ang mga piraso ay madaling pinagsama-sama (Inmon et al. 1997). Isa pa
pamamaraan ay ang paggamit ng mga talahanayan ng buod na binuo
pagbubuod data da data detalyado. Kaya, i data ang mga buod ay higit pa
compact kaysa sa detalyado, na nangangailangan ng mas kaunting espasyo sa memorya.
Kaya ang data ng detalye ay maaaring maimbak sa isang drive
mas murang storage, na mas nakakatipid ng storage.
Kahit na ang paggamit ng mga talahanayan ng buod ay maaaring makatipid ng espasyo
memorya, nangangailangan sila ng maraming pagsisikap upang panatilihing napapanahon ang mga ito
alinsunod sa komersyal na pangangailangan. Gayunpaman, ang pamamaraan na ito ay
malawakang ginagamit at kadalasang ginagamit kasabay ng pamamaraan
nakaraan(Pinakamahusay 1995, Inmon 1996a, Chauduri at Dayal
1997).
Pagtukoy Warehouse ng Data Tekniko
Arkitektura Kahulugan ng mga pamamaraan
dw arkitektura
Ang mga naunang nag-adopt ng data warehousing ay pangunahing naisip
isang sentralisadong pagpapatupad ng dw kung saan ang lahat ng data, kasama
i data panlabas, ay isinama sa isang solong,
pisikal na imbakan (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Ang pangunahing bentahe ng diskarteng ito ay ang mga end user
Naa-access ko ang view sa isang entrepreneurial scale
(view sa buong enterprise) dei data organisasyon (Ovum 1998). Isa pa
bentahe ay nag-aalok ito ng standardisasyon ng data sa pamamagitan ng
ang organisasyon, na nangangahulugang mayroon lamang isang bersyon o
kahulugan para sa bawat terminolohiya na ginamit sa dw deposito
(reposity) metadata (Flanagan at Safdie 1997, Ovum 1998). Ang
disadvantage ng diskarteng ito, sa kabilang banda, ay ito ay mahal at mahirap
itatayo (Flanagan at Safdie 1997, Ovum 1998, Inmon et al.
1998). Hindi nagtagal pagkatapos ng arkitektura ng imbakan data
naging popular ang sentralisadong, umunlad ang konsepto ng pagkuha
sa pinakamaliit na subset ng data upang suportahan ang mga pangangailangan ng
mga partikular na aplikasyon (Varney 1996, IDC 1997, Berson at Smith
1997, paboreal 1998). Ang mga maliliit na sistemang ito ay nagmula sa mas marami
dakila data bodega sentralisado. Tinatawag silang date
dependent na mga bodega ng departamento o dependent data mart.
Ang dependent data mart architecture ay kilala bilang
three-tiered architecture kung saan ang unang tier ay binubuo ng data
sentralisadong bodega, ang pangalawa ay binubuo ng mga bodega data
departamento at ang pangatlo ay binubuo ng access sa data at mula sa mga kasangkapan ng
pagsusuri (Demarest 1994, Inmon et al. 1997).
Ang mga data mart ay karaniwang binuo pagkatapos ng data bodega
sentralisado ay itinayo upang matugunan ang mga pangangailangan ng
tiyak na mga yunit (White 1995, Varney 1996).
Tindahan ng data marts i data napaka-kaugnay na nauugnay sa mga detalye
pagkakaisa (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
Ang bentahe ng pamamaraang ito ay hindi magkakaroon dato hindi
isinama at na i data sila ay hindi gaanong kalabisan sa loob ng data
marts dahil sa lahat data nanggaling sa deposito ng data pinagsama-sama.
Ang isa pang kalamangan ay magkakaroon ng kaunting mga koneksyon sa pagitan ng bawat isa
data mart at mga kaugnay na mapagkukunan data dahil ang bawat data mart ay mayroon lamang
isang pinagmulan ng data. Dagdag pa sa arkitektura na ito sa lugar, ang mga gumagamit
maa-access pa rin ng finals ang pangkalahatang-ideya ng data
mga organisasyon ng korporasyon. Ang pamamaraang ito ay kilala bilang ang
top-down na paraan, kung saan binuo ang mga data mart pagkatapos ng data
bodega (peacock 1998, Goff 1998).
Ang pagtaas ng pangangailangan na magpakita ng mga resulta nang maaga, ang ilan
ang mga organisasyon ay nagsimulang magtayo ng mga independiyenteng data mart
(Flanagan at Safdie 1997, White 2000). Sa kasong ito, data marts
kunin nila ang kanila data diretso mula sa mga pangunahing kaalaman ng data OLTP at hindi mula sa
sentralisado at pinagsamang imbakan, kaya inaalis ang pangangailangan para sa
magkaroon ng sentral na imbakan sa site.
Ang bawat data mart ay nangangailangan ng hindi bababa sa isang link sa mga pinagmulan nito
di data. Isang kawalan ng pagkakaroon ng maraming link para sa bawat petsa
mart ay iyon, kumpara sa dalawang nakaraang mga arkitektura, ang
labis na kasaganaan ng data tumataas nang malaki.
Ang bawat data mart ay dapat mag-imbak ng lahat ng data lokal na hiniling para sa
walang epekto sa mga OLTP system. Nagdudulot ito ng i data
sila ay nakaimbak sa iba't ibang data marts (Inmon et al. 1997).
Ang isa pang kawalan ng arkitektura na ito ay humahantong sa
paglikha ng mga kumplikadong interconnections sa pagitan ng data marts at kanilang
pinagmumulan ng data na mahirap isagawa at kontrolin (Inmon ed
iba pa. 1997).
Ang isa pang kawalan ay ang mga end user ay hindi makakapag-power
i-access ang pangkalahatang-ideya ng impormasyon ng kumpanya bilang i data
ng iba't ibang data mart ay hindi isinama (Ovum 1998).
Ang isa pang kawalan ay maaaring mayroong higit sa isa
kahulugan para sa bawat terminolohiya na ginagamit sa data marts na nabuo nito
hindi pagkakapare-pareho ng data sa organisasyon (Ovum 1998).
Sa kabila ng mga disadvantages na tinalakay sa itaas, independiyenteng data marts
nakakaakit pa rin sila ng interes ng maraming organisasyon (IDC 1997).
Ang isang kadahilanan na nakakaakit sa kanila ay ang kanilang mas mabilis na pag-unlad
at nangangailangan ng mas kaunting oras at mapagkukunan (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Alinsunod dito, pangunahin silang naglilingkod
bilang mga pagsubok na proyekto na maaaring magamit upang makilala
mabilis ang mga benepisyo at/o mga di-kasakdalan sa proyekto (Parsaye
1995, Braly 1995, Newing 1996). Sa kasong ito, ang bahagi mula sa
ang ipatupad sa pilot project ay dapat maliit ngunit mahalaga
para sa organisasyon (Newing 1996, Mansell-Lewis 1996).
Sa pamamagitan ng pagsusuri sa prototype, magagawa ng mga end user at administrasyon
magpasya kung itutuloy o ititigil ang proyekto (Flanagan at Safdie
1997).
Kung ang desisyon ay magpapatuloy, data marts para sa ibang mga sektor
dapat silang itayo nang paisa-isa. Mayroong dalawang mga pagpipilian para sa
mga end user batay sa kanilang mga pangangailangan sa pagbuo ng data
mga independiyenteng matr: pinagsama-sama/federated at hindi pinagsama (Ovum
1998)
Sa unang paraan, dapat na itayo ang bawat bagong data mart
batay sa kasalukuyang data mart at modelo data ginagamit
ng kompanya (Varney 1996, Berson at Smith 1997, Peacock 1998).
Ang pangangailangan na gamitin ang modelo data ginagawang kailangan ng kumpanya
tiyakin na mayroon lamang isang kahulugan para sa bawat terminolohiya
ginagamit sa pamamagitan ng data marts, ito rin ay upang matiyak na ang data
Maaaring pagsamahin ang iba't ibang mart upang magbigay ng pangkalahatang-ideya ng
impormasyon ng korporasyon (Bresnahan 1996). Ang pamamaraang ito ay
tinatawag na bottom-up at pinakamainam kapag may hadlang sa
pinansiyal na paraan at oras (Flanagan at Safdie 1997, Ovum 1998,
peacock 1998, Goff 1998). Sa pangalawang paraan, data marts
ang itinayo ay maaari lamang matugunan ang mga pangangailangan ng isang partikular na yunit.
Ang isang variant ng federated data mart ay ang data bodega ipinamahagi
kung saan ang database Ang middleware ng hub server ay ginagamit upang sumali sa marami
data marts sa iisang repository ng data ipinamahagi (White 1995). Sa
kasong ito, i data ang mga kumpanya ay ipinamamahagi sa ilang mga data mart.
Ang mga kahilingan ng end user ay ipinapasa sa database
hub server middleware, na kumukuha ng lahat data hinihiling ng data
marts at ibinabalik ang mga resulta sa mga application ng end user. Ito
paraan ay nagbibigay ng impormasyon ng negosyo sa mga end user. gayunpaman,
Ang mga problema ng data mart ay hindi pa rin naaalis
malaya. May isa pang architecture na pwedeng gamitin which is
tawagan ang data bodega virtual (White 1995). Gayunpaman, ito
arkitektura, na inilalarawan sa figure 2.9, ay hindi isang arkitektura
ng imbakan data totoo dahil hindi nito ginagalaw ang load
mula sa OLTP system hanggang data bodega (Demarest 1994).
Sa katunayan, ang mga kahilingan para sa data ng mga end user ay naipasa sa
Mga OLTP system na nagbabalik ng mga resulta pagkatapos ng pagproseso
mga kahilingan ng gumagamit. Bagama't pinapayagan ng arkitektura na ito ang mga user
finals upang makabuo ng mga ulat at bumalangkas ng mga kahilingan, hindi makapagbibigay ng i
data kasaysayan at pangkalahatang-ideya ng impormasyon ng kumpanya mula noong i data
mula sa iba't ibang mga sistema ng OLTP ay hindi isinama. Kaya, ito
arkitektura ay hindi maaaring masiyahan ang pagsusuri ng data kumplikado tulad ng
mga halimbawa ng pagtataya.
Pagpili ng mga aplikasyon ng pag-access at pag-access
pagbawi ng data
Ang layunin ng pagtatayo ng a data bodega ay upang ihatid
impormasyon sa mga end user (Inmon et al 1997, Poe 1996,
McFadden 1996, Shanks et al 1997, Hammergren 1998); isa o
maramihang pag-access at mga application sa pagbawi data dapat ipagkaloob. Upang
Sa ngayon, may malawak na pagkakaiba-iba ng mga application na ito na mapagpipilian ng user
pumili (Hammergren 1998, Humphries et al. 1999). Ang
ang mga piling aplikasyon ay tumutukoy sa tagumpay ng pagsisikap
ng imbakan data sa isang organisasyon dahil ang
ang mga application ay ang pinaka nakikitang bahagi ng data bodega sa gumagamit
pangwakas (Inmon et al. 1997, Poe 1996). Upang magtagumpay sa isang petsa
warehouse, dapat na kayang suportahan ang mga aktibidad sa pagsusuri ng data
ng end user (Poe 1996, Seddon at Benjamin 1998, Eckerson
1999). Kaya dapat ang "antas" ng kung ano ang gusto ng end user
nakilala (Poe 1996, Mattison 1996, Inmon et al 1997,
Humphries et al. 1999).
Sa pangkalahatan, ang mga end user ay maaaring ipangkat sa tatlo
mga kategorya: executive user, business analyst at power user (Poe
1996, Humphries et al. 1999). Kailangan ng mga executive user
madaling pag-access sa mga paunang natukoy na hanay ng mga ulat (Humphries ed
iba 1999). Ang mga ulat na ito ay madaling makamit gamit ang
menu nabigasyon (Poe 1996). Dagdag pa, ang mga ulat ay dapat
ipakita ang impormasyon gamit ang graphical na representasyon
tulad ng mga talahanayan at template upang mabilis na maihatid
impormasyon (Humphries et al. 1999). Mga analyst ng negosyo, na hindi
maaari silang magkaroon ng mga teknikal na posibilidad upang bumuo ng mga relasyon mula sa
zero sa kanilang sarili, kailangan nilang mabago ang kasalukuyang mga relasyon sa
matugunan ang kanilang mga tiyak na pangangailangan (Poe 1996, Humphries et al
1999). Ang mga power user, sa kabilang banda, ay ang uri ng mga end user na
may kakayahang bumuo at magsulat ng mga kahilingan at ulat mula sa
zero (Poe 1996, Humphries et al. 1999). Sila ang mga
bumuo ng mga ulat para sa iba pang uri ng mga gumagamit (Poe 1996, Humphries
at iba pa 1999).
Kapag natukoy na ang mga kinakailangan ng end user ay dapat gawin
isang seleksyon ng mga access at recovery application data sa lahat
ang mga magagamit (Poe 1996, Inmon et al. 1997).
Access sa data at retrieval tools ay maaaring
inuri sa 4 na uri: OLAP tool, EIS/DSS tool, query tool at
mga tool sa pag-uulat at data mining.
Ang mga tool ng OLAP ay nagbibigay-daan sa mga user na gumawa ng mga ad hoc query pati na rin
mga ginawa sa database del data bodega. Dagdag pa ang mga produktong ito
payagan ang mga user na mag-drill down mula sa data pangkalahatan sa mga
detalyado.
Ang mga tool ng EIS/DSS ay nagbibigay ng executive na pag-uulat bilang pagsusuri ng "paano kung".
at access sa mga ulat na nakaayos sa menu. Ang mga ulat ay dapat na
paunang natukoy at pinagsama sa mga menu para sa mas madaling pag-navigate.
Ang mga tool sa query at pag-uulat ay nagbibigay-daan sa mga user na gumawa ng mga ulat
paunang natukoy at tiyak.
Ginagamit ang mga tool sa pagmimina ng data upang matukoy ang mga ugnayang iyon
maaaring magbigay ng bagong liwanag sa mga nakalimutang operasyon sa data del
datawarehouse.
Kasabay ng pag-optimize ng mga kinakailangan ng bawat uri ng user, i
Ang mga napiling tool ay dapat na intuitive, mahusay at madaling gamitin.
Dapat din silang magkatugma sa ibang bahagi ng arkitektura e
may kakayahang magtrabaho sa mga umiiral na sistema. Iminumungkahi din na
pumili ng data access at retrieval tool na may mga presyo at performance
makatwiran. Kasama sa iba pang pamantayan na dapat isaalang-alang ang pangako ng
vendor ng tool sa pagsuporta sa kanilang produkto at sa mga pagpapaunlad nito
magkakaroon din sa mga susunod na release. Upang matiyak ang pakikipag-ugnayan ng gumagamit
sa paggamit ng data warehouse, ang development team ay kinabibilangan ng
mga gumagamit sa proseso ng pagpili ng tool. Sa kasong ito
isang praktikal na pagtatasa ng gumagamit ay dapat isagawa.
Upang mapabuti ang halaga ng data warehouse, magagawa ng development team
nagbibigay din ng web access sa kanilang mga data warehouse. A
Ang web-enabled na data warehouse ay nagbibigay-daan sa mga user na ma-access ang data
mula sa malalayong lugar o habang naglalakbay. Gayundin ang impormasyon ay maaari
ipagkakaloob sa mas mababang gastos sa pamamagitan ng pagbawas sa gastos
di pagsasanay.
2.4.3 Warehouse ng Data Yugto ng Operasyon
Ang yugtong ito ay binubuo ng tatlong aktibidad: Pagtukoy sa mga diskarte sa petsa
pag-refresh, kontrol sa mga aktibidad ng data warehouse at pamamahala ng
seguridad ng data warehouse.
Kahulugan ng mga diskarte sa pag-refresh ng data
Pagkatapos ng paunang paglo-load, i data sa database ng data warehouse
dapat na i-refresh pana-panahon upang i-play ang
mga pagbabagong ginawa sa data mga orihinal. Kaya dapat tayong magpasya
kailan magre-refresh, gaano kadalas ang
i-refresh at kung paano i-refresh ang data. Iminumungkahi na gawin ang
refresh dei data kapag ang system ay maaaring kunin offline. doon
Ang rate ng pag-refresh ay tinutukoy ng development team batay
sa mga kinakailangan ng gumagamit. Mayroong dalawang mga diskarte sa pagre-refresh ng
data warehouse: kumpletong pag-refresh at patuloy na paglo-load ng
mga pagbabago.
Ang unang diskarte, ang buong pag-refresh, ay nangangailangan ng pag-reload
lahat data mula sa wala. Nangangahulugan ito na ang lahat ng data kinakailangan dapat
i-extract, linisin, baguhin at isama sa bawat pag-refresh. Ito
diskarte ay dapat, hangga't maaari, iwasan dahil
Nangangailangan ito ng maraming oras at mapagkukunan.
Ang isang alternatibong diskarte ay ang patuloy na pag-load ng i
mga pagbabago. Ito ay nagdaragdag ng i data na nabago
mula noong huling ikot ng pag-refresh ng data warehouse. Ang pagkakakilanlan ng
ang mga bago o binagong talaan ay makabuluhang binabawasan ang halaga ng
data na dapat ipalaganap sa data warehouse sa bawat isa
update dahil ito lang data ay idadagdag sa database
ng data warehouse.
Mayroong hindi bababa sa 5 mga diskarte na maaaring magamit upang mag-withdraw
i data bago o binago. Upang makakuha ng isang mahusay na diskarte
refresh dei data maaaring maging kapaki-pakinabang ang isang halo ng mga pamamaraang ito
kukunin ang lahat ng mga pagbabago sa system.
Ang unang diskarte, na gumagamit ng mga timestamp, ay ipinapalagay na darating iyon
itinalaga sa lahat data na-edit at nag-update ng timestamp kaya
para madaling matukoy ang lahat data binago at bago.
Ang pamamaraang ito, gayunpaman, ay hindi malawakang ginagamit sa karamihan
bahagi ng mga operating system ngayon.
Ang pangalawang diskarte ay ang paggamit ng delta file na binuo ni
isang application na naglalaman lamang ng mga pagbabagong ginawa sa data.
Ang paggamit ng file na ito ay nagpapalakas din sa ikot ng pag-update.
Gayunpaman, kahit na ang pamamaraang ito ay hindi ginagamit sa marami
mga aplikasyon.
Ang ikatlong diskarte ay upang i-scan ang isang log file, na
karaniwang naglalaman ng katulad na impormasyon sa delta file. Ang nag-iisa
Ang pagkakaiba ay ang isang log file ay nilikha para sa proseso ng pagbawi at
maaaring mahirap intindihin.
Ang pang-apat na diskarte ay ang pagbabago ng code ng aplikasyon.
Gayunpaman karamihan sa code ng aplikasyon ay luma at
marupok; samakatuwid ang pamamaraan na ito ay dapat na iwasan.
Ang huling diskarte ay ang paghahambing ng i data mga mapagkukunan na may file
pangunahing mga diyos data.
Pagsubaybay sa mga aktibidad ng data warehouse
Kapag ang data warehouse ay nailabas na sa mga user, ito ay
kinakailangan upang masubaybayan ito sa paglipas ng panahon. Sa kasong ito, ang administrator
ng data warehouse ay maaaring gumamit ng isa o higit pang mga tool sa pamamahala at
kontrol upang subaybayan ang paggamit ng data warehouse. Sa partikular
maaaring mangolekta ng impormasyon tungkol sa mga tao at panahon
na ina-access nila ang data warehouse. Halika na data maaaring malikha ang mga pananim
isang profile ng gawaing isinagawa na maaaring magamit bilang input
sa pagpapatupad ng chargeback ng user. Ang Chargeback
nagbibigay-daan sa mga user na malaman ang tungkol sa halaga ng pagproseso ng
datawarehouse.
Higit pa rito, ang kontrol ng data warehouse ay maaari ding gamitin para sa
tukuyin ang mga uri ng mga query, ang kanilang laki, ang bilang ng mga query sa bawat
araw, mga oras ng pagtugon sa query, mga sektor na naabot at dami
di data naproseso. Isa pang layunin ng paggawa ng tseke ng
data warehouse ay upang makilala ang data na hindi ginagamit. Ang mga ito data
maaari silang alisin mula sa warehouse ng data upang mapabuti ang oras
ng tugon sa pagpapatupad ng query at kontrolin ang paglaki ng
data na naninirahan sa loob ng base ng datos ng data warehouse.
Pamamahala ng seguridad ng data warehouse
Ang isang data warehouse ay naglalaman ng data pinagsama-sama, kritikal, sensitibo na
madaling maabot. Para sa kadahilanang ito dapat
maprotektahan mula sa mga hindi awtorisadong gumagamit. Isang paraan upang
ipatupad ang seguridad ay ang paggamit ng del function DBMS
upang magtalaga ng iba't ibang mga pribilehiyo sa iba't ibang uri ng mga user. Dito sa
paraan, dapat mapanatili ang isang profile para sa bawat uri ng user
access. Ang isa pang paraan upang ma-secure ang iyong data warehouse ay ang pag-encrypt nito
gaya ng nakasulat sa base ng datos ng data warehouse. Access sa
data at kailangang i-decrypt ng mga retrieval tool ang data bago isumite ang i
mga resulta sa mga gumagamit.
2.4.4 Warehouse ng Data Yugto ng Deployment
Ito ang huling yugto sa ikot ng pagpapatupad ng data warehouse. Ang
ang mga aktibidad na isasagawa sa yugtong ito ay kinabibilangan ng pagsasanay ng
mga user na gamitin ang data warehouse at gumawa ng mga review
ng data warehouse.
Pagsasanay ng gumagamit
Dapat gawin muna ang pagsasanay ng gumagamit
ng access sa data ng data warehouse at ang paggamit ng mga tool
pagkuha. Sa pangkalahatan, ang mga sesyon ay dapat magsimula sa
ang pagpapakilala sa konsepto ng pag-iimbak ng data, sa
nilalaman ng data warehouse, ai meta data at ang mga pangunahing tampok
ng mga kasangkapan. Pagkatapos, maaari ding pag-aralan ng mga mas advanced na user ang
mga pisikal na talahanayan at mga tampok ng gumagamit ng pag-access ng data at mga tool
pagkuha.
Mayroong maraming mga diskarte sa paggawa ng pagsasanay sa gumagamit. Isa sa
ang mga ito ay nagsasangkot ng pagpili ng maraming user o analyst na pinili ng a
pangkat ng mga gumagamit, batay sa kanilang pamumuno at kakayahan
komunikasyon. Ang mga ito ay sinanay sa isang personal na kapasidad sa
lahat ng kailangan nilang malaman para maging pamilyar sa
sistema. Kapag natapos na ang pagsasanay, bumalik sila sa kanilang trabaho at
sinimulan nilang turuan ang ibang mga gumagamit kung paano gamitin ang system. Sa
batay sa kanilang natutunan, maaaring magsimula ang ibang mga gumagamit
galugarin ang data warehouse.
Ang isa pang diskarte ay upang sanayin ang maraming mga gumagamit sa parehong
oras, para kang kumukuha ng kurso sa silid-aralan. Ang pamamaraang ito
Ito ay angkop kapag mayroong maraming mga gumagamit na kailangang sanayin
sabay sabay. Ang isa pang paraan ay ang pagsasanay
bawat user nang paisa-isa, isa-isa. Ang pamamaraang ito ay
angkop kapag kakaunti ang gumagamit.
Ang layunin ng pagsasanay sa gumagamit ay upang maging pamilyar ka
na may access sa data at ang mga retrieval tools gayundin ang mga nilalaman ng
datawarehouse. Gayunpaman, ang ilang mga gumagamit ay maaaring mabigla
sa dami ng impormasyong ibinigay sa panahon ng sesyon
pagsasanay. Kaya isang tiyak na bilang ng mga bagay ang kailangang gawin
patuloy na suporta at refresher session para tumugon
sa mga tiyak na tanong. Sa ilang mga kaso, isang grupo ang nabuo
mga user na magbigay ng ganitong uri ng suporta.
Pagtitipon ng feedback
Kapag nailunsad na ang data warehouse, magagawa ng mga user
gumamit ng i data na naninirahan sa data warehouse para sa iba't ibang layunin.
Kadalasan, ginagamit ng mga analyst o user ang i data sa
data warehouse para sa:
1 Tukuyin ang mga uso ng kumpanya
2 Suriin ang mga profile sa pagbili ng mga customer
3 Hatiin ang i mga customer at
4 Magbigay ng pinakamahusay na serbisyo sa mga customer – i-customize ang mga serbisyo
5 Bumuo ng mga estratehiya marketing
6 Magbigay ng mapagkumpitensyang mga panipi para sa mga pagsusuri sa gastos at tulong
kontrol
7 Suportahan ang madiskarteng paggawa ng desisyon
8 Tukuyin ang mga pagkakataong mamukod-tangi
9 Pagbutihin ang kalidad ng mga kasalukuyang proseso ng negosyo
10 Suriin ang kita
Kasunod ng direksyon ng pagbuo ng data warehouse, magagawa nila
Magsagawa ng serye ng mga pagsusuri sa system para makakuha ng feedback
parehong mula sa development team at mula sa komunidad ng
mga end user.
Ang mga resultang nakuha ay maaaring isaalang-alang para sa
susunod na ikot ng pag-unlad.
Dahil ang data warehouse ay may incremental na diskarte,
mahalagang matuto mula sa mga tagumpay at pagkakamali ng mga nauna
mga pag-unlad.
2.5 Buod
Sa kabanatang ito, tinalakay ang mga pamamaraang naroroon
panitikan. Sa seksyon 1 tinalakay ang konsepto ng
data warehouse at ang papel nito sa agham ng desisyon. Nasa
seksyon 2 ang pangunahing pagkakaiba sa pagitan
data warehouse at OLTP system. Sa seksyon 3 tinalakay namin ang
Monash data warehouse model na ginamit
sa seksyon 4 upang ilarawan ang mga aktibidad na kasangkot sa proseso
pagbuo ng isang data warehouse, ang mga tesis na ito ay hindi batay sa
mahigpit na pananaliksik. Kung ano ang nangyayari sa realidad ay maaaring
ibang-iba sa iniulat ng panitikan, gayunpaman ang mga ito
ang mga resulta ay maaaring gamitin upang lumikha ng isang pangunahing bagahe na
bigyang-diin ang konsepto ng data warehouse para sa pananaliksik na ito.
Kabanata 3
Mga pamamaraan ng pananaliksik at disenyo
Ang kabanatang ito ay tumatalakay sa mga pamamaraan ng pananaliksik at disenyo para sa
itong pag aaral. Ang unang bahagi ay nagpapakita ng isang pangkalahatang view ng mga pamamaraan
ng pananaliksik na magagamit para sa pagkuha ng impormasyon, bukod pa rito
ang mga pamantayan sa pagpili ng pinakamahusay na paraan para sa isa ay tinatalakay
partikular na pag-aaral. Dalawang pamamaraan ang tinatalakay sa seksyon 2
pinili na may mga pamantayang itinakda lamang; sa mga ito ay pipiliin at
pinagtibay ang isa na may mga dahilan na itinakda sa seksyon 3 kung nasaan sila
ipinaliwanag din ang mga dahilan para sa pagbubukod ng iba pang pamantayan. doon
ang seksyon 4 ay naglalahad ng disenyo ng pananaliksik at ang seksyon 5 ay naglalahad nito
mga konklusyon.
3.1 Pananaliksik sa mga sistema ng impormasyon
Ang pananaliksik sa mga sistema ng impormasyon ay hindi lamang limitado
sa larangang teknolohikal ngunit dapat ding palawigin upang maisama
mga layunin tungkol sa pag-uugali at organisasyon.
Utang namin ito sa mga theses ng iba't ibang disiplina mula sa
mga agham panlipunan hanggang sa mga natural; ito ay humahantong sa pangangailangan para sa a
ilang spectrum ng mga pamamaraan ng pananaliksik na kinasasangkutan ng quantitative na pamamaraan
at mga husay na gagamitin para sa mga sistema ng impormasyon.
Ang lahat ng magagamit na pamamaraan ng pananaliksik ay mahalaga, sa katunayan marami
mga mananaliksik tulad nina Jenkins (1985), Nunamaker et al. (1991), at Galliers
(1992) argue na walang tiyak na unibersal na paraan
magsagawa ng pananaliksik sa iba't ibang larangan ng mga sistema ng impormasyon; Sa totoo lang
ang isang pamamaraan ay maaaring angkop para sa isang partikular na pananaliksik ngunit hindi
para sa iba. Nagdudulot ito sa atin ng pangangailangang pumili ng paraan na iyon
ay angkop para sa aming partikular na proyekto ng pananaliksik: para dito
pagpipilian Benbasat et al. (1987) ay nagsasaad na dapat silang isaalang-alang
katangian at layunin ng pananaliksik.
3.1.1 Kalikasan ng pananaliksik
Iba't ibang pamamaraan batay sa katangian ng pananaliksik ay maaaring
inuri sa tatlong tradisyon na kilala sa agham
ng impormasyon: positivist, interpretative at kritikal na pananaliksik.
3.1.1.1 Positivist na pananaliksik
Ang positivist na pananaliksik ay kilala rin bilang siyentipikong pag-aaral o
empirikal. Sinisikap nitong: “ipaliwanag at hulaan ang mangyayari sa
panlipunang mundo sa pamamagitan ng pagtingin sa mga regularidad at sanhi-at-bunga na mga relasyon
kabilang sa mga elementong bumubuo nito” (Shanks et al 1993).
Ang positivist na pananaliksik ay nailalarawan din sa pag-uulit,
pagpapasimple at pagtanggi. Higit pa rito, inamin ng positivist na pananaliksik
ang pagkakaroon ng isang priori na relasyon sa pagitan ng mga phenomena na pinag-aralan.
Ayon kay Galliers (1992) ang taxonomy ay isang paraan ng pananaliksik
kasama sa positivist paradigm, na gayunpaman ay hindi limitado dito,
sa katunayan mayroong mga eksperimento sa laboratoryo, mga eksperimento sa larangan,
case study, theorem proofs, predictions at simulation.
Gamit ang mga pamamaraang ito, inamin ng mga mananaliksik na ang mga phenomena
ang pinag-aralan ay maaaring maobserbahan nang obhetibo at mahigpit.
3.1.1.2 Pananaliksik sa interpretasyon
Interpretive research, na kadalasang tinatawag na phenomenology o
ang anti-positivism ay inilarawan ni Neuman (1994) bilang “pagsusuri
sistematiko ng panlipunang kahulugan ng pagkilos sa pamamagitan ng tuwiran at
detalyadong pagmamasid ng mga tao sa mga natural na sitwasyon, sa pagkakasunud-sunod
upang makarating sa pag-unawa at interpretasyon kung paano ang
ang mga tao ay lumikha at nagpapanatili ng kanilang panlipunang mundo." Pag-aaral
interpretative pamamaraan tinatanggihan ang palagay na ang mga naobserbahang penomena
maaaring maobserbahan nang may layunin. Sa katunayan sila ay nakabatay
sa mga pansariling interpretasyon. Higit pa rito, ang mga interpretive na mananaliksik ay hindi
nagpapataw sila ng mga priori na kahulugan sa mga penomena na kanilang pinag-aaralan.
Kasama sa pamamaraang ito ang mga subjective/argumentative na pag-aaral, mga aksyon ng
pananaliksik, mga pag-aaral na deskriptibo/pagpapakahulugan, pananaliksik sa hinaharap at mga laro
papel. Bilang karagdagan sa mga pagsisiyasat at case study na ito ay maaaring
kasama sa pamamaraang ito bilang pag-aalala nila sa mga pag-aaral ng
mga indibidwal o organisasyon sa loob ng mga kumplikadong sitwasyon
ng totoong mundo.
3.1.1.3 Kritikal na pananaliksik
Ang kritikal na pagtatanong ay ang hindi gaanong kilalang diskarte sa mga agham
panlipunan ngunit kamakailan ay nakatanggap ng atensyon mula sa mga mananaliksik
sa larangan ng mga sistema ng impormasyon. Ang pilosopikal na palagay na ang
ang panlipunang realidad ay makasaysayang ginawa at ginawa ng mga tao,
gayundin ang mga sistemang panlipunan kasama ang kanilang mga aksyon at pakikipag-ugnayan. Ang kanilang
kakayahan, gayunpaman, ay pinapamagitan ng isang tiyak na halaga ng pagsasaalang-alang
panlipunan, kultural at pampulitika.
Tulad ng interpretive na pananaliksik, ang kritikal na pananaliksik ay nagpapanatili na ang
Ang positivist na pananaliksik ay walang kinalaman sa kontekstong panlipunan at binabalewala ito
impluwensya nito sa mga kilos ng tao.
Ang kritikal na pananaliksik, sa kabilang banda, ay pinupuna ang interpretive na pananaliksik para sa
maging masyadong subjective at dahil hindi ito naglalayong tumulong
tao upang mapabuti ang kanilang buhay. Ang pinakamalaking pagkakaiba sa pagitan ng
kritikal na pananaliksik at ang iba pang dalawang diskarte ay ang evaluative na dimensyon nito.
Habang ang objectivity ng positivist at interpretative na mga tradisyon ay para sa
hulaan o ipaliwanag ang status quo o social reality, kritikal na pananaliksik
naglalayong kritikal na suriin at baguhin ang pinagbabatayan ng panlipunang realidad
studio.
Ang mga kritikal na mananaliksik ay karaniwang sumasalungat sa status quo upang
alisin ang mga pagkakaiba sa lipunan at pagbutihin ang mga kalagayang panlipunan. doon
Ang kritikal na pananaliksik ay may pangako sa isang prosesong pananaw ng
phenomena ng interes at, samakatuwid, ay karaniwang longitudinal.
Ang mga halimbawa ng pamamaraan ng pananaliksik ay ang mga pangmatagalang pag-aaral sa kasaysayan at
etnograpikong pag-aaral. Ang kritikal na pananaliksik, gayunpaman, ay hindi pa
malawakang ginagamit sa pagsasaliksik ng mga sistema ng impormasyon
3.1.2 Layunin ng pananaliksik
Kasama ang likas na katangian ng paghahanap, maaaring gamitin ang layunin nito
upang gabayan ang mananaliksik sa pagpili ng isang partikular na pamamaraan
pananaliksik. Ang layunin ng isang proyekto sa pananaliksik ay malapit na nauugnay
sa posisyon ng paghahanap na may kaugnayan sa ikot ng paghahanap na binubuo ng
tatlong yugto: pagbuo ng teorya, pagsubok sa teorya, at pagpipino ng teorya
teorya. Kaya, batay sa momentum na may paggalang sa ikot ng paghahanap, a
proyekto ng pananaliksik ay maaaring magkaroon ng isang paliwanag, naglalarawan, layunin
eksplorasyon o predictive.
3.1.2.1 Pananaliksik sa pagtuklas
Ang eksplorasyong pananaliksik ay naglalayong mag-imbestiga ng isang paksa
ganap na bago at bumalangkas ng mga tanong at hypotheses sa pananaliksik
kinabukasan. Ang ganitong uri ng pananaliksik ay ginagamit sa pagbuo ng
teorya upang makakuha ng mga paunang sanggunian sa isang bagong lugar.
Karaniwan, ginagamit ang mga pamamaraan ng pananaliksik ng husay, tulad ng mga kaso
ng pag-aaral o phenomenological studies.
Gayunpaman, posible ring gumamit ng mga quantitative technique tulad ng
eksplorasyong pagsisiyasat o eksperimento.
3.1.3.3 Deskriptibong paghahanap
Ang deskriptibong pananaliksik ay naglalayon sa pagsusuri at paglalarawan sa malaking bahagi
detalye ng isang partikular na sitwasyon o organisasyonal na kasanayan. Ito
ay angkop para sa pagbuo ng teorya at maaari ding gamitin para sa
kumpirmahin o i-dispute ang mga hypotheses. Karaniwang deskriptibong pananaliksik
kasama ang paggamit ng mga sukat at sample. Ang pinaka-angkop na pamamaraan ng pananaliksik
isama ang mga pagsisiyasat at pagsusuri ng mga nauna.
3.1.2.3 Pananaliksik na nagpapaliwanag
Ang paliwanag na pananaliksik ay sumusubok na ipaliwanag kung bakit nangyayari ang mga bagay.
Ito ay binuo sa mga katotohanang napag-aralan na at sinusubukang hanapin
ang mga dahilan para sa mga katotohanang ito.
Kaya ang paliwanag na pananaliksik ay karaniwang binuo sa pananaliksik
exploratory o descriptive at pantulong sa pagsubok at pagpipino
ang mga teorya. Ang paliwanag na pananaliksik ay karaniwang gumagamit ng mga case study
o mga pamamaraan ng pananaliksik na nakabatay sa survey.
3.1.2.4 Preemptive na pananaliksik
Ang preventive research ay naglalayong hulaan ang mga kaganapan at pag-uugali
sa ilalim ng obserbasyon na pinag-aaralan (Marshall at Rossman
1995). Ang hula ay ang pamantayang siyentipikong pagsubok ng katotohanan.
Ang ganitong uri ng pananaliksik ay karaniwang gumagamit ng mga survey o pagsusuri ng
data mga mananalaysay. (Yin 1989)
Ang talakayan sa itaas ay nagpapakita na mayroong ilang
posibleng paraan ng pananaliksik na magagamit sa isang pag-aaral
partikular. Gayunpaman, dapat mayroong isang tiyak na pamamaraan na mas angkop
ng iba para sa isang partikular na uri ng proyekto ng pananaliksik. (Galliers
1987, Yin 1989, De Vaus 1991). Ang bawat mananaliksik, samakatuwid, ay may
kailangang maingat na suriin ang mga kalakasan at kahinaan ng
iba't ibang pamamaraan, upang makarating sa paggamit ng pinakaangkop na paraan ng pananaliksik e
tugma sa proyekto ng pananaliksik. (Jenkins 1985, Pervan at Klass
1992, Bonomia 1985, Yin 1989, Himilton at Ives 1992).
3.2. Mga posibleng paraan ng paghahanap
Ang layunin ng proyektong ito ay pag-aralan ang karanasan sa
Mga organisasyong Australian na may i data nakaimbak na may isa
pag-unlad ng data bodega. Dato na, sa kasalukuyan, mayroong isa
kakulangan ng pananaliksik sa lugar ng data warehousing sa Australia,
ang proyektong pananaliksik na ito ay nasa theoretical phase pa rin ng cycle
pananaliksik at may layuning eksplorasyon. Paggalugad sa karanasan sa
Mga organisasyong Australian na gumagamit ng data warehousing
nangangailangan ng interpretasyon ng tunay na lipunan. Dahil dito, ang
sumusunod ang pilosopikal na palagay na pinagbabatayan ng proyekto ng pananaliksik
ang tradisyonal na interpretasyon.
Matapos ang isang mahigpit na pagsusuri sa mga magagamit na pamamaraan, nakilala ang mga ito
dalawang posibleng paraan ng pananaliksik: mga survey at case study
(case study), na maaaring gamitin para sa pananaliksik
eksplorasyon (Shanks et al. 1993). Ikinatuwiran ni Galliers (1992).
ang pagiging angkop ng dalawang pamamaraang ito para sa partikular na pag-aaral na ito sa
ang binagong taxonomy nito na nagsasabi na ang mga ito ay angkop para sa pagtatayo
teoretikal. Tinatalakay ng sumusunod na dalawang subseksiyon ang bawat pamamaraan sa
detalye.
3.2.1 Paraan ng pagsasaliksik ng sarbey
Ang pamamaraan ng pagsasaliksik ng sarbey ay nagmula sa sinaunang pamamaraan ng
census. Ang census ay binubuo ng pagkolekta ng impormasyon mula sa
isang buong populasyon. Ang pamamaraang ito ay mahal at hindi praktikal
lalo na kung malaki ang populasyon. Kaya, kumpara sa
census, ang isang survey ay karaniwang nakatutok sa
mangolekta ng impormasyon para sa isang maliit na bilang, o sample, ng
mga kinatawan ng populasyon (Fowler 1988, Neuman 1994). A
ang sample ay sumasalamin sa populasyon kung saan ito iginuhit, na may iba't ibang
mga antas ng katumpakan, ayon sa sample na istraktura, ang
laki at ang paraan ng pagpili na ginamit (Fowler 1988, Babbie
1982, Neuman 1994).
Ang paraan ng pagsisiyasat ay tinukoy bilang "mga snapshot ng mga kasanayan,
sitwasyon o pananaw sa isang partikular na punto ng panahon, na isinagawa gamit
mga talatanungan o panayam, kung saan maaaring magmula ang mga hinuha
ginawa” (Galliers 1992:153) [instant photograph of practices,
sitwasyon o pananaw sa partikular na punto ng panahon, na isinagawa gamit
mga talatanungan o panayam, kung saan maaaring gumawa ng mga hinuha]. Ang
ang mga pagsisiyasat ay tumatalakay sa pangongolekta ng impormasyon sa ilang aspeto
ng pag-aaral, sa pamamagitan ng isang tiyak na bilang ng mga kalahok, paggawa
mga tanong (Fowler 1988). Maging ang mga talatanungan at panayam na ito, na
isama ang harapang telepono at mga structured na panayam,
ay ang mga pamamaraan ng koleksyon ng data pinakakaraniwang ginagamit sa
pagsisiyasat (Blalock 1970, Nachmias at Nachmias 1976, Fowler
1988), maaaring gamitin ang mga obserbasyon at pagsusuri (Gable
1994). Sa lahat ng mga pamamaraang ito ng pagkolekta ng data, ang gamit ng
questionnaire ang pinakasikat na pamamaraan, dahil tinitiyak nito na i data
nakolekta ay nakabalangkas at na-format, at samakatuwid ay nagpapadali
klasipikasyon ng impormasyon (Hwang 1987, de Vaus 1991).
Sa pagsusuri ng i data, madalas na ginagamit ng isang diskarte sa pagsisiyasat ang
quantitative techniques, tulad ng statistical analysis, ngunit maaari silang maging
ginagamit din ang mga qualitative techniques (Galliers 1992, Pervan
at Klass 1992, Gable 1994). Karaniwan, i data nakolekta ay
ginagamit upang pag-aralan ang mga distribusyon at pattern ng mga asosasyon
(Fowler 1988).
Bagama't ang mga survey ay karaniwang angkop para sa pananaliksik
na pakikitungo sa tanong na 'ano?' (ano) o mula rito
nagmula, tulad ng 'magkano' at 'magkano', sila
maaaring itanong sa pamamagitan ng tanong na 'bakit' (Sonquist at
Dunkelberg 1977, Yin 1989). Ayon kina Sonquist at Dunkelberg
(1977), ang pagsisiyasat sa pananaliksik ay naglalayon sa mahihirap na hypotheses, programa ng
pagsusuri, naglalarawan sa populasyon at pagbuo ng mga modelo ng
pag-uugali ng tao. Bukod pa rito, maaaring gamitin ang mga survey
pag-aralan ang isang tiyak na opinyon ng populasyon, kundisyon,
opinyon, katangian, inaasahan at maging ang mga nakaraang pag-uugali
o kasalukuyan (Neuman 1994).
Ang mga pagsisiyasat ay nagpapahintulot sa mananaliksik na matuklasan ang mga ugnayan sa pagitan ng
populasyon at ang mga resulta ay karaniwang mas generic kaysa
iba pang mga pamamaraan (Sonquist at Dunkelberg 1977, Gable 1994). Ang
ang mga survey ay nagpapahintulot sa mga mananaliksik na masakop ang isang heograpikal na lugar
mas malawak at para maabot ang maraming nagpahayag (Blalock 1970,
Sonquist at Dunkelberg 1977, Hwang at Lin 1987, Gable 1994,
Neuman 1994). Sa wakas, makakapagbigay ng impormasyon ang mga survey
na hindi available sa ibang lugar o sa form na kinakailangan para sa mga pagsusuri
(Fowler 1988).
Gayunpaman, mayroong ilang mga limitasyon sa pagsasagawa ng isang survey. Isa
disadvantage ay hindi makakuha ng maraming impormasyon ang mananaliksik
hinggil sa bagay na pinag-aralan. Ito ay dahil sa katotohanan na ang
ang mga pagsisiyasat ay isinasagawa lamang sa isang partikular na oras at, samakatuwid,
may limitadong bilang ng mga variable at tao na magagawa ng mananaliksik
pag-aaral (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Ang isa pang kawalan ay kung ano ang maaaring maging isang survey
napakamahal sa mga tuntunin ng oras at mapagkukunan, lalo na kung
nagsasangkot ng harapang pakikipanayam (Fowler 1988).
3.2.2. Paraan ng Pananaliksik sa Pagtatanong
Ang pamamaraan ng pananaliksik sa pagtatanong ay nagsasangkot ng malalim na pag-aaral ng
isang partikular na sitwasyon sa loob ng tunay na konteksto nito sa a
tinukoy na tagal ng panahon, nang walang anumang interbensyon sa bahagi ng
mananaliksik (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Pangunahin ang pamamaraang ito ay ginagamit upang ilarawan ang mga relasyon sa pagitan
ang mga baryabol na pinag-aaralan sa isang partikular na sitwasyon
(Galliers 1992). Ang mga pagsisiyasat ay maaaring may kinalaman sa mga indibidwal na kaso o
maramihan, depende sa kababalaghang nasuri (Franz at Robey 1987,
Eisenhardt 1989, Yin 1989).
Ang pamamaraan ng pananaliksik sa pagtatanong ay tinukoy bilang "isang pagtatanong
empirikal na pag-aaral na nag-aaral ng kontemporaryong phenomenon sa loob ng
relatibong tunay na konteksto, gamit ang maraming pinagmumulan na nakalap mula sa isa o
maraming entity tulad ng mga tao, grupo, o organisasyon” (Yin 1989).
Walang malinaw na paghihiwalay sa pagitan ng phenomenon at konteksto nito e
walang kontrol o eksperimentong pagmamanipula ng mga variable (Yin
1989, Benbasat et al. 1987).
Mayroong iba't ibang mga pamamaraan para sa pagkolekta ng mga diyos data che posono
gamitin sa paraan ng pagtatanong, na kinabibilangan ng
direktang mga obserbasyon, pagsusuri ng mga talaan ng archival, mga talatanungan,
pagsusuri ng dokumentasyon at mga nakabalangkas na panayam. pagkakaroon
isang magkakaibang hanay ng mga pamamaraan ng pag-aani data, mga pagsisiyasat
payagan ang mga mananaliksik na harapin ang pareho data qualitative yan
sabay-sabay na dami (Bonoma 1985, Eisenhardt 1989, Yin
1989, Gable 1994). Tulad ng kaso sa pamamaraan ng survey, a
ang inquiry researcher ay nagsisilbing observer o researcher at hindi
bilang aktibong kalahok sa organisasyong pinag-aaralan.
Iginiit ni Benbasat et al.(1987) na ang paraan ng pagtatanong ay
partikular na angkop para sa pananaliksik sa pagbuo ng teorya, na
magsimula sa isang tanong sa pananaliksik at magpatuloy sa pagsasanay
ng isang teorya sa panahon ng proseso ng pagkolekta data. Pagiging
angkop din para sa entablado
ng pagbuo ng teorya, iminumungkahi nina Franz at Robey (1987).
Ang paraan ng pagtatanong ay maaari ding gamitin para sa complex
yugto ng teorya. Sa kasong ito, batay sa ebidensyang nakolekta, isa
ang ibinigay na teorya o hypothesis ay napatunayan o pinabulaanan. Dagdag pa, ang pagsisiyasat ay
angkop din para sa pananaliksik na tumatalakay sa mga tanong na 'paano' o 'paano'
'bakit' (Yin 1989).
Kung ikukumpara sa ibang mga pamamaraan, pinapayagan ng mga survey ang mananaliksik na
makuha ang mahahalagang impormasyon nang mas detalyado (Galliers
1992, Shanks et al 1993). Higit pa rito, pinapayagan ng mga pagsisiyasat ang
mananaliksik upang maunawaan ang kalikasan at pagiging kumplikado ng mga prosesong pinag-aralan
(Benbasat et al. 1987).
Mayroong apat na pangunahing kawalan na nauugnay sa pamamaraan
pagsisiyasat. Ang una ay ang kakulangan ng mga kinokontrol na pagbabawas. doon
Maaaring baguhin ng subjectivity ng mananaliksik ang mga resulta at konklusyon
ng pag-aaral (Yin 1989). Ang pangalawang kawalan ay ang kakulangan ng
kinokontrol na pagmamasid. Hindi tulad ng mga eksperimentong pamamaraan, ang
hindi makokontrol ng inquiry researcher ang mga phenomena na pinag-aralan
habang sinusuri ang mga ito sa kanilang natural na konteksto (Gable 1994). Ang
ikatlong kawalan ay ang kakulangan ng replicability. Ito ay dahil sa katotohanan
na malabong maobserbahan ng mananaliksik ang parehong mga pangyayari, at
hindi mapatunayan ang mga resulta ng isang partikular na pag-aaral (Lee 1989).
Sa wakas, bilang isang kinahinatnan ng non-replicability, ito ay mahirap
gawing pangkalahatan ang mga resulta na nakuha mula sa isa o higit pang mga pagsisiyasat (Galliers
1992, Shanks et al 1993). Ang lahat ng mga problemang ito, gayunpaman, hindi
ay hindi malulutas at maaaring, sa katunayan, mababawasan ng
mananaliksik na naglalapat ng mga angkop na aksyon (Lee 1989).
3.3. Bigyang-katwiran ang pamamaraan ng pananaliksik
pinagtibay
Mula sa dalawang posibleng paraan ng pananaliksik para sa pag-aaral na ito, ang pamamaraan ng
ang pagsisiyasat ay itinuturing na pinakaangkop. Ang pagsisiyasat ay
ay itinapon kasunod ng maingat na pagsasaalang-alang sa mga nauugnay
merito at kahinaan. Ang kaginhawahan o hindi nararapat ng bawat isa
pamamaraan para sa pag-aaral na ito ay tinalakay sa ibaba.
3.3.1. Hindi angkop na paraan ng pananaliksik
ng pagtatanong
Ang pamamaraan ng pagtatanong ay nangangailangan ng malalim na pag-aaral tungkol sa isa
partikular na sitwasyon sa loob ng isa o higit pang organisasyon para sa a
tagal ng panahon (Eisenhardt 1989). Sa kasong ito, ang panahon ay maaaring
lumampas sa takdang panahon na ibinigay para sa pag-aaral na ito. Isa pa
dahilan sa hindi paggamit ng pamamaraan ng survey ay ang mga resulta
maaari silang magdusa mula sa isang kakulangan ng higpit (Yin 1989). Subjectivity
ng mananaliksik ay maaaring makaimpluwensya sa mga resulta at konklusyon. Isa pa
dahilan ay ang pamamaraang ito ay mas angkop para sa pananaliksik sa mga katanungan
ng uri ng 'paano' o 'bakit' (Yin 1989), habang ang tanong sa pananaliksik
para sa pag-aaral na ito ito ay nasa 'ano' na uri. Huli ngunit hindi bababa sa
Ang mahalaga, mahirap i-generalize ang mga natuklasan mula sa isa lang o
ilang mga pagsisiyasat (Galliers 1992, Shanks et al 1993). Sa batayan ng
ang makatwirang paliwanag na ito, ang paraan ng pananaliksik ng pagtatanong ay hindi
napili dahil hindi ito angkop para sa pag-aaral na ito.
3.3.2. Kaginhawaan ng paraan ng paghahanap ng
pagsisiyasat
Noong isinagawa ang pananaliksik na ito, ang pagsasagawa ng data warehousing
ay hindi malawak na pinagtibay ng
mga organisasyong Australian. Kaya, walang gaanong impormasyon
hinggil sa kanilang pagpapatupad sa loob ng
mga organisasyong Australian. Dumating ang magagamit na impormasyon
mula sa mga organisasyong nagpatupad o gumamit ng data
bodega. Sa kasong ito, ang pamamaraan ng pagsasaliksik ng survey ay ang pinaka
angkop dahil pinapayagan ka nitong makakuha ng impormasyon na hindi
magagamit sa ibang lugar o sa form na kinakailangan para sa pagsusuri (Fowler 1988).
Bilang karagdagan, ang pamamaraan ng pagsasaliksik ng sarbey ay nagpapahintulot sa mananaliksik na
makakuha ng magandang insight sa mga kasanayan, sitwasyon, o
nakikita sa isang partikular na oras (Galliers 1992, Denscombe 1998).
Kinailangan ang pangkalahatang view upang mapataas ang
Kaalaman tungkol sa karanasan sa pag-iimbak ng data sa Australia.
Muli, sinabi ni Sonquist at Dunkelberg (1977) na ang mga resulta ng
Ang pananaliksik sa sarbey ay mas pangkalahatan kaysa sa iba pang mga pamamaraan.
3.4. Disenyo ng Pananaliksik sa Sarbey
Ang pagsisiyasat sa data warehousing practice ay isinagawa noong 1999.

Ang target na populasyon ay binubuo ng mga organisasyon
Interesado ang mga Australyano sa mga pag-aaral ng data warehousing, tulad nila
malamang na alam na tungkol sa i data na kanilang iniimbak at,
samakatuwid, maaari itong magbigay ng kapaki-pakinabang na impormasyon para sa pag-aaral na ito. doon
natukoy ang target na populasyon sa isang paunang survey ng
lahat ng miyembro ng Australia ng 'The Data Warehousing Institute' (Tdwiaap).
Tinatalakay ng bahaging ito ang disenyo ng yugto ng pananaliksik
empirikal na ebidensya ng pag-aaral na ito.
3.4.1. Teknik ng koleksyon data
Mula sa tatlong teknik na karaniwang ginagamit sa pagsasaliksik ng sarbey
(ibig sabihin, postal questionnaire, panayam sa telepono at panayam
personal) (Nachmias 1976, Fowler 1988, de Vaus 1991), para sa
pinagtibay ng pag-aaral na ito ang mail questionnaire. Ang una
dahilan sa pag-ampon ng huli ay maaari nitong makamit ang a
populasyong nagkalat sa heograpiya (Blalock 1970, Nachmias e
Nachmias 1976, Hwang at Lin 1987, de Vaus 1991, Gable 1994).
Pangalawa, ang postal questionnaire ay angkop para sa mga kalahok
mataas ang pinag-aralan (Fowler 1988). Ang mail questionnaire para dito
Ang pag-aaral ay tinutugunan sa mga sponsor ng proyekto sa pag-iimbak ng data,
mga direktor at/o mga tagapamahala ng proyekto. Pangatlo, malayo ang mga questionnaire
Ang mail ay angkop kapag mayroon kang secure na listahan ng
mga address (Salant at Dilman 1994). TDWI, sa kasong ito, isa
Ang pinagkakatiwalaang asosasyon ng warehousing ng data ay nagbigay ng listahan ng address
ng mga miyembro nito sa Australia. Isa pang bentahe ng palatanungan
sa pamamagitan ng koreo laban sa talatanungan sa telepono o mga panayam
personal ay nagbibigay-daan ito sa mga nagparehistro na tumugon nang higit pa
katumpakan, lalo na kapag kailangang kumonsulta ang mga nagparehistro
mga tala o talakayin ang mga tanong sa ibang tao (Fowler
1988).
Ang isang potensyal na kawalan ay maaaring ang oras na kinakailangan para sa
magsagawa ng mga talatanungan sa pamamagitan ng koreo. Karaniwan, isang questionnaire ang layo
ang mail ay isinasagawa sa pagkakasunud-sunod na ito: magpadala ng mga liham, maghintay para sa
mga tugon at magpadala ng kumpirmasyon (Fowler 1988, Bainbridge 1989).
Kaya, ang kabuuang oras ay maaaring mas mahaba kaysa sa oras na kinakailangan para sa
mga personal na panayam o para sa mga panayam sa telepono. Gayunpaman, ang
ang kabuuang oras ay maaaring malaman nang maaga (Fowler 1988,
Denscombe 1998). Ang oras na ginugol sa pagsasagawa ng mga panayam
ang personal na data ay hindi maaaring malaman nang maaga dahil ito ay nag-iiba mula sa
isang panayam sa isa pa (Fowler 1988). Mga panayam sa telepono
maaaring mas mabilis kaysa sa mga postal questionnaire at
mga personal na panayam ngunit maaaring magkaroon ng mataas na rate ng nawawala
tugon dahil sa kawalan ng kakayahan ng ilang tao (Fowler 1988).
Bilang karagdagan, ang mga panayam sa telepono ay karaniwang limitado sa mga listahan ng
medyo maikling tanong (Bainbridge 1989).
Ang isa pang kahinaan ng isang mail questionnaire ay ang mataas na rate ng
kakulangan ng tugon (Fowler 1988, Bainbridge 1989, Neuman
1994). Gayunpaman, ang mga countermeasure ay ginawa, na nag-uugnay
ang pag-aaral na ito sa isang pinagkakatiwalaang institusyon sa larangan ng datos
warehousing (i.e. TDWI) (Bainbridge 1989, Neuman 1994), ang
na nagpapadala ng dalawang sulat ng paalala sa mga hindi tumugon
(Fowler 1988, Neuman 1994) at may kasama ring liham
suplemento na nagpapaliwanag sa layunin ng pag-aaral (Neuman 1994).
3.4.2. Unit ng pagsusuri
Ang layunin ng pag-aaral na ito ay makakuha ng impormasyon tungkol sa
ang pagpapatupad ng data warehousing at paggamit nito
sa loob ng mga organisasyong Australian. Ang target na populasyon
ay binubuo ng lahat ng organisasyong Australian na mayroon
ipinatupad, o ipinapatupad, i data bodega. Sa
ang mga indibidwal na organisasyon ay pagkatapos ay nakarehistro. Ang talatanungan
ipinadala ito sa pamamagitan ng koreo sa mga organisasyong interesado sa pag-aampon
di data bodega. Tinitiyak ng pamamaraang ito na ang impormasyon
nakolekta ay mula sa pinaka-angkop na mapagkukunan ng bawat organisasyon
kalahok.
3.4.3. Sampol ng survey
Ang "mailing list" ng mga kalahok sa survey ay nakuha mula sa
TDWI. Mula sa listahang ito, 3000 organisasyong Australian
ay pinili bilang batayan para sa sampling. A
ipinaliwanag ng karagdagang liham ang proyekto at layunin ng pagsisiyasat,
kasama ang isang sagutang papel at isang pre-paid na sobre para sa
ibalik ang nakumpletong talatanungan ay ipinadala sa sample.
Sa 3000 organisasyon, 198 ang sumang-ayon na lumahok sa
pag-aaral. Ang ganitong maliit na bilang ng mga tugon ay inaasahan dato il
malaking bilang ng mga organisasyong Australian na mayroon sila noon
niyakap o tinatanggap ang diskarte sa petsa
bodega sa loob ng kanilang mga organisasyon. Kaya ang
Ang target na populasyon para sa pag-aaral na ito ay binubuo lamang ng 198
mga organisasyon.
3.4.4. Mga nilalaman ng talatanungan
Ang istraktura ng talatanungan ay batay sa modelo ng petsa
Monash warehousing (tinalakay dati sa bahagi 2.3). Ang
nilalaman ng talatanungan ay batay sa pagsusuri ng
panitikan na ipinakita sa kabanata 2. Isang kopya ng talatanungan
na ipinadala sa mga kalahok sa survey ay matatagpuan
sa Appendix B. Ang talatanungan ay binubuo ng anim na seksyon, na
sumusunod ang mga yugto ng modelong tinalakay. Ang sumusunod na anim na talata
maikli nilang ibubuod ang mga nilalaman ng bawat seksyon.
Seksyon A: Pangunahing impormasyon tungkol sa organisasyon
Ang seksyong ito ay naglalaman ng mga tanong na may kaugnayan sa profile ng
mga kalahok na organisasyon. Dagdag pa, ang ilan sa mga tanong ay
nauugnay sa kalagayan ng proyekto ng data warehousing
kalahok. Kumpidensyal na impormasyon gaya ng iyong pangalan
ng organisasyon ay hindi ipinahayag sa pagsusuri ng sarbey.
Seksyon B: Magsimula
Ang mga tanong sa bahaging ito ay nauugnay sa panimulang aktibidad
data warehousing. Ang mga tanong ay tinanong kung gaano katagal
may kinalaman sa mga nagpasimula ng proyekto, tagagarantiya, kasanayan at kaalaman
mga kahilingan, ang mga layunin ng pagbuo ng data warehousing at ang
mga inaasahan ng mga end user.
Seksyon C: Disenyo
Ang bahaging ito ay naglalaman ng mga tanong na may kaugnayan sa mga gawain ng
pagpaplano ng data bodega. Sa partikular, ang mga tanong ay
estado tungkol sa saklaw ng pagpapatupad, ang tagal ng proyekto, ang gastos
ng proyekto at ang pagsusuri sa gastos/pakinabang.
Seksyon D: Pag-unlad
Sa seksyon ng pag-unlad ay may mga tanong na may kaugnayan sa mga aktibidad ng
pag-unlad ng data bodega: koleksyon ng mga kinakailangan ng user
pangwakas, ang mga pinagmumulan ng data, ang lohikal na modelo ng data, mga prototype, ang
pagpaplano ng kapasidad, mga teknikal na arkitektura at pagpili ng
mga tool sa pagbuo ng data warehousing.
Seksyon E: Operasyon
Mga tanong sa operasyon na may kaugnayan sa operasyon ed
sa pagpapalawak ng data bodega, kung paano ito umuunlad sa
susunod na yugto ng pag-unlad. doon kalidad ng data, ang mga estratehiya ng
refresh dei data, ang granularity ng data, scalability ng data
bodega at ang mga problema sa seguridad ng data bodega sila ay nasa pagitan
mga uri ng tanong.
Seksyon F: Pag-unlad
Ang seksyong ito ay naglalaman ng mga tanong na nauugnay sa paggamit ng data
bodega ng mga end user. Interesado ang mananaliksik
sa layunin at kapakinabangan ng data bodega, pagsusuri at mga estratehiya
ng pagsasanay na pinagtibay at ang diskarte sa pagkontrol ng data
pinagtibay ang bodega.
3.4.5. Rate ng pagtugon
Bagama't ang mga survey sa mail ay pinupuna dahil sa pagkakaroon ng rate ng
mababang tugon, ang mga hakbang ay ginawa upang madagdagan ang
rate ng return (tulad ng tinalakay dati sa bahagi
3.4.1). Ang terminong 'rate ng pagtugon' ay tumutukoy sa porsyento ng
mga tao sa isang partikular na sample ng survey na tumutugon sa
talatanungan (Denscombe 1998). Ginamit ang sumusunod
formula para kalkulahin ang rate ng pagtugon para sa pag-aaral na ito:
Bilang ng mga taong tumugon
Rate ng pagtugon =
——————————————————————————— X 100
Kabuuang bilang ng mga questionnaire na ipinadala
3.4.6. Test Pilot
Bago ipadala ang talatanungan sa sample, ang mga tanong ay
napagmasdan sa pamamagitan ng pagsasagawa ng mga pilot test, gaya ng iminungkahi ni Luck
at Rubin (1987), Jackson (1988), at de Vaus (1991). Ang layunin ng
Ang mga pilot test ay upang ipakita ang lahat ng awkward, hindi maliwanag at mga expression
mga tanong na mahirap bigyang-kahulugan, upang linawin ang anuman
mga kahulugan at terminong ginamit at upang matukoy ang tinatayang oras
kinakailangan upang makumpleto ang talatanungan (Warwick at Lininger 1975,
Jackson 1988, Salant at Dilman 1994). Ang mga pilot test ay
isinasagawa sa pamamagitan ng pagpili ng mga paksang may mga katangiang katulad ng mga iyon
ng mga huling paksa, gaya ng iminungkahi ni Davis e Cosenza (1993). Sa
sa pag-aaral na ito, anim na data warehousing professionals ang
napili bilang pilot subject. Pagkatapos ng bawat pagsubok sa pilot, sila ay
ang mga kinakailangang pagwawasto ay ginawa. Mula sa mga pilot test na isinagawa, i
tumulong ang mga kalahok sa muling paghubog at pag-reset ng
huling bersyon ng talatanungan.
3.4.7. Paraan ng Pagsusuri Ng Dati
I data ng pagsisiyasat na nakolekta mula sa mga saradong questionnaire na talatanungan ay
ay nasuri gamit ang isang statistical software package
tinatawag na SPSS. Marami sa mga tugon ang nasuri
gamit ang mga deskriptibong istatistika. Isang tiyak na bilang ng mga questionnaire
bumalik sila ng hindi kumpleto. Ang mga ito ay ginagamot ng mas malaki
pansin upang matiyak na i data ang nawawala ay hindi isa
kahihinatnan ng mga error sa pagpasok ng data, ngunit bakit ang mga tanong ay hindi
ay angkop para sa nagdeklara, o nagpasya ang nagpahayag na huwag
sagutin ang isa o higit pang mga tiyak na tanong. Ang mga sagot na ito
ang mga nawawala ay hindi pinansin sa panahon ng pagsusuri data at sila ay
naka-code bilang '- 9' upang matiyak na hindi sila kasama sa proseso
mga pagsusuri.
Sa paghahanda ng talatanungan, ang mga tanong ay isinara
na-precode sa pamamagitan ng pagtatalaga ng numero sa bawat opsyon. Ang numero
pagkatapos ay ginamit ito sa paghahanda ng i data sa panahon ng pagsusuri
(Denscombe 1998, Sapsford at Jupp 1996). Halimbawa, nagkaroon
anim na opsyon na nakalista sa tanong 1 ng seksyon B: payo
board, senior executive, IT department, unit
ng negosyo, consultant at iba pa. Sa file ng data ng SPSS, ay
nabuo ang isang variable upang ipahiwatig ang 'ang nagpasimula ng proyekto',
na may anim na label ng halaga: '1' para sa 'lupon ng mga direktor', '2'
para sa 'the high-level executive' at iba pa. Ang paggamit ng Likertin scale
sa ilan sa mga saradong tanong ay pinayagan din nito
isang pagkakakilanlan na hindi nangangailangan ng pagsisikap dahil sa paggamit ng mga halaga
kaukulang mga numero na ipinasok sa SPSS. Para sa mga katanungan sa
hindi kumpletong mga sagot, na hindi magkahiwalay,
ang bawat opsyon ay itinuturing bilang isang variable na may dalawa
mga label ng halaga: '1 ' para sa 'minarkahan' at '2 ' para sa 'walang marka'.
Ang mga tanong na bukas ay tinatrato nang iba kaysa mga tanong
sarado. Ang mga sagot sa mga tanong na ito ay hindi naipasok
SPSS. Sa halip, sinuri sila sa pamamagitan ng kamay. Ang paggamit nito
uri ng mga tanong ay nagbibigay-daan sa iyo upang makakuha ng impormasyon tungkol sa mga ideya
malayang naipahayag at ang mga personal na karanasan ng mga respondente
(Bainbridge 1989, Denscombe 1998). Hangga't maaari, ito ay ginawa
isang kategorya ng mga sagot.
Para sa pagsusuri ng data, ginagamit ang mga simpleng pamamaraan ng pagsusuri sa istatistika,
tulad ng dalas ng mga tugon, ang ibig sabihin, ang karaniwang paglihis
ibig sabihin at ang median (Argyrous 1996, Denscombe 1998).
Ang Gamma test ay epektibo para sa pagkuha ng mga quantitative measurements
ng mga asosasyon sa pagitan ng data mga ordinal (Norusis 1983, Argyrous 1996).
Ang mga pagsusulit na ito ay angkop dahil ang mga ordinal na kaliskis na ginamit ay hindi
marami silang mga kategorya at maaaring ipakita sa isang talahanayan
(Norusis 1983).
3.5 Buod
Sa kabanatang ito, ang metodolohiya ng pananaliksik at ang
mga disenyo na pinagtibay para sa pag-aaral na ito.
Pagpili ng pinakaangkop na paraan ng pananaliksik para sa a
partikular na pag-aaral ang kinuha
pagsasaalang-alang ng ilang mga tuntunin, kabilang ang kalikasan at uri
ng pananaliksik, gayundin ang mga merito at kahinaan ng bawat posible
pamamaraan (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987,
yin 1989, Hamilton and ives 1992, Galliers 1992, neuman 1994). Tingnan
ang kakulangan ng umiiral na kaalaman at teorya tungkol dito
ng data warehousing adoption sa Australia, ang pag-aaral na ito ni
ang pananaliksik ay nangangailangan ng interpretive na pamamaraan ng pananaliksik na may kasanayan
exploratory upang tuklasin ang mga karanasan ng mga organisasyon
Australian. Ang napiling paraan ng pananaliksik ay pinili para sa
mangolekta ng impormasyon tungkol sa pagpapatibay ng konsepto ng petsa
ware-housing ng mga organisasyong Australian. A
postal questionnaire ang napili bilang pamamaraan sa pagkolekta data. Ang
mga katwiran para sa pamamaraan ng pananaliksik at pamamaraan ng koleksyon data
ibibigay sa kabanatang ito. Gayundin ito ay
nagpakita ng talakayan sa yunit ng pagsusuri, ang sample
ginamit, ang porsyento ng mga sagot, ang nilalaman ng talatanungan, ang
pre-test ng talatanungan at ang paraan ng pagsusuri ng data.

Pagdidisenyo ng a Warehouse ng Data:
Pinagsasama-sama ang Mga Relasyon ng Entity at Dimensional Modeling
Abstract
Tindahan i data Ito ay isang pangunahing kasalukuyang isyu para sa marami
mga organisasyon. Isang pangunahing problema sa pag-unlad
ng imbakan ng data ito ang kanyang disenyo.
Dapat suportahan ng disenyo ang pagtuklas ng mga konsepto sa data
bodega sa legacy system at iba pang pinagmumulan ng data at isa din
madaling pag-unawa at kahusayan sa pagpapatupad ng data
bodega.
Karamihan sa bodega ng panitikan data inirerekomenda
ang paggamit ng entity relationship modelling o dimensional modeling para sa
kumakatawan sa disenyo ng data bodega.
Sa papel na ito ipinapakita namin kung paano pareho
ang mga representasyon ay maaaring pagsamahin sa isang diskarte para sa
pagguhit ng data bodega. Ang pamamaraang ginamit ay sistematiko
napagmasdan sa isang case study at natukoy sa isang bilang ng
mahalagang implikasyon sa mga propesyonal.
DATA WAREHOUSING
Un data bodega ay karaniwang binibigyang kahulugan bilang isang "nakatuon sa paksa,
integrated, time-variant, at nonvolatile na koleksyon ng data bilang suporta
ng mga desisyon ng pamamahala” (Inmon at Hackathorn, 1994).
Ang subject-oriented at integrated ay nagpapahiwatig na ang data bodega è
idinisenyo upang tumawid sa functional na mga hangganan ng mga legacy system para sa
nag-aalok ng pinagsamang pananaw ng data.
Ang time-variant ay nababahala sa makasaysayang o time-series na katangian ng video data in
un data bodega, na nagbibigay-daan sa mga trend na masuri.
Non-volatile ay nagpapahiwatig na ang data bodega hindi ito tuloy-tuloy
na-update bilang a database ng OLTP. Sa halip ito ay na-update
pana-panahon, kasama data mula sa panloob at panlabas na mapagkukunan. Ang
data bodega ito ay partikular na idinisenyo para sa pananaliksik
sa halip na para sa integridad ng mga update at pagganap ng
mga operasyon.
Ang ideya ng pag-iimbak ng i data ito ay hindi bago, ito ay isa sa mga layunin
ng pamamahala ng data mula noong ikaanimnapung taon (Il Martin, 1982).
I data bodega inaalok nila ang imprastraktura data para sa pamamahala
mga sistema ng suporta. Kasama sa mga sistema ng suporta sa pamamahala ang desisyon
mga support system (DSS) at executive information system (EIS).
Ang DSS ay isang computer-based information system na
idinisenyo upang mapabuti ang proseso at dahil dito ang mahigpit na pagkakahawak
desisyon ng tao. Ang EIS ay karaniwang isang sistema ng paghahatid ng
data na nagbibigay-daan sa mga executive ng negosyo na madaling ma-access ang view
ng data.
Ang pangkalahatang arkitektura ng a data bodega itinatampok ang papel ng
data bodega sa suporta sa pamamahala. Bilang karagdagan sa pag-aalok
ang imprastraktura data para sa EIS at DSS, al data bodega posible
i-access ito nang direkta sa pamamagitan ng mga query. ANG data kasama sa isang petsa
warehouse ay batay sa isang pagsusuri ng mga kinakailangan sa impormasyon
pamamahala at nakuha mula sa tatlong mapagkukunan: mga panloob na sistema ng pamana,
mga sistema ng pagkuha ng data ng espesyal na layunin at panlabas na pinagmumulan ng data. ANG
data sa mga panloob na sistema ng legacy, ang mga ito ay madalas na kalabisan,
hindi pare-pareho, mababang kalidad, at nakaimbak sa iba't ibang mga format
kaya kailangan nilang i-reconcile at linisin bago mo mai-load ang mga ito sa
data bodega (Inmon, 1992; McFadden, 1996). ANG data mula sa
mula sa mga sistema ng imbakan data ad hoc at mula sa mga mapagkukunan data
ang panlabas ay kadalasang ginagamit upang dagdagan (i-update, palitan) i
data mula sa mga legacy system.
Maraming mapanghikayat na dahilan upang bumuo ng a data bodega,
na kinabibilangan ng mas mahusay na paggawa ng desisyon sa pamamagitan ng paggamit
epektibong karagdagang impormasyon (Ives 1995), suporta para sa isang focus
sa kumpletong negosyo (Graham 1996), at ang pagbawas sa mga gastos ng
panustos ng data para sa EIS at DSS (Graham 1996, McFadden
1996).
Ang isang kamakailang empirical na pag-aaral ay natagpuan, sa karaniwan, isang pagbabalik ng
pamumuhunan para sa i data bodega ng 401% pagkatapos ng tatlong taon (Graham,
1996). Gayunpaman, ang iba pang mga empirical na pag-aaral ng data bodega mayroon
natagpuan ang mga makabuluhang problema kabilang ang kahirapan sa pagsukat ed
pagtatalaga ng mga benepisyo, kawalan ng malinaw na layunin, minamaliit ito
layunin at pagiging kumplikado ng proseso ng pag-iimbak i data, Sa
partikular tungkol sa mga pinagmumulan at kalinisan ng data.
Tindahan i data maaaring ituring na solusyon
sa problema ng pamamahala ng data sa pagitan ng mga organisasyon. doon
pagmamanipula ng data bilang isang yamang panlipunan ito ay nanatiling isa sa
pangunahing isyu sa pamamahala ng mga sistema ng impormasyon sa buong
mundo sa loob ng maraming taon (Brancheau et al. 1996, Galliers et al. 1994,
Niederman et al. 1990, Pervan 1993).
Isang tanyag na diskarte sa pamamahala ng asset data noong dekada otsenta ito noon
pagbuo ng isang modelo data sosyal. Modelo data sosyal noon
idinisenyo upang mag-alok ng isang matatag na batayan para sa pagbuo ng mga bagong sistema
mga aplikasyon e database at muling pagtatayo at pagsasama-sama ng pamana
mga sistema (Brancheau et al.
1989, Goodhue et al. 1988:1992, Kim at Everest 1994).
Gayunpaman, maraming mga problema sa diskarteng ito, sa
partikular, ang pagiging kumplikado at gastos ng bawat gawain, at ang mahabang panahon
kinakailangan na magkaroon ng mga nakikitang resulta (Beynon-Davies 1994, Earl
1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997).
Il data bodega ito ay isang hiwalay na database na kasama ng mga legacy
mga database sa halip na palitan ang mga ito. Samakatuwid, pinapayagan ka nitong
idirekta ang pamamahala ng data at maiwasan ang magastos na muling pagtatayo
ng mga legacy system.
KARAGDAGANG MGA PAMAMAGITAN SA DATA DESIGN
WAREHOUSE
Ang proseso ng pagbuo at pagperpekto a data bodega
dapat na mas maunawaan bilang isang proseso ng ebolusyon kaysa sa isang
cycle ng pag-unlad ng mga tradisyonal na sistema (pagnanasa, 1995, Shanks,
O'Donnell at Arnott 1997a). Maraming proseso ang kasangkot sa a
proyekto ng data bodega tulad ng pagsisimula, pagpaplano;
impormasyong nakuha mula sa mga kinakailangan na hiniling ng mga tagapamahala ng kumpanya;
pinagmumulan, pagbabago, paglilinis ng data at pag-synchronize mula sa legacy
mga sistema at iba pang pinagmumulan ng data; mga sistema ng paghahatid sa pag-unlad;
pagsubaybay sa data bodega; at kawalang-saysay ng proseso
ebolusyonaryo at pagbuo ng a data bodega (Stinches, O'Donnell
at Arnott 1997b). Sa journal na ito, nakatuon tayo sa kung paano
gumuhit ng i data nakaimbak sa konteksto ng iba pang mga prosesong ito.
Mayroong ilang mga diskarte na iminungkahi para sa arkitektura ng data
bodega sa panitikan (Inmon 1994, Ives 1995, Kimball 1994
McFadden 1996). Ang bawat isa sa mga pamamaraang ito ay may maikling
repasuhin na may pagsusuri sa kanilang mga kalakasan at kahinaan.
Ang Diskarte ni Inmon (1994) para sa Warehouse ng Data
Disenyo
Iminungkahi ni Inmon (1994) ang apat na umuulit na hakbang upang gumuhit ng data
bodega (tingnan ang Larawan 2). Ang unang hakbang ay ang disenyo ng isang template
data panlipunan upang maunawaan kung paano i data maaaring isama
sa mga functional na lugar sa loob ng isang organisasyon
paghahati i data tindahan sa mga lugar. Modelo data ito ay ginawa para sa
sa tindahan data nauukol sa paggawa ng desisyon, kabilang ang data
makasaysayan, at kasama data deduced at pinagsama-sama. Ang ikalawang hakbang ay
tukuyin ang mga lugar ng paksa para sa pagpapatupad. Ang mga ito ay nakabatay
sa mga priyoridad na tinutukoy ng isang partikular na organisasyon. Ang pangatlo
Ang hakbang ay nagsasangkot ng pagguhit ng a database para sa subject area, poses
bigyang-pansin ang pagsasama ng mga naaangkop na antas ng granularity.
Inirerekomenda ni Inmon ang paggamit ng mga entity at modelo ng mga relasyon. Pang-apat
Ang hakbang ay upang makilala ang mga source system data kinakailangan at paunlarin
mga proseso ng pagbabagong-anyo upang makuha, malinis at i-format i data.
Ang lakas ng diskarte ni Inmon ay ang modelo data sosyal
nag-aalok ng batayan para sa pagsasama ng data sa loob ng organisasyon
at pagpaplano ng suporta para sa umuulit na pagbuo ng data
bodega. Ang mga bahid nito ay ang kahirapan at gastos sa pagguhit
modelo data panlipunan, ang kahirapan sa pag-unawa sa mga modelo ng mga entidad at
mga relasyon na ginamit sa parehong mga modelo, na data panlipunan at ng data
naka-imbak ayon sa lugar ng paksa, at ang kaangkupan ng data del
pagguhit ng data bodega para sa pagsasakatuparan ng database
may kaugnayan ngunit hindi para sa database multi-dimensional.
Ives' (1995) Diskarte sa Warehouse ng Data
Disenyo
Ives (1995) ay nagmumungkahi ng isang apat na hakbang na diskarte sa pagdidisenyo ng isang
sistema ng impormasyon na itinuturing niyang naaangkop sa disenyo ng isang data
bodega (tingnan ang Larawan 3). Ang diskarte ay batay sa
Information Engineering para sa pagbuo ng mga sistema ng impormasyon
(Martin 1990). Ang unang hakbang ay upang matukoy ang mga layunin, ang mga kadahilanan
kritikal at matagumpay at pangunahing mga tagapagpahiwatig ng pagganap. ANG
pangunahing proseso ng negosyo at kinakailangang impormasyon ay
na-modelo upang humantong sa amin sa isang modelo data sosyal. Ang pangalawang hakbang
nagsasangkot ng pagbuo ng isang pagtukoy ng arkitektura data
nakaimbak ayon sa lugar, database di data bodega, ang mga bahagi
ng teknolohiya na kinakailangan, ang hanay ng suporta sa organisasyon
kinakailangan upang ipatupad at gumana sa data bodega. Ang pangatlo
Kasama sa hakbang ang pagpili ng mga kinakailangang software package at tool.
Ang ikaapat na hakbang ay ang detalyadong disenyo at pagbuo ng
data bodega. Napansin ni Ives ang tindahan na iyon data isa siyang bonded na lalaki
umuulit na proseso.
Ang lakas ng diskarte ni Ives ay ang paggamit ng mga tiyak na pamamaraan para sa
matukoy ang mga kinakailangan ng impormasyon, ang paggamit ng isang nakabalangkas
proseso upang suportahan ang pagsasama ng data bodega,
ang naaangkop na pagpili ng hardware at software, at ang paggamit ng maramihang
mga diskarte sa representasyon para sa data bodega. Ang kanyang mga kapintasan
ang mga ito ay likas sa pagiging kumplikado. Kasama sa iba ang kahirapan sa
bumuo ng maraming antas ng database all'interno del data bodega in
makatwirang oras at gastos.
Kimball's (1994) Approach to Warehouse ng Data
Disenyo
Kimball (1994) ay nagmungkahi ng limang umuulit na hakbang upang gumuhit ng isang datos
bodega (tingnan ang Larawan 4). Lalo na ang kanyang diskarte
nakatuon sa disenyo ng isa lamang data bodega at sa paggamit ng mga modelo
dimensional sa kagustuhan sa mga modelo ng mga entity at relasyon. Kimball
pag-aralan ang mga dimensional na modelong iyon dahil mas madali kong maunawaan
business executive deals, ito ay mas mahusay kapag nakikitungo
kumplikadong mga konsultasyon, at ang disenyo ng database mas pisikal
mahusay (Kimball 1994). Kinikilala ni Kimball na ang pag-unlad ng a
data bodega ay umuulit, at iyon data bodega hiwalay kaya nila
isama sa pamamagitan ng paghahati sa mga talahanayan ng dimensyon
karaniwan.
Ang unang hakbang ay upang matukoy ang partikular na lugar ng paksa
ginawang perpekto. Ang pangalawa at pangatlong hakbang ay may kinalaman sa paghubog
dimensional. Sa ikalawang hakbang ang mga sukat ay tumutukoy sa mga bagay ng
interes sa lugar ng paksa at pinagsama sa isang talahanayan ng katotohanan.
Halimbawa, sa lugar ng paksa ng pagbebenta ang mga sukat ng interes
maaaring isama ang halaga ng mga bagay na naibenta at ang dolyar
bilang isang pera sa pagbebenta. Ang ikatlong hakbang ay nagsasangkot ng pagkilala
dimensyon na kung saan ay ang mga paraan kung saan sila ay maaaring ipangkat i
katotohanan. Sa isang lugar ng paksa ng pagbebenta, mga kaugnay na dimensyon
maaaring magsama ng item, lokasyon at yugto ng panahon. doon
Ang talahanayan ng katotohanan ay may isang multi-part key upang maiugnay sa bawat isa
ng mga talahanayan ng dimensyon at karaniwang naglalaman ng napakaraming numero
puno ng katotohanan. Sa kabaligtaran, naglalaman ang mga talahanayan ng sukat
mapaglarawang impormasyon tungkol sa mga sukat at iba pang katangian na
maaaring gamitin sa pangkatang katotohanan. Yung fact table e
mga sukat na nauugnay sa form ng panukala na tinatawag na isa
pattern ng bituin dahil sa hugis nito. Kasama sa ikaapat na hakbang
ang pagbuo ng a database multidimensional upang maperpekto ito
pattern ng bituin. Ang huling hakbang ay ang pagtukoy ng mga source system data
kinakailangan at bumuo ng mga proseso ng pagbabago upang makakuha, malinis
at pormat i data.
Kabilang sa mga lakas ng diskarte ni Kimball ang paggamit ng mga modelo
dimensional na kumakatawan sa i data nakaimbak na gumagawa nito
madaling maunawaan at humahantong sa mahusay na pisikal na disenyo. A
dimensional na modelo na madaling gumamit ng pareho
mga sistema ng database ang relational ay maaaring gawing perpekto o mga sistema
database multidimensional. Kasama sa mga bahid nito ang kakulangan
ng ilang mga pamamaraan upang mapadali ang pagpaplano o pagsasama ng
maraming mga pattern ng bituin sa loob ng isa data bodega at ang
kahirapan sa pagdidisenyo mula sa matinding denormalized na istraktura sa a
dimensional na modelo a data sa mga legacy system.
McFadden's (1996) Approach to Data
Disenyo ng Warehouse
Ang McFadden (1996) ay nagmumungkahi ng limang hakbang na diskarte sa
gumuhit ng data bodega (tingnan ang Larawan 5).
Ang kanyang diskarte ay batay sa isang sintesis ng mga ideya mula sa panitikan
at nakatutok sa disenyo ng isa lamang data bodega. Ang una
Ang hakbang ay nagsasangkot ng pagsusuri ng mga kinakailangan. Bagaman ang mga detalye
Ang mga diskarte ay hindi inireseta, tinutukoy ng mga tala ni McFadden ang
nilalang data mga detalye at kanilang mga katangian, at tumutukoy sa mga mambabasa ng Watson
at Frolick (1993) para sa pagkuha ng mga kinakailangan.
Sa ikalawang hakbang, iginuhit ang modelo ng relasyon ng entity
data bodega at pagkatapos ay napatunayan ng mga pinuno ng negosyo. Ang pangatlo
Kasama sa hakbang ang pagtukoy sa pagmamapa mula sa legacy system
at panlabas na pinagmumulan ng data bodega. Kasama sa ikaapat na hakbang
mga proseso sa pagbuo, pag-deploy at pag-synchronize ng data sa
data bodega. Sa huling hakbang, ang sistema ay naihatid
binuo na may partikular na diin sa isang user interface.
Itinuturo ni McFadden na sa pangkalahatan ang proseso ng pagguhit
umuulit.
Ang mga kalakasan ng diskarte ni McFadden ay tumutukoy sa pakikilahok
ng mga pinuno ng negosyo sa pagtukoy ng mga kinakailangan at gayundin
ang kahalagahan ng mga mapagkukunan data, ang kanilang paglilinis at pagkolekta. kanya
ang mga kapintasan ay may kinalaman sa kawalan ng proseso para sa paghahati a
magandang proyekto ni data bodega sa maraming pinagsama-samang yugto, at doon
kahirapan sa pag-unawa sa entity at mga modelo ng relasyon na ginamit sa disenyo ng
data bodega.

    0/5 (0 Review)
    0/5 (0 Review)
    0/5 (0 Review)

    Alamin ang higit pa mula sa Online Web Agency

    Mag-subscribe upang makatanggap ng pinakabagong mga artikulo sa pamamagitan ng email.

    avatar ng may-akda
    admin Pinuno ng Kumpanya
    👍Online na Web Agency | Dalubhasa sa Web Agency sa Digital Marketing at SEO. Ang Web Agency Online ay isang Web Agency. Para sa Agenzia Web Online, ang tagumpay sa digital transformation ay batay sa mga pundasyon ng Iron SEO version 3. Mga Espesyalidad: System Integration, Enterprise Application Integration, Service Oriented Architecture, Cloud Computing, Data warehouse, business intelligence, Big Data, portal, intranet, Web Application Disenyo at pamamahala ng relational at multidimensional database Pagdidisenyo ng mga interface para sa digital media: usability at Graphics. Ang Online Web Agency ay nag-aalok sa mga kumpanya ng mga sumusunod na serbisyo: -SEO sa Google, Amazon, Bing, Yandex; -Web Analytics: Google Analytics, Google Tag Manager, Yandex Metrica; -Mga conversion ng user: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM sa Google, Bing, Amazon Ads; -Social Media Marketing (Facebook, Linkin, Youtube, Instagram).
    Aking Agile Privacy
    Ang site na ito ay gumagamit ng teknikal at profiling cookies. Sa pamamagitan ng pag-click sa tanggapin, pinapahintulutan mo ang lahat ng cookies sa pag-profile. Sa pamamagitan ng pag-click sa tanggihan o sa X, lahat ng cookies sa pag-profile ay tinatanggihan. Sa pamamagitan ng pag-click sa i-customize posible na piliin kung aling mga profile ng cookies ang isaaktibo.
    Sumusunod ang site na ito sa Data Protection Act (LPD), Swiss Federal Law ng 25 Setyembre 2020, at sa GDPR, EU Regulation 2016/679, na nauugnay sa proteksyon ng personal na data pati na rin ang libreng paggalaw ng naturang data.