https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

Data warehouse at Enterprise Resource Planning | DWH at ERP

ARKIBO DATA CENTRAL: HISTORY ED MGA EBOLUSYON

Ang dalawang nangingibabaw na tema ng corporate technology noong 90s ay i data bodega at ang ERP. Sa mahabang panahon ang dalawang malalakas na agos na ito ay naging bahagi ng corporate IT nang hindi nagkakaroon ng mga interseksyon. Ito ay halos bilang kung sila ay bagay at anti-materya. Ngunit ang paglaki ng parehong phenomena ay hindi maiiwasang humantong sa kanilang intersection. Ang mga kumpanya ngayon ay nahaharap sa problema kung ano ang gagawin sa ERP at data bodega. Ang artikulong ito ay magbabalangkas kung ano ang mga problema at kung paano sila tinutugunan ng mga kumpanya.

SA SIMULA…

Sa simula ay mayroong data bodega. Bodega ng data ay nilikha upang kontrahin ang sistema ng aplikasyon sa pagproseso ng transaksyon. Sa mga unang araw ang pagsasaulo ng data ito ay sinadya upang maging isang counterpoint lamang sa mga aplikasyon sa pagproseso ng transaksyon. Ngunit sa kasalukuyan ay may mga mas sopistikadong pangitain kung ano ang magagawa ng isang tao data bodega. Sa panahon ngayon ang data bodega ito ay bahagi ng isang istraktura na maaaring tawaging Corporate Information Factory.

ANG CORPORATE INFORMATION FACTORY (CIF)

Ang Corporate Information Factory ay may mga karaniwang bahagi ng arkitektura: isang pagbabagong-anyo at layer ng pagsasama-sama ng code na nagsasama ng i data habang ako data lumipat mula sa kapaligiran ng aplikasyon patungo sa data bodega ng kumpanya; a data bodega ng kumpanya kung saan i data detalyado at pinagsama-samang mga kasaysayan. Ang data bodega ang kumpanya ay nagsisilbing pundasyon kung saan maaaring itayo ang lahat ng iba pang bahagi ng kapaligiran data bodega; isang operational data store (ODS). Ang ODS ay isang hybrid na istraktura na naglalaman ng ilang aspeto ng data bodega at iba pang aspeto ng isang OLTP na kapaligiran; data marts, kung saan maaaring magkaroon ng sariling bersyon ang iba't ibang departamento ng data bodega; a data bodega ng paggalugad kung saan maaaring ipakita ng mga "thinkers" ng kumpanya ang kanilang 72-oras na mga query na walang masamang epekto sa data bodega; at isang near line memory, kung saan data matanda at data ang maramihang detalye ay maaaring maimbak sa murang halaga.

KUNG SAAN KASAMA ANG ERP SA PABRIKA NG IMPORMASYON NG CORPORATE

Ang ERP ay pinagsama sa Corporate Information Factory sa dalawang lugar. Una bilang pangunahing aplikasyon (baseline) na nagbibigay ng data ng aplikasyon sa data bodega. Sa kasong ito i data, na nabuo bilang isang by-product ng isang proseso ng transaksyon, ay isinama at nilo-load sa data bodega ng kumpanya. Ang pangalawang punto ng unyon sa pagitan ng ERP at CIF ay ang ODS. Sa katunayan, sa maraming kapaligiran ang ERP ay ginagamit bilang isang klasikong ODS.

Kung sakaling ang ERP ay ginamit bilang isang pangunahing aplikasyon, ang parehong ERP ay maaari ding gamitin sa CIF bilang ODS. Sa anumang kaso, kung ang ERP ay gagamitin sa parehong mga tungkulin, dapat mayroong malinaw na pagkakaiba sa pagitan ng dalawang entity. Sa madaling salita, kapag ginagampanan ng ERP ang papel ng pangunahing aplikasyon at ODS, dapat na magkaiba ang dalawang entidad ng arkitektura. Kung ang isang solong pagpapatupad ng isang ERP ay sumusubok na gampanan ang parehong mga tungkulin nang sabay-sabay na magkakaroon ng mga problema sa disenyo at pagpapatupad ng istrukturang iyon.

HIWALAY NA ODS AT MGA BATAYANG APPLICATION

Mayroong maraming mga kadahilanan na humahantong sa paghahati ng mga bahagi ng arkitektura. Marahil ang pinaka-nagsasabing isyu sa paghihiwalay ng iba't ibang bahagi ng isang arkitektura ay ang bawat bahagi ng arkitektura ay may sariling pananaw. Iba ang layunin ng baseline application kaysa sa ODS. Subukang mag-overlap

isang baseline application view sa mundo ng isang ODS o vice versa ay hindi isang tamang paraan upang gumana.

Dahil dito, ang unang problema ng isang ERP sa CIF ay ang pag-verify kung mayroong pagkakaiba sa pagitan ng mga baseline application at ng ODS.

MGA MODELONG DATA SA CORPORATE PABRIKA NG IMPORMASYON

Upang makamit ang pagkakaisa sa pagitan ng iba't ibang bahagi ng arkitektura ng CIF, dapat mayroong isang modelo ng data. Ang mga modelo ng data nagsisilbi silang link sa pagitan ng iba't ibang bahagi ng arkitektura tulad ng mga baseline application at ang ODS. Ang mga modelo ng data nagiging "intellectual road map" sila para makuha ang tamang kahulugan mula sa iba't ibang bahagi ng arkitektura ng CIF.

Kasabay ng paniwala na ito, ang ideya ay dapat mayroong isang mahusay at natatanging modelo ng data. Malinaw na dapat mayroong isang pattern ng data para sa bawat isa sa mga bahagi at higit pa rito ay dapat mayroong isang makatwirang landas na nagkokonekta sa iba't ibang mga modelo. Ang bawat bahagi ng arkitektura - ODS, baseline application, data bodega kumpanya, at iba pa .. - nangangailangan ng sarili nitong modelo ng data. At kaya dapat mayroong isang tumpak na kahulugan kung paano ang mga modelong ito ng data interface sila sa isa't isa.

MOVE I DATA NG ERP DATE WAREHOUSE

Kung ang pinagmulan ng data ay isang baseline application at / o isang ODS, kapag ang ERP ay pumasok sa i data sa data bodega, ang pagpapasok na ito ay dapat maganap sa pinakamababang antas ng "granularity". Ibuod o pagsama-samahin lamang i data tulad ng paglabas nila sa ERP baseline application o ang ERP ODS ay hindi tamang gawin. ANG data kailangan ang mga detalye sa data bodega upang maging batayan ng proseso ng DSS. ganyan data ay muling mabubuo sa maraming paraan ng mga data mart at paggalugad ng data bodega.

Ang paglilipat ng data mula sa ERP baseline application environment hanggang sa data bodega ng kumpanya ay ginagawa sa isang makatwirang nakakarelaks na paraan. Ang ganitong pagbabago ay nangyayari humigit-kumulang 24 na oras pagkatapos ng pag-upgrade o paglikha sa ERP. Ang katotohanan ng pagkakaroon ng "tamad" na paggalaw ng mga diyos data sa data bodega ng kumpanya ay nagpapahintulot sa data na nagmumula sa ERP upang "tumira". Sa sandaling i data ay idineposito sa baseline application, pagkatapos ay maaari mong ligtas na ilipat ang i data ng ERP sa enterprise. Isa pang layunin na makakamit salamat sa "tamad" na paggalaw ng mga diyos data ito ay ang malinaw na demarcation sa pagitan ng mga proseso ng pagpapatakbo at DSS. Sa pamamagitan ng isang "mabilis" na paggalaw ng data ang linya sa pagitan ng DSS at operational ay nananatiling malabo.

Il Movimento dei data mula sa ODS ng ERP hanggang data bodega ng kumpanya ay ginagawa nang pana-panahon, karaniwang lingguhan o buwanan. Sa kasong ito ang paggalaw ng data ito ay batay sa pangangailangang "linisin" ang luma data mga mananalaysay. Siyempre, ang ODS ay naglalaman ng i data na mas bago kaysa sa data mga mananalaysay na matatagpuan sa data bodega.

Ang paglilipat ng data sa data bodega halos hindi ito ginagawang "pakyawan" (sa isang mamamakyaw na paraan). Kopyahin ang isang talahanayan mula sa kapaligiran ng ERP sa data bodega wala itong saysay. Ang isang mas makatotohanang diskarte ay ang paglipat ng mga piling unit ng data. Tanging ang data na nagbago mula noong huling pag-update ng data bodega ay ang mga dapat ilipat sa data bodega. Isang paraan para malaman kung alin data ay binago mula noong huling pag-update ay upang tingnan ang mga timestamp data matatagpuan sa kapaligiran ng ERP. Pinipili ng taga-disenyo ang lahat ng mga pagbabagong naganap mula noong huling pag-update. Ang isa pang diskarte ay ang paggamit ng mga diskarte sa pagkuha ng pagbabago data. Sa mga pamamaraang ito, sinusuri ang mga log at journal tape upang matukoy kung alin data dapat ilipat mula sa kapaligiran ng ERP patungo sa data bodega. Ang mga diskarteng ito ay pinakamainam dahil ang mga log at journal tape ay mababasa mula sa mga ERP file nang walang karagdagang epekto sa iba pang mapagkukunan ng ERP.

IBA PANG KOMPLIKASYON

Ang isa sa mga problema sa ERP sa CIF ay kung ano ang nangyayari sa iba pang mga mapagkukunan ng application o sa data ng ODS na dapat mag-ambag sa data bodega ngunit hindi sila bahagi ng kapaligiran ng ERP. Dahil sa saradong kalikasan ng ERP, lalo na ang SAP, ang pagtatangkang pagsamahin ang mga susi mula sa mga panlabas na mapagkukunan ng data kasama ko data na nagmula sa ERP sa oras ng paglipat i data sa data bodega, ito ay isang malaking hamon. At ilan nga ba ang mga probabilidad na i data ng mga aplikasyon o ODS sa labas ng kapaligiran ng ERP ay isasama sa data bodega? Ang mga posibilidad ay talagang napakataas.

HANAPIN DATA MGA KASAYSAYAN MULA SA ERP

Isa pang problema sa data Ang ERP ay nagmula sa pangangailangang magkaroon data makasaysayan sa loob ng data bodega. Karaniwan ang data bodega mga pangangailangan data mga mananalaysay. At kadalasan ang teknolohiya ng ERP ay hindi nag-iimbak ng mga ito data makasaysayan, hindi bababa sa hindi sa punto kung saan ito ay kinakailangan sa data bodega. Kapag malaking halaga ng data ang kasaysayan ay nagsimulang idagdag sa kapaligiran ng ERP, ang kapaligirang iyon ay kailangang linisin. Halimbawa, ipagpalagay na a data bodega dapat na puno ng limang taon ng data historikal habang ang ERP ay nagtataglay ng maximum na anim na buwan ng mga ito data. Hangga't ang kumpanya ay nasiyahan upang mangolekta ng iba't-ibang data makasaysayang habang lumilipas ang panahon, kung gayon walang problema sa paggamit ng ERP bilang mapagkukunan para sa data bodega. Ngunit kapag ang data bodega kailangan niyang bumalik sa panahon at kumuha ng mga diyos data mga kasaysayan na hindi pa nakolekta at nai-save ng ERP, kung gayon ang kapaligiran ng ERP ay nagiging hindi epektibo.

ERP AT METADATA

Isa pang pagsasaalang-alang na dapat gawin tungkol sa ERP at data bodega ay ang isa sa umiiral na metadata sa kapaligiran ng ERP. Tulad ng metadata na pumasa mula sa kapaligiran ng ERP patungo sa data bodega, ang metadata ay dapat ilipat sa parehong paraan. Bilang karagdagan, ang metadata ay dapat na mabago sa format at istraktura na kinakailangan ng imprastraktura ng data bodega. Mayroong malaking pagkakaiba sa pagitan ng operational metadata at DSS metadata. Ang operational metadata ay pangunahing para sa developer at sa

programmer. Pangunahing para sa end user ang metadata ng DSS. Ang kasalukuyang metadata sa mga ERP application o ODS ay kailangang ma-convert at ang conversion na ito ay hindi palaging madali at diretso.

PAG-SOURCING NG ERP DATA

Kung ang ERP ay ginagamit bilang tagapagbigay ng data para sa data bodega dapat mayroong isang solidong interface na gumagalaw i data mula sa kapaligiran ng ERP hanggang sa kapaligiran data bodega. Ang interface ay dapat:

▪ maging madaling gamitin
▪ payagan ang pag-access sa data ng ERP
▪ kunin ang kahulugan ng data na malapit nang ililipat sa data bodega
▪ malaman ang mga limitasyon ng ERP na maaaring lumitaw kapag ginawa ang pag-access data ng ERP:
▪ integridad ng referential
▪ hierarchical na relasyon
▪ mga implicit na lohikal na relasyon
▪ kumbensyon ng aplikasyon
▪ lahat ng istruktura ng data suportado ng ERP, at iba pa ...
▪ maging mahusay sa pag-access data, sa pamamagitan ng pagbibigay ng:
▪ direktang paggalaw ng data
▪ pagkuha ng pagbabago data
▪ sumusuporta sa napapanahong pag-access sa data
▪ maunawaan ang format ng data, at iba pa… INTERFACE SA SAP Ang interface ay maaaring may dalawang uri, homegrown o komersyal. Ang ilan sa mga pangunahing komersyal na interface ay kinabibilangan ng:

▪ SAS
▪ Prims Solutions
▪ D2k, at iba pa ... MARAMING ERP TECHNOLOGIES Ang pagtrato sa kapaligiran ng ERP na parang ito ay isang teknolohiya ay isang malaking pagkakamali. Mayroong maraming mga teknolohiya ng ERP, bawat isa ay may mga lakas nito. Ang mga kilalang vendor sa merkado ay:

▪ SAP
▪ Oracle Financials
▪ PeopleSoft
▪ JD Edwards
▪ Baan Panghinain Ang SAP ay ang pinakamalaki at pinakakumpletong ERP software. Ang mga application ng SAP ay sumasaklaw sa maraming uri ng mga aplikasyon sa maraming lugar. Ang SAP ay may reputasyon sa pagiging:

▪ napakalaki
▪ napakahirap at mahal na ipatupad
▪ nangangailangan ito ng maraming tao at consultant para maipatupad
▪ nangangailangan ng mga dalubhasang tao para sa pagpapatupad
▪ tumatagal ng mahabang panahon para ipatupad. May reputasyon din ang SAP sa pag-iimbak ng sarili nitong data napakaingat, na ginagawang mahirap para sa isang tao sa labas ng lugar ng SAP na ma-access ang mga ito. Ang lakas ng SAP ay ang makapag-capture at makapag-imbak ng malaking halaga ng data. Kamakailan ay inihayag ng SAP ang intensyon nitong palawigin ang mga aplikasyon nito sa data bodega. Maraming mga kalamangan at kahinaan sa paggamit ng SAP bilang isang supplier ng data bodega. Ang isang bentahe ay ang SAP ay naka-install na at ang karamihan sa mga consultant ay pamilyar na sa SAP.
Ang mga disadvantage ng pagkakaroon ng SAP bilang supplier ng data bodega ay marami: walang karanasan si SAP sa mundo ng data bodega Kung ang SAP ang supplier ng data bodega, kailangang "ilabas" i data mula sa SAP al data bodega. Dato isang track record ng SAP ng saradong sistema, malamang na hindi madaling makuha ang i mula sa SAP papunta dito (???). Maraming legacy na environment na nagpapagana sa SAP, gaya ng IMS, VSAM, ADABAS, ORACLE, DB2, at iba pa. Iginiit ng SAP ang isang "hindi imbento dito" na diskarte. Ang SAP ay hindi gustong makipagtulungan sa ibang mga vendor para gamitin o gawin ang data bodega. Ang SAP ay nagpipilit sa pagbuo ng lahat ng software nito mismo.

Bagama't ang SAP ay isang malaki at makapangyarihang kumpanya, sinusubukang muling isulat ang teknolohiya ng ELT, OLAP, pangangasiwa ng system, at maging ang pangunahing code ng dbms baliw lang. Sa halip na magkaroon ng kooperatiba na saloobin sa mga supplier ng data bodega matagal na, sinunod ng SAP ang diskarte na "pinakamahusay nilang alam". Pinipigilan ng saloobing ito ang tagumpay na maaaring makuha ng SAP sa larangan ng data bodega.
Ang pagtanggi ng SAP na payagan ang mga panlabas na supplier na ma-access kaagad at maganda ang sa kanila data. Ang pinakadiwa ng paggamit ng a data bodega ay madaling ma-access data. Ang buong kwento ng SAP ay batay sa pagpapahirap sa pag-access data.
Ang kakulangan ng karanasan ng SAP sa pagharap sa malalaking volume ng data; sa larangan ng data bodega may mga volume ng data hindi kailanman nakita ng SAP at upang mahawakan ang malalaking halaga ng data kailangan mong magkaroon ng angkop na teknolohiya. Ang SAP ay tila hindi alam ang teknolohikal na hadlang na ito na umiiral upang makapasok sa larangan ng data bodega.
Ang kultura ng korporasyon ng SAP: Ang SAP ay lumikha ng isang negosyo sa pagkuha ng i data mula sa sistema. Ngunit para magawa ito kailangan mong magkaroon ng ibang kaisipan. Ayon sa kaugalian, ang mga kumpanya ng software na mahusay sa pagkuha ng data sa isang kapaligiran ay hindi naging mahusay sa pagkuha ng data upang pumunta sa ibang paraan. Kung magagawa ng SAP ang ganitong uri ng switch, ito ang unang kumpanya na gagawa nito.

Sa madaling salita, kaduda-duda kung dapat piliin ng isang kumpanya ang SAP bilang kanilang supplier ng data bodega. Mayroong napakaseryosong mga panganib sa isang banda at napakakaunting mga gantimpala sa kabilang banda. Ngunit may isa pang dahilan kung bakit pinipigilan ang pagpili ng SAP bilang tagapagtustos ng data bodega. Dahil dapat pareho ang bawat kumpanya data bodega sa lahat ng iba pang kumpanya? Ang data bodega ito ang puso ng competitive advantage. Kung pareho ang pinagtibay ng bawat kumpanya data bodega ito ay magiging mahirap, kung hindi imposible, upang makamit ang isang competitive na kalamangan. Mukhang iniisip ni SAP na a data bodega maaari itong makita bilang isang cookie at ito ay isang karagdagang senyales ng kanilang "kumuha ng data sa" application mentality.

Walang ibang ERP vendor ang kasing dominante ng SAP. Walang alinlangan na may mga kumpanyang susunod sa landas ng SAP para sa kanila data bodega ngunit marahil ang mga ito data bodega Ang mga SAP ay magiging malalaki, magastos, at makakaubos ng oras sa paggawa.

Kasama sa mga environment na ito ang mga aktibidad gaya ng pagpoproseso ng bank teller, mga proseso ng booking ng airline, proseso ng reklamo sa insurance, at iba pa. Kung mas malakas ang sistema ng transaksyon, mas malinaw ang pangangailangan para sa paghihiwalay sa pagitan ng proseso ng pagpapatakbo at DSS (Decision Support System). Gayunpaman, sa mga sistema ng human at personal na mapagkukunan, hindi ka kailanman nahaharap sa malalaking volume ng mga transaksyon. At, siyempre, kapag ang isang tao ay tinanggap o umalis sa kumpanya ito ay isang talaan ng isang transaksyon. Ngunit kumpara sa ibang mga sistema, ang mga sistema ng human at personal na mapagkukunan ay walang maraming transaksyon. Samakatuwid, sa mga sistema ng human at personal na mapagkukunan ay hindi lubos na halata na kailangan ang isang DataWarehouse. Sa maraming paraan kinakatawan ng mga system na ito ang bundle ng mga DSS system.

Ngunit may isa pang kadahilanan na kailangang isaalang-alang kapag nakikitungo sa datawarehouse at PeopleSoft. Sa maraming kapaligiran, i data ng mga tao at personal na mapagkukunan ay pangalawa sa pangunahing negosyo ng kumpanya. Karamihan sa mga kumpanya ay gumagawa, nagbebenta, nagbibigay ng mga serbisyo, at iba pa. Ang mga sistema ng human at personal na mapagkukunan ay karaniwang pangalawa (o sumusuporta) sa pangunahing linya ng negosyo ng kumpanya. Samakatwid, ito ay mali-mali at hindi maginhawa a data bodega hiwalay para sa suporta ng tao at personal na mapagkukunan.

Ang PeopleSoft ay ibang-iba sa SAP sa bagay na ito. Sa SAP, ipinag-uutos na magkaroon ng a data bodega. Sa PeopleSoft, hindi gaanong malinaw. Ang isang data warehouse ay opsyonal sa PeopleSoft.

Ang pinakamagandang bagay na masasabi para sa data PeopleSoft ay iyon ang data bodega maaaring gamitin upang i-archive ang i data nauugnay sa lumang tao at personal na yaman. Ang pangalawang dahilan kung bakit gustong gamitin ng isang kumpanya ang a data bodega a

sa kapinsalaan ng kapaligiran ng PeopleSoft ay ang payagan ang pag-access at libreng pag-access sa mga tool sa pagsusuri, ai data ng PeopleSoft. Ngunit lampas sa mga kadahilanang ito, maaaring may mga kaso kung saan mas mainam na walang data warehouse para sa data PeopleSoft.

Sa buod

Mayroong maraming mga pananaw sa pagbuo ng isang data bodega sa loob ng isang ERP software.
Ilan sa mga ito ay:

▪ Makatuwirang magkaroon ng a data bodega sino ang kamukha ng iba sa industriya?
▪ Gaano ka-flexible ang isang ERP data bodega software?
▪ Isang ERP data bodega maaaring hawakan ng software ang dami ng data na matatagpuan sa isang "data bodega arena"?
▪ Ano ang talaan ng track na ginagawa ng ERP vendor sa harap ng madali at mura, sa mga tuntunin ng oras, data? (ano ang track record ng mga vendor ng ERP sa paghahatid ng mura, nasa oras, madaling ma-access ang data?)
▪ Ano ang pagkaunawa ng nagtitinda ng ERP sa arkitektura ng DSS at pabrika ng impormasyon ng korporasyon?
▪ Naiintindihan ng mga vendor ng ERP kung paano kumuha data sa loob ng kapaligiran, ngunit naiintindihan din kung paano i-export ang mga ito?
▪ Gaano kabukas ang vendor ng ERP sa mga tool sa warehousing ng data?
Ang lahat ng mga pagsasaalang-alang na ito ay dapat gawin sa pagtukoy kung saan ilalagay ang data bodega na magho-host i data ERP at iba pa data. Sa pangkalahatan, maliban kung may mapanghikayat na dahilan para gawin ang iba, inirerekomenda ang pagtatayo data bodega sa labas ng kapaligiran ng vendor ng ERP. KABANATA 1 Pangkalahatang-ideya ng Mga Pangunahing punto ng Organisasyon ng BI:
Gumagana ang mga repositoryo ng impormasyon salungat sa arkitektura ng business intelligence (BI):
Maaaring limitahan ng kultura ng korporasyon at IT ang tagumpay sa pagbuo ng mga organisasyon ng BI.

Hindi na ang teknolohiya ang limiting factor para sa mga organisasyon ng BI. Ang problema para sa mga arkitekto at tagaplano ng proyekto ay hindi kung umiiral ang teknolohiya, ngunit kung maaari nilang epektibong ipatupad ang magagamit na teknolohiya.

Para sa maraming kumpanya a data bodega ito ay higit pa sa isang passive deposit na namamahagi ng i data sa mga gumagamit na nangangailangan nito. ANG data kinukuha ang mga ito mula sa mga source system at nilalagyan ng mga target na istruktura ng data bodega. Ako data maaari din silang linisin sa anumang kapalaran. Gayunpaman, walang karagdagang halaga ang idinagdag o inaani ni data sa panahon ng prosesong ito.

Sa esensya, ang passive DW, sa pinakamaganda, ay nagbibigay lamang ng i data malinis at gumagana sa mga asosasyon ng gumagamit. Ang paglikha ng impormasyon at analytical na pag-unawa ay ganap na nakasalalay sa mga gumagamit. Hatulan kung ang DW (Bodega ng data) ay isang tagumpay at subjective. Kung hahatulan natin ang tagumpay sa kakayahang mahusay na kolektahin, isama at linisin ang data corporate sa isang predictable na batayan, pagkatapos ay oo, ang DW ay isang tagumpay. Sa kabilang banda, kung titingnan natin ang pangangalap ng impormasyon, pagsasama-sama at pagsasamantala sa kabuuan ng organisasyon, kung gayon ang DW ay isang kabiguan. Ang DW ay nagbibigay ng kaunti o walang halaga ng impormasyon. Bilang resulta, ang mga gumagamit ay napipilitang gumawa, kaya lumilikha ng mga silo ng impormasyon. Ang kabanatang ito ay nagpapakita ng isang komprehensibong pangkalahatang-ideya upang i-recap ang business intelligence (BI) architecture ng organisasyon. Magsimula tayo sa isang paglalarawan ng BI at pagkatapos ay lumipat sa mga talakayan ng disenyo at pag-unlad ng impormasyon, kumpara sa simpleng pagbibigay ng data sa mga gumagamit. Ang mga talakayan ay pagkatapos ay nakatuon sa pagkalkula ng halaga ng iyong mga pagsisikap sa BI. Nagtatapos kami sa pamamagitan ng pagtukoy kung paano tinutugunan ng IBM ang mga kinakailangan sa arkitektura ng BI ng iyong organisasyon.

Paglalarawan ng arkitektura ng organisasyon ng BI

Ang makapangyarihang mga sistema ng impormasyon na nakatuon sa transaksyon ay karaniwan na ngayon sa bawat malaking negosyo, na epektibong nagpapapantay sa larangan ng paglalaro para sa mga korporasyon sa buong mundo.

Ang pananatiling mapagkumpitensya, gayunpaman, ngayon ay nangangailangan ng mga sistemang nakatuon sa analytical na maaaring baguhin ang kakayahan ng kumpanya sa pamamagitan ng muling pagtuklas at paggamit ng impormasyong mayroon na sila. Ang mga analytic system na ito ay nagmula sa pag-unawa sa kayamanan ng mga diyos data magagamit. Maaaring pahusayin ng BI ang pagganap sa lahat ng impormasyon ng enterprise. Maaaring pagbutihin ng mga kumpanya ang mga relasyon sa pagitan ng mga customer at mga supplier, pagbutihin ang kakayahang kumita ng mga produkto at serbisyo, bumuo ng mga bago at mas mahusay na mga alok, kontrolin ang panganib at, bukod sa maraming iba pang mga kita, bawasan ang paggasta nang husto. Sa BI ang iyong kumpanya sa wakas ay nagsimulang gumamit ng impormasyon ng customer bilang isang mapagkumpitensyang asset salamat sa mga application na may mga layunin sa merkado.

Ang pagkakaroon ng tamang negosyo ay nangangahulugan ng pagkakaroon ng mga tiyak na sagot sa mga pangunahing tanong tulad ng:

▪ Alin sa atin mga customer pinapalaki ba nila tayo, o pinadalhan nila tayo ng lugi?
▪ Kung saan nakatira ang pinakamaganda natin mga customer Kaugnay sa tindahan/ warehouse na madalas nilang pinupuntahan?
▪ Alin sa aming mga produkto at serbisyo ang pinakamabisang ibenta at kanino?
▪ Aling mga produkto ang pinakamabisang ibenta at kanino?
▪ Aling kampanya sa pagbebenta ang pinakamatagumpay at bakit?
▪ Aling mga channel sa pagbebenta ang pinakaepektibo para sa aling mga produkto?
▪ Paano namin mapapabuti ang mga relasyon sa aming pinakamahusay mga customer? Karamihan sa mga kumpanya ay mayroon data mahirap sagutin ang mga tanong na ito.
Ang mga operating system ay bumubuo ng malaking dami ng produkto, customer at data merkado mula sa mga punto ng pagbebenta, reserbasyon, serbisyo sa customer at mga teknikal na sistema ng suporta. Ang hamon ay kunin at pagsamantalahan ang impormasyong ito. Sinasamantala ng maraming kumpanya ang maliliit na bahagi lamang ng kanilang sarili data para sa mga estratehikong pagsusuri.
I data natitira, madalas na kasama sa i data ang pagkuha ng mga panlabas na mapagkukunan tulad ng "mga ulat ng pamahalaan", at iba pang biniling impormasyon, ay isang minahan ng ginto na naghihintay lamang na tuklasin, at data dapat lang silang pinuhin sa konteksto ng impormasyon ng iyong organisasyon.

Maaaring magamit ang kaalamang ito sa maraming paraan, mula sa pagdidisenyo ng pangkalahatang diskarte sa korporasyon hanggang sa personal na komunikasyon sa mga supplier, sa pamamagitan ng mga call center, pag-invoice, internet at iba pang mga punto. Ang kapaligiran ng negosyo ngayon ay nagdidikta na ang DW at ang mga kaugnay na solusyon sa BI ay nagbabago nang higit pa sa pagpapatakbo ng mga tradisyonal na istruktura ng negosyo. data na i data na-normalize sa atomic-level at "star / cube farms".

Ang kailangan upang manatiling mapagkumpitensya ay isang pagsasanib ng mga tradisyonal at advanced na teknolohiya sa pagsisikap na suportahan ang isang malawak na analytical landscape.
Sa konklusyon, ang pangkalahatang kapaligiran ay dapat mapabuti ang kaalaman ng kumpanya sa kabuuan, siguraduhin na ang mga aksyon na ginawa bilang resulta ng mga pagsusuri na isinagawa ay kapaki-pakinabang para sa lahat upang makinabang.

Halimbawa, sabihin nating niraranggo mo ang sa iyo mga customer sa mga kategorya ng mataas o mababang panganib.
Kung ang impormasyong ito ay nabuo sa pamamagitan ng isang modelo ng pag-extract o iba pang paraan, dapat itong ilagay sa DW at gawing naa-access ng sinuman, sa pamamagitan ng anumang tool sa pag-access, tulad ng mga static na ulat, spreadsheet, talahanayan, o online analytical processing (OLAP) .

Gayunpaman, sa kasalukuyan, karamihan sa ganitong uri ng impormasyon ay nananatili sa silos ng data ng mga indibidwal o departamento na bumubuo ng pagsusuri. Ang organisasyon sa kabuuan ay may kaunti o walang visibility para sa pag-unawa. Sa pamamagitan lamang ng paghahalo ng ganitong uri ng nilalaman ng impormasyon sa iyong enterprise DW maaari mong alisin ang mga silo ng impormasyon at itaas ang iyong kapaligiran sa DW.
Mayroong dalawang pangunahing hadlang sa pagbuo ng isang organisasyong BI.
Una, mayroon tayong problema sa mismong organisasyon at sa disiplina nito.
Bagama't hindi kami makakatulong sa mga pagbabago sa patakaran ng organisasyon, makakatulong kami na maunawaan ang mga bahagi ng BI ng isang organisasyon, ang arkitektura nito, at kung paano pinapadali ng teknolohiya ng IBM ang pagbuo nito.
Ang pangalawang hadlang na malalagpasan ay ang kakulangan ng pinagsama-samang teknolohiya at ang kaalaman sa isang pamamaraan na nagpapaalala sa buong espasyo ng BI kumpara sa isang maliit na bahagi lamang.

Ang IBM ay tumutugon sa mga pagbabago sa teknolohiya ng pagsasama. Responsibilidad mong magbigay ng mulat na pagpaplano. Ang arkitektura na ito ay dapat na binuo gamit ang teknolohiyang pinili para sa walang limitasyong pagsasama, o sa pinakakaunti, sa teknolohiya na sumusunod sa mga bukas na pamantayan. Bukod pa rito, dapat tiyakin ng iyong pamamahala sa negosyo na ang negosyo ng BI ay tapos na sa iskedyul at hindi upang payagan ang pagbuo ng mga silo ng impormasyon na nagmumula sa mga agenda, o mga layunin para sa sarili.
Hindi ito nangangahulugan na ang kapaligiran ng BI ay hindi sensitibo upang tumugon sa iba't ibang mga pangangailangan at pangangailangan ng iba't ibang mga gumagamit; sa halip, nangangahulugan ito na ang pagpapatupad ng mga indibidwal na pangangailangan at pangangailangan ay ginagawa para sa kapakinabangan ng buong organisasyon ng BI.
Ang isang paglalarawan ng arkitektura ng organisasyon ng BI ay matatagpuan sa pahina 9 sa Figure 1.1. Ang arkitektura ay nagpapakita ng isang mayamang timpla ng mga teknolohiya at pamamaraan.
Mula sa tradisyonal na view, kasama sa arkitektura ang mga sumusunod na bahagi ng bodega

Layer ng Atomic.

Ito ang pundasyon, ang puso ng buong DW at samakatuwid ng madiskarteng pag-uulat.
I data na nakaimbak dito ay mananatili sa makasaysayang integridad, mga ulat ng data at kasama sa mga ito ang mga nagmula na sukatan, pati na rin ang paglilinis, pagsasama, at pag-imbak gamit ang mga template ng pag-extract.
Lahat ng kasunod na paggamit ng mga ito data at ang kaugnay na impormasyon ay nagmula sa pasilidad na ito. Ito ay isang mahusay na mapagkukunan para sa pagkuha ng data at para sa mga ulat na may structured SQL query

Operasyong deposito ng data o base ng ulat ng data(Operational data store (ODS) o pag-uulat database.)

Ito ay isang istraktura ng data partikular na idinisenyo para sa teknikal na pagbibigay ng senyas.

I data na nakaimbak at naiulat sa itaas ang mga istrukturang ito ay maaaring magpalaganap sa bodega sa pamamagitan ng staging area, kung saan maaari itong magamit para sa madiskarteng pag-uulat.

Lugar ng pagtatanghal ng dula.

Ang unang hinto para sa karamihan data inilaan para sa kapaligiran ng warehouse ay ang zone ng organisasyon.
Dito i data sila ay isinama, nililinis at binago sa data mga kita na mamumuno sa istraktura ng bodega

Date marts.

Ang bahaging ito ng arkitektura ay kumakatawan sa istruktura ng data partikular na ginagamit para sa OLAP. Ang pagkakaroon ng datamarts, kung i data sila ay naka-imbak sa magkakapatong na mga diagram ng bituin data multidimensional sa isang relational na kapaligiran, o sa mga file ng data Ang nakalaan na ginagamit ng partikular na teknolohiya ng OLAP, gaya ng DB2 OLAP server, ay hindi nauugnay.

Ang tanging hadlang ay ang arkitektura ay nagpapadali sa paggamit ng data multidimensional.
Kasama rin sa arkitektura ang mga kritikal na teknolohiya at diskarte ng Bi na namumukod-tangi bilang:

Spatial na pagsusuri

Ang espasyo ay isang windfall ng impormasyon para sa analyst at kritikal upang makumpleto ang paglutas. Maaaring kumatawan ang espasyo ng impormasyon tungkol sa mga taong naninirahan sa isang partikular na lokasyon, gayundin ang impormasyon tungkol sa kung saan pisikal na nauugnay ang lokasyong iyon sa ibang bahagi ng mundo.

Upang maisagawa ang pagsusuring ito, dapat kang magsimula sa pamamagitan ng pagbubuklod ng iyong impormasyon sa mga coordinate ng latitude at longitude. Ito ay tinutukoy bilang "geocoding" at dapat ay bahagi ng proseso ng pagkuha, pagbabago, at paglo-load (ETL) sa atomic na antas ng iyong bodega.

Pagmimina ng data.

Ang pagkuha ng data nagbibigay-daan sa aming mga kumpanya na palaguin ang bilang ng mga customer, upang mahulaan ang mga uso sa pagbebenta at payagan ang pamamahala ng mga relasyon sa mga customer (CRM), bukod sa iba pang mga inisyatiba ng BI.

Ang pagkuha ng data ito ay dapat samakatuwid ay isinama sa mga istruktura ng data ng DWHouse at sinusuportahan ng mga proseso ng bodega upang tiyakin ang parehong epektibo at mahusay na paggamit ng teknolohiya at mga kaugnay na pamamaraan.

Tulad ng ipinahiwatig sa arkitektura ng BI, ang atomic na antas ng DWHouse, pati na rin ang mga datamart, ay isang mahusay na mapagkukunan ng data para sa pagkuha. Ang parehong mga pasilidad na iyon ay dapat ding mga tatanggap ng mga resulta ng pagkuha upang matiyak ang kakayahang magamit sa pinakamalawak na madla.

Mga ahente.

Mayroong iba't ibang mga ahente upang suriin ang customer para sa bawat punto tulad ng, mga operating system ng kumpanya at ang dw mismo. Ang mga ahente na ito ay maaaring mga advanced na neural network na sinanay upang matutunan ang tungkol sa mga trend ng bawat punto, tulad ng hinaharap na pangangailangan ng produkto batay sa mga promosyon sa pagbebenta, mga engine na nakabatay sa panuntunan upang tumugon sa isang dato hanay ng mga pangyayari, o kahit na mga simpleng ahente na nag-uulat ng mga pagbubukod sa "mga nangungunang executive". Ang mga prosesong ito ay karaniwang nangyayari sa real time at, samakatuwid, ay dapat na malapit na isinama sa paggalaw ng pareho data. Ang lahat ng mga istrukturang ito ng data, tinitiyak ng mga teknolohiya at diskarte na hindi ka magpapalipas ng gabi sa pagbuo ng isang organisasyon ng iyong BI.

Ang aktibidad na ito ay bubuo sa mga incremental na hakbang, sa pamamagitan ng maliliit na puntos.
Ang bawat hakbang ay isang independiyenteng pagsisikap ng proyekto, at tinutukoy bilang isang pag-ulit sa iyong dw o BI na inisyatiba. Maaaring kabilang sa mga pag-ulit ang pagpapatupad ng mga bagong teknolohiya, simula sa mga bagong pamamaraan, pagdaragdag ng mga bagong istruktura ng data , naglo-load i data karagdagang, o sa pamamagitan ng pagpapalawak ng analytics ng iyong kapaligiran. Ang talatang ito ay tinalakay nang mas detalyado sa Kabanata 3.

Bilang karagdagan sa mga tradisyunal na istruktura ng DW at mga tool ng BI, mayroong iba pang mga function ng iyong organisasyong BI na kailangan mong idisenyo, tulad ng:

Mga touch point ng customer (Customer touch puntos).

Tulad ng anumang modernong organisasyon, mayroong ilang mga touchpoint ng customer na nagpapahiwatig kung paano magkaroon ng positibong karanasan para sa iyo mga customer. May mga tradisyunal na channel tulad ng mga merchant, switchboard operator, direct mail, multimedia at advertising press, pati na rin ang pinakabagong mga channel tulad ng email at web, data ang mga produkto na may ilang punto ng kontak ay dapat makuha, dalhin, linisin, baguhin at pagkatapos ay i-populate sa mga pasilidad ng data ng BI.

Mga pangunahing kaalaman sa data operational at user associations (Operational

mga database at komunidad ng gumagamit).
Sa dulo ng mga contact point ng mga customer makikita mo ang mga pangunahing kaalaman ng data aplikasyon ng kumpanya at mga komunidad ng gumagamit. ANG data umiiral ay data tradisyonal na dapat pagsama-samahin at pagsamahin sa data dumadaloy mula sa mga contact point upang matupad ang kinakailangang impormasyon.

Mga analyst. (Analysts)

Ang pangunahing benepisyaryo ng kapaligiran ng BI ay ang analyst. Siya ang nakikinabang sa kasalukuyang pagkuha ng data pagpapatakbo, isinama sa iba't ibang mga mapagkukunan ng data , na dinagdagan ng mga feature gaya ng geographic analysis (geocoding) at ipinakita sa mga teknolohiyang BI na nagbibigay-daan sa iyong mag-extract, OLAP, advanced na SQL reporting at geographic analysis. Ang pangunahing interface ng analyst sa kapaligiran ng pag-uulat ay ang BI portal.

Gayunpaman, hindi lamang ang analyst ang nakikinabang sa arkitektura ng BI.
Mga executive, malalaking asosasyon ng gumagamit, at maging mga kasosyo, mga supplier at i mga customer dapat silang makahanap ng mga benepisyo sa enterprise BI.

Back feed loop.

Ang arkitektura ng BI ay isang kapaligiran sa pag-aaral. Ang isang katangiang prinsipyo ng pag-unlad ay upang payagan ang patuloy na mga istruktura ng data na ma-update gamit ang teknolohiyang BI na ginamit at sa pamamagitan ng mga aksyon ng user. Ang isang halimbawa ay pagsusuri ng customer (pagmamarka ng customer).

Kung ang departamento ng pagbebenta ay gagawa ng modelo ng pagmimina ng mga marka ng customer upang gumamit ng bagong serbisyo, kung gayon ang departamento ng pagbebenta ay hindi dapat ang tanging pangkat na nakikinabang mula sa serbisyo.

Sa halip, ang modelo ng pagmimina ay dapat isagawa bilang isang natural na bahagi ng daloy ng data sa loob ng kumpanya at ang mga marka ng customer ay dapat maging isang pinagsamang bahagi ng konteksto ng impormasyon ng bodega, na nakikita ng lahat ng mga gumagamit. IBM's Suite of Bi-bi-centric kabilang ang DB2 UDB, DB2 OLAP Server ang karamihan sa mga pangunahing bahagi ng teknolohiya, na tinukoy sa Figure 1.1.

Gumagamit kami ng arkitektura tulad ng makikita sa figure na ito sa aklat upang bigyan kami ng antas ng pagpapatuloy at ipakita kung paano umaangkop ang bawat produkto ng IBM sa pangkalahatang balangkas ng BI.

Pagbibigay ng Nilalaman ng Impormasyon (Pagbibigay Nilalaman ng Impormasyon)

Ang pagdidisenyo, pagbuo, at pagpapatupad ng iyong kapaligiran sa BI ay isang nakakatakot na gawain. Dapat yakapin ng disenyo ang kasalukuyan at hinaharap na mga kinakailangan sa negosyo. Ang disenyo ng arkitektura ay dapat na kumpleto upang maisama ang lahat ng mga konklusyon na natagpuan sa yugto ng disenyo. Ang pagpapatupad ay dapat manatiling nakatuon sa isang layunin: upang bumuo ng arkitektura ng BI bilang pormal na ipinakita sa disenyo at batay sa mga kinakailangan sa negosyo.

Ito ay partikular na mahirap na magtaltalan na ang disiplina ay magtitiyak ng kamag-anak na tagumpay.
Ito ay simple dahil hindi ka nagkakaroon ng BI environment ng biglaan, ngunit gawin ito sa maliliit na hakbang sa paglipas ng panahon.

Gayunpaman, ang pagtukoy sa mga bahagi ng BI ng iyong arkitektura ay mahalaga para sa dalawang dahilan: Gagabayan mo ang lahat ng kasunod na mga teknikal na desisyon sa arkitektura.
Magagawa mong sinasadya na magdisenyo ng isang partikular na paggamit ng teknolohiya kahit na maaaring hindi ka makaulit na nangangailangan ng teknolohiya sa loob ng ilang buwan.

Ang sapat na pag-unawa sa iyong mga kinakailangan sa negosyo ay makakaapekto sa uri ng mga produktong nakukuha mo para sa iyong arkitektura.
Tinitiyak ng disenyo at pag-unlad ng iyong arkitektura na ang iyong bodega ay

hindi isang random na kaganapan, ngunit sa halip ay isang "pinag-isipang mabuti", maingat na ginawang patalastas opera ng sining bilang mosaic ng halo-halong teknolohiya.

Idisenyo ang nilalaman ng impormasyon

Ang lahat ng paunang disenyo ay dapat tumuon sa at tukuyin ang mga pangunahing bahagi ng BI na kakailanganin ng pangkalahatang kapaligiran ngayon at sa hinaharap.
Ang pag-alam sa Mga Kinakailangan sa Negosyo ay mahalaga.

Bago pa man magsimula ang lahat ng pormal na pagpaplano, ang tagaplano ng proyekto ay maaaring matukoy kaagad ang isa o dalawang bahagi.
Ang balanse ng mga bahagi na maaaring kailanganin para sa iyong arkitektura, gayunpaman, ay hindi madaling mahanap. Sa yugto ng disenyo, ang pangunahing bahagi ng arkitektura ay nag-uugnay sa application development session (JAD) sa isang paghahanap upang matukoy ang mga kinakailangan sa negosyo.

Minsan ang mga kinakailangang ito ay maaaring ipagkatiwala sa mga tool sa pagtatanong at pag-uulat.
Halimbawa, sinasabi ng mga user na kung gusto nilang kasalukuyang i-automate ang isang ulat dapat silang manu-manong bumuo sa pamamagitan ng pagsasama ng dalawang kasalukuyang ulat at pagdaragdag ng mga kalkulasyon na nagmula sa kumbinasyon ng data.
Bagama't simple ang kinakailangang ito, tinutukoy nito ang ilang functionality ng feature na dapat mong isama kapag bumibili ng mga tool sa pag-uulat para sa iyong organisasyon.

Dapat ding ituloy ng taga-disenyo ang mga karagdagang kinakailangan upang makakuha ng kumpletong larawan. Gusto ba ng mga user na mag-subscribe sa ulat na ito?
Ang mga subset ba ng ulat ay nabuo at nai-email sa iba't ibang mga user? Gustong makita ang ulat na ito sa portal ng kumpanya? Ang lahat ng kinakailangang ito ay bahagi ng simpleng pangangailangan na palitan ang isang manu-manong ulat ayon sa kinakailangan ng mga user. Ang pakinabang ng mga ganitong uri ng mga kinakailangan ay ang lahat, mga user at taga-disenyo, ay may pag-unawa sa konsepto ng mga ulat.

Mayroong iba pang mga uri ng negosyo, gayunpaman, na kailangan nating planuhin. Kapag ang mga kinakailangan sa negosyo ay nakasaad sa anyo ng mga madiskarteng tanong sa negosyo, madali para sa may karanasan na taga-disenyo na matukoy ang sukat / katotohanan at mga kinakailangan sa dimensional.

Kung ang mga gumagamit ng JAD ay hindi alam kung paano ipahayag ang kanilang mga kinakailangan sa anyo ng isang problema sa negosyo, ang taga-disenyo ay madalas na magbibigay ng mga halimbawa upang simulan ang session ng pagkolekta ng mga kinakailangan.
Matutulungan ng ekspertong taga-disenyo ang mga user na maunawaan hindi lamang ang madiskarteng kalakalan, kundi pati na rin kung paano ito sanayin.
Ang diskarte sa pangangalap ng mga kinakailangan ay tinalakay sa kabanata 3; sa ngayon gusto lang naming ituro ang pangangailangan na magdisenyo para sa lahat ng uri ng mga kinakailangan sa BI.

Ang isang madiskarteng problema sa negosyo ay hindi lamang isang pangangailangan sa negosyo, kundi pati na rin isang palatandaan ng disenyo. Kung kailangan mong sagutin ang isang multidimensional na tanong, kailangan mong isaulo, ipakita ang data mga sukat, at kung kailangan mong mag-imbak ng i data multidimensional, kailangan mong magpasya kung anong uri ng teknolohiya o pamamaraan ang iyong gagamitin.

Nagpapatupad ka ba ng nakareserbang cube star scheme, o pareho? Tulad ng nakikita mo, kahit na ang isang simpleng problema sa negosyo ay maaaring makaapekto nang malaki sa disenyo. Ngunit ang mga ganitong uri ng mga kinakailangan sa negosyo ay karaniwan at siyempre, hindi bababa sa mga may karanasan na mga tagaplano at taga-disenyo ng proyekto.

Nagkaroon ng sapat na debate tungkol sa mga teknolohiya at suporta ng OLAP, at isang malawak na hanay ng mga solusyon ang magagamit. Sa ngayon, binanggit namin ang pangangailangang pagsamahin ang simpleng pag-uulat sa mga dimensyong kinakailangan sa negosyo, at kung paano nakakaimpluwensya ang mga kinakailangang ito sa mga teknikal na desisyon sa arkitektura.

Ngunit ano ang mga kinakailangan na hindi madaling maunawaan ng mga gumagamit o ng koponan ng DW? Kakailanganin mo ba ang spatial analysis?
Ang mga modelo ng pagmimina ng data magiging mahalagang bahagi ba sila ng iyong kinabukasan? Sino ang nakakaalam?

Mahalagang tandaan na ang mga uri ng teknolohiyang ito ay hindi kilala ng mga pangkalahatang komunidad ng gumagamit at mga miyembro ng koponan ng DW, sa bahagi nito ay maaaring dahil ang mga ito ay karaniwang pinangangasiwaan ng ilang in-house o third-party na teknikal na eksperto. Ito ay isang matinding kaso ng mga problema na nabubuo ng mga ganitong uri ng teknolohiya. Kung hindi mailarawan ng mga user ang mga kinakailangan sa negosyo o mai-frame ang mga ito sa paraang nagbibigay ng mga alituntunin sa mga taga-disenyo, maaari silang hindi mapansin o, mas masahol pa, hindi na lang pinansin.

Nagiging mas problemado kapag hindi makilala ng taga-disenyo at developer ang aplikasyon ng isa sa mga advanced ngunit kritikal na teknolohiyang ito.
Gaya ng madalas nating marinig na sinasabi ng mga Designer, “well, bakit hindi natin ito isantabi hanggang sa makuha natin ito? “Interesado ba talaga sila sa priorities, o umiiwas lang sila sa mga requirements na hindi nila naiintindihan? Ito ay malamang na ang huling hypothesis. Sabihin nating ang iyong koponan sa pagbebenta ay nakipag-ugnayan sa isang kinakailangan sa negosyo, tulad ng nakasaad sa Figure 1.3, tulad ng nakikita mo, ang kinakailangan ay nakabalangkas sa anyo ng isang problema sa negosyo. Ang pagkakaiba sa pagitan ng problemang ito at ng tipikal na dimensional na problema ay ang distansya. Sa kasong ito, gustong malaman ng grupo ng benta, sa buwanang batayan, ang kabuuang benta mula sa mga produkto, bodega at mga customer na nakatira sa loob ng 5 milya mula sa bodega kung saan sila namimili.

Nakalulungkot, maaaring balewalain ng mga designer o arkitekto ang spatial component sa pamamagitan ng pagsasabing, "Nasa atin ang customer, ang produkto at ang data ng deposito. Panatilihin natin ang distansya hanggang sa isa pang pag-ulit.

"Maling sagot. Ang ganitong uri ng problema sa negosyo ay ganap na tungkol sa BI. Kinakatawan nito ang isang mas malalim na pag-unawa sa aming negosyo at isang matatag na espasyo sa analytics para sa aming mga analyst. Ang BI ay lampas sa simpleng query o karaniwang pag-uulat, o kahit OLAP. Hindi ito nangangahulugan na ang mga teknolohiyang ito ay hindi mahalaga sa iyong BI, ngunit nag-iisa ang mga ito ay hindi kumakatawan sa kapaligiran ng BI.

Disenyo para sa konteksto ng impormasyon (Pagdidisenyo para sa Nilalaman ng Impormasyon)

Ngayong natukoy na natin ang mga kinakailangan sa Negosyo na nakikilala ang iba't ibang pangunahing bahagi, dapat na isama ang mga ito sa isang pangkalahatang disenyo ng arkitektura. Ang ilan sa mga bahagi ng BI ay bahagi ng aming unang pagsisikap, habang ang ilan ay hindi ipapatupad sa loob ng ilang buwan.

Gayunpaman, ang lahat ng kilalang kinakailangan ay makikita sa disenyo upang kapag kailangan nating ipatupad ang isang partikular na teknolohiya, handa tayong gawin ito. Ang isang bagay tungkol sa disenyo ay magpapakita ng tradisyonal na pag-iisip.

Itong set ng data ay ginagamit upang suportahan ang mga huling paggamit ng data mga sukat na ginagabayan ng mga isyu sa Negosyo na natukoy namin. Habang ang mga karagdagang dokumento ay nabuo, tulad ng pagbuo ng disenyo ng data, magsisimula tayong gawing pormal kung paano i data kumalat sila sa kapaligiran. Natiyak namin ang pangangailangan na kumatawan sa data dimensionally, paghahati sa kanila (ayon sa mga partikular na partikular na pangangailangan) sa data marts.

Ang susunod na tanong na sasagutin ay: paano itatayo ang mga data mart na ito?
Binubuo mo ba ang mga bituin upang suportahan ang mga cube, o mga cube lamang, o mga bituin lamang? (o kanang mga cube, o kanang mga bituin). Bumuo ng arkitektura para sa mga umaasang data mart na nangangailangan ng atomic layer para sa lahat data aquisites? Payagan ang mga independiyenteng data mart na makakuha data direkta mula sa mga operating system?

Anong teknolohiya ng kubo ang susubukan mong i-standardize?

Mayroon kang napakalaking dami ng mga diyos data kailangan para sa dimensional analysis o kailangan mo ba ng mga cube mula sa iyong pambansang sales force sa lingguhan o pareho? Gumagawa ka ba ng isang malakas na bagay tulad ng DB2 OLAP Server para sa pananalapi o Cognos PowerPlay cube para sa iyong organisasyon sa pagbebenta o pareho? Ito ang malalaking desisyon sa disenyo ng arkitektura na makakaapekto sa iyong kapaligiran sa BI mula rito. Oo, natukoy mo ang pangangailangan para sa OLAP. Ngayon paano mo gagawin ang ganoong uri ng pamamaraan at teknolohiya?

Paano nakakaapekto ang ilan sa mga mas advanced na teknolohiya sa iyong mga disenyo? Ipagpalagay natin na natiyak mo ang isang spatial na pangangailangan sa iyong organisasyon. Ngayon ay kailangan mong alalahanin ang mga edisyon sa pagguhit ng arkitektura kahit na hindi mo planong gumawa ng mga spatial na bahagi sa loob ng ilang buwan. Ang arkitekto ay dapat magdisenyo ngayon batay sa kung ano ang kailangan. Hulaan ang pangangailangan para sa spatial analysis na bumubuo, nag-iimbak, gumagawa at nagbibigay ng access sa data spatial. Ito naman ay dapat magsilbi bilang isang hadlang patungkol sa uri ng teknolohiya ng software at mga detalye ng platform na maaari mong isaalang-alang sa kasalukuyan. Halimbawa, ang sistema ng pangangasiwa ng base ng datos Ang Relational Relational (RDBMS) na gagawin mo para sa iyong atomic layer ay dapat mayroong available na matatag na spatial extension. Titiyakin nito ang pinakamataas na pagganap kapag gumagamit ng geometry at spatial na mga bagay sa iyong mga analytical na application. Kung hindi mahawakan ng iyong RDBMS ang data (spatial-centric) sa loob, kaya kailangan mong magtatag ng a base ng datos (spatial-centric) panlabas. Pinapalubha nito ang pamamahala ng mga edisyon at nakompromiso ang iyong pangkalahatang pagganap, hindi pa banggitin ang mga karagdagang problemang nabuo para sa iyong mga DBA, dahil malamang na mayroon silang kaunting pag-unawa sa mga pangunahing kaalaman ng data space din. Sa kabilang banda, kung pinangangasiwaan ng iyong RDMBS engine ang lahat ng spatial na bahagi at alam ng optimizer nito ang mga espesyal na pangangailangan (hal., pag-index) ng mga spatial na bagay, kung gayon ang iyong mga DBA ay maaaring pangasiwaan ang pamamahala ng mga isyu kaagad at maaari mong i-maximize ang pagganap .

Gayundin, kailangan mong ayusin ang staging area (scene area) at atomic environment layer para isama ang address cleanup (a

pangunahing elemento sa spatial analysis), pati na rin ang kasunod na pag-save ng mga spatial na bagay. Ang sunud-sunod na mga edisyon ng disenyo ay nagpapatuloy ngayong ipinakilala namin ang paniwala ng kalinisan ng address. Sa isang bagay, ang application na ito ay magdidikta ng uri ng software na kailangan para sa iyong pagsisikap sa ETL.

Kailangan mo ba ng mga produkto tulad ng Trillium upang mabigyan ka ng malinis na address, o isang ETL provider na iyong pinili upang ibigay ang functionality na iyon?
Sa ngayon, mahalagang pahalagahan mo ang antas ng disenyo na dapat kumpletuhin bago mo simulan ang pagtatayo ng iyong kapaligiran (warehouse). Ang mga halimbawa sa itaas ay dapat magpakita ng maraming desisyon sa disenyo na dapat sumunod sa pagkakakilanlan ng anumang partikular na pangangailangan sa negosyo. Kapag ginawa nang tama, ang mga desisyon sa disenyo na ito ay nagtataguyod ng pagtutulungan sa pagitan ng mga pisikal na istruktura ng iyong kapaligiran, ang pagpili ng teknolohiyang ginamit, at ang daloy ng pagpapalaganap ng nilalaman ng impormasyon. Kung wala itong kumbensyonal na arkitektura ng BI, ang iyong organisasyon ay sasailalim sa isang magulong halo ng mga kasalukuyang teknolohiya, sa pinakamaganda, maluwag na pinagsama upang magbigay ng maliwanag na katatagan.

Panatilihin ang nilalaman ng impormasyon

Ang pagdadala ng halaga ng impormasyon sa iyong organisasyon ay isang napakahirap na gawain. Kung walang sapat na pag-unawa at karanasan, o wastong pagpaplano at pagguhit, kahit na ang pinakamahusay na mga koponan ay mabibigo. Sa kabilang banda, kung mayroon kang mahusay na intuwisyon at detalyadong pagpaplano ngunit walang disiplina na dapat isagawa, sinayang mo lang ang iyong pera at oras dahil ang iyong pagsusumikap ay tiyak na mabibigo. Dapat malinaw ang mensahe: Kung kulang ka sa isa o higit pa sa mga kasanayang ito, pag-unawa / karanasan o disenyo / disenyo o disiplina sa pagpapatupad, ito ay mapilayan o sisira sa gusali ng organisasyon ng BI.

Sapat bang handa ang iyong koponan? Mayroon bang sinuman sa iyong BI team na nakakaunawa sa malawak na analytical landscape na available sa mga BI environment, ang mga diskarte at teknolohiyang kinakailangan para ipatupad ang landscape na iyon? Mayroon bang sinuman sa iyong koponan na makakakilala sa pagkakaiba ng aplikasyon sa pagitan ng advanced

static na pag-uulat at OLAP, o ang mga pagkakaiba sa pagitan ng ROLAP at OLAP? Malinaw bang kinikilala ng isa sa mga miyembro ng iyong koponan kung paano ang pagmimina at kung paano ito maaaring makaapekto sa bodega o kung paano maaaring suportahan ng bodega ang pagganap ng pagmimina? Naiintindihan ng isang miyembro ng pangkat ang halaga ng data space o agent-based na teknolohiya? Mayroon ka bang taong pinahahalagahan ang natatanging aplikasyon ng mga tool ng ETL kumpara sa teknolohiya ng broker ng mensahe? Kung wala ka nito, kumuha ka ng isa. Ang BI ay mas malaki kaysa sa isang normalized na atomic layer, OLAP, mga pattern ng bituin, at isang ODS.

Ang pagkakaroon ng pag-unawa at karanasan upang makilala ang mga kinakailangan ng BI at ang kanilang mga solusyon ay mahalaga sa iyong kakayahang maayos na gawing pormal ang mga pangangailangan ng user at magdisenyo at ipatupad ang kanilang mga solusyon. Kung nahihirapan ang iyong komunidad ng mga user na ilarawan ang mga kinakailangan, nasa warehouse team na ang magbigay ng pag-unawang iyon. Pero kung ang warehouse team

hindi kinikilala ang partikular na aplikasyon ng BI - halimbawa, pagmimina ng data - kung gayon hindi ito ang pinakamagandang bagay na ang mga kapaligiran ng BI ay kadalasang limitado sa pagiging passive na mga repositoryo. Gayunpaman, ang pagbalewala sa mga teknolohiyang ito ay hindi nakakabawas sa kahalagahan nito at sa epekto ng mga ito sa paglitaw ng mga kakayahan sa business intelligence ng iyong organisasyon, pati na rin ang mga asset ng impormasyon na pinaplano mong i-promote.

Dapat isama ng disenyo ang paniwala ng disenyo, at parehong nangangailangan ng karampatang indibidwal. Bilang karagdagan, ang pagdidisenyo ay nangangailangan ng pilosopiya ng bahay-bahay at pagsunod sa mga pamantayan. Halimbawa, kung ang iyong kumpanya ay nagtatag ng isang karaniwang platform o natukoy ang isang partikular na RDBMS na gusto nilang i-standardize sa buong platform, tungkulin ng lahat sa koponan na sumunod sa mga pamantayang iyon. Sa pangkalahatan, inilalantad ng isang koponan ang pangangailangan para sa normalisasyon (sa mga komunidad ng gumagamit), ngunit ang koponan mismo ay hindi gustong sumunod sa mga pamantayang itinatag sa ibang mga lugar sa kumpanya o marahil sa mga katulad na kumpanya. Hindi lamang ito mapagkunwari, ngunit tinitiyak nito na hindi kayang samantalahin ng kompanya ang mga kasalukuyang mapagkukunan at pamumuhunan. Hindi ito nangangahulugan na walang mga sitwasyon na ginagarantiyahan ang isang hindi pamantayang plataporma o teknolohiya; gayunpaman, ang mga pagsisikap ng bodega

dapat nilang mainggit na protektahan ang mga pamantayan ng kompanya hanggang sa iba ang idikta ng mga kinakailangan sa negosyo.

Ang ikatlong pangunahing sangkap na kailangan upang bumuo ng isang organisasyon ng BI ay disiplina.
Ito ay nakasalalay sa kabuuan, pantay sa mga indibidwal at sa kapaligiran. Ang mga tagaplano ng proyekto, mga sponsor, arkitekto, at mga gumagamit ay dapat pahalagahan ang disiplina na kinakailangan upang mabuo ang istraktura ng impormasyon ng kumpanya. Dapat idirekta ng mga taga-disenyo ang kanilang mga pagsisikap sa proyekto sa paraang makadagdag sa iba pang kinakailangang pagsisikap sa lipunan.

Halimbawa, ipagpalagay na ang iyong kumpanya ay bumuo ng isang ERP application na may bahagi ng warehouse.
Samakatuwid, responsibilidad ng mga taga-disenyo ng ERP na makipagtulungan sa pangkat ng kapaligiran ng warehouse upang hindi makipagkumpitensya o madoble ang gawaing nasimulan na.

Ang disiplina ay isa ring paksa na dapat sakupin ng buong organisasyon at karaniwang itinatag at ipinagkatiwala sa antas ng ehekutibo.
Handa ba ang mga executive na sumunod sa isang dinisenyong diskarte? Isang diskarte na nangangako na lumikha ng nilalaman ng impormasyon na sa huli ay magdadala ng halaga sa lahat ng bahagi ng negosyo, ngunit maaaring ikompromiso ang mga indibidwal o mga agenda ng departamento? Tandaan ang kasabihang "Ang pag-iisip tungkol sa lahat ay mas mahalaga kaysa sa pag-iisip tungkol sa isang bagay". Totoo ang kasabihang ito para sa mga organisasyon ng BI.

Sa kasamaang-palad, maraming warehouse ang tumutuon sa kanilang mga pagsisikap na sinusubukang i-target at bigyan ng halaga ang isang partikular na departamento o partikular na mga user, na may maliit na pagsasaalang-alang sa organisasyon sa pangkalahatan. Ipagpalagay na ang executive ay humiling ng tulong mula sa pangkat ng werehouse. Tumutugon ang team sa pamamagitan ng 90-araw na trabaho na kasama hindi lamang ang paghahatid ng mga kinakailangan sa notification na tinukoy ng executive ngunit ang pagtiyak na ang lahat data base ay halo-halong sa atomic na antas bago ipinakilala sa iminungkahing teknolohiya ng kubo.
Tinitiyak ng karagdagan sa engineering na ito na makikinabang ang werehouse firm mula sa data kailangan para sa manager.
Gayunpaman, ang ehekutibo ay nakipag-usap sa mga panlabas na pagkonsulta na nagmungkahi ng isang katulad na aplikasyon sa paghahatid sa mas mababa sa 4 na linggo.

Ipagpalagay na ang panloob na pangkat ng werehouse ay may kakayahan, ang ehekutibo ay may pagpipilian. Yaong maaaring suportahan ang karagdagang disiplina sa engineering na kinakailangan upang mapangalagaan ang asset ng impormasyon ng enterprise o maaaring piliin na ipatupad ang kanilang sariling solusyon nang mabilis. Ang huli ay tila masyadong madalas na pinili at ginagamit lamang upang lumikha ng mga lalagyan ng impormasyon na iilan lamang o ang nag-iisang nakikinabang.

Maikli at pangmatagalang layunin

Dapat gawing pormal ng mga arkitekto at taga-disenyo ng proyekto ang isang pangmatagalang pagtingin sa pangkalahatang arkitektura at mga planong lumago sa isang organisasyong BI. Ang kumbinasyong ito ng panandaliang pakinabang at pangmatagalang pagpaplano ay kumakatawan sa dalawang mukha ng mga pagsisikap ng BI. Ang panandaliang pakinabang ay ang BI facet na nauugnay sa mga pag-ulit ng iyong bodega.

Dito nakatuon ang mga designer, arkitekto, at sponsor sa pagtugon sa mga partikular na kinakailangan sa komersyo. Nasa antas na ito kung saan itinatayo ang mga pisikal na istruktura, binibili ang teknolohiya at ipinapatupad ang mga pamamaraan. Ang mga ito ay hindi ginawa upang matugunan ang mga partikular na kinakailangan gaya ng tinukoy ng mga partikular na komunidad ng gumagamit. Ginagawa ang lahat upang matugunan ang mga partikular na pangangailangan na tinukoy ng isang partikular na komunidad.
Ang pangmatagalang pagpaplano, gayunpaman, ay ang iba pang aspeto ng BI. Dito tiniyak ng mga plano at proyekto na ang anumang pisikal na istraktura ay itinayo, ang mga teknolohiyang pinili at ang mga diskarteng ipinatupad na ginawa nang may pansin sa negosyo. Ang pangmatagalang pagpaplano ang nagbibigay ng pagkakaisa na kailangan upang matiyak na ang mga benepisyo ng negosyo ay nakukuha mula sa anumang panandaliang mga pakinabang na natagpuan.

I-justify ang iyong pagsisikap sa BI

Un data bodega sa sarili nitong wala itong taglay na halaga. Sa madaling salita, walang likas na halaga sa pagitan ng mga teknolohiya ng bodega at mga diskarte sa pagpapatupad.

Ang halaga ng anumang pagsusumikap sa warehouse ay makikita sa mga pagkilos na ginawa bilang resulta ng kapaligiran ng warehouse at nilalaman ng impormasyon na lumago sa paglipas ng panahon. Ito ay isang kritikal na punto na dapat maunawaan bago mo subukang tantyahin ang halaga ng anumang inisyatiba sa wherehouse.

Kadalasan, sinusubukan ng mga arkitekto at designer na maglapat ng halaga sa mga pisikal at teknikal na bahagi ng bodega kapag ang halaga ay batay sa mga proseso ng negosyo na positibong naaapektuhan ng bodega at mahusay na nakuhang impormasyon.

Dito nakasalalay ang hamon sa found BI: Paano mo binibigyang-katwiran ang pamumuhunan? Kung ang wherehouse mismo ay walang intrinsic na halaga, ang mga taga-disenyo ng proyekto ay dapat mag-imbestiga, tukuyin at gawing pormal ang mga benepisyong nakamit ng mga indibidwal na gagamit ng bodega upang mapabuti ang mga partikular na proseso ng negosyo o ang halaga ng protektadong impormasyon o pareho.

Upang gawing kumplikado ang mga bagay, ang anumang komersyal na proseso na apektado ng strain ng warehouse ay maaaring magbigay ng "malaki" o "slight" na mga benepisyo. Ang malaking benepisyo ay nagbibigay ng isang tiyak na sukatan para sa pagsukat ng return on investment (ROI) - halimbawa, ang paggawa ng imbentaryo ng karagdagang oras sa isang partikular na panahon o para sa mas mababang halaga ng transportasyon sa bawat kargamento. Ang maliliit na benepisyo, tulad ng pinahusay na pag-access sa impormasyon, ay mas mahirap tukuyin sa mga tuntunin ng nasasalat na halaga.

Ikonekta ang iyong proyekto upang malaman ang Mga kahilingan sa negosyo

Kadalasan, sinusubukan ng mga taga-disenyo ng proyekto na iugnay ang halaga ng bodega sa mga walang hugis na layunin ng kumpanya. Sa pamamagitan ng pagdedeklara na "ang halaga ng isang bodega ay nakabatay sa aming kakayahang matugunan ang mga madiskarteng kahilingan" binubuksan namin ang talakayan sa isang kaaya-ayang paraan. Ngunit iyon lamang ay hindi sapat upang matukoy kung ang pamumuhunan sa imbentaryo ay may katuturan. Pinakamainam na i-link ang mga pag-uulit ng warehouse sa mga partikular at kilalang kahilingan sa negosyo.

Sukatin ang ROI

Ang pagkalkula ng ROI sa isang setup ng warehouse ay maaaring maging partikular na mahirap. Ito ay lalong mahirap kung ang kalamangan

punong-guro ng isang partikular na pag-uulit ay isang bagay na hindi mahahawakan o madaling sukatin. Nalaman ng isang pag-aaral na nakikita ng mga user ang dalawang pangunahing benepisyo ng mga inisyatiba ng BI:

▪ Lumikha ng kakayahang gumawa ng mga desisyon
▪ Lumikha ng access sa impormasyon
Ang mga perk na ito ay soft (o mild) perk. Madaling makita kung paano namin makalkula ang isang ROI batay sa isang mas mahirap (o mas malaki) na bentahe tulad ng pagbawas sa gastos ng transportasyon, ngunit paano namin sinusukat ang kakayahang gumawa ng mas mahusay na mga desisyon?
Ito ay tiyak na isang hamon para sa mga taga-disenyo ng proyekto kapag sinusubukan nilang makuha ang kumpanya na mamuhunan sa isang partikular na pagsisikap sa bodega. Ang pagtaas ng mga benta o pagbaba ng mga gastos ay hindi na ang mga pangunahing tema na nagtutulak sa kapaligiran ng BI.
Sa halip, naghahanap ka ng mas mahusay na access sa impormasyon sa mga katanungan sa negosyo upang ang isang partikular na departamento ay makagawa ng mas mabilis na mga desisyon. Ito ang mga madiskarteng driver na nagkataon na parehong mahalaga sa negosyo ngunit mas malabo at mas mahirap ilarawan sa isang tiyak na sukatan. Sa kasong ito, ang pagkalkula ng ROI ay maaaring mapanlinlang, kung hindi nauugnay.
Dapat na maipakita ng mga taga-disenyo ng proyekto ang nasasalat na halaga para sa mga executive upang magpasya kung ang pamumuhunan sa isang partikular na pag-uulit ay sulit. Gayunpaman, hindi kami magmumungkahi ng bagong paraan para sa pagkalkula ng ROI, at hindi rin kami gagawa ng anumang mga argumento para sa o laban dito.
Mayroong maraming mga artikulo at aklat na magagamit na tumatalakay sa mga pangunahing kaalaman sa pagkalkula ng ROI. May mga espesyal na panukalang halaga tulad ng halaga sa pamumuhunan (YOU), na inaalok ng mga pangkat tulad ng Gartner, na maaari mong saliksikin. Sa halip, tututuon kami sa mga pangunahing aspeto ng anumang ROI o iba pang mga panukalang halaga na kailangan mong isaalang-alang. Paglalapat ng ROI Bilang karagdagan sa argumento tungkol sa mga benepisyong "mahirap" kumpara sa mga benepisyong "magaan" na nauugnay sa mga pagsusumikap ng BI, may iba pang mga isyu na dapat isaalang-alang kapag nag-aaplay ng ROI. Halimbawa:

Mag-attribute ng masyadong maraming pagtitipid sa mga pagsisikap ng DW na darating pa rin
Sabihin nating lumipat ang iyong kumpanya mula sa isang mainframe architecture patungo sa isang distributed UNIX environment. Kaya ang anumang pagtitipid na maaaring (o maaaring hindi) gawin sa pamamagitan ng pagsisikap na iyon ay hindi dapat maiugnay lamang, kung mayroon man (?), Sa bodega.

Hindi isinasaalang-alang ang lahat ng gastos. At maraming bagay ang dapat isaalang-alang. Isaalang-alang ang sumusunod na listahan:

▪ Gastos ng pagsisimula, kabilang ang pagiging posible.
▪ Halaga ng nakalaang hardware na may kaugnay na storage at mga komunikasyon
▪ Halaga ng software, kabilang ang pamamahala ng data at mga extension ng kliyente / server, ETL software, mga teknolohiya ng DSS, visualization tool, programming at workflow application, at monitoring software,.
▪ Gastos sa disenyo ng istraktura data, kasama ang pagsasakatuparan, at ang pag-optimize ng
▪ Gastos sa pagpapaunlad ng software na direktang nauugnay sa pagsisikap ng BI
▪ Gastos ng suporta sa bahay, kabilang ang pag-optimize ng pagganap, kabilang ang kontrol sa bersyon ng software at mga pagpapatakbo ng tulong Ilapat ang "Big-Bang" ROI. Ang pagtatayo ng bodega bilang isang napakalaking pagsisikap ay tiyak na mabibigo, gayundin ang pagkalkula ng ROI para sa isang malaking inisyatiba ng negosyo Nakakagulat ang alok, at ang mga designer ay patuloy na gumagawa ng mahinang pagtatangka upang tantiyahin ang halaga ng buong pagsisikap . Bakit sinusubukan ng mga tagaplano na maglagay ng halaga sa pananalapi sa inisyatiba ng negosyo kung ito ay malawak na kilala at tinatanggap na ang pagtantya ng mga partikular na pag-uulit ay mahirap? Paano ito posible? Ito ay hindi posible na may ilang mga pagbubukod. Huwag gawin ito. Ngayong naitatag na namin kung ano ang hindi dapat gawin kapag kinakalkula ang ROI, narito ang ilang punto na tutulong sa amin na tukuyin ang isang maaasahang proseso para sa pagtantya ng halaga ng iyong mga pagsusumikap sa BI.

Pagkuha ng ROI Consent. Anuman ang iyong piniling pamamaraan para sa pagtatantya ng halaga ng iyong mga pagsusumikap sa BI, dapat itong magkasundo ng lahat ng partido, kabilang ang mga tagaplano ng proyekto, mga sponsor, at mga executive ng negosyo.

Bawasan ang ROI sa mga makikilalang bahagi. Ang isang kinakailangang hakbang patungo sa makatwirang pagkalkula ng ROI ay ituon ang pagkalkula na iyon sa isang partikular na proyekto. Binibigyang-daan ka nitong tantyahin ang isang halaga batay sa mga partikular na kinakailangan sa negosyo na natutugunan

Tukuyin ang mga gastos. Tulad ng nabanggit, maraming mga gastos ang kailangang isaalang-alang. Higit pa rito, ang mga gastos ay dapat isama hindi lamang ang mga nauugnay sa iisang pag-ulit kundi pati na rin ang mga gastos na nauugnay sa pagtiyak ng pagsunod sa mga pamantayan ng enterprise.

Tukuyin ang mga benepisyo. Sa pamamagitan ng malinaw na pagli-link ng ROI sa mga partikular na kinakailangan sa negosyo, dapat nating matukoy ang mga benepisyo na hahantong sa pagtugon sa mga kinakailangan.

Bawasan ang mga gastos at benepisyo sa paparating na mga kita. Ito ang pinakamahusay na paraan upang ibabatay ang iyong mga valuation sa net present value (NPV) kumpara sa pagsubok na hulaan ang halaga sa hinaharap sa mga kita sa hinaharap.

Panatilihin ang iyong ROI split time sa pinakamababa. Ito ay mahusay na dokumentado sa katagalan na ginamit ito sa iyong ROI.

Gumamit ng higit sa isang ROI formula. Maraming paraan para sa paghula ng ROI at dapat mong planuhin kung gagamit ng isa o higit pa, kabilang ang net present value, internal rate of return (IRR), at payback.

Tukuyin ang paulit-ulit na proseso. Ito ay mahalaga sa pagkalkula ng anumang pangmatagalang halaga. Ang isang solong nauulit na proseso ay dapat na idokumento para sa lahat ng kasunod na pagkakasunud-sunod ng proyekto.

Ang mga problemang nakalista ay ang pinakakaraniwang problema na tinukoy ng mga dalubhasa sa werehouse. Ang pagpupumilit ng management na maghatid ng “Big-Bang” ROI ay lubhang nakalilito. Kung sisimulan mo ang lahat ng iyong mga kalkulasyon sa ROI sa pamamagitan ng paghahati-hati sa mga ito sa mga makikilala at nakikitang bahagi, mayroon kang magandang pagkakataon sa pagtantya ng tumpak na pagtatasa ng ROI.

Mga tanong tungkol sa mga benepisyo ng ROI

Anuman ang iyong mga benepisyo, malambot man o mahirap, maaari mong gamitin ang ilang pangunahing tanong upang matukoy ang halaga ng mga ito. Halimbawa, gamit ang isang simpleng sistema ng sukat, mula 1 hanggang 10, maaari mong sukatin ang epekto ng anumang pagsisikap gamit ang mga sumusunod na tanong:

Paano mo ire-rate ang pag-unawa sa data bilang resulta ng proyektong ito ng iyong kumpanya?
Paano mo tatantyahin ang mga pagpapabuti ng proseso kasunod ng proyektong ito?
Paano mo susukatin ang epekto ng mga bagong insight at hinuha na ngayon ay ginawang available ng pag-ulit na ito
Ano ang naging epekto ng mga bagong kapaligiran sa computer na may mataas na pagganap bilang resulta ng natutunan? Kung kakaunti ang mga sagot sa mga tanong na ito, posibleng hindi sulit ang puhunan ng kumpanya. Ang mga tanong na may mataas na marka ay tumutukoy sa mga makabuluhang pagtaas sa halaga at dapat magsilbing gabay para sa karagdagang pagsisiyasat. Halimbawa, ang mataas na marka ng pagpapabuti ng proseso ay dapat humantong sa mga taga-disenyo na suriin kung paano napabuti ang mga proseso. Maaari mong makita na ang ilan o lahat ng mga natamo ay nasasalat at samakatuwid ang isang halaga ng pera ay madaling mailapat. Nasusulit ang unang pag-ulit ng bodega Ang pinakamalaking resulta ng iyong pagsusumikap sa negosyo ay madalas sa mga unang pag-ulit. Ang mga maagang pagsisikap na ito ay tradisyonal na nagtatatag ng pinakakapaki-pakinabang na nilalaman ng impormasyon para sa publiko at nagtatatag ng tulong sa pundasyon ng teknolohiya para sa kasunod na mga aplikasyon ng BI. Karaniwan ang bawat kasunod na kasunod ng data Ang mga proyekto sa bodega ay nagdadala ng mas kaunting karagdagang halaga sa negosyo sa kabuuan. Ito ay totoo lalo na kung ang pag-ulit ay hindi nagdaragdag ng mga bagong paksa o hindi nakakatugon sa mga pangangailangan ng isang bagong komunidad ng gumagamit.

Ang tampok na ito ng pag-iimbak ay nalalapat din sa lumalaking stack ng data mga mananalaysay. Dahil ang mga kasunod na pagsisikap ay nangangailangan ng higit pa data at kung paano pa data ay ibinubuhos sa bodega sa paglipas ng panahon, ang karamihan sa data ito ay nagiging hindi gaanong nauugnay sa pagsusuri na ginamit. Ang mga ito data madalas silang tinatawag data natutulog at ito ay palaging mahal upang panatilihin ang mga ito dahil sila ay halos hindi ginagamit.

Ano ang ibig sabihin nito para sa mga sponsor ng proyekto? Sa pangkalahatan, ang mga naunang sponsor ay nagbabahagi ng higit sa mga gastos sa pamumuhunan. Pangunahin ito dahil sila ang nagtulak upang mahanap ang malawak na teknolohikal na kapaligiran at resource layer ng warehouse, kabilang ang organic.

Ngunit ang mga unang hakbang na ito ay nagdadala ng pinakamataas na halaga at samakatuwid ang mga taga-disenyo ng proyekto ay kadalasang kailangang bigyang-katwiran ang pamumuhunan.
Ang mga proyektong ginawa pagkatapos ng iyong BI na inisyatiba ay maaaring may mas mababang gastos (kumpara sa una) at direkta, ngunit mas mababa ang halaga sa kumpanya.

At ang mga may-ari ng organisasyon ay dapat magsimulang isaalang-alang ang pagtatapon ng build-up data at hindi gaanong nauugnay na mga teknolohiya.

Pagmimina ng Data: Pagmimina Dati

Maraming bahagi ng arkitektura ang nangangailangan ng mga pagkakaiba-iba sa mga teknolohiya at pamamaraan ng data mining—
halimbawa, ang iba't ibang "ahente" para sa pagsusuri ng mga punto ng interes ng mga customer, ang mga operating system ng kumpanya at para sa parehong dw. Ang mga ahente na ito ay maaaring mga advanced na neural network na sinanay sa mga uso sa POT, tulad ng hinaharap na pangangailangan ng produkto batay sa mga promosyon sa pagbebenta; mga engine na nakabatay sa panuntunan upang tumugon sa isang set dato mga pangyayari, halimbawa, medikal na diagnosis at mga rekomendasyon sa paggamot; o kahit na mga simpleng ahente na may tungkuling mag-ulat ng mga eksepsiyon sa mga nangungunang executive. Karaniwan ang mga proseso ng pagkuha na ito data si

i-verify sa real time; samakatuwid, dapat silang ganap na magkaisa sa kilusan ng data stessi

Online Analytic Processing Processing

Online na Analytics

Ang kakayahang maghiwa, tumaga, gumulong, mag-drill down, at magsuri
what-if, ay nasa saklaw, ng layunin ng IBM technology suite. Halimbawa, umiiral ang online analytic processing (OLAP) function para sa DB2 na nagdadala ng dimensional analysis sa makina ng database pareho .

Ang mga function ay nagdaragdag ng dimensional na utility sa SQL habang sinasamantala nang husto ang pagiging natural na bahagi ng DB2. Ang isa pang halimbawa ng OLAP integration ay ang extraction tool, DB2 OLAP Server Analyzer. Binibigyang-daan ng teknolohiyang ito ang mga cube ng DB2 OLAP Server na mabilis at awtomatikong mai-parse para mahanap at maiulat ang mga halaga ng data data hindi pangkaraniwan o hindi inaasahan sa buong cube sa trade analyst. At sa wakas, ang mga feature ng DW Center ay nagbibigay ng paraan para makontrol ng mga arkitekto, bukod sa iba pang mga bagay, ang profile ng isang DB2 OLAP server cube bilang natural na bahagi ng mga proseso ng ETL.

Spatial na Pagsusuri Spatial na Pagsusuri

Ang espasyo ay kumakatawan sa kalahati ng mga analytical anchor (conduction) na kinakailangan para sa isang panorama
malawak na analitiko (ang oras ay kumakatawan sa iba pang kalahati). Ang atomic-level ng warehouse, na kinakatawan sa Figure 1.1, ay kinabibilangan ng mga batayan ng parehong oras at espasyo. Itinatala ng oras ang pagsusuri ng anchor ayon sa oras at pagsusuri ng anchor ng impormasyon sa address ayon sa espasyo. Ang mga timestamp ay nagsasagawa ng pagsusuri ayon sa oras, at ang impormasyon ng address ay nagsasagawa ng pagsusuri ayon sa espasyo. Ang diagram ay nagpapakita ng geocoding - proseso ng pag-convert ng mga address sa mga punto sa isang mapa o mga punto sa kalawakan upang ang mga konsepto tulad ng distansya at panloob / panlabas ay maaaring magamit sa pagsusuri - na isinasagawa sa atomic na antas at ang spatial na pagsusuri na ginawang magagamit sa analyst. Nagbibigay ang IBM ng mga spatial extension, na binuo kasama ng Environmental System Research Institute (ESRI), al database DB2 upang ang mga spatial na bagay ay maiimbak bilang isang normal na bahagi ng database pamanggit. DB2

Mga Spatial Extenders, nagbibigay din sila ng lahat ng SQL extension para samantalahin ang spatial analysis. Halimbawa, ang mga extension ng SQL sa query sa
Ang distansya sa pagitan ng mga address o kung ang isang punto ay nasa loob o labas ng isang tinukoy na polygonal na lugar, ay isang analytical na pamantayan sa Spatial Extender. Tingnan ang kabanata 16 para sa higit pang impormasyon.

Database-Mga Tool sa Resident Tool Database-Naninirahan

Ang DB2 ay may maraming mga tampok na residente ng SQL BI na tumutulong sa pagkilos ng pagsusuri. Kabilang dito ang:

Ang recursion ay gumagana upang magsagawa ng pagsusuri, tulad ng "hanapin ang lahat ng posibleng landas ng paglipad mula sa San Francisco a New York".
Ang analytic function para sa ranking, cumulative functions, cube at rollup para mapadali ang mga gawain na karaniwang nangyayari lamang sa teknolohiya ng OLAP, ay natural na bahagi na ngayon ng makina ng database
Ang kakayahang lumikha ng mga talahanayan na naglalaman ng mga resulta
Mga nagbebenta ng database mas pinaghalo ng mga pinuno ang mga kakayahan ng BI sa database stesso
Ang pangunahing mga supplier ng base ng datos ay pinagsasama ang higit pang mga kakayahan ng BI sa database stesso
Nagbibigay ito ng pinakamahusay na pagganap at karamihan sa mga opsyon sa pagpapatupad para sa mga solusyon sa BI.
Ang mga tampok at pag-andar ng DB2 V8 ay tinalakay nang detalyado sa mga sumusunod na kabanata:
Teknikal na Arkitektura at Mga Pundasyon sa Pamamahala ng Data (Kabanata 5)

DB2 BI Fundamentals (Kabanata 6)
DB2 Materialized Query Tables (Kabanata 7)
Mga Function ng DB2 OLAP (Kabanata 13)
DB2 Enhanced BI Features and Functions (Kabanata 15) Pinasimpleng Sistema ng Paghahatid ng Data Sistema ng paghahatid ng data pinasimple

Ang arkitektura na inilalarawan sa Figure 1.1 ay kinabibilangan ng maraming istruktura data pisikal. Ang isa ay ang bodega ng data nagpapatakbo. Sa pangkalahatan, ang ODS ay isang subject oriented, integrated at kasalukuyang. Gagawa ka ng ODS para suportahan, halimbawa, ang opisina ng pagbebenta. Magsasama ang mga benta ng ODS data nagmumula sa maraming iba't ibang sistema ngunit pananatilihin lamang, halimbawa, ang mga transaksyon ngayon. Ang ODS ay maaari ding i-update ng ilang beses sa isang araw. Kasabay nito, itinutulak ng mga proseso ang data isinama sa iba pang mga application. Ang istraktura na ito ay partikular na idinisenyo upang pagsamahin data kasalukuyan at pabago-bago at malamang na kandidato na sumailalim sa real-time na analytics, tulad ng pagbibigay ng mga ahente ng serbisyo mga customer kasalukuyang impormasyon sa pagbebenta ng isang customer sa pamamagitan ng pagkuha ng impormasyon sa trend ng mga benta mula sa imbentaryo mismo. Ang isa pang istraktura na ipinapakita sa Figure 1.1 ay isang pormal na estado para sa dw. Hindi lamang ito ang lugar upang maisagawa ang kinakailangang pagsasama, ng kalidad ng data, at ang pagbabago ng data ng papasok na bodega, ngunit isa rin itong maaasahan at pansamantalang imbakan na lugar para sa data mga replika na maaaring magamit sa real-time na pagsusuri. Kung magpasya kang gumamit ng ODS o staging area, isa sa mga pinakamahusay na tool para i-populate ang mga istrukturang ito data gamit ang iba't ibang mga mapagkukunan ng operating ay ang heterogenous na ipinamamahagi na query ng DB2. Ang kakayahang ito ay inihahatid ng opsyonal na feature ng DB2 na tinatawag na DB2 Relational Connect (query lang) at sa pamamagitan ng DB2 DataJoiner (isang hiwalay na produkto na naghahatid ng application, insert, update, at delete na kakayahan sa magkakaibang mga distributed RDBMS).

Ang teknolohiyang ito ay nagpapahintulot sa mga arkitekto na data upang itali data ng produksyon na may analytical na proseso. Hindi lamang maaaring umangkop ang teknolohiya sa halos alinman sa mga kahilingan sa pagtitiklop na maaaring lumitaw sa real-time na analytics, maaari rin itong mag-link sa isang malawak na iba't ibang mga base ng data pinakasikat, kabilang ang DB2, Oracle, Sybase, SQL Server, Informix, at iba pa. Maaaring gamitin ang DB2 DataJoiner upang i-populate ang isang istraktura data pormal bilang isang ODS o kahit isang permanenteng talahanayan na kinakatawan sa bodega na idinisenyo para sa mabilis na pagbawi ng mga instant update o para sa pagbebenta. Siyempre, ang parehong mga istraktura data maaaring ma-populate gamit ang

isa pang pangunahing teknolohiya na idinisenyo para sa pagtitiklop ng data, IBM DataPropagator Relational. (Ang DataPropagator ay isang hiwalay na produkto para sa mga sentral na system. Kasama sa DB2 UNIX, Linux, Windows, at OS / 2 ang mga serbisyo ng pagtitiklop data bilang isang karaniwang tampok).
Isa pang paraan para sa paglipat ng data Ang nagpapatakbo sa paligid ng enterprise ay isang enterprise application integrator na kilala rin bilang isang message broker. Ang natatanging teknolohiyang ito ay nagbibigay-daan sa walang kaparis na kontrol na mag-target at lumipat data sa paligid ng kumpanya. Ang IBM ang may pinakamalawak na ginagamit na broker ng mensahe, MQSeries, o isang variation ng produkto na kinabibilangan ng mga kinakailangan ng e-commerce, IBM WebSphere MQ.
Para sa higit pang talakayan kung paano gamitin ang MQ upang suportahan ang isang bodega at kapaligiran ng BI, bisitahin ang Website ng aklat. Sa ngayon, sapat na upang sabihin na ang teknolohiyang ito ay isang mahusay na paraan upang makuha at baguhin (gamit ang MQSeries Integrator) data mga target na operator na na-recruit para sa mga solusyon sa BI. Ang teknolohiya ng MQ ay isinama at naka-package sa UDB V8, na nangangahulugan na ang mga pila ng mensahe ay maaari na ngayong pamahalaan na parang mga talahanayan ng DB2. Ang konsepto ng welding queued mensahe at ang uniberso ng database Ang relasyon ay humahantong sa isang malakas na kapaligiran sa paghahatid data.

Zero-Latency Zero latency

Ang pinakahuling madiskarteng layunin para sa IBM ay zero-latency analysis. Gaya ng tinukoy ni
Gartner, ang isang BI system ay dapat na makapag-infer, makapag-assimilate at makapagbigay ng impormasyon para sa mga analyst on demand. Ang hamon, siyempre, ay nasa kung paano maghalo data kasalukuyan at real-time na may kinakailangang makasaysayang impormasyon, tulad ng i data nauugnay na pattern / trend, o nakuhang pag-unawa, gaya ng profile ng customer.

Kasama sa naturang impormasyon, halimbawa, ang pagkakakilanlan ng mga customer mataas o mababa ang panganib o kung aling mga produkto i mga customer malamang na bibili sila kung mayroon na silang keso sa kanilang mga shopping cart.

Ang pagkuha ng zero latency ay epektibong nakadepende sa dalawang pangunahing mekanismo:

Kumpletong pagsasama ng data na sinusuri gamit ang mga itinatag na pamamaraan at gamit ang mga tool na nilikha ng BI
Isang sistema ng paghahatid ng data mahusay para matiyak na tunay na available ang real-time na analytics Ang mga zero-latency na paunang kinakailangan na ito ay hindi naiiba sa dalawang layuning itinakda ng IBM at inilarawan sa itaas. Ang malapit na pagkakabit ng data ito ay bahagi ng tuluy-tuloy na programa ng pagsasama ng IBM. At lumikha ng isang sistema ng paghahatid ng data ang mahusay ay ganap na nakadepende sa magagamit na teknolohiya na nagpapasimple sa proseso ng paghahatid data. Dahil dito, ang dalawa sa tatlong layunin ng IBM ay kritikal sa pagkamit ng pangatlo. Sinasadya ng IBM ang pagbuo ng teknolohiya nito upang matiyak na ang zero latency ay isang katotohanan para sa mga pagsisikap sa warehouse. Buod / Synthesis Ang organisasyon ng BI ay nagbibigay ng isang mapa ng daan para sa pagsasakatuparan ng iyong kapaligiran
paulit-ulit. Dapat itong ayusin upang maipakita ang mga pangangailangan ng iyong negosyo, ngayon at sa hinaharap. Kung walang malawak na pananaw sa arkitektura, ang mga pag-uulit ng warehouse ay higit pa sa random na sentral na pagpapatupad ng warehouse na maliit na nagagawa upang lumikha ng isang malaki, nagbibigay-kaalaman na negosyo. Ang unang hadlang para sa mga tagapamahala ng proyekto ay kung paano bigyang-katwiran ang mga pamumuhunan na kailangan upang mapaunlad ang organisasyon ng BI. Habang ang pagkalkula ng ROI ay nanatiling pangunahing prop para sa mga nagawa ng imbentaryo, nagiging mas mahirap hulaan nang eksakto. Ito ay humantong sa iba pang mga paraan ng pagtukoy kung nakukuha mo ang halaga ng iyong pera. Ang halaga sa investment2 (IKAW), halimbawa, ay ipinahayag bilang isang solusyon. Ito ay nagbabadya sa mga arkitekto ng data at sa mga tagaplano ng proyekto na sadyang bumubuo at nagbibigay ng impormasyon sa mga asosasyon ng gumagamit at hindi lamang nagbibigay ng serbisyo sa data. Malaki ang pagkakaiba ng dalawa. Ang impormasyon ay isang bagay na gumagawa ng pagkakaiba sa paggawa ng desisyon at pagiging epektibo; medyo, i data sila ay bumubuo ng mga bloke para sa pagkuha ng impormasyong iyon.

Bagama't kritikal sa pinagmulan data upang himukin ang mga katanungan sa negosyo, ang kapaligiran ng BI ay dapat magsilbi ng mas malaking papel sa paglikha ng nilalaman ng impormasyon. Kailangan nating gumawa ng mga karagdagang hakbang upang linisin, isama, ibahin ang anyo o kung hindi man ay lumikha ng nilalamang impormasyon na maaaring gawin ng mga user, at pagkatapos ay kailangan nating tiyakin na ang mga pagkilos at desisyong iyon, kung saan makatwiran, ay makikita sa kapaligiran ng BI. Kung i-relegate natin ang bodega para magsilbi lamang sa data, tinitiyak na ang mga asosasyon ng gumagamit ay gagawa ng nilalaman ng impormasyong kinakailangan upang kumilos. Tinitiyak nito na ang kanilang komunidad ay makakagawa ng mas mahusay na mga desisyon, ngunit ang negosyo ay nagdurusa sa kakulangan ng kaalaman na kanilang ginamit. Dato na ang mga arkitekto at tagaplano ng proyekto ay nagpasimula ng mga partikular na proyekto sa kapaligiran ng BI, nananatili silang may pananagutan sa negosyo sa kabuuan. Ang isang simpleng halimbawa ng dalawang panig na tampok na ito ng mga pag-ulit ng BI ay matatagpuan sa pinagmulan data. Lahat data na natanggap para sa mga partikular na komersyal na kahilingan ay dapat na ma-populate sa unang atomic layer. Ginagarantiyahan nito ang pagbuo ng asset ng impormasyon ng kumpanya, pati na rin ang pamamahala, pagtugon sa mga partikular na kahilingan ng user na tinukoy sa pag-ulit.

Ano ang Data Warehouse?

Bodega ng data ay naging puso ng arkitektura ng mga sistema ng impormasyon mula noong 1990 at sumusuporta sa mga proseso ng impormasyon sa pamamagitan ng pag-aalok ng isang solidong pinagsama-samang platform data ang mga mananalaysay na kinuha bilang batayan para sa mga kasunod na pagsusuri. ANG data bodega nag-aalok sila ng kadalian ng pagsasama sa isang mundo ng mga hindi tugmang sistema ng aplikasyon. Bodega ng data ito ay umunlad upang maging isang fashion. Bodega ng data nag-aayos at nag-iimbak i data kinakailangan para sa impormasyon at analytical na mga proseso sa batayan ng mahabang makasaysayang pananaw sa panahon. Ang lahat ng ito ay nagsasangkot ng malaki at patuloy na pangako sa pagtatayo at pagpapanatili ng data bodega.

Kaya ano ang a data bodega? A data bodega ito ay:

▪ nakatuon sa mga paksa
▪ pinagsamang sistema
▪ variant time
▪ non-volatile (hindi nagkansela)

isang koleksyon ng data ginagamit upang suportahan ang mga desisyon sa pamamahala sa pagpapatupad ng mga proseso.
I data ipinasok sa data bodega sa karamihan ng mga kaso nagmula ang mga ito mula sa mga kapaligiran sa pagpapatakbo. Ang data bodega ito ay natanto ng isang storage unit, na pisikal na nakahiwalay sa iba pang bahagi ng system, na nilalaman nito data dating binago ng mga application na nagpapatakbo sa impormasyong nagmula sa operating environment.

Ang literal na kahulugan ng a data bodega nararapat sa isang malalim na paliwanag dahil may mahahalagang pinagbabatayan na dahilan at kahulugan na naglalarawan sa mga katangian ng isang bodega.

ORIENTASYON NG PAKSA THEMATIC

Ang unang katangian ng a data bodega ay na ito ay nakatuon sa mga pangunahing manlalaro ng isang kumpanya. Ang paghatol sa mga pagsubok sa pamamagitan ng i data ito ay kabaligtaran sa mas klasikong pamamaraan na nakikita ang oryentasyon ng mga aplikasyon patungo sa mga proseso at pag-andar, isang paraan para sa karamihang ibinabahagi ng karamihan sa mga mas lumang sistema ng pamamahala.

Ang mundo ng pagpapatakbo ay idinisenyo sa paligid ng mga application at function tulad ng mga pautang, pagtitipid, bankcard at tiwala para sa isang institusyong pampinansyal. Ang mundo ng dw ay nakaayos sa mga pangunahing paksa tulad ng customer, nagbebenta, produkto at negosyo. Ang pagkakahanay sa mga paksa ay nakakaapekto sa disenyo at pagpapatupad ng data matatagpuan sa dw. Higit sa lahat, ang pangunahing argumento ay nakakaapekto sa pinakamahalagang bahagi ng pangunahing istraktura.

Ang mundo ng application ay naiimpluwensyahan pareho ng disenyo ng database at ng disenyo ng proseso. Ang mundo ng dw ay eksklusibong nakatuon sa pagmomodelo data at sa pagguhit ng database. Ang disenyo ng proseso (sa klasikong anyo nito) ay hindi bahagi ng dw environment.

Ang mga pagkakaiba sa pagitan ng pagpili ng proseso / pag-andar ng aplikasyon at pagpili ayon sa paksa ay ipinahayag din bilang mga pagkakaiba sa nilalaman ng data sa isang detalyadong antas. ANG data del dw huwag isama ang i data na hindi gagamitin para sa proseso ng DSS habang nag-aaplay

operational oriented sa data naglalaman ng i data upang agad na matugunan ang mga kinakailangan sa paggana/pagproseso na maaaring o walang anumang gamit para sa DSS analyst.
Isa pang mahalagang paraan kung saan data naiiba sa data ng dw ay nasa mga ulat ng data. Ako data Ang mga operator ay nagpapanatili ng tuluy-tuloy na ugnayan sa pagitan ng dalawa o higit pang mga talahanayan batay sa isang panuntunan sa negosyo na aktibo. ANG data ng dw ay sumasaklaw sa isang spectrum ng oras at ang mga ratio na matatagpuan sa dw ay marami. Maraming mga panuntunan sa pangangalakal (at naaayon, marami data ) ay kinakatawan sa bodega ng data sa pagitan ng dalawa o higit pang mga talahanayan.

(Para sa isang detalyadong paliwanag kung paano ang mga ugnayan sa pagitan ng data ay pinamamahalaan sa DW, tinutukoy namin ang Tech Topic sa bagay na iyon.)
Mula sa walang ibang pananaw kaysa sa pangunahing pagkakaiba sa pagitan ng isang functional/process na pagpipilian ng aplikasyon at isang pagpili ng paksa, mayroon bang mas malaking pagkakaiba sa pagitan ng mga operating system at data at ang DW.

PAGSASAMA PAGSASAMA

Ang pinakamahalagang aspeto ng kapaligiran ng dw ay ang i data na matatagpuan sa loob ng dw ay madaling isinama. LAGI. WALANG EXCEPTIONS. Ang pinaka esensya ng dw environment ay ang i data nakapaloob sa loob ng mga limitasyon ng bodega ay isinama.

Ang integrasyon ay nagpapakita ng sarili nito sa maraming iba't ibang paraan - sa mga natukoy na convention na pare-pareho, sa lawak ng pare-parehong mga variable, sa pare-parehong mga istrukturang naka-code, sa pisikal na katangian ng data pare-pareho, at iba pa.

Sa paglipas ng mga taon, ang mga taga-disenyo ng iba't ibang mga application ay gumawa ng maraming mga desisyon tungkol sa kung paano dapat mabuo ang isang application. Ang estilo at indibidwal na mga desisyon sa disenyo ng mga application ng mga designer ay nagpapakita ng kanilang mga sarili sa isang daang paraan: sa mga pagkakaiba sa coding, pangunahing istraktura, pisikal na katangian, mga kumbensyon sa pagkakakilanlan, at iba pa. Ang sama-samang kakayahan ng maraming mga taga-disenyo ng application na lumikha ng hindi naaayon na mga aplikasyon ay maalamat. Inilalantad ng Figure 3 ang ilan sa pinakamahalagang pagkakaiba sa mga paraan ng pagdidisenyo ng mga application.

Encoding: Encode:

Pinili ng mga designer ng application ang field coding - kasarian - sa maraming paraan. Ang isang taga-disenyo ay kumakatawan sa sex bilang isang "m" at "f". Ang isa pang taga-disenyo ay kumakatawan sa sex bilang isang "1" at isang "0". Ang isa pang taga-disenyo ay kumakatawan sa sex bilang isang "x" at "y". Ang isa pang taga-disenyo ay kumakatawan sa sex bilang "lalaki" at "babae". Hindi mahalaga kung paano papasok ang sex sa DW. Ang "M" at "F" ay malamang na kasing ganda ng buong representasyon.

Ang mahalaga ay anuman ang pinagmulan ng larangan ng kasarian, ang larangang iyon ay dumarating sa DW sa isang pare-parehong pinagsamang estado. Dahil dito kapag ang field ay na-load sa DW mula sa isang application kung saan ito ay kinakatawan sa format na "M" at "F", ang data dapat i-convert sa DW format.

Pagsukat ng mga Katangian: Pagsukat ng Mga Katangian:

Pinili ng mga designer ng application na sukatin ang pipeline sa iba't ibang paraan sa paglipas ng mga taon. Isang designer stores i data ng pipeline sa sentimetro. Isa pang application designer stores i data ng pipeline sa mga tuntunin ng pulgada. Isa pang application designer stores i data ng pipeline sa milyong cubic feet kada segundo. At ang isa pang taga-disenyo ay nag-iimbak ng impormasyon ng pipeline sa mga tuntunin ng mga yarda. Anuman ang pinagmulan, kapag dumating ang impormasyon ng pipeline sa DW dapat itong sukatin sa parehong paraan.

Ayon sa mga indikasyon sa Figure 3, ang mga isyu sa pagsasama ay nakakaapekto sa halos lahat ng aspeto ng proyekto - ang mga pisikal na katangian ng data, ang dilemma ng pagkakaroon ng higit sa isang pinagmulan ng data, ang isyu ng hindi tugmang natukoy na mga sample, mga format ng data hindi pare-pareho, at iba pa.

Anuman ang argumento ng disenyo, pareho ang resulta - i data sila ay dapat na naka-imbak sa DW sa isang pang-isahan at pandaigdigang katanggap-tanggap na paraan kahit na ang pinagbabatayan na mga operating system ay nag-iimbak sa ibang paraan. data.

Kapag tinitingnan ng DSS analyst ang DW, ang layunin ng analyst ay ang pagsasamantala sa data na nasa bodega,

sa halip na magtaka tungkol sa kredibilidad o pagkakapare-pareho ng data.

VARIANCY NG ORAS

Lahat data sa DW ang mga ito ay tumpak sa ilang mga punto sa oras. Ang pangunahing tampok na ito ng data sa DW ito ay ibang-iba sa data matatagpuan sa operating environment. ANG data ng operating environment ay kasing-tumpak ng sa oras ng pag-access. Sa madaling salita, sa operating environment kapag na-access ang isang drive data, inaasahan na ito ay magpapakita ng mga halaga nang tumpak tulad ng sa oras ng pag-login. Bakit ako data sa DW ay tumpak tulad ng sa ilang mga punto sa oras (ibig sabihin, hindi "ngayon"), i data matatagpuan sa DW ay "time variances".
Ang pagkakaiba-iba ng oras ng data Ang DW ay tinutukoy sa maraming paraan.
Ang pinakasimpleng paraan ay i data ng isang DW na kumakatawan data sa loob ng mahabang panahon - lima hanggang sampung taon. Ang abot-tanaw ng oras na kinakatawan para sa operating environment ay mas maikli kaysa sa kasalukuyang mga halaga mula hanggang animnapu't siyamnapu.
Ang mga application na dapat gumana nang maayos at dapat na magagamit para sa pagproseso ng transaksyon ay dapat magdala ng pinakamababang halaga ng data kung aminin nila ang anumang antas ng kakayahang umangkop. Kaya ang mga application sa pagpapatakbo ay may maikling panahon, tulad ng isang paksa sa disenyo ng audio application.
Ang pangalawang paraan na lumilitaw ang 'time variancy' sa DW ay nasa pangunahing istraktura. Ang bawat pangunahing istraktura sa DW ay naglalaman, nang tahasan o tahasang, isang elemento ng oras, gaya ng araw, linggo, buwan, atbp. Ang elemento ng oras ay halos palaging nasa ibaba ng pinagsama-samang key na makikita sa DW. Sa mga pagkakataong ito, tuwirang iiral ang elemento ng oras, gaya ng kaso kung saan ang isang buong file ay nadoble sa katapusan ng buwan o quarter.
Ang ikatlong paraan ng pagkakaiba-iba ng oras ay ipinapakita ay ang i data ng DW, sa sandaling mairehistro sila nang tama, ay hindi maa-update. ANG data ng DW ay, para sa lahat ng praktikal na layunin, isang mahabang serye ng mga snapshot (mga snapshot). Siyempre, kung ang mga snapshot ay nakuha nang hindi tama, ang mga snapshot ay maaaring i-edit. Ngunit kung ipagpalagay na ang mga snapshot ay tapos na nang tama, hindi sila nababago sa sandaling ginawa ang mga ito. Sa ilang

kaso maaaring hindi etikal o kahit na hindi wasto na ang mga snapshot sa DW ay binago. ANG data pagpapatakbo, bilang tumpak tulad ng sa sandali ng pag-access, maaari silang i-update kapag kinakailangan.

HINDI VOLATILE

Ang pang-apat na mahalagang katangian ng DW ay ang pagiging non-volatile nito.
Regular na ginagawa ang mga update, pagpapasok, pagtanggal at pagbabago para sa mga operational environment sa record-by-record na batayan. Ngunit ang pangunahing pagmamanipula ng data na nagaganap sa DW ay mas simple. Mayroon lamang dalawang uri ng mga operasyon na nagaganap sa DW - ang paunang paglo-load ng data at access sa data. Walang update ng data (sa pangkalahatang kahulugan ng pag-update) sa DW bilang isang normal na operasyon sa pagpoproseso. Mayroong ilang napakalakas na kahihinatnan ng pangunahing pagkakaiba sa pagitan ng pagpoproseso ng pagpapatakbo at pagproseso ng DW. Sa antas ng disenyo, ang pangangailangang maging maingat tungkol sa abnormal na pag-update ay hindi isang salik sa DW, dahil ang pag-update ng data hindi ito naisasagawa. Nangangahulugan ito na sa pisikal na antas ng disenyo, ang mga kalayaan ay maaaring gawin upang ma-optimize ang pag-access sa data, lalo na sa pagharap sa mga isyu ng normalisasyon at pisikal na denormalisasyon. Ang isa pang kinahinatnan ng pagiging simple ng mga pagpapatakbo ng DW ay nasa pinagbabatayan na teknolohiyang ginagamit upang patakbuhin ang kapaligiran ng DW. Ang pagkakaroon upang suportahan ang mga online na record-by-record na mga update (tulad ng kadalasang nangyayari sa pagpoproseso ng pagpapatakbo) ay nangangailangan ng teknolohiya na magkaroon ng isang napakakomplikadong pundasyon sa ilalim ng maliwanag na pagiging simple.
Ang teknolohiyang sumusuporta sa backup at pagbawi ng mga kopya, transaksyon at integridad ng data at ang pagtuklas at lunas sa kondisyon ng deadlock ay medyo kumplikado at hindi kinakailangan para sa pagproseso ng DW. Ang mga katangian ng isang DW, oryentasyon ng disenyo, pagsasama ng data sa loob ng DW, pagkakaiba-iba ng oras at ang pagiging simple ng pamamahala data, na ang lahat ay humahantong sa isang kapaligiran na napaka, ibang-iba sa klasikong operating environment. Ang pinagmulan ng halos lahat data ng DW ay ang operating environment. Nakatutukso isipin na mayroong napakalaking redundancy ng data sa pagitan ng dalawang kapaligiran.
Sa katunayan, ang unang impresyon na mayroon ang maraming tao ay ang malaking kalabisan ng data sa pagitan ng operating environment at ng

DW. Ang ganitong interpretasyon ay mababaw at nagpapakita ng kakulangan sa pag-unawa kung ano ang nangyayari sa DW.
Sa katunayan mayroong isang minimum na redundancy ng data sa pagitan ng operating environment at i data ng DW. Isaalang-alang natin ang mga sumusunod: data ay sinasala dato na pumasa ka mula sa operating environment patungo sa DW environment. Marami data hindi sila lumalabas sa operating environment. Maliban sa i data na kinakailangan para sa pagproseso ng DSS, hanapin ang kanilang direksyon sa kapaligiran

▪ ang abot-tanaw ng oras ng data ito ay ibang-iba mula sa isang kapaligiran patungo sa isa pa. ANG data sa kapaligiran ng operating ang mga ito ay napaka-sariwa. ANG data sa DW mas matanda sila. Mula sa pananaw ng abot-tanaw ng oras lamang, mayroong napakakaunting overlap sa pagitan ng operating environment at ng DW.

▪ Ang DW ay naglalaman ng data buod na hindi kailanman makikita sa kapaligiran

▪ Ako data sumasailalim sa isang pangunahing pagbabago habang sila ay nagpapatuloy sa Figure 3 ay naglalarawan na karamihan sa mga data malaki ang pagbabago sa mga ito hangga't sila ay napili at inilipat sa DW. Sa ibang paraan, karamihan sa mga data ay pisikal at radikal na nagbabago habang ito ay inililipat sa DW. Mula sa punto ng view ng integration sila ay hindi pareho data naninirahan sa operating environment. Sa liwanag ng mga salik na ito, ang redundancy ng data sa pagitan ng dalawang kapaligiran ay isang bihirang kaganapan, na humahantong sa mas mababa sa 1% na redundancy sa pagitan ng dalawang kapaligiran. ANG STRUCTURE NG WAREHOUSE Ang mga DW ay may natatanging istraktura. Mayroong iba't ibang antas ng buod at detalye na naghahati sa mga DW.
Ang iba't ibang bahagi ng isang DW ay:

metadata
Dati kasalukuyang mga detalye
Dati ng lumang detalye
Dati bahagyang summarized
Dati mataas ang buod

Sa ngayon ang pangunahing pag-aalala ay para sa i data kasalukuyang mga detalye. Ito ang pangunahing alalahanin dahil:

I data ang mga kasalukuyang detalye ay sumasalamin sa pinakabagong mga kaganapan, na palaging may malaking interes at
i data napakalaki ng mga kasalukuyang detalye dahil nakaimbak ito sa pinakamababang antas ng granularity e
i data Ang kasalukuyang mga detalye ay halos palaging nakaimbak sa memorya ng disk, na mabilis na ma-access, ngunit mahal at kumplikado ng I. data mas lumang mga detalye ay data na nakaimbak sa ilang memorya ng masa. Ito ay naa-access nang paminsan-minsan at naka-imbak sa isang antas ng detalye na katugma sa data kasalukuyang mga detalye. Bagama't hindi ipinag-uutos na mag-imbak sa isang kahaliling daluyan ng imbakan, dahil sa malaking dami ng data kaisa ng kalat-kalat na pag-access ng data, ang memory medium para sa data ang mas lumang detalye ay karaniwang hindi nakaimbak sa disk. ANG data buod nang basta-basta ay data na distilled mula sa mababang antas ng detalye na natagpuan sa kasalukuyang antas ng detalye. Ang antas na ito ng DW ay halos palaging nakaimbak sa memorya ng disk. Ang mga problema ng disenyo na nagpapakita ng kanilang sarili sa arkitekto ng data sa pagbuo ng antas na ito ng DW ay:

Aling unit ng oras ang buod na ginawa sa itaas
Aling nilalaman, mga katangian ang bahagyang magbubuod sa nilalaman ng data Ang susunod na antas ng data na matatagpuan sa DW ay ang sa data mataas ang buod. ANG data ang mga highly summarized ay compact at madaling ma-access. ANG data ang mataas na buod ay kung minsan ay matatagpuan sa kapaligiran ng DW at sa ibang mga kaso i data mataas ang summarized ay matatagpuan sa labas ng mga agarang pader ng teknolohiyang nagho-host ng DW. (sa anumang kaso, i data ang mataas na buod ay bahagi ng DW saanman i data ay pisikal na matatagpuan). Ang huling bahagi ng DW ay ang metadata. Sa maraming aspeto, ang metadata ay nasa ibang dimensyon kaysa sa iba data ng DW, dahil walang laman ang metadata dato direktang kinuha mula sa operating environment. Ang metadata ay gumaganap ng isang espesyal at napakahalagang papel sa DW. Ginagamit ang metadata bilang:

isang direktoryo upang matulungan ang analyst ng DSS na mahanap ang mga nilalaman ng DW,
isang gabay sa pagmamapa ng data ng kung paano i data ay binago mula sa operating environment patungo sa DW environment,
isang gabay sa mga algorithm na ginagamit para sa pagbubuod sa pagitan data kasalukuyang mga detalye at i data bahagyang buod, i data lubos na buod, ang metadata ay gumaganap ng isang mas mahalagang papel sa kapaligiran ng DW kaysa dati sa kapaligiran ng pagpapatakbo LUMANG DETALYE STORAGE MEDIUM Maaaring gamitin ang magnetic tape upang mag-imbak ng ganoong uri ng data. Sa katunayan, mayroong iba't ibang uri ng storage media na dapat isaalang-alang para sa pangangalaga ng mga luma data ng detalye. Depende sa dami ng data, ang dalas ng pag-access, ang halaga ng mga tool at ang uri ng pag-access, lubos na malamang na kakailanganin ng ibang mga tool ang lumang antas ng detalye sa DW. DALOY NG DATA Mayroong normal at mahuhulaan na daloy ng mga diyos data sa loob ng DW.
I data ipasok ang DW mula sa operating environment. (TANDAAN: Mayroong ilang napaka-kagiliw-giliw na mga pagbubukod sa panuntunang ito. Gayunpaman, halos lahat data ipasok ang DW mula sa operating environment). Dato na ako data ipasok ang DW mula sa operating environment, ito ay binago tulad ng inilarawan sa itaas. Kung ipasok mo ang DW, i data ipasok ang kasalukuyang antas ng detalye, tulad ng ipinapakita. Ito ay naninirahan doon at ginagamit hanggang sa mangyari ang isa sa tatlong mga kaganapan:

ay dinadalisay,
ay summarized, at / o ▪ ay Hindi na ginagamit na proseso sa loob ng isang DW move i data kasalukuyang mga detalye a data ng lumang detalye, ayon sa edad ng data. Ang proseso

ang pagbubuod ay gumagamit ng detalye ng data upang makalkula i data bahagyang summarized at highly summarized mga antas ng data. Mayroong ilang mga pagbubukod sa daloy na ipinakita (tatalakayin sa ibang pagkakataon). Gayunpaman, kadalasan, para sa karamihan ng data matatagpuan sa loob ng isang DW, ang daloy ng data ay tulad ng nakalarawan.

GAMIT ANG DATAWAREHOUSE

Hindi nakakagulat ang iba't ibang antas ng data sa loob ng DW hindi sila nakakatanggap ng iba't ibang antas ng paggamit. Bilang isang tuntunin, mas mataas ang antas ng pagbubuod, mas marami ang data ginagamit ang mga ito.
Maraming gamit ang nagaganap sa data mataas ang buod, habang ang luma data ang mga detalye ay halos hindi na ginagamit. May magandang dahilan para ilipat ang organisasyon sa paradigm sa paggamit ng mapagkukunan. Higit pang buod i data, mas mabilis at mas mahusay na makarating sa data. Kung ang tindahan napag-alaman na gumagawa ito ng maraming proseso sa antas ng detalye ng DW, pagkatapos ay natupok ang isang katumbas na malaking halaga ng mga mapagkukunan ng makina. Para sa pinakamahusay na interes ng lahat na magproseso sa lalong madaling panahon sa isang mataas na antas ng pagbubuod.

Para sa maraming mga tindahan, ginamit ang DSS analyst sa isang pre-environment DW data sa antas ng detalye. Sa maraming aspeto ang pagdating a data ang detalyado ay mukhang isang kumot ng seguridad, kahit na available ang iba pang antas ng pagbubuod. Isa sa mga gawain ng arkitekto ng data ay upang hindi sanay ang gumagamit ng DSS mula sa patuloy na paggamit ng data sa pinakamababang antas ng detalye. Mayroong dalawang dahilan na magagamit sa arkitekto ng data:

sa pamamagitan ng pag-install ng chargeback system, kung saan nagbabayad ang end user para sa mga nagamit na mapagkukunan e
na nagpapahiwatig na ang napakahusay na oras ng pagtugon ay maaaring makuha kapag ang pag-uugali na may i data ito ay nasa mataas na antas ng pagbubuod, habang ang mahinang oras ng pagtugon ay nagmumula sa pag-uugali ng data sa mababang antas ng IBANG KONSIDERASYON Mayroong ilang iba pang mga pagsasaalang-alang sa pagtatayo at pamamahala ng DW.
Ang unang pagsasaalang-alang ay ang mga indeks. ANG data sa mas mataas na antas ng pagbubuod maaari silang malayang mai-index, habang i data

sa mas mababang mga antas ng detalye ang mga ito ay napakalaki na maaari itong ma-index nang matipid. Mula sa parehong token, i data sa mataas na antas ng detalye maaari silang maging medyo madaling restructured, habang ang dami ng data sa mas mababang antas ito ay napakalaki na i data hindi sila madaling maiayos. Dahil dito, ang modelo ng data at ang pormal na gawaing ginawa ng disenyo ay naglatag ng pundasyon para sa DW na inilapat halos eksklusibo sa kasalukuyang antas ng detalye. Sa madaling salita, ang mga aktibidad sa pagmomolde ng data hindi nalalapat ang mga ito sa mga antas ng pagbubuod sa halos bawat kaso. Ang isa pang structural consideration ay ang subdivision ng data ng DW.

Ang paghahati ay maaaring gawin sa dalawang antas - sa antas ng dbms at sa antas ng aplikasyon. Sa dibisyon sa antas dbms, ang dbms ipinaalam sa kanya ang mga dibisyon at sinusubaybayan ang mga ito nang naaayon. Sa kaso ng isang application-level division, tanging ang programmer lamang ang nakakaalam ng mga dibisyon at ang responsibilidad para sa kanilang administrasyon ay naiwan sa kanya.

Sa ibaba ng antas dbms, maraming trabaho ang awtomatikong ginagawa. Maraming inflexibility na nauugnay sa awtomatikong pangangasiwa ng mga dibisyon. Sa kaso ng dibisyon sa antas ng aplikasyon ng data del data bodega, maraming trabaho ang nagpapabigat sa programmer, ngunit ang resulta ay ang kakayahang umangkop sa pangangasiwa ng data sa data bodega

IBANG ANOMALIYA

Habang ang mga bahagi ng data bodega gumana tulad ng inilarawan para sa halos lahat data, may ilang kapaki-pakinabang na pagbubukod na kailangang talakayin. Ang isang pagbubukod ay ang sa data pampublikong buod ng data. Ang mga ito ay data mga buod na kinakalkula mula sa data bodega ngunit ginagamit sila ng lipunan. ANG data ang mga pampublikong buod ay iniimbak at pinamamahalaan sa data bodega, bagama't tulad ng nabanggit sa itaas sila ay naisip. Ang mga accountant ay nagtatrabaho upang makagawa ng gayong quarterly data tulad ng kita, quarterly expenses, quarterly profit, at iba pa. Ang gawaing ginawa ng mga accountant ay panlabas sa data bodega. Gayunpaman, i data ay ginagamit "panloob" sa loob ng kumpanya - mula sa marketing, benta, atbp. Ang isa pang anomalya, na hindi tatalakayin, ay ang tungkol sa data panlabas.

Isa pang mahusay na uri ng data na makikita sa a data bodega ay iyon ng permanenteng data ng detalye. Nagreresulta ito sa pangangailangang permanenteng mag-imbak ng i data sa isang detalyadong antas para sa etikal o legal na mga dahilan. Kung inilalantad ng isang kumpanya ang mga manggagawa nito sa mga mapanganib na sangkap, kailangan data detalyado at permanente. Kung ang isang kumpanya ay gumagawa ng isang produkto na nagsasangkot ng kaligtasan ng publiko, tulad ng mga bahagi ng isang eroplano, mayroong pangangailangan para sa data permanenteng detalye, pati na rin kung ang isang kumpanya ay pumasok sa mga mapanganib na kontrata.

Hindi kayang balewalain ng kumpanya ang mga detalye dahil sa mga susunod na taon, sakaling magkaroon ng demanda, mabawi, may pinagtatalunang depekto sa konstruksiyon, atbp. ang pagkakalantad ng kumpanya ay maaaring maging mahusay. Dahil dito mayroong isang natatanging uri ng data kilala bilang permanenteng data ng detalye.

SUMMARY

Un data bodega ay isang object oriented, integrated, time variant, isang koleksyon ng data hindi pabagu-bago upang suportahan ang mga pangangailangan sa paggawa ng desisyon ng administrasyon. Ang bawat isa sa mga kapansin-pansing tungkulin ng a data bodega may mga implikasyon nito. Bilang karagdagan mayroong apat na antas ng data del data bodega:

Lumang detalye
Kasalukuyang detalye
Dati bahagyang summarized
Dati Ang mataas na summarized Metadata ay isa ring mahalagang bahagi ng data bodega. ABSTRAK Ang konsepto ng imbakan ng data ito ay kamakailan lamang ay tumanggap ng maraming atensyon at naging uso ng dekada 90. Ito ay dahil sa kakayahan ng isang data bodega upang malampasan ang mga limitasyon ng mga sistema ng suporta sa pamamahala tulad ng mga sistema ng tulong sa desisyon (DSS) at mga sistema ng ehekutibong impormasyon (EIS). Bagama't ang konsepto ng data bodega mukhang promising, implementing i data bodega maaaring maging problema dahil sa malakihang proseso ng pag-iimbak. Sa kabila ng pagiging kumplikado ng data, maraming supplier at consultant na nag-stock data i-claim na ang pag-iimbak ng data kasalukuyang hindi nagsasangkot ng mga problema. Gayunpaman, sa simula ng proyektong pananaliksik na ito, halos walang independyente, mahigpit at sistematikong pananaliksik ang naisagawa. Dahil dito, mahirap sabihin kung ano ang aktwal na nangyayari sa industriya kapag sila ay binuo data bodega. Sinaliksik ng pag-aaral na ito ang kasanayan sa pag-iimbak ng data mga kontemporaryo na naglalayong bumuo ng mas mayamang pag-unawa sa kasanayan sa Australia. Ang pagsusuri sa panitikan ay nagbigay ng konteksto at pundasyon para sa empirikal na pag-aaral. Mayroong ilang mga resulta mula sa paghahanap na ito. Una, isiniwalat ng pag-aaral na ito ang mga aktibidad na naganap sa panahon ng pagbuo ng data bodega. Sa maraming lugar, i data kinumpirma ng natipon ang pagsasanay na iniulat sa panitikan. Pangalawa, ang mga isyu at problema na maaaring makaapekto sa pag-unlad ng data bodega ay natukoy mula sa pag-aaral na ito. Panghuli, ang mga benepisyong nakuha mula sa mga organisasyon ng Australia na nauugnay sa paggamit ng data bodega ay nahayag.

Kabanata 1

Konteksto ng pananaliksik

Ang konsepto ng data warehousing ay tumanggap ng malawakang pagkakalantad at naging isang umuusbong na kalakaran noong 90s (McFadden 1996, TDWI 1996, Shah at Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman at Oates 2000). Ito ay makikita mula sa dumaraming bilang ng mga artikulo sa data warehousing sa mga komersyal na publikasyon (Little at Gibson 1999). Maraming mga artikulo (tingnan, halimbawa, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett at re 1996, Graham et al. 1996, Sakaguchi at Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, Clarke 1997, Clarke 1997, O. Edwards 1998, TDWI 1999) ay nag-ulat ng mga makabuluhang benepisyo sa mga organisasyong nagpapatupad ng i data bodega. Sinuportahan nila ang kanilang teorya ng anecdotal na ebidensya ng matagumpay na pagpapatupad, mataas na return on investment figure (ROI) at, gayundin, sa pamamagitan ng pagbibigay ng mga alituntunin o pamamaraan para sa pagbuo ng data bodega

(Shanks et al. 1997, Seddon at Benjamin 1998, maliit at Gibson 1999). Sa isang matinding kaso, Graham et al. (1996) ay nag-ulat ng isang average na kita sa isang tatlong-taong pamumuhunan na 401%.

Karamihan sa kasalukuyang panitikan, gayunpaman, ay nakaligtaan ang mga kumplikadong kasangkot sa pagsasagawa ng mga naturang proyekto. Ang mga proyekto ng data bodega ang mga ito ay karaniwang kumplikado at malakihan at samakatuwid ay nagpapahiwatig ng mataas na posibilidad ng pagkabigo kung hindi maingat na kinokontrol (Shah at Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs at Clymer 1998, Rao 1998). Nangangailangan sila ng malaking halaga ng kapwa tao at pinansiyal na mapagkukunan at, oras at pagsisikap upang maitayo ang mga ito (Hill 1998, Crofts 1998). Ang karaniwang oras at pinansiyal na paraan na kinakailangan ay humigit-kumulang dalawang taon at dalawa o tatlong milyong dolyar, ayon sa pagkakabanggit (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Ang oras na ito at mga paraan sa pananalapi ay kinakailangan upang kontrolin at pagsama-samahin ang maraming iba't ibang aspeto ng data warehousing (Cafasso 1995, Hill 1998). Sa tabi ng hardware at software na pagsasaalang-alang, iba pang mga function, na nag-iiba mula sa pagkuha ng data sa mga proseso ng paglo-load ng data, mula sa kapasidad ng memorya upang pamahalaan ang mga update at mula sa meta data para sa pagsasanay ng gumagamit, dapat silang isaalang-alang.

Sa panahon ng proyektong pananaliksik na ito, kakaunti ang akademikong pananaliksik na isinagawa sa larangan ng data warehousing, lalo na sa Australia. Kitang-kita ito sa kakulangan ng mga artikulong nai-publish sa data warehousing mula sa mga pahayagan o iba pang akademikong sulatin noong panahong iyon. Marami sa mga magagamit na akademikong sulatin ang naglalarawan sa karanasan sa US. Ang kakulangan ng akademikong pananaliksik sa lugar ng pag-iimbak ng datos ay nagdulot ng pangangailangan para sa mahigpit na pananaliksik at empirikal na pag-aaral (McFadden 1996, Shanks et al. 1997, Little at Gibson 1999). Sa partikular, mga pag-aaral sa pananaliksik sa proseso ng pagpapatupad ng data bodega kailangang gawin upang mapalawak ang pangkalahatang kaalaman tungkol sa pagpapatupad ng data bodega at magsisilbing batayan para sa isang pag-aaral sa hinaharap na pananaliksik (Shanks et al. 1997, Little at Gibson 1999).

Ang layunin ng pag-aaral na ito, samakatuwid, ay upang siyasatin kung ano ang aktwal na nangyayari kapag ipinatupad at ginagamit ng mga organisasyon ang i data bodega sa Australia. Sa partikular, ang pag-aaral na ito ay magsasangkot ng pagsusuri ng isang buong proseso ng pag-unlad ng a data bodega, simula sa pagsisimula at pagpaplano sa pamamagitan ng disenyo at pagpapatupad at kasunod na paggamit sa loob ng mga organisasyong Australian. Bilang karagdagan, ang pag-aaral ay mag-aambag din sa kasalukuyang pagsasanay sa pamamagitan ng pagtukoy sa mga lugar kung saan ang pagsasanay ay maaaring higit pang pagbutihin at ang mga inefficiencies at mga panganib ay maaaring mabawasan o maiiwasan. Bilang karagdagan, ito ay magsisilbing batayan para sa iba pang pag-aaral sa data bodega sa Australia at pupunan ang puwang na kasalukuyang umiiral sa panitikan.

Mga tanong sa pananaliksik

Ang layunin ng pananaliksik na ito ay pag-aralan ang mga aktibidad na kasangkot sa pagpapatupad ng data bodega at ang kanilang paggamit ng mga organisasyong Australian. Sa partikular, ang mga elemento tungkol sa pagpaplano ng proyekto, pagpapaunlad, pagpapatakbo, paggamit at mga panganib na kasangkot ay pinag-aaralan. Kaya ang tanong ng pananaliksik na ito ay:

“Paano ang kasalukuyang practice ng data bodega sa Australia?"

Upang mabisang masagot ang tanong na ito, kinakailangan ang isang bilang ng mga subsidiary na katanungan sa pananaliksik. Sa partikular, tatlong sub-tanong ang natukoy mula sa literatura, na ipinakita sa kabanata 2, upang gabayan ang proyektong ito ng pananaliksik: Paano ang mga data bodega mula sa mga organisasyon ng Australia? Ano ang mga problemang nararanasan?

Ano ang mga benepisyong nararanasan?
Sa pagsagot sa mga tanong na ito, ginamit ang isang exploratory research design na gumagamit ng inquiry. Bilang isang eksplorasyong pag-aaral, ang mga sagot sa mga tanong sa itaas ay hindi kumpleto (Shanks et al. 1993, Denscombe 1998). Sa kasong ito, kinakailangan ang triangulation upang mapabuti ang mga sagot sa mga tanong na ito. Gayunpaman, ang pagsisiyasat ay magbibigay ng matibay na pundasyon para sa hinaharap na gawain sa pagsusuri sa mga tanong na ito. Ang isang detalyadong talakayan sa pagbibigay-katwiran ng pamamaraan at disenyo ng pananaliksik ay ipinakita sa kabanata 3.

Istraktura ng proyekto ng pananaliksik

Ang proyektong pananaliksik na ito ay nahahati sa dalawang bahagi: ang kontekstwal na pag-aaral ng konsepto ng datawarehousing at ang empirical na pananaliksik (tingnan ang figure 1.1), ang bawat isa ay tinatalakay sa ibaba.

Bahagi I: Pag-aaral sa konteksto

Ang unang bahagi ng pananaliksik ay binubuo sa pagrepaso sa kasalukuyang literatura sa iba't ibang uri ng data warehousing kabilang ang decision aid systems (DSS), executive information systems (EIS), case study ng data bodega at ang mga konsepto ng data bodega. Higit pa rito, ang mga resulta ng foum sui data bodega at mga grupo ng pagpupulong para sa mga eksperto at practitioner na pinamumunuan ng Monash DSS research group, ay nag-ambag sa yugtong ito ng pag-aaral na nilayon upang makakuha ng impormasyon sa pagsasagawa ng data bodega at upang matukoy ang mga panganib na kasangkot sa kanilang pag-aampon. Sa panahong ito ng kontekstwal na pag-aaral, ang pag-unawa sa lugar ng problema ay itinatag upang magbigay ng background na kaalaman para sa mga susunod na empirical na pagsisiyasat. Gayunpaman, ito ay isang patuloy na proseso habang isinasagawa ang pananaliksik na pag-aaral.

Bahagi II: Empirical Research

Ang medyo bagong konsepto ng data warehousing, lalo na sa Australia, ay lumikha ng pangangailangan para sa isang pagsisiyasat upang makakuha ng malawak na larawan ng karanasan ng user. Ang bahaging ito ay ginawa kapag ang domain ng problema ay naitatag sa pamamagitan ng malawak na pagsusuri sa literatura. Ang konsepto ng data-warehousing na nabuo sa yugto ng pag-aaral sa konteksto ay ginamit bilang input para sa paunang talatanungan ng pag-aaral na ito. Pagkatapos nito, sinuri ang talatanungan. Expert na kayo data bodega nakibahagi sa pagsusulit. Ang layunin ng paunang pagsusulit sa talatanungan ay suriin ang pagkakumpleto at katumpakan ng mga tanong. Batay sa mga resulta ng pagsusulit, ang talatanungan ay binago at ang binagong bersyon ay ipinadala sa mga kalahok sa survey. Ang mga ibinalik na talatanungan ay sinuri para sa i data sa mga talahanayan, diagram at iba pang mga format. ANG

resulta ng pagsusuri ng data bumuo ng snapshot ng pagsasagawa ng data warehousing sa Australia.

PANGKALAHATANG-IDEYA NG DATA WAREHOUSING

Ang konsepto ng data warehousing ay umunlad sa mga pagpapabuti sa teknolohiya ng computer.
Ito ay naglalayong malampasan ang mga problemang kinakaharap ng mga application support group tulad ng Decision Support System (DSS) at Executive Information System (EIS).

Noong nakaraan, ang pinakamalaking balakid ng mga application na ito ay ang kawalan ng kakayahan ng mga application na ito na magbigay ng a base ng datos kailangan para sa pagsusuri.
Ito ay pangunahing sanhi ng likas na katangian ng gawain ng pamamahala. Ang mga interes ng pamamahala ng isang kumpanya ay patuloy na nag-iiba depende sa lugar na sakop. Samakatuwid, ako data pangunahing para sa mga application na ito ay dapat na mabilis na magbago depende sa bahaging gagamutin.
Nangangahulugan ito na i data dapat na available ang mga ito sa naaangkop na anyo para sa mga kinakailangang pagsusuri. Sa katunayan, ang mga grupo ng suporta sa application ay nakahanap ng maraming kahirapan sa nakaraan upang mangolekta at magsama data mula sa kumplikado at magkakaibang mga mapagkukunan.

Ang natitirang bahagi ng seksyong ito ay nagpapakita ng isang pangkalahatang-ideya ng konsepto ng data warehousing at tinatalakay kung paano ang data bodega maaaring malampasan ang mga problema ng mga grupo ng suporta sa aplikasyon.
Ang salitang "Warehouse ng DataInilabas ni William Inmon noong 1990. Ang madalas niyang binabanggit na kahulugan ay ang Warehouse ng Data bilang isang koleksyon ng data subject-oriented, integrated, non-volatile, at variable sa paglipas ng panahon, upang suportahan ang mga desisyon sa pamamahala.

Gamit ang kahulugang ito, itinuturo ni Inmon na i data naninirahan sa a data bodega dapat silang magkaroon ng sumusunod na 4 na katangian:

▪ Nakatuon sa paksa
▪ Pinagsama
▪ Hindi pabagu-bago
▪ Variable sa paglipas ng panahon Ayon sa Subject Oriented Inmon ay nangangahulugan na i data sa data bodega sa pinakamalaking mga lugar ng organisasyon na naging

tinukoy sa modelo data. Halimbawa lahat data tungkol sa mga customer ay nakapaloob sa lugar ng paksa MGA CUSTOMER. Ganun din lahat data na may kaugnayan sa mga produkto ay nakapaloob sa paksa na mga PRODUKTO.

Sa pamamagitan ng Integrati Inmon ay nangangahulugan na i data mula sa iba't ibang platform, system at lokasyon ay pinagsama at nakaimbak sa isang lugar. Dahil dito data ang mga katulad na format ay dapat mabago sa pare-parehong mga format upang madali silang maidagdag at maihambing.
Halimbawa, ang kasarian ng lalaki at babae ay kinakatawan ng mga titik M at F sa isang sistema, at may 1 at 0 sa isa pa. Upang maisama ang mga ito nang maayos, dapat baguhin ang isa o parehong mga format upang magkapareho ang dalawang format. Sa kasong ito maaari naming baguhin ang M sa 1 at F sa 0 o vice versa. Ipinahihiwatig ng subject-oriented at Integrated na ang data bodega ay idinisenyo upang magbigay ng functional at transversal view ng data ng kumpanya.

Non-volatile ay nangangahulugan na i data sa data bodega manatiling pare-pareho at i-update ang data hindi naman kailangan. Sa halip, anumang pagbabago sa data ang mga orihinal ay idinagdag sa database del data bodega. Nangangahulugan ito na ang mananalaysay ng data ay nakapaloob sa data bodega.

Para sa mga Variable sa Paglipas ng Panahon Isinasaad ng Inmon na i data sa data bodega laging naglalaman ng mga time marker at i data karaniwang tumatawid sila sa isang tiyak na abot-tanaw ng oras. Halimbawa a
data bodega maaaring magkaroon ng 5 taon ng mga makasaysayang halaga ng mga customer mula 1993 hanggang 1997. Ang pagkakaroon ng mananalaysay at isang serye ng panahon ng data nagbibigay-daan sa iyo upang pag-aralan ang mga uso.

Un data bodega kaya niyang kolektahin ang sarili niya data mula sa mga sistema ng OLTP; mula sa mga pinagmulan data panlabas sa organisasyon at / o iba pang mga espesyal na proyekto ng sistema ng pagkuha data.
I data ang mga extract ay maaaring dumaan sa proseso ng paglilinis, sa kasong ito i data ang mga ito ay binago at isinama bago itago sa database del data bodega. Tsaka ako data

naninirahan sa loob ng database del data bodega ay ginawang available sa access ng end-user at mga tool sa pagbawi. Gamit ang mga tool na ito, maa-access ng end user ang pinagsama-samang view ng organisasyon ng data.

I data naninirahan sa loob ng database del data bodega ang mga ito ay naka-imbak sa parehong detalye at sa mga format ng buod.
Ang antas ng buod ay maaaring depende sa katangian ng data. Ako data ang detalyado ay maaaring binubuo ng data kasalukuyang at data mga mananalaysay
I data real ay hindi kasama sa data bodega hanggang ako ay data sa data bodega ay muling na-update.
Bilang karagdagan sa pag-iimbak ng data kanilang sarili, a data bodega maaari rin itong mag-imbak ng ibang uri ng dato tinatawag na METADATA na naglalarawan sa i data naninirahan sa kanyang database.
Mayroong dalawang uri ng metadata: development metadata at analysis metadata.
Ginagamit ang development metadata upang pamahalaan at i-automate ang mga proseso ng pag-extract, paglilinis, pagmamapa at pag-upload data sa data bodega.
Ang impormasyong nakapaloob sa metadata ng pag-unlad ay maaaring maglaman ng mga detalye ng mga operating system, mga detalye ng mga elementong kukunin, ang modelo data del data bodega at mga panuntunan sa negosyo para sa pag-convert ng data data.

Ang pangalawang uri ng metadata, na kilala bilang analytics metadata ay nagbibigay-daan sa end user na galugarin ang nilalaman ng data bodega upang mahanap ang data magagamit at ang kanilang kahulugan sa malinaw, hindi teknikal na mga termino.

Kaya ang analytics metadata ay gumagana bilang isang tulay sa pagitan ng data bodega at mga aplikasyon ng end-user. Ang metadata na ito ay maaaring maglaman ng modelo ng negosyo, mga paglalarawan ng data naaayon sa modelo ng negosyo, mga paunang natukoy na query at ulat, impormasyon para sa pag-access ng user at ang index.

Dapat pagsamahin ang metadata ng pagsusuri at pag-develop sa isang pinagsama-samang metadata ng containment upang gumana nang maayos.

Sa kasamaang palad, marami sa mga umiiral na tool ang may sariling metadata at sa kasalukuyan ay walang mga umiiral na pamantayan na

payagan ang mga tool sa warehousing ng data na isama ang metadata na ito. Upang malunasan ang sitwasyong ito maraming vendor ng mga nangungunang tool sa pag-iimbak ng data ang bumuo ng Meta Data Council na kalaunan ay naging Meta Data Coalition.

Ang layunin ng koalisyon na ito ay bumuo ng isang karaniwang set ng metadata na nagbibigay-daan sa iba't ibang mga tool sa warehousing ng data na mag-convert ng metadata
Ang kanilang mga pagsisikap ay nagresulta sa pagsilang ng Meta Data Interchange Specification (MDIS) na magbibigay-daan sa pagpapalitan ng impormasyon sa pagitan ng mga archive ng Microsoft at mga kaugnay na MDIS file.

Ang pagkakaroon ng data parehong summarized/index at detalyado, binibigyan nito ang user ng posibilidad na magsagawa ng DRILL DROWN (pagbabarena) mula sa data na-index sa mga detalyado at vice versa. Ang pagkakaroon ng data pinahihintulutan ng detalyadong kasaysayan ang paglikha ng mga pagsusuri sa trend sa paglipas ng panahon. Bilang karagdagan, ang metadata ng pagsusuri ay maaaring gamitin bilang isang del directory database del data bodega upang matulungan ang mga end user na mahanap ang i data kailangan.

Kung ihahambing sa mga OLTP system, na may kakayahang suportahan ang pagsusuri ng data at pag-uulat, ang data bodega ito ay nakikita bilang isang mas angkop na sistema para sa mga proseso ng impormasyon tulad ng paggawa at pagsagot sa mga query at paggawa ng mga ulat. Ang susunod na seksyon ay i-highlight ang mga pagkakaiba ng dalawang sistema nang detalyado.

DATA WAREHOUSE LABAN SA OLTP SYSTEMS

Marami sa mga sistema ng impormasyon sa loob ng mga organisasyon ay nilayon upang suportahan ang pang-araw-araw na operasyon. Ang mga system na ito na kilala bilang OLTP SYSTEMS, ay kumukuha ng mga pang-araw-araw na transaksyon na patuloy na ina-update.

I data sa loob ng mga sistemang ito ay kadalasang binabago, idinaragdag o tinatanggal ang mga ito. Halimbawa, nagbabago ang address ng isang customer habang lumilipat siya sa isang lugar. Sa kasong ito, ang bagong address ay irerehistro sa pamamagitan ng pagbabago sa address field ng database. Ang pangunahing layunin ng mga sistemang ito ay upang bawasan ang mga gastos sa transaksyon at sa parehong oras bawasan ang mga oras ng pagproseso. Kasama sa mga halimbawa ng OLTP System ang mga kritikal na pagkilos gaya ng pag-order ng journal, payroll, mga invoice, pagmamanupaktura, serbisyo sa customer mga customer.

Hindi tulad ng mga OLTP system, na nilikha para sa transaksyon at mga prosesong nakabatay sa kaganapan, i data bodega ay nilikha upang magbigay ng suporta sa proseso na nakabatay sa analytics data at sa mga proseso ng paggawa ng desisyon.

Ito ay karaniwang nakakamit sa pamamagitan ng pagsasama ng i data mula sa iba't ibang OLTP at mga panlabas na sistema sa isang "lalagyan" ng data, gaya ng tinalakay sa nakaraang seksyon.

Modelo ng Proseso ng Monash Data Warehousing

Ang modelo ng proseso para sa data bodega Ang Monash ay binuo ng mga mananaliksik sa Monash DSS Research Group at batay sa panitikan ng data bodega, karanasan sa mga patlang ng mga sistema ng suporta sa pag-unlad, mga talakayan sa mga vendor ng application para magamit sa data bodega, sa isang pangkat ng mga eksperto sa paggamit ng data bodega.

Ang mga yugto ay: Pagsisimula, Pagpaplano, Pagpapaunlad, Pagpapatakbo at Pagpapaliwanag. Ipinapaliwanag ng diagram ang umuulit o ebolusyonaryong katangian ng pagbuo ng a data bodega proseso gamit ang mga two-way na arrow na inilagay sa pagitan ng iba't ibang phase. Sa kontekstong ito, ang ibig sabihin ng "iterative" at "evolutionary" ay, sa bawat hakbang ng proseso, ang mga aktibidad sa pagpapatupad ay maaaring palaging magpalaganap pabalik sa nakaraang yugto. Ito ay dahil sa katangian ng isang proyekto data bodega kung saan nagaganap ang mga karagdagang kahilingan ng end user anumang oras. Halimbawa, sa yugto ng pag-unlad ng isang proseso data bodegaKung ang isang bagong laki ng paksa o lugar ay hiniling ng end user, na hindi bahagi ng orihinal na plano, dapat itong idagdag sa system. Nagdudulot ito ng pagbabago sa proyekto. Ang resulta ay kailangang baguhin ng koponan ng disenyo ang mga kinakailangan ng mga dokumentong ginawa sa ngayon sa yugto ng disenyo. Sa maraming mga kaso, ang kasalukuyang estado ng proyekto ay kailangang bumalik sa yugto ng disenyo kung saan ang bagong kinakailangan ay kailangang idagdag at idokumento. Dapat makita ng end user ang partikular na dokumentasyon na nasuri at ang mga pagbabagong ginawa sa yugto ng pag-unlad. Sa pagtatapos ng yugto ng pag-unlad na ito, ang proyekto ay kailangang makakuha ng magandang feedback mula sa parehong development at user team. Ang feedback ay muling ginagamit upang mapabuti ang isang hinaharap na proyekto.

Pagpaplano ng kapasidad
dw ay may posibilidad na napakalaki sa laki at mabilis na lumaki (Best 1995, Rudin 1997a) dahil sa dami ng data historikal na kanilang pinapanatili mula sa kanilang tagal. Ang paglago ay maaari ding sanhi ng data mga add-on na hiniling ng mga user para taasan ang halaga ng data na mayroon na sila. Dahil dito, ang mga kinakailangan sa imbakan para sa data maaaring makabuluhang mapahusay (Eckerson 1997). Kaya, mahalagang tiyakin, sa pamamagitan ng pagsasagawa ng pagpaplano ng kapasidad, na ang sistemang itatayo ay maaaring lumago habang lumalaki ang mga pangangailangan (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Sa pagpaplano para sa scalability ng data warehouse, dapat malaman ng isa ang inaasahang paglaki sa laki ng warehouse, ang mga uri ng mga tanong na malamang na gawin, at ang bilang ng mga end user na sinusuportahan (Best 1995, Rudin 1997b, Foley 1997a). Ang pagbuo ng mga scalable na application ay nangangailangan ng kumbinasyon ng mga scalable na teknolohiya ng server at scalable na mga diskarte sa disenyo ng application (Best 1995, Rudin 1997b. Parehong kinakailangan sa pagbuo ng isang mataas na scalable na application. Ang mga scalable na teknolohiya ng server ay maaaring gawing madali at epektibo ang gastos upang magdagdag ng storage, memory at CPU nang walang nakakababa ng pagganap (Lang 1997, Telephony 1997).

Mayroong dalawang pangunahing scalable na teknolohiya ng server: symmetric multiple processing (SMP) at massively parallel processing (MPP) ) (IDC 1997, Humphries et al. 1999). Karaniwang mayroong maraming processor ang SMP server na nagbabahagi ng memorya, mga system bus, at iba pang mapagkukunan (IDC 1997, Humphries et al. 1999). Maaaring magdagdag ng mga karagdagang processor para mapalakas ito kapangyarihan computational. Ang isa pang paraan upang madagdagan ang kapangyarihan computation ng SMP server, ay upang pagsamahin ang maraming SMP machine. Ang pamamaraan na ito ay kilala bilang clustering (Humphries et al. 1999). Ang isang MPP server, sa kabilang banda, ay may maraming processor na bawat isa ay may sariling memorya, sistema ng bus, at iba pang mapagkukunan (IDC 1997, Humphries et al. 1999). Ang bawat processor ay tinatawag na node. Isang pagtaas sa kapangyarihan maaaring makuha ang computational

pagdaragdag ng mga karagdagang node sa mga MPP server (Humphries et al. 1999).

Ang isang kahinaan ng mga server ng SMP ay ang napakaraming input-output (I/O) na mga operasyon ay maaaring masikip ang sistema ng bus (IDC 1997). Ang problemang ito ay hindi nangyayari sa loob ng mga MPP server dahil ang bawat processor ay may sariling bus system. Gayunpaman, ang mga interconnection sa pagitan ng bawat node ay karaniwang mas mabagal kaysa sa SMP bus system. Higit pa rito, ang mga MPP server ay maaaring magdagdag ng karagdagang layer ng pagiging kumplikado sa mga developer ng application (IDC 1997). Kaya, ang pagpili sa pagitan ng mga server ng SMP at MPP ay maaaring maimpluwensyahan ng maraming mga kadahilanan, kabilang ang pagiging kumplikado ng mga aplikasyon, ang ratio ng presyo/pagganap, kinakailangan ang throughput, ang mga dw application na napigilan at ang pagtaas ng laki ng database ng dw at sa bilang ng mga end user.

Ang isang bilang ng mga scalable na diskarte sa disenyo ng aplikasyon ay maaaring gamitin sa pagpaplano ng kapasidad. Gumagamit ang isa ng iba't ibang panahon ng pag-uulat tulad ng mga araw, linggo, buwan at taon. Ang pagkakaroon ng iba't ibang panahon ng notification, ang database ay maaaring hatiin sa mapapangkat-pangkat na mga piraso (Inmon et al. 1997). Ang isa pang pamamaraan ay ang paggamit ng mga talahanayan ng buod na binuo sa pamamagitan ng pagbubuod data da data detalyado. Kaya, i data ang mga abstract ay mas compact kaysa sa detalyado, na nangangailangan ng mas kaunting espasyo sa memorya. Kaya ang data maaaring i-archive ang mga detalye sa mas murang storage unit, na mas makakatipid ng storage. Habang ang paggamit ng mga talahanayan ng buod ay maaaring makatipid ng espasyo sa imbakan, nangangailangan ang mga ito ng maraming pagsisikap upang mapanatili ang mga ito sa kasalukuyan at naaayon sa mga pangangailangan ng negosyo. Gayunpaman, ang pamamaraan na ito ay malawakang ginagamit at kadalasang ginagamit kasabay ng nakaraang pamamaraan (Best 1995, Inmon 1996a, Chauduri at Dayal
1997).

Pagtukoy Warehouse ng Data Mga Teknikal na Arkitektura Kahulugan ng mga diskarte sa dw architecture

Ang mga naunang nag-adopt ng data warehousing ay pangunahing naisip ng isang sentralisadong pagpapatupad ng data warehouse kung saan lahat data, kasama ang i data panlabas, ay isinama sa isang solong,
pisikal na imbakan (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Ang pangunahing benepisyo ng diskarteng ito ay ang mga end user ay naa-access ang enterprise-wide view ng data organisasyonal (Ovum 1998). Ang isa pang plus ay nag-aalok ito ng standardisasyon ng data sa kabuuan ng organisasyon, na nangangahulugan na mayroon lamang isang bersyon o kahulugan para sa bawat terminolohiya na ginagamit sa dw repository metadata (Flanagan at Safdie 1997, Ovum 1998). Ang disbentaha naman ng diskarteng ito, sa kabilang banda, ay ito ay mahal at mahirap gawin (Flanagan at Safdie 1997, Ovum 1998, Inmon et al. 1998). Hindi nagtagal pagkatapos ng arkitektura ng imbakan data naging popular ang sentralisadong, ang konsepto ng pagmimina ang pinakamaliit na subset ng mga diyos ay umunlad data upang suportahan ang mga pangangailangan ng mga partikular na aplikasyon (Varney 1996, IDC 1997, Berson at Smith 1997, peacock 1998). Ang maliliit na sistemang ito ay nagmula sa mas malaki data bodega sentralisado. Pinangalanan sila data bodega kagawaran ng empleyado o data mart ng empleyado. Ang dependent data mart architecture ay kilala bilang three-tiered architecture kung saan ang unang tier ay binubuo ng data bodega sentralisado, ang pangalawa ay binubuo ng mga deposito ng data departamento at ang pangatlo ay binubuo ng access sa data at sa pamamagitan ng mga tool sa pagsusuri (Demarest 1994, Inmon et al. 1997).

Ang mga data mart ay karaniwang binuo pagkatapos ng data bodega sentralisado ay itinayo upang matugunan ang mga pangangailangan ng mga partikular na yunit (White 1995, Varney 1996).
Tindahan ng data marts i data nauugnay sa mga partikular na yunit (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

Ang bentahe ng pamamaraang ito ay hindi magkakaroon dato hindi pinagsama at na i data ay hindi gaanong kalabisan sa loob ng data marts dahil ang lahat ng data nanggaling sa deposito ng data pinagsama-sama. Ang isa pang bentahe ay magkakaroon ng mas kaunting mga link sa pagitan ng bawat data mart at mga pinagmulan nito data dahil ang bawat data mart ay may isang source lang ng data. Dagdag pa sa pagkakaroon ng ganitong arkitektura, maa-access pa rin ng mga end user ang data

mga organisasyon ng korporasyon. Ang pamamaraang ito ay kilala bilang ang top-down na paraan, kung saan ang mga data mart ay binuo pagkatapos ng data bodega (paboreal 1998, Goff 1998).
Ang pagtaas ng pangangailangan na magpakita ng mga resulta nang maaga, ang ilang mga organisasyon ay nagsimulang bumuo ng mga independiyenteng data mart (Flanagan at Safdie 1997, White 2000). Sa kasong ito, makukuha ng data mart ang kanila data diretso mula sa mga pangunahing kaalaman ng data OLTP at non-OLTP mula sa sentralisadong at pinagsama-samang imbakan, kaya inaalis ang pangangailangan para sa sentral na imbakan sa lugar.

Ang bawat data mart ay nangangailangan ng hindi bababa sa isang link sa mga pinagmulan nito data. Ang isang kawalan ng pagkakaroon ng maraming link sa bawat data mart ay, kumpara sa nakaraang dalawang arkitektura, ang labis na kasaganaan ng data tumataas nang malaki.

Ang bawat data mart ay dapat mag-imbak ng lahat ng data kinakailangan sa lokal na walang epekto sa mga OLTP system. Nagdudulot ito ng i data sila ay nakaimbak sa iba't ibang data marts (Inmon et al. 1997). Ang isa pang disbentaha ng arkitektura na ito ay humahantong ito sa paglikha ng mga kumplikadong pagkakaugnay sa pagitan ng data mart at ng kanilang mga pinagmumulan ng data. data na mahirap ipatupad at kontrolin (Inmon et al. 1997).

Ang isa pang disbentaha ay maaaring hindi ma-access ng mga end user ang pangkalahatang-ideya ng impormasyon ng kumpanya dahil i data ng iba't ibang data mart ay hindi isinama (Ovum 1998).
Ang isa pang disbentaha ay maaaring mayroong higit sa isang kahulugan para sa bawat terminolohiya na ginagamit sa mga data mart na bumubuo ng mga hindi pagkakapare-pareho ng data. data sa organisasyon (Ovum 1998).
Sa kabila ng mga disadvantages na tinalakay sa itaas, ang mga standalone data mart ay nakakaakit pa rin ng interes ng maraming organisasyon (IDC 1997). Isang salik na nakakaakit sa kanila ay ang mas mabilis silang umunlad at nangangailangan ng mas kaunting oras at mapagkukunan (Bresnahan 1996, Berson at Smith 1997, Ovum 1998). Dahil dito, pangunahing nagsisilbi ang mga ito bilang mga disenyo ng pagsubok na maaaring magamit upang mabilis na matukoy ang mga benepisyo at/o mga pagkukulang sa disenyo (Parsaye 1995, Braly 1995, Newing 1996). Sa kasong ito, ang bahaging ipapatupad sa pilot project ay dapat maliit ngunit mahalaga sa organisasyon (Newing 1996, Mansell-Lewis 1996).

Sa pamamagitan ng pagsusuri sa prototype, maaaring magpasya ang mga end user at management kung ipagpapatuloy o ititigil ang proyekto (Flanagan at Safdie 1997).
Kung ang desisyon ay magpapatuloy, ang mga data mart para sa iba pang mga industriya ay dapat na itayo nang paisa-isa. Mayroong dalawang mga opsyon para sa mga end user batay sa kanilang mga pangangailangan sa pagbuo ng mga independiyenteng data matr: integrated/federated at unintegrated (Ovum 1998)

Sa unang paraan, ang bawat bagong data mart ay dapat itayo batay sa kasalukuyang data mart at modelo data ginamit ng kompanya (Varney 1996, Berson at Smith 1997, Peacock 1998). Ang pangangailangan na gamitin ang modelo data ng enterprise ay nangangahulugan na dapat tiyakin ng isa na mayroon lamang isang kahulugan para sa bawat terminolohiya na ginagamit sa kabuuan ng data marts, upang matiyak din na ang iba't ibang data mart ay maaaring pagsamahin upang magbigay ng pangkalahatang-ideya ng impormasyon ng enterprise (Bresnahan 1996). Ang pamamaraang ito ay tinatawag na bottom-up na pamamaraan at pinakamahusay na ginagamit kapag may hadlang sa pinansiyal na paraan at oras (Flanagan at Safdie 1997, Ovum 1998, peacock 1998, Goff 1998). Sa pangalawang paraan, ang mga built data mart ay maaari lamang matugunan ang mga pangangailangan ng isang partikular na yunit. Ang isang variant ng federated data mart ay ang data bodega ipinamahagi kung saan ang database Ang middleware ng hub server ay ginagamit upang pagsamahin ang maraming data mart sa iisang repositoryo data ipinamahagi (White 1995). Sa kasong ito, i data ang negosyo ay ipinamamahagi sa ilang data mart. Ang mga kahilingan ng end user ay ipinapasa sa database hub server middleware, na kumukuha ng lahat data hiniling ng data mart at ibalik ang mga resulta sa mga application ng end-user. Nagbibigay ang paraang ito ng impormasyon ng negosyo sa mga end user. Gayunpaman, ang mga problema ng mga independiyenteng data mart ay hindi pa rin naaalis. May isa pang arkitektura na maaaring gamitin na tinatawag na data bodega virtual (White 1995). Gayunpaman, ang arkitektura na ito, na inilalarawan sa Figure 2.9, ay hindi isang arkitektura ng imbakan ng data data tunay dahil hindi nito ginagalaw ang load mula sa OLTP system sa data bodega (Demarest 1994).

Sa katunayan, ang mga kahilingan para sa data ng mga end user ay ipinapasa sila sa mga OLTP system na nagbabalik ng mga resulta pagkatapos iproseso ang mga kahilingan ng user. Bagama't pinapayagan ng arkitektura na ito ang mga end user na bumuo ng mga ulat at gumawa ng mga kahilingan, hindi ito makapagbibigay ng i

data kasaysayan at pangkalahatang-ideya ng impormasyon ng kumpanya mula noong i data dahil ang iba't ibang mga sistema ng OLTP ay hindi isinama. Samakatuwid, ang arkitektura na ito ay hindi maaaring masiyahan ang pagsusuri ng data tulad ng mga hula.

Pagpili ng mga aplikasyon ng pag-access at pagbawi ng data data

Ang layunin ng pagtatayo ng a data bodega ay upang ihatid ang impormasyon sa mga end user (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); isa o higit pang access at recovery application data dapat ipagkaloob. Sa ngayon, may malawak na pagkakaiba-iba ng mga naturang application na mapagpipilian ng user (Hammergren 1998, Humphries et al. 1999). Tinutukoy ng mga napiling aplikasyon ang tagumpay ng pagsisikap sa pag-iimbak data sa isang organisasyon dahil ang mga application ay ang pinaka nakikitang bahagi ng data bodega sa end user (Inmon et al. 1997, Poe 1996). Upang maging matagumpay a data bodega, ay dapat na kayang suportahan ang mga aktibidad sa pagsusuri ng data data ng end user (Poe 1996, Seddon at Benjamin 1998, Eckerson 1999). Kaya't ang "antas" ng kung ano ang nais ng end user ay dapat matukoy (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

Sa pangkalahatan, ang mga end user ay maaaring pangkatin sa tatlong kategorya: executive user, business analysts at power users (Poe 1996, Humphries et al. 1999). Ang mga executive user ay nangangailangan ng madaling pag-access sa mga paunang natukoy na hanay ng mga ulat (Humphries et al. 1999). Ang mga ulat na ito ay madaling ma-access gamit ang menu navigation (Poe 1996). Bilang karagdagan, ang mga ulat ay dapat magpakita ng impormasyon gamit ang graphical na representasyon tulad ng mga talahanayan at mga template upang maihatid ang impormasyon nang mabilis (Humphries et al. 1999). Ang mga analyst ng negosyo, na maaaring walang teknikal na kakayahan upang bumuo ng mga ulat mula sa simula sa kanilang sarili, ay kailangang mabago ang mga kasalukuyang ulat upang matugunan ang kanilang mga partikular na pangangailangan (Poe 1996, Humphries et al. 1999). Ang mga power user, sa kabilang banda, ay ang uri ng end user na may kakayahang bumuo at magsulat ng mga kahilingan at ulat mula sa simula (Poe 1996, Humphries et al. 1999). Sila ang mga

bumuo sila ng mga relasyon para sa iba pang uri ng mga gumagamit (Poe 1996, Humphries et al. 1999).

Kapag natukoy na ang mga kinakailangan ng end user, dapat gumawa ng pagpili ng mga access at recovery application data sa lahat ng magagamit (Poe 1996, Inmon et al. 1997).
Access sa data at retrieval tool ay maaaring uriin sa 4 na uri: OLAP tool, EIS/DSS tool, query at reporting tool, at data mining tool.

Binibigyang-daan ng mga tool ng OLAP ang mga user na lumikha ng mga ad hoc query pati na rin ang mga ginawa sa database del data bodega. Bukod pa rito, pinapayagan ng mga produktong ito ang mga user na mag-drill down mula sa data pangkalahatan hanggang detalyado.

Ang mga tool ng EIS/DSS ay nagbibigay ng executive na pag-uulat gaya ng pagsusuri ng “paano kung” at pag-access sa mga ulat na batay sa menu. Ang mga ulat ay dapat na paunang natukoy at pinagsama sa mga menu para sa mas madaling pag-navigate.
Ang mga tool sa pagtatanong at pag-uulat ay nagbibigay-daan sa mga user na gumawa ng mga paunang natukoy at partikular na ulat.

Ginagamit ang mga tool sa pagmimina ng data upang matukoy ang mga relasyon na maaaring magbigay ng bagong liwanag sa mga nakalimutang operasyon data ng data warehouse.

Kasabay ng pag-optimize sa mga kinakailangan ng bawat uri ng user, ang mga tool na napili ay dapat na intuitive, mahusay at madaling gamitin. Kailangan din nilang maging tugma sa iba pang bahagi ng arkitektura at magagawang gumana sa mga umiiral nang system. Iminumungkahi din na pumili ng data access at retrieval tools na may makatwirang presyo at performance. Kasama sa iba pang pamantayan na dapat isaalang-alang ang pangako ng nagtitinda ng tool sa pagsuporta sa kanilang produkto at ang mga pag-unlad nito sa mga paglabas sa hinaharap. Upang matiyak ang pakikipag-ugnayan ng user sa paggamit ng data warehouse, ang development team ay nagsasangkot ng mga user sa proseso ng pagpili ng tool. Sa kasong ito, ang isang praktikal na pagsusuri ng gumagamit ay dapat isagawa.

Upang mapahusay ang halaga ng data warehouse, ang development team ay maaari ding magbigay ng web access sa kanilang mga data warehouse. Ang isang web-enabled na data warehouse ay nagbibigay-daan sa mga user na ma-access ang data mula sa malalayong lugar o habang naglalakbay. Gayundin ang impormasyon ay maaari

ipagkakaloob sa mas mababang halaga sa pamamagitan ng pagbaba sa mga gastos sa pagsasanay.

2.4.3 Warehouse ng Data Yugto ng Operasyon

Ang bahaging ito ay binubuo ng tatlong aktibidad: kahulugan ng mga diskarte sa pag-refresh ng data, kontrol sa mga aktibidad ng data warehouse at pamamahala ng seguridad ng data warehouse.

Kahulugan ng mga diskarte sa pag-refresh ng data

Pagkatapos ng paunang paglo-load, i data sa database ng data warehouse ay dapat na i-refresh pana-panahon upang kopyahin ang mga pagbabagong ginawa sa data mga orihinal. Kaya kailangan mong magpasya kung kailan ire-refresh, kung gaano kadalas dapat iiskedyul ang pag-refresh at kung paano i-refresh ang data. Iminumungkahi na i-refresh ang data kapag ang system ay maaaring kunin offline. Ang rate ng pag-refresh ay tinutukoy ng development team batay sa mga kinakailangan ng user. Mayroong dalawang diskarte sa pag-refresh ng data warehouse: ganap na pag-refresh at patuloy na pag-upload ng mga pagbabago.

Ang unang diskarte, ang buong pag-refresh, ay nangangailangan ng pag-reload ng lahat data mula sa wala. Nangangahulugan ito na ang lahat ng data kinakailangan ay dapat i-extract, linisin, baguhin at isama sa bawat pag-refresh. Ang pamamaraang ito ay dapat na iwasan hangga't maaari dahil ito ay nakakaubos ng oras at nakakaubos ng mapagkukunan.

Ang isang alternatibong diskarte ay ang patuloy na pag-upload ng mga pagbabago. Ito ay nagdaragdag ng i data na nagbago mula noong huling ikot ng pag-refresh ng data warehouse. Ang pagkilala sa mga bago o binagong talaan ay makabuluhang binabawasan ang halaga ng data na dapat ipalaganap sa data warehouse sa bawat update bilang mga ito lamang data ay idadagdag sa database ng data warehouse.

Mayroong hindi bababa sa 5 mga diskarte na maaaring magamit upang bawiin i data bago o binago. Upang makamit ang isang mahusay na diskarte sa pag-refresh ng video data maaaring maging kapaki-pakinabang ang isang halo ng mga diskarteng ito na kumukuha ng lahat ng pagbabago sa system.

Ang unang diskarte, na gumagamit ng mga timestamp, ay ipinapalagay na ang lahat ay itinalaga data nag-edit at nag-update ng timestamp para madali mong matukoy ang lahat data binago at bago. Gayunpaman, ang pamamaraang ito ay hindi malawakang ginagamit sa karamihan ng mga operating system ngayon.
Ang pangalawang diskarte ay ang paggamit ng delta file na binuo ng application na naglalaman lamang ng mga pagbabagong ginawa sa data. Ang paggamit ng file na ito ay nagpapalakas din sa ikot ng pag-update. Gayunpaman, kahit na ang pamamaraang ito ay hindi ginagamit sa maraming mga aplikasyon.
Ang ikatlong diskarte ay ang pag-scan ng isang log file, na karaniwang naglalaman ng impormasyong katulad ng delta file. Ang pagkakaiba lang ay ang isang log file ay nilikha para sa proseso ng pagbawi at maaaring mahirap maunawaan.
Ang pang-apat na diskarte ay ang pagbabago ng code ng aplikasyon. Gayunpaman, karamihan sa code ng aplikasyon ay luma at malutong; samakatuwid ang pamamaraan na ito ay dapat na iwasan.
Ang huling diskarte ay ang paghahambing ng i data mga mapagkukunan na may pangunahing file na dei data.

Pagsubaybay sa mga aktibidad ng data warehouse

Kapag nai-release na ang data warehouse sa mga user, kailangan itong subaybayan sa paglipas ng panahon. Sa kasong ito, ang administrator ng data warehouse ay maaaring gumamit ng isa o higit pang mga tool sa pamamahala at kontrol upang subaybayan ang paggamit ng data warehouse. Sa partikular, maaaring mangolekta ng impormasyon sa mga tao at sa oras na ma-access nila ang data warehouse. Halika na data na nakolekta, maaaring gumawa ng profile ng gawaing isinagawa na maaaring magamit bilang input sa pagpapatupad ng chargeback ng user. Nagbibigay-daan ang Chargeback sa mga user na malaman ang tungkol sa gastos sa pagproseso ng data warehouse.

Bilang karagdagan, ang pag-audit ng warehouse ng data ay maaari ding gamitin upang tukuyin ang mga uri ng query, laki ng mga ito, bilang ng mga query bawat araw, oras ng reaksyon ng query, mga sektor na naabot, at dami ng data naproseso. Ang isa pang layunin ng paggawa ng data warehouse auditing ay kilalanin ang data na hindi ginagamit. Ang mga ito data maaari silang alisin mula sa warehouse ng data upang mapabuti ang oras

ng tugon sa pagpapatupad ng query at kontrolin ang paglaki ng data na naninirahan sa loob ng base ng datos ng data warehouse.

Pamamahala ng seguridad ng data warehouse

Ang isang data warehouse ay naglalaman ng data pinagsama-sama, kritikal, sensitibo na madaling maabot. Para sa kadahilanang ito dapat itong protektahan mula sa mga hindi awtorisadong gumagamit. Ang isang paraan upang ipatupad ang seguridad ay ang paggamit ng del function DBMS upang magtalaga ng iba't ibang mga pribilehiyo sa iba't ibang uri ng mga user. Sa ganitong paraan, dapat mapanatili ang isang access profile para sa bawat uri ng user. Ang isa pang paraan upang ma-secure ang data warehouse ay ang pag-encrypt nito gaya ng nakasulat sa base ng datos ng data warehouse. Access sa data at kailangang i-decrypt ng mga retrieval tool ang data bago ipakita ang mga resulta sa mga user.

2.4.4 Warehouse ng Data Yugto ng Deployment

Ito ang huling yugto sa ikot ng pagpapatupad ng data warehouse. Ang mga aktibidad na isasagawa sa yugtong ito ay kinabibilangan ng pagsasanay sa mga user na gamitin ang data warehouse at pagsasagawa ng mga pagsusuri sa data warehouse.

Pagsasanay ng gumagamit

Dapat gawin ang pagsasanay ng gumagamit bago mag-access data ng data warehouse at ang paggamit ng mga retrieval tool. Sa pangkalahatan, ang mga session ay dapat magsimula sa isang panimula sa konsepto ng storage data, ang nilalaman ng data warehouse, ang meta data at ang mga pangunahing tampok ng mga tool. Pagkatapos, maaaring pag-aralan din ng mga mas advanced na user ang mga pisikal na talahanayan at feature ng mga user ng access sa data at mga tool sa pagkuha.

Mayroong maraming mga diskarte upang gawin ang pagsasanay ng gumagamit. Ang isa sa mga ito ay nagsasangkot ng pagpili ng maraming user o analyst na pinili mula sa grupo ng mga user, batay sa kanilang mga kasanayan sa pamumuno at komunikasyon. Ang mga ito ay personal na sinanay sa lahat ng kailangan nilang malaman upang maging pamilyar sa system. Pagkatapos ng pagsasanay, babalik sila sa kanilang mga trabaho at magsisimulang magturo sa ibang mga user kung paano gamitin ang system. Sa

Batay sa kanilang natutunan, maaaring simulan ng ibang mga user ang paggalugad sa data warehouse.
Ang isa pang diskarte ay ang sanayin ang maraming user nang sabay-sabay, na parang nagsasanay ka sa isang silid-aralan. Ang pamamaraang ito ay angkop kapag maraming mga gumagamit na kailangang sanayin nang sabay-sabay. Ang isa pang paraan ay ang sanayin ang bawat user nang paisa-isa, isa-isa. Ang pamamaraang ito ay angkop kapag kakaunti ang mga gumagamit.

Ang layunin ng pagsasanay ng gumagamit ay upang maging pamilyar sa pag-access data at mga tool sa pagkuha pati na rin ang mga nilalaman ng data warehouse. Gayunpaman, ang ilang mga gumagamit ay maaaring mabigla sa dami ng impormasyong ibinigay sa panahon ng sesyon ng pagsasanay. Pagkatapos ay kailangang gawin ang ilang mga refresher session para sa patuloy na suporta at para masagot ang mga partikular na tanong. Sa ilang mga kaso, isang pangkat ng gumagamit ang nabuo upang magbigay ng ganitong uri ng suporta.

Pagtitipon ng feedback

Kapag nailunsad na ang data warehouse, magagamit ng mga user ang i data naninirahan sa data warehouse para sa iba't ibang layunin. Kadalasan, ginagamit ng mga analyst o user ang i data sa data warehouse para sa:

1 Tukuyin ang mga uso ng kumpanya
2 Suriin ang mga profile sa pagbili ng mga customer
3 Hatiin i mga customer at
4 Magbigay ng pinakamahusay na serbisyo sa mga customer – i-customize ang mga serbisyo
5 Bumuo ng mga diskarte marketing
6 Gumawa ng mapagkumpitensyang mga panipi para sa mga pagsusuri sa gastos at tumulong sa pagkontrol
7 Suportahan ang madiskarteng paggawa ng desisyon
8 Tukuyin ang mga pagkakataong lumabas
9 Pagbutihin ang kalidad ng mga kasalukuyang proseso ng negosyo
10 Suriin ang kita

Kasunod ng direksyon ng pag-develop ng data warehouse, maaaring magsagawa ng serye ng mga pagsusuri ng system para makakuha ng feedback

kapwa ng development team at ng end-user na komunidad.
Ang mga resulta na nakuha ay maaaring isaalang-alang para sa susunod na yugto ng pag-unlad.

Dahil ang data warehouse ay may incremental na diskarte, mahalagang matuto mula sa mga tagumpay at pagkakamali ng mga nakaraang pag-unlad.

2.5 Buod

Sa kabanatang ito ay tinalakay ang mga diskarte na nasa literatura. Sa seksyon 1 ang konsepto ng data warehouse at ang papel nito sa agham ng desisyon ay tinalakay. Inilarawan ng Seksyon 2 ang mga pangunahing pagkakaiba sa pagitan ng mga warehouse ng data at mga OLTP system. Tinalakay ng Seksyon 3 ang modelo ng data warehouse ng Monash na ginamit sa seksyon 4 upang ilarawan ang mga aktibidad na kasangkot sa proseso ng pagbuo ng isang data warehouse, ang mga paghahabol na ito ay hindi batay sa mahigpit na pananaliksik. Ang nangyayari sa katotohanan ay maaaring ibang-iba sa kung ano ang iniulat ng literatura, gayunpaman, ang mga resultang ito ay maaaring gamitin upang lumikha ng isang pangunahing bagahe na nagsalungguhit sa konsepto ng data warehouse para sa pananaliksik na ito.

Kabanata 3

Mga pamamaraan ng pananaliksik at disenyo

Ang kabanatang ito ay tumatalakay sa mga pamamaraan ng pananaliksik at disenyo para sa pag-aaral na ito. Ang unang bahagi ay nagpapakita ng isang pangkalahatang pananaw ng mga pamamaraan ng pananaliksik na magagamit para sa pagkuha ng impormasyon, at saka ang mga pamantayan para sa pagpili ng pinakamahusay na paraan para sa isang partikular na pag-aaral ay tinatalakay. Sa seksyon 2 dalawang pamamaraan na pinili na may mga pamantayan sa itaas ay tinalakay; isa sa mga ito ay pipiliin at pagtibayin para sa mga kadahilanang itinakda sa seksyon 3 kung saan ang mga dahilan para sa pagbubukod ng iba pang pamantayan ay itinakda din. Inilalahad ng Seksyon 4 ang proyekto ng pananaliksik at seksyon 5 ang mga konklusyon.

3.1 Pananaliksik sa mga sistema ng impormasyon

Ang pananaliksik sa mga sistema ng impormasyon ay hindi lamang limitado sa teknolohikal na larangan ngunit dapat ding palawigin upang isama ang mga layunin sa pag-uugali at organisasyon.
Utang namin ito sa mga thesis ng iba't ibang mga disiplina mula sa mga agham panlipunan hanggang sa mga natural; ito ay humahantong sa pangangailangan para sa isang tiyak na spectrum ng mga pamamaraan ng pananaliksik na kinasasangkutan ng quantitative at qualitative na pamamaraan na gagamitin para sa mga sistema ng impormasyon.
Ang lahat ng magagamit na pamamaraan ng pananaliksik ay mahalaga, sa katunayan ilang mga mananaliksik tulad ng Jenkins (1985), Nunamaker et al. (1991), at Galliers (1992) ay nangangatuwiran na walang tiyak na unibersal na pamamaraan para sa pagsasagawa ng pananaliksik sa iba't ibang larangan ng mga sistema ng impormasyon; sa katunayan ang isang pamamaraan ay maaaring angkop para sa isang partikular na pananaliksik ngunit hindi para sa iba. Ito ay humahantong sa amin sa pangangailangan na pumili ng isang paraan na angkop para sa aming partikular na proyekto ng pananaliksik: para sa pagpipiliang ito Benbasat et al. (1987) na nagsasabi na ang kalikasan at layunin ng pananaliksik ay dapat isaalang-alang.

3.1.1 Kalikasan ng pananaliksik

Ang iba't ibang pamamaraan ng pananaliksik na nakabatay sa kalikasan ay maaaring mauri sa tatlong kilalang tradisyon sa agham ng impormasyon: positivist, interpretive, at kritikal na pananaliksik.

3.1.1.1 Positivist na pananaliksik

Ang positivist na pananaliksik ay kilala rin bilang siyentipiko o empirikal na pag-aaral. Ito ay naglalayong: "ipaliwanag at hulaan kung ano ang mangyayari sa panlipunang mundo sa pamamagitan ng pagtingin sa mga regularidad at sanhi-epekto na relasyon sa pagitan ng mga elementong bumubuo nito" (Shanks et al 1993).

Ang positivist na pananaliksik ay nailalarawan din sa pamamagitan ng pag-uulit, pagpapasimple at pagtanggi. Higit pa rito, inamin ng positivist na pananaliksik ang pagkakaroon ng isang priori na relasyon sa pagitan ng mga phenomena na pinag-aralan.
Ayon kay Galliers (1992) ang taxonomy ay isang paraan ng pananaliksik na kasama sa positivist na paradigm, na gayunpaman ay hindi limitado dito, sa katunayan may mga laboratoryo experiments, field experiments, case study, theorem demonstrations, predictions at simulations. Gamit ang mga pamamaraang ito, inamin ng mga mananaliksik na ang mga phenomena na pinag-aralan ay maaaring maobserbahan nang may layunin at mahigpit.

3.1.1.2 Pananaliksik sa interpretasyon

Ang interpretasyong pananaliksik, na kadalasang tinatawag na phenomenology o anti-positivism ay inilarawan ni Neuman (1994) bilang “ang sistematikong pagsusuri ng panlipunang kahulugan ng aksyon sa pamamagitan ng direkta at detalyadong pagmamasid ng mga tao sa mga natural na sitwasyon, upang makarating sa isang pag-unawa at ang interpretasyon kung paano nilikha at pinapanatili ng mga tao ang kanilang panlipunang mundo”. Tinatanggihan ng mga pag-aaral ng interpretasyon ang palagay na ang mga naobserbahang penomena ay maaaring maobserbahan nang may layunin. Sa katunayan sila ay batay sa mga pansariling interpretasyon. Higit pa rito, ang mga interpretive na mananaliksik ay hindi nagpapataw ng isang priori na kahulugan sa mga phenomena na kanilang pinag-aaralan.

Kasama sa paraang ito ang mga subjective/argumentative na pag-aaral, action research, descriptive/interpretative studies, future research, at role-playing. Bilang karagdagan sa mga survey at case study na ito ay maaaring isama sa diskarteng ito dahil ang mga ito ay may kinalaman sa mga pag-aaral ng mga indibidwal o organisasyon sa loob ng mga kumplikadong sitwasyon sa totoong mundo.

3.1.1.3 Kritikal na pananaliksik

Ang kritikal na paghahanap ay ang pinakakaunting kilalang diskarte sa mga agham panlipunan ngunit kamakailan ay nakatanggap ng atensyon ng mga mananaliksik sa arena ng mga sistema ng impormasyon. Ang pilosopikal na palagay na ang panlipunang realidad ay makasaysayang ginawa at ginawa ng mga tao, pati na rin ang mga sistemang panlipunan kasama ang kanilang mga aksyon at pakikipag-ugnayan. Ang kanilang kakayahan, gayunpaman, ay pinamagitan ng ilang mga pagsasaalang-alang sa lipunan, kultura at pampulitika.

Tulad ng interpretive research, ang kritikal na pananaliksik ay nangangatwiran na ang positivist na pananaliksik ay walang kinalaman sa kontekstong panlipunan at binabalewala ang impluwensya nito sa mga aksyon ng tao.
Ang kritikal na pananaliksik, sa kabilang banda, ay pinupuna ang interpretive na pananaliksik para sa pagiging masyadong subjective at para sa hindi pagtatakda upang tulungan ang mga tao na mapabuti ang kanilang buhay. Ang pinakamalaking pagkakaiba sa pagitan ng kritikal na pananaliksik at ang iba pang dalawang diskarte ay ang evaluative na sukat nito. Habang ang objectivity ng positivist at interpretive na mga tradisyon ay upang hulaan o ipaliwanag ang status quo o social reality, ang kritikal na pananaliksik ay naglalayong kritikal na suriin at baguhin ang panlipunang realidad na pinag-aaralan.

Ang mga kritikal na mananaliksik ay karaniwang sumasalungat sa status quo upang alisin ang mga pagkakaiba sa lipunan at mapabuti ang mga kalagayang panlipunan. Ang kritikal na pananaliksik ay may pangako sa isang proseso ng pagtingin sa mga phenomena ng interes at, samakatuwid, ay karaniwang pahaba. Ang mga halimbawa ng mga pamamaraan ng pananaliksik ay ang mga pangmatagalang pag-aaral sa kasaysayan at pag-aaral na etnograpiko. Ang kritikal na paghahanap, gayunpaman, ay hindi malawakang ginagamit sa pagsasaliksik ng mga sistema ng impormasyon

3.1.2 Layunin ng pananaliksik

Kasama ang katangian ng pananaliksik, ang layunin nito ay magagamit upang gabayan ang mananaliksik sa pagpili ng isang partikular na paraan ng pananaliksik. Ang saklaw ng isang proyekto sa pananaliksik ay malapit na nauugnay sa posisyon ng pananaliksik na may kaugnayan sa siklo ng pananaliksik na binubuo ng tatlong yugto: pagbuo ng teorya, pagsubok sa teorya at pagpipino ng teorya. Kaya, batay sa momentum na may kinalaman sa ikot ng pananaliksik, ang isang proyekto sa pananaliksik ay maaaring magkaroon ng paliwanag, deskriptibo, exploratory, o predictive na layunin.

3.1.2.1 Pananaliksik sa pagtuklas

Ang pananaliksik sa pagtuklas ay naglalayong mag-imbestiga ng isang ganap na bagong paksa at magbalangkas ng mga tanong at hypotheses para sa hinaharap na pananaliksik. Ang ganitong uri ng pananaliksik ay ginagamit sa pagbuo ng teorya upang makakuha ng mga paunang sanggunian sa isang bagong lugar. Karaniwang ginagamit ang mga pamamaraan ng pananaliksik ng husay, tulad ng mga pag-aaral ng kaso o pag-aaral na phenomenological.

Gayunpaman, posible ring gumamit ng mga quantitative technique tulad ng mga exploratory survey o eksperimento.

3.1.3.3 Deskriptibong paghahanap

Ang deskriptibong pananaliksik ay idinisenyo upang pag-aralan at ilarawan nang detalyado ang isang partikular na sitwasyon o kasanayan sa organisasyon. Ito ay angkop para sa pagbuo ng mga teorya at maaari ding gamitin upang kumpirmahin o hamunin ang mga hypotheses. Karaniwang kinabibilangan ng deskriptibong pananaliksik ang paggamit ng mga sukat at sample. Kasama sa mga angkop na pamamaraan ng pananaliksik ang mga survey at pagsusuri sa background.

3.1.2.3 Pananaliksik na nagpapaliwanag

Ang paliwanag na pananaliksik ay sumusubok na ipaliwanag kung bakit nangyayari ang mga bagay. Bumubuo ito sa mga katotohanang napag-aralan na at sinusubukang hanapin ang mga dahilan ng mga katotohanang iyon.
Kaya ang paliwanag na pananaliksik ay karaniwang itinatayo sa ibabaw ng exploratory o descriptive na pananaliksik at ito ay kaakibat ng pagsubok at pagpino ng mga teorya. Ang paliwanag na pananaliksik ay karaniwang gumagamit ng mga pag-aaral ng kaso o mga pamamaraan ng pananaliksik na nakabatay sa survey.

3.1.2.4 Preemptive na pananaliksik

Ang preemptive na pananaliksik ay naglalayong hulaan ang mga naobserbahang kaganapan at pag-uugali na pinag-aaralan (Marshall at Rossman 1995). Ang hula ay ang pamantayang siyentipikong pagsubok ng katotohanan. Ang ganitong uri ng pananaliksik ay karaniwang gumagamit ng mga survey o pagsusuri ng data data mga mananalaysay. (Yin 1989)

Ang talakayan sa itaas ay nagpapakita na mayroong ilang posibleng paraan ng pananaliksik na maaaring gamitin sa isang partikular na pag-aaral. Gayunpaman, dapat mayroong isang tiyak na pamamaraan na mas angkop kaysa sa iba para sa isang partikular na uri ng proyekto ng pananaliksik. (Galliers 1987, Yin 1989, De Vaus 1991). Samakatuwid, ang bawat mananaliksik ay kailangang maingat na suriin ang mga kalakasan at kahinaan ng iba't ibang mga pamamaraan, upang gamitin ang pinaka-angkop na paraan ng pananaliksik na katugma sa proyekto ng pananaliksik. (Jenkins 1985, Pervan at Klass 1992, Bonomia 1985, Yin 1989, Himilton at Ives 1992).

3.2. Mga posibleng paraan ng paghahanap

Ang layunin ng proyektong ito ay pag-aralan ang karanasan ng mga organisasyon ng Australia sa i data nakaimbak na may pag-unlad ng data bodega. Dato na, sa kasalukuyan, may kakulangan ng pananaliksik sa lugar ng data warehousing sa Australia, ang proyektong ito ng pananaliksik ay nasa teoretikal na yugto pa rin ng ikot ng pananaliksik at may layuning eksplorasyon. Ang paggalugad sa karanasan sa mga organisasyong Australian na gumagamit ng data warehousing ay nangangailangan ng pagbibigay-kahulugan sa totoong lipunan. Dahil dito, ang pilosopikal na palagay na pinagbabatayan ng proyekto ng pananaliksik ay sumusunod sa tradisyonal na interpretasyon.

Pagkatapos ng mahigpit na pagsusuri sa mga magagamit na pamamaraan, dalawang posibleng paraan ng pananaliksik ang natukoy: mga survey at case study, na maaaring gamitin para sa exploratory research (Shanks et al. 1993). Pinagtatalunan ni Galliers (1992) ang pagiging angkop ng dalawang pamamaraang ito para sa partikular na pag-aaral na ito sa kanyang binagong taxonomy sa pagsasabing angkop ang mga ito para sa teoretikal na konstruksyon. Tinatalakay ng sumusunod na dalawang subseksiyon ang bawat pamamaraan nang detalyado.

3.2.1 Paraan ng pagsasaliksik ng sarbey

Ang pamamaraan ng pagsasaliksik ng sarbey ay nagmula sa sinaunang pamamaraan ng census. Ang census ay tungkol sa pagkolekta ng impormasyon mula sa isang buong populasyon. Ang pamamaraang ito ay mahal at hindi praktikal, lalo na kung ang populasyon ay malaki. Kaya, kumpara sa isang census, ang isang survey ay karaniwang nakatuon sa pagkolekta ng impormasyon para sa isang maliit na bilang, o sample, ng mga kinatawan ng populasyon (Fowler 1988, Neuman 1994). Ang isang sample ay sumasalamin sa populasyon kung saan ito iginuhit, na may iba't ibang antas ng katumpakan, depende sa sample na istraktura, laki, at paraan ng pagpili na ginamit (Fowler 1988, Babbie 1982, Neuman 1994).

Ang pamamaraan ng survey ay tinukoy bilang "mga snapshot ng mga kasanayan, sitwasyon o pananaw sa isang partikular na punto ng oras, na isinagawa gamit ang mga questionnaire o mga panayam, kung saan maaaring magmula ang mga hinuha.
ginawa” (Galliers 1992:153) [snapshot photography ng mga kasanayan, sitwasyon o pananaw sa isang partikular na punto ng panahon, kinuha gamit ang mga talatanungan o panayam, kung saan maaaring gumawa ng mga hinuha]. Ang mga survey ay nababahala sa pangangalap ng impormasyon tungkol sa ilang mga aspeto ng pag-aaral mula sa isang bilang ng mga kalahok sa pamamagitan ng pagtatanong (Fowler 1988). Ang mga talatanungan at panayam na ito, na kinabibilangan ng harapang mga panayam sa telepono at mga nakabalangkas na panayam, ay mga pamamaraan din ng pagkolekta. data ginagamit sa mga sarbey (Blalock 1970, Nachmias at Nachmias 1976, Fowler 1988), maaaring gamitin ang mga obserbasyon at pagsusuri (Gable 1994). Sa lahat ng mga pamamaraang ito ng pagkolekta ng mga diyos data, ang paggamit ng talatanungan ay ang pinakasikat na pamamaraan, dahil tinitiyak nito na i data

nakabalangkas at naka-format, at sa gayon ay pinapadali ang pag-uuri ng impormasyon (Hwang 1987, de Vaus 1991).

Sa pagsusuri ng i data, ang isang diskarte sa survey ay kadalasang gumagamit ng quantitative techniques, tulad ng statistical analysis, ngunit ang qualitative techniques ay maaari ding gamitin (Galliers 1992, Pervan

at Klass 1992, Gable 1994). Karaniwan, i data nakolekta ay ginagamit upang pag-aralan ang mga distribusyon at mga pattern ng mga asosasyon (Fowler 1988).

Bagama't karaniwang angkop ang mga survey para sa mga paghahanap na tumatalakay sa tanong na 'ano?' (ano) o nagmula rito, tulad ng 'quanto' (magkano) at 'quant'è' (ilan), maaari silang itanong sa pamamagitan ng tanong na 'bakit' (Sonquist at Dunkelberg 1977, Yin 1989). Ayon kay Sonquist at Dunkelberg (1977), ang pagtatanong ng pananaliksik ay naglalayon sa mga mahirap na hypotheses, mga programa sa pagsusuri, naglalarawan sa populasyon at pagbuo ng mga modelo ng pag-uugali ng tao. Higit pa rito, maaaring gamitin ang mga sarbey upang pag-aralan ang opinyon, kundisyon, paniniwala, katangian, inaasahan at maging ang nakaraan o kasalukuyang pag-uugali ng isang partikular na populasyon (Neuman 1994).

Ang mga survey ay nagbibigay-daan sa mananaliksik na tumuklas ng mga ugnayan ng populasyon at ang mga resulta ay karaniwang mas pangkalahatan kaysa sa iba pang mga pamamaraan (Sonquist at Dunkelberg 1977, Gable 1994). Ang mga survey ay nagpapahintulot sa mga mananaliksik na masakop ang isang mas malawak na heyograpikong lugar at maabot ang malaking bilang ng mga tumugon (Blalock 1970, Sonquist at Dunkelberg 1977, Hwang at Lin 1987, Gable 1994, Neuman 1994). Sa wakas, ang mga survey ay maaaring magbigay ng impormasyon na hindi magagamit sa ibang lugar o sa form na kinakailangan para sa mga pagsusuri (Fowler 1988).

Gayunpaman, mayroong ilang mga limitasyon sa pagsasagawa ng survey. Ang isang kawalan ay hindi makakuha ng maraming impormasyon ang mananaliksik tungkol sa bagay na pinag-aralan. Ito ay dahil sa ang katunayan na ang mga survey ay isinasagawa lamang sa isang partikular na oras at, samakatuwid, mayroong isang limitadong bilang ng mga variable at mga tao na ang mananaliksik ay maaaring

pag-aaral (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Ang isa pang disbentaha ay ang pagsasagawa ng isang survey ay maaaring maging lubhang magastos sa mga tuntunin ng oras at mga mapagkukunan, lalo na kung ito ay nagsasangkot ng harapang pakikipanayam (Fowler 1988).

3.2.2. Paraan ng Pananaliksik sa Pagtatanong

Ang pamamaraan ng pananaliksik sa pagtatanong ay nagsasangkot ng malalim na pag-aaral ng isang partikular na sitwasyon sa loob ng aktwal na konteksto nito sa isang tinukoy na yugto ng panahon, nang walang anumang interbensyon sa bahagi ng mananaliksik (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Pangunahin ang pamamaraang ito ay ginagamit upang ilarawan ang mga relasyon sa pagitan ng mga variable na pinag-aaralan sa isang partikular na sitwasyon (Galliers 1992). Ang mga pagsisiyasat ay maaaring magsama ng isa o maramihang kaso, depende sa phenomenon na nasuri (Franz at Robey 1987, Eisenhardt 1989, Yin 1989).

Ang pamamaraan ng pagsasaliksik ng pagtatanong ay tinukoy bilang "isang empirikal na pagtatanong na nag-iimbestiga sa isang kontemporaryong kababalaghan sa loob ng aktwal na konteksto nito, gamit ang maramihang mga mapagkukunan na kinuha mula sa isa o higit pang mga entidad tulad ng mga tao, grupo, o organisasyon" (Yin 1989). Walang malinaw na paghihiwalay sa pagitan ng phenomenon at konteksto nito at walang kontrol o eksperimentong pagmamanipula ng mga variable (Yin 1989, Benbasat et al. 1987).

Mayroong iba't ibang mga pamamaraan para sa pagkolekta ng mga diyos data na maaaring gamitin sa paraan ng pagtatanong, na kinabibilangan ng mga direktang obserbasyon, mga pagsusuri sa talaan ng archival, mga talatanungan, pagsusuri sa dokumentasyon, at mga nakabalangkas na panayam. Ang pagkakaroon ng magkakaibang hanay ng mga pamamaraan sa pag-aani data, pinapayagan ng mga survey ang mga mananaliksik na harapin ang pareho data qualitative at quantitative sa parehong oras (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Tulad ng kaso sa pamamaraan ng survey, ang isang survey researcher ay nagsisilbing observer o researcher at hindi bilang aktibong kalahok sa organisasyong pinag-aaralan.

Iginiit ni Benbasat et al.(1987) na ang paraan ng pagtatanong ay partikular na angkop sa pagbuo ng teorya ng pananaliksik, na nagsisimula sa isang katanungan sa pananaliksik at nagpapatuloy sa pagsasanay.

ng isang teorya sa panahon ng proseso ng pagkolekta data. Angkop din para sa entablado

ng pagbuo ng teorya, iminumungkahi nina Franz at Robey (1987) na ang paraan ng pagtatanong ay maaari ding gamitin para sa kumplikadong yugto ng teorya. Sa kasong ito, batay sa nakolektang ebidensya, ang isang ibinigay na teorya o hypothesis ay napatunayan o hindi napatunayan. Bilang karagdagan, ang pagtatanong ay angkop din para sa pananaliksik na tumatalakay sa mga tanong na 'paano' o 'bakit' (Yin 1989).

Kung ikukumpara sa ibang mga pamamaraan, pinapayagan ng mga survey ang mananaliksik na makuha ang mahahalagang impormasyon nang mas detalyado (Galliers 1992, Shanks et al. 1993). Higit pa rito, ang mga pagsisiyasat ay nagpapahintulot sa mananaliksik na maunawaan ang kalikasan at pagiging kumplikado ng mga prosesong pinag-aralan (Benbasat et al. 1987).

Mayroong apat na pangunahing kawalan na nauugnay sa paraan ng pagtatanong. Ang una ay ang kakulangan ng mga kinokontrol na pagbabawas. Maaaring baguhin ng subjectivity ng mananaliksik ang mga resulta at konklusyon ng pag-aaral (Yin 1989). Ang pangalawang kawalan ay ang kawalan ng kontroladong pagmamasid. Hindi tulad ng mga eksperimentong pamamaraan, hindi makokontrol ng inquiry researcher ang mga phenomena na pinag-aralan dahil sinusuri ang mga ito sa kanilang natural na konteksto (Gable 1994). Ang ikatlong kawalan ay ang kakulangan ng replicability. Ito ay dahil sa ang katunayan na ang mananaliksik ay malamang na hindi maobserbahan ang parehong mga kaganapan, at hindi mapatunayan ang mga resulta ng isang partikular na pag-aaral (Lee 1989). Sa wakas, bilang kinahinatnan ng non-replicability, mahirap i-generalize ang mga resultang nakuha mula sa isa o higit pang mga survey (Galliers 1992, Shanks et al. 1993). Ang lahat ng mga problemang ito, gayunpaman, ay hindi malulutas at maaaring, sa katunayan, ay mababawasan ng mananaliksik sa pamamagitan ng paglalapat ng mga naaangkop na aksyon (Lee 1989).

3.3. Bigyang-katwiran ang pamamaraan ng pananaliksik pinagtibay

Mula sa dalawang posibleng paraan ng pananaliksik para sa pag-aaral na ito, ang pamamaraan ng sarbey ay itinuturing na pinakaangkop. Ang nag-iimbestiga ay tinanggihan kasunod ng maingat na pagsasaalang-alang sa mga nauugnay

merito at kahinaan. Ang kaginhawahan o hindi naaangkop ng bawat pamamaraan para sa pag-aaral na ito ay tinalakay sa ibaba.

3.3.1. Hindi angkop na paraan ng pananaliksik ng pagtatanong

Ang pamamaraan ng pagtatanong ay nangangailangan ng malalim na pag-aaral ng isang partikular na sitwasyon sa loob ng isa o higit pang mga organisasyon sa loob ng isang panahon (Eisenhardt 1989). Sa kasong ito, ang panahon ay maaaring lumampas sa takdang panahon na ibinigay para sa pag-aaral na ito. Ang isa pang dahilan upang hindi gamitin ang paraan ng pagtatanong ay ang mga resulta ay maaaring magdusa mula sa kakulangan ng higpit (Yin 1989). Ang pagiging subjectivity ng mananaliksik ay maaaring makaimpluwensya sa mga resulta at konklusyon. Ang isa pang dahilan ay ang pamamaraang ito ay mas angkop sa mga tanong sa pagsasaliksik ng uri ng 'paano' o 'bakit' (Yin 1989), samantalang ang tanong sa pananaliksik para sa pag-aaral na ito ay ang uri na 'ano'. Panghuli ngunit hindi bababa sa, mahirap i-generalize ang mga natuklasan mula lamang sa isa o ilang mga survey (Galliers 1992, Shanks et al. 1993). Batay sa katwiran na ito, hindi napili ang pamamaraan ng sarbey na pananaliksik dahil hindi ito angkop para sa pag-aaral na ito.

3.3.2. Kaginhawaan ng paraan ng paghahanap ng pagsisiyasat

Noong isinagawa ang pananaliksik na ito, ang pagsasanay ng data warehousing ay hindi pa malawakang pinagtibay ng mga organisasyong Australian. Samakatuwid, walang gaanong impormasyon tungkol sa kanilang pagpapatupad sa loob ng mga organisasyong Australian. Ang impormasyong makukuha ay nagmula sa mga organisasyong nagpatupad o gumamit ng a data bodega. Sa kasong ito, ang pamamaraan ng pagsasaliksik ng sarbey ang pinakaangkop dahil pinapayagan nito ang pagkuha ng impormasyon na hindi makukuha sa ibang lugar o sa form na kinakailangan para sa pagsusuri (Fowler 1988). Bilang karagdagan, ang pamamaraan ng pananaliksik sa pagtatanong ay nagbibigay-daan sa mananaliksik na magkaroon ng magandang pananaw sa mga gawi, sitwasyon, o pananaw sa isang takdang panahon (Galliers 1992, Denscombe 1998). Ang isang pangkalahatang-ideya ay hiniling upang itaas ang kamalayan sa karanasan sa pag-iimbak ng data sa Australia.

Higit pa rito, sinabi ni Sonquist at Dunkelberg (1977) na ang mga resulta ng pananaliksik sa survey ay mas pangkalahatan kaysa sa iba pang mga pamamaraan.

3.4. Disenyo ng Pananaliksik sa Sarbey

Ang data warehousing practice survey ay isinagawa noong 1999. Ang target na populasyon ay binubuo ng mga organisasyong Australian na interesado sa pag-aaral ng data warehousing, dahil malamang na alam na nila ang data na kanilang iniimbak at, samakatuwid, ay maaaring magbigay ng kapaki-pakinabang na impormasyon para sa pag-aaral na ito. Natukoy ang target na populasyon sa isang paunang survey ng lahat ng miyembro ng Australia ng 'The Data Warehousing Institute' (Tdwi-aap). Ang bahaging ito ay tumatalakay sa disenyo ng empirical research phase ng pag-aaral na ito.

3.4.1. Teknik ng koleksyon data

Mula sa tatlong pamamaraan na karaniwang ginagamit sa pagsasaliksik ng sarbey (ibig sabihin, mail questionnaire, panayam sa telepono at personal na panayam) (Nachmias 1976, Fowler 1988, de Vaus 1991), ang mail questionnaire ay pinagtibay para sa pag-aaral na ito. Ang unang dahilan sa pag-ampon ng huli ay maaari itong maabot ang isang populasyon na nagkalat sa heograpiya (Blalock 1970, Nachmias at Nachmias 1976, Hwang at Lin 1987, de Vaus 1991, Gable 1994). Pangalawa, ang mail questionnaire ay angkop para sa mga kalahok na may mataas na pinag-aralan (Fowler 1988). Ang mail questionnaire para sa pag-aaral na ito ay naka-address sa data warehousing project sponsors, directors at/o project managers. Ikatlo, ang mga postal questionnaire ay angkop kapag ang isang secure na listahan ng mga address ay magagamit (Salant at Dilman 1994). Ang TDWI, sa kasong ito, isang pinagkakatiwalaang asosasyon ng warehousing ng data ang nagbigay ng mailing list ng mga miyembro nito sa Australia. Ang isa pang bentahe ng talatanungan sa koreo sa mga talatanungan sa telepono o mga personal na panayam ay pinapayagan nito ang mga sumasagot na tumugon nang mas tumpak, lalo na kapag ang mga sumasagot ay kailangang kumonsulta sa mga talaan o talakayin ang mga tanong sa ibang tao (Fowler 1988).

Ang isang potensyal na kawalan ay maaaring ang oras na kinakailangan upang magsagawa ng mga questionnaire sa pamamagitan ng koreo. Karaniwan, ang isang talatanungan sa koreo ay isinasagawa sa pagkakasunud-sunod na ito: mga sulat sa koreo, maghintay ng mga tugon, at magpadala ng kumpirmasyon (Fowler 1988, Bainbridge 1989). Kaya, ang kabuuang oras ay maaaring mas mahaba kaysa sa oras na kinakailangan para sa harapang mga panayam o mga panayam sa telepono. Gayunpaman, ang kabuuang oras ay maaaring malaman nang maaga (Fowler 1988, Denscombe 1998). Ang oras na ginugol sa pagsasagawa ng mga personal na panayam ay hindi malalaman nang maaga dahil ito ay nag-iiba sa bawat pakikipanayam (Fowler 1988). Ang mga panayam sa telepono ay maaaring mas mabilis kaysa sa mga talatanungan sa koreo at mga personal na panayam ngunit maaaring magkaroon ng mataas na rate ng hindi nasagot dahil sa kawalan ng kakayahang magamit ng ilang tao (Fowler 1988). Bukod pa rito, ang mga panayam sa telepono ay karaniwang limitado sa medyo maikling listahan ng mga tanong (Bainbridge 1989).

Ang isa pang kahinaan ng isang talatanungan sa koreo ay ang mataas na antas ng hindi pagtugon (Fowler 1988, Bainbridge 1989, Neuman 1994). Gayunpaman, ang mga countermeasure ay ginawa sa pamamagitan ng pag-uugnay ng pag-aaral na ito sa isang pinagkakatiwalaang institusyon ng data warehousing (i.e. TDWI) (Bainbridge 1989, Neuman 1994), na naglalabas ng dalawang liham ng paalala sa mga hindi tumutugon (Fowler 1988, Neuman 1994) at kasama rin ang isang karagdagang liham na nagpapaliwanag ang layunin ng pag-aaral (Neuman 1994).

3.4.2. Unit ng pagsusuri

Ang layunin ng pag-aaral na ito ay makakuha ng impormasyon tungkol sa pagpapatupad ng data warehousing at ang paggamit nito sa loob ng mga organisasyong Australian. Ang target na populasyon ay ang lahat ng organisasyon ng Australia na nagpatupad, o nagpapatupad, i data bodega. Ang mga indibidwal na organisasyon ay pagkatapos ay nakarehistro. Ang talatanungan ay ipinadala sa koreo sa mga organisasyong interesadong magpatibay data bodega. Tinitiyak ng pamamaraang ito na ang impormasyong nakolekta ay nagmumula sa mga pinaka-angkop na mapagkukunan ng bawat kalahok na organisasyon.

3.4.3. Sampol ng survey

Ang mailing list ng mga kalahok sa survey ay nakuha mula sa TDWI. Mula sa listahang ito, 3000 organisasyong Australian ang napili bilang batayan para sa sampling. Ang isang follow-up na liham na nagpapaliwanag sa proyekto at ang layunin ng survey, kasama ang isang form ng tugon at isang prepaid na sobre para sa pagbabalik ng nakumpletong talatanungan ay ipinadala sa sample. Sa 3000 organisasyon, 198 ang sumang-ayon na lumahok sa pag-aaral. Ang ganitong maliit na bilang ng mga tugon ay inaasahan dato ang malaking bilang ng mga organisasyong Australian na noon ay yumakap o tinatanggap ang diskarte sa pag-iimbak ng data sa loob ng kanilang mga organisasyon. Kaya, ang target na populasyon para sa pag-aaral na ito ay binubuo lamang ng 198 na organisasyon.

3.4.4. Mga nilalaman ng talatanungan

Ang disenyo ng talatanungan ay batay sa modelo ng warehousing ng data ng Monash (tinalakay kanina sa bahagi 2.3). Ang nilalaman ng talatanungan ay batay sa pagsusuri sa literatura na ipinakita sa kabanata 2. Ang isang kopya ng talatanungan na ipinadala sa mga kalahok sa sarbey ay makikita sa Apendiks B. Ang talatanungan ay binubuo ng anim na seksyon, na sumusunod sa mga hakbang ng modelong sakop . Ang sumusunod na anim na talata ay maikling buod ng mga nilalaman ng bawat seksyon.

Seksyon A: Pangunahing impormasyon tungkol sa organisasyon
Ang seksyong ito ay naglalaman ng mga tanong na may kaugnayan sa profile ng mga kalahok na organisasyon. Bukod pa rito, ang ilan sa mga tanong ay nauugnay sa katayuan ng proyekto ng data warehousing ng kalahok. Ang kumpidensyal na impormasyon gaya ng pangalan ng organisasyon ay hindi isiniwalat sa pagsusuri ng survey.

Seksyon B: Magsimula
Ang mga tanong sa seksyong ito ay nauugnay sa pagsisimula sa data warehousing. Tinanong ang mga tanong tungkol sa mga nagpasimula ng proyekto, mga sponsor, kinakailangang mga kasanayan at kaalaman, ang mga layunin ng pagbuo ng data warehousing at ang mga inaasahan ng mga end user.

Seksyon C: Disenyo
Ang seksyong ito ay naglalaman ng mga tanong na may kaugnayan sa pagpaplano ng mga aktibidad ng data bodega. Sa partikular, ang mga tanong ay tungkol sa saklaw ng pagpapatupad, ang tagal ng proyekto, ang halaga ng proyekto at ang pagsusuri sa gastos/pakinabang.

Seksyon D: Pag-unlad
Sa seksyon ng pag-unlad ay may mga katanungan na may kaugnayan sa mga aktibidad sa pagpapaunlad ng data bodega: koleksyon ng mga kinakailangan ng end user, mga mapagkukunan ng data, ang lohikal na modelo ng data, mga prototype, pagpaplano ng kapasidad, mga teknikal na arkitektura at pagpili ng mga tool sa pagbuo ng data warehousing.

Seksyon E: Operasyon
Mga tanong sa pagpapatakbo na may kaugnayan sa pagpapatakbo at pagpapalawak ng data bodega, habang ito ay umuunlad sa susunod na yugto ng pag-unlad. doon kalidad ng data, ang mga diskarte sa pag-refresh ng data, ang granularity ng data, scalability ng data bodega at mga isyu sa seguridad data bodega ay kabilang sa mga uri ng mga itinanong.

Seksyon F: Pag-unlad
Ang seksyong ito ay naglalaman ng mga tanong na may kaugnayan sa paggamit ng data bodega ng mga end user. Interesado ang mananaliksik sa layunin at gamit ng data bodega, ang mga diskarte sa pagsusuri at pagsasanay na pinagtibay at ang diskarte sa pagkontrol ng data bodega pinagtibay.

3.4.5. Rate ng pagtugon

Kahit na ang mga survey sa mail ay pinupuna dahil sa pagkakaroon ng mababang rate ng pagtugon, ang mga hakbang ay ginawa upang taasan ang rate ng pagbabalik (tulad ng tinalakay sa itaas sa seksyon 3.4.1). Ang terminong 'rate ng pagtugon' ay tumutukoy sa porsyento ng mga tao sa isang partikular na sample ng survey na tumugon sa questionnaire (Denscombe 1998). Ang sumusunod na pormula ay ginamit upang kalkulahin ang rate ng pagtugon para sa pag-aaral na ito:

Bilang ng mga taong tumugon
Rate ng pagtugon = —————————————————————————— X 100 Kabuuang bilang ng mga talatanungan na ipinadala

3.4.6. Test Pilot

Bago ipinadala ang talatanungan sa sample, ang mga tanong ay nasubok sa pamamagitan ng pagsasagawa ng mga pagsubok sa piloto, gaya ng iminungkahi nina Luck at Rubin (1987), Jackson (1988), at de Vaus (1991). Ang layunin ng mga pilot trial ay ipakita ang anumang awkward, hindi maliwanag na mga expression at mahirap ipaliwanag na mga tanong, upang linawin ang anumang mga kahulugan at terminong ginamit, at upang matukoy ang tinatayang oras na kinakailangan upang makumpleto ang questionnaire (Warwick and Lininger 1975, Jackson 1988, Salant at Dilman 1994). Ang mga pagsubok sa piloto ay isinagawa sa pamamagitan ng pagpili ng mga paksang may mga katangiang katulad ng sa mga huling paksa, gaya ng iminungkahi ni Davis e Cosenza (1993). Sa pag-aaral na ito, anim na data warehousing professional ang napili bilang pilot subject. Pagkatapos ng bawat pilot test, ginawa ang mga kinakailangang pagwawasto. Mula sa mga pilot test na isinagawa, ang mga kalahok ay nag-ambag sa remodeling at pag-reset ng huling bersyon ng questionnaire.

3.4.7. Paraan ng Pagsusuri Ng Dati

I data Ang data ng survey na nakolekta mula sa mga closed-ended questionnaires ay sinuri gamit ang statistical software package na tinatawag na SPSS. Marami sa mga tugon ang sinuri gamit ang mga istatistikal na naglalarawan. Ilang questionnaire ang naibalik na hindi kumpleto. Ang mga ito ay ginagamot nang mas maingat upang matiyak na i data ang nawawala ay hindi resulta ng mga error sa pagpasok ng data, ngunit dahil ang mga tanong ay hindi angkop para sa nagparehistro, o nagpasya ang nagparehistro na huwag sagutin ang isa o higit pang mga partikular na tanong. Ang mga nawawalang sagot na ito ay hindi pinansin kapag nag-parse ng data data at na-code bilang '-9' upang matiyak ang kanilang pagbubukod mula sa proseso ng pagsusuri.

Sa paghahanda ng talatanungan, ang mga saradong tanong ay na-pre-code sa pamamagitan ng pagtatalaga ng numero sa bawat opsyon. Ang numero noon ay ginamit sa pagsasanay i data sa panahon ng pagsusuri (Denscombe 1998, Sapsford at Jupp 1996). Halimbawa, mayroong anim na opsyon na nakalista sa tanong 1 ng seksyon B: board of directors, senior executive, IT department, business unit, consultant at iba pa. Sa file ng data ng SPSS, isang variable ang nabuo para sa 'project initiator', na may anim na value label: '1' para sa 'board', '2' para sa 'senior executive', at iba pa sa Street. Ang paggamit ng Likertin scale sa ilan sa mga saradong tanong ay pinapayagan din para sa walang hirap na pagkakakilanlan sa pamamagitan ng paggamit ng kaukulang mga numerical value na ipinasok sa SPSS. Para sa mga tanong na may hindi kumpletong mga sagot, na hindi magkaparehong eksklusibo, ang bawat opsyon ay itinuturing bilang isang variable na may dalawang label ng halaga: '1 ' para sa 'may check' at '2 ' para sa 'uncheck'.

Ang mga bukas na tanong ay tinatrato nang iba sa mga saradong tanong. Ang mga sagot sa mga tanong na ito ay hindi naipasok sa SPSS. Sa halip, sinuri sila sa pamamagitan ng kamay. Ang paggamit ng ganitong uri ng tanong ay nagbibigay-daan upang makakuha ng impormasyon tungkol sa malayang pagpapahayag ng mga ideya at personal na karanasan sa mga respondente (Bainbridge 1989, Denscombe 1998). Kung saan posible, ginawa ang isang pagkakategorya ng mga tugon.

Para sa pagsusuri ng dataAng mga pamamaraan ng simpleng pagsusuri sa istatistika ay ginagamit, tulad ng dalas ng mga tugon, ang ibig sabihin, ang karaniwang paglihis at ang median (Argyrous 1996, Denscombe 1998).
Ang Gamma test ay gumanap para sa pagkuha ng mga sukat ng dami ng mga asosasyon sa pagitan data mga ordinal (Norusis 1983, Argyrous 1996). Ang mga pagsusulit na ito ay angkop dahil ang mga ordinal na kaliskis na ginamit ay walang maraming kategorya at maaaring ipakita sa isang talahanayan (Norusis 1983).

3.5 Buod

Sa kabanatang ito, tinalakay ang metodolohiya at disenyo ng pananaliksik na pinagtibay para sa pag-aaral na ito.

Ang pagpili ng pinakaangkop na paraan ng pananaliksik para sa isang partikular na pag-aaral ay tumatagal
pagsasaalang-alang ng isang bilang ng mga patakaran, kabilang ang kalikasan at uri ng pananaliksik, pati na rin ang mga merito at kahinaan ng bawat posibleng paraan (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, yin 1989, Hamilton and ives 1992, Galliers 1992, neuman 1994). Dahil sa kakulangan ng umiiral na kaalaman at teorya tungkol sa pag-aampon ng data warehousing sa Australia, ang pag-aaral ng pananaliksik na ito ay humihiling ng isang interpretive na pamamaraan ng pananaliksik na may kakayahang eksplorasyon upang tuklasin ang mga karanasan ng mga organisasyong Australian. Ang napiling paraan ng pananaliksik ay pinili upang mangalap ng impormasyon tungkol sa pagpapatibay ng konsepto ng data ware-housing ng mga organisasyong Australian. Pinili ang isang postal questionnaire bilang pamamaraan sa pagkolekta data. Ang mga katwiran para sa pamamaraan ng pananaliksik at pamamaraan ng koleksyon data ang mga pagpipilian ay ibibigay sa kabanatang ito. Higit pa rito, ipinakita ang isang talakayan sa yunit ng pagsusuri, ang sample na ginamit, ang porsyento ng mga sagot, ang nilalaman ng talatanungan, ang pre-test ng talatanungan at ang paraan ng pagsusuri ng data.

Pagdidisenyo ng a Warehouse ng Data:

Pinagsasama-sama ang Mga Relasyon ng Entity at Dimensional Modeling

Abstract
Tindahan i data ay isang pangunahing kasalukuyang isyu para sa maraming mga organisasyon. Isang pangunahing problema sa pagbuo ng warehousing data ito ang kanyang disenyo.
Dapat suportahan ng drawing ang pagtuklas ng mga konsepto sa data bodega sa legacy system at iba pang pinagmumulan ng data at din ng isang madaling pag-unawa at kahusayan sa pagpapatupad ng data bodega.
Karamihan sa bodega ng panitikan data Inirerekomenda ang paggamit ng entity relationship modelling o dimensional modeling para kumatawan sa disenyo ng data bodega.
Sa papel na ito ipinapakita namin kung paano maaaring pagsamahin ang parehong mga representasyon sa isang diskarte sa disenyo ng data bodega. Ang pamamaraang ginamit ay sistematiko

napagmasdan sa isang case study at natukoy sa ilang mahahalagang implikasyon sa mga propesyonal.

DATA WAREHOUSING

Un data bodega ito ay karaniwang tinukoy bilang isang "nakatuon sa paksa, pinagsama-samang, time-variant, at hindi pabagu-bagong koleksyon ng data bilang suporta sa mga desisyon ng pamamahala" (Inmon at Hackathorn, 1994). Ang subject-oriented at integrated ay nagpapahiwatig na ang data bodega ay idinisenyo upang tumawid sa functional na mga hangganan ng mga legacy system upang mag-alok ng pinagsama-samang pananaw ng data.
Ang time-variant ay nababahala sa makasaysayang o time-series na katangian ng video data sa a data bodega, na nagbibigay-daan sa mga trend na masuri. Non-volatile ay nagpapahiwatig na ang data bodega hindi ito patuloy na ina-update tulad ng a database ng OLTP. Sa halip ito ay ina-update pana-panahon, kasama ang data mula sa panloob at panlabas na mapagkukunan. Ang data bodega partikular itong idinisenyo para sa pananaliksik sa halip na i-update ang integridad at pagganap ng operasyon.
Ang ideya ng pag-iimbak ng i data ay hindi bago, ito ay isa sa mga layunin ng pamamahala data mula noong ikaanimnapung taon (Il Martin, 1982).
I data bodega inaalok nila ang imprastraktura data para sa mga sistema ng suporta sa pamamahala. Kasama sa mga management support system ang mga decision support system (DSS) at executive information system (EIS). Ang DSS ay isang computer-based na sistema ng impormasyon na idinisenyo upang mapabuti ang proseso at dahil dito ay paggawa ng desisyon ng tao. Ang EIS ay karaniwang isang sistema ng paghahatid data na nagbibigay-daan sa mga executive ng negosyo na madaling ma-access ang view ng data.
Ang pangkalahatang arkitektura ng a data bodega itinatampok ang papel ng data bodega sa suporta sa pamamahala. Bilang karagdagan sa pag-aalok ng imprastraktura data para sa EIS at DSS, al data bodega maaari itong ma-access nang direkta sa pamamagitan ng mga query. ANG data kasama sa a data bodega ay batay sa pagsusuri ng mga kinakailangan sa impormasyon ng pamamahala at nakuha mula sa tatlong pinagmumulan: mga panloob na legacy system, mga espesyal na layunin na sistema ng pagkuha ng data at panlabas na pinagmumulan ng data. ANG data sa mga panloob na sistema ng legacy, ang mga ito ay madalas na paulit-ulit, hindi pare-pareho, may mababang kalidad, at nakaimbak sa iba't ibang mga format upang ang mga ito ay dapat na magkasundo at linisin bago sila mai-load sa

data bodega (Inmon, 1992; McFadden, 1996). ANG data mula sa mga sistema ng imbakan data ad hoc at mula sa mga mapagkukunan data ang panlabas ay kadalasang ginagamit upang dagdagan (i-update, palitan) i data mula sa mga legacy system.

Maraming mapanghikayat na dahilan upang bumuo ng a data bodega, na kinabibilangan ng pinahusay na paggawa ng desisyon sa pamamagitan ng mabisang paggamit ng higit pang impormasyon (Ives 1995), suporta para sa pagtutok sa buong mga gawain (Graham 1996), at pagbawas sa mga gastos sa paggawa ng desisyon data para sa EIS at DSS (Graham 1996, McFadden 1996).

Ang isang kamakailang empirical na pag-aaral ay natagpuan, sa karaniwan, isang return on investment para sa i data bodega ng 401% pagkatapos ng tatlong taon (Graham, 1996). Gayunpaman, ang iba pang mga empirical na pag-aaral ng data bodega nakahanap ng mga makabuluhang problema kabilang ang kahirapan sa pagsukat at paglalaan ng mga benepisyo, kawalan ng malinaw na layunin, pagmamaliit sa saklaw at pagiging kumplikado ng proseso ng pag-iimbak data, lalo na tungkol sa mga pinagmumulan at kalinisan ng data. Tindahan i data maaaring ituring na solusyon sa problema sa pamamahala data sa pagitan ng mga organisasyon. Ang pagmamanipula ng data bilang isang mapagkukunang panlipunan ito ay nanatiling isa sa mga pangunahing problema sa pamamahala ng mga sistema ng impormasyon sa buong mundo sa loob ng maraming taon (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Isang tanyag na diskarte sa pamamahala ng asset data noong dekada otsenta ay ang pagbuo ng isang modelo data sosyal. Modelo data social ay idinisenyo upang mag-alok ng isang matatag na batayan para sa pagbuo ng mga bagong sistema ng aplikasyon e database at ang muling pagtatayo at pagsasama ng mga legacy system (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kim at Everest 1994). Gayunpaman, mayroong ilang mga problema sa diskarteng ito, sa partikular, ang pagiging kumplikado at gastos ng bawat gawain, at ang mahabang panahon na kinakailangan upang makamit ang mga nasasalat na resulta (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il data bodega ito ay isang hiwalay na database na kasama ng mga legacy na database sa halip na palitan ang mga ito. Samakatuwid, pinapayagan ka nitong idirekta ang pamamahala ng data at maiwasan ang magastos na muling pagtatayo ng mga legacy system.

KARAGDAGANG MGA PAMAMAGITAN SA DATA DESIGN

WAREHOUSE

Ang proseso ng pagbuo at pagperpekto a data bodega ay dapat na higit na maunawaan bilang isang proseso ng ebolusyon sa halip na isang tradisyunal na siklo ng pag-unlad ng mga sistema (pagnanasa, 1995, Shanks, O'Donnell at Arnott 1997a). Maraming proseso ang kasangkot sa isang proyekto data bodega tulad ng pagsisimula, pag-iiskedyul; impormasyong nakuha mula sa mga kinakailangan na hiniling mula sa mga tagapamahala ng kumpanya; pinagmumulan, pagbabago, paglilinis ng data at pag-sync mula sa mga legacy system at iba pang mapagkukunan data; mga sistema ng paghahatid sa ilalim ng pag-unlad; pagsubaybay sa data bodega; at kawalang-saysay ng proseso ng ebolusyon at ng pagbuo ng a data bodega (Stinchi, O'Donnell at Arnott 1997b). Sa journal na ito, nakatuon kami sa kung paano gumuhit ng i data nakaimbak sa konteksto ng iba pang mga prosesong ito. Mayroong ilang mga iminungkahing diskarte sa arkitektura ng video data bodega sa panitikan (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Ang bawat isa sa mga pamamaraang ito ay may maikling pagsusuri na may pagsusuri sa kanilang mga kalakasan at kahinaan.

Ang Diskarte ni Inmon (1994) para sa Warehouse ng Data Disenyo

Iminungkahi ni Inmon (1994) ang apat na umuulit na hakbang sa disenyo ng a data bodega (tingnan ang Larawan 2). Ang unang hakbang ay ang disenyo ng isang template data panlipunan upang maunawaan kung paano i data maaaring isama sa mga functional na lugar sa loob ng isang organisasyon sa pamamagitan ng paghahati sa i data tindahan sa mga lugar. Modelo data ito ay ginawa para sa imbakan data nauukol sa paggawa ng desisyon, kabilang ang data makasaysayan, at kasama data ibabawas at pinagsama-sama. Ang ikalawang hakbang ay upang tukuyin ang mga paksa para sa pagpapatupad. Ang mga ito ay batay sa mga priyoridad na tinutukoy ng isang partikular na organisasyon. Ang ikatlong hakbang ay nagsasangkot ng pagguhit ng a database para sa paksa, bigyang-pansin ang partikular na pagsasama sa mga naaangkop na antas ng granularity. Inirerekomenda ni Inmon ang paggamit ng entity at modelo ng relasyon. Ang ikaapat na hakbang ay ang pagtukoy ng mga source system data kinakailangan at bumuo ng mga proseso ng pagbabago upang makuha, malinis at ma-format i data.

Ang lakas ng diskarte ni Inmon ay ang modelo data panlipunan nag-aalok ng batayan para sa integrasyon ng data sa loob ng organisasyon at pagpaplano ng mga suporta para sa umuulit na pag-unlad ng data bodega. Ang mga kawalan nito ay ang kahirapan at gastos ng pagdidisenyo ng modelo data panlipunan, ang kahirapan sa pag-unawa sa mga modelo ng mga entidad at ugnayang ginagamit sa parehong mga modelo, na data panlipunan at ng data naka-imbak ayon sa lugar ng paksa, at ang kaangkupan ng data ng pagguhit ng data bodega para sa pagsasakatuparan ng database may kaugnayan ngunit hindi para sa database multi-dimensional.

Ives' (1995) Diskarte sa Warehouse ng Data Disenyo

Ives (1995) ay nagmumungkahi ng isang apat na hakbang na diskarte sa pagdidisenyo ng isang sistema ng impormasyon na pinaniniwalaan niyang naaangkop sa disenyo ng isang data bodega (tingnan ang Larawan 3). Ang diskarte ay batay sa Information Engineering para sa pagbuo ng mga sistema ng impormasyon (Martin 1990). Ang unang hakbang ay upang matukoy ang iyong mga layunin, tagumpay at kritikal na mga kadahilanan, at mga pangunahing tagapagpahiwatig ng pagganap. Ang mga pangunahing proseso ng negosyo at ang kinakailangang impormasyon ay ginawang modelo upang humantong tayo sa isang modelo data sosyal. Ang ikalawang hakbang ay nagsasangkot ng pagbuo ng isang pagtukoy sa arkitektura data nakaimbak ayon sa lugar, database di data bodega, ang mga bahagi ng teknolohiya na kinakailangan, ang hanay ng suporta sa organisasyon na kinakailangan upang ipatupad at gumana kasama data bodega. Kasama sa ikatlong hakbang ang pagpili ng mga kinakailangang software package at tool. Ang ikaapat na hakbang ay ang detalyadong disenyo at pagbuo ng data bodega. Napansin ni Ives ang tindahan na iyon data ito ay isang pinipigilang umuulit na proseso.

Ang mga lakas ng diskarte ng Ives ay ang paggamit ng mga teknikal na detalye upang matukoy ang mga kinakailangan sa impormasyon, ang paggamit ng isang nakabalangkas na proseso upang suportahan ang pagsasama ng data bodega, ang naaangkop na pagpili ng hardware at software, at ang paggamit ng maramihang mga diskarte sa representasyon para sa data bodega. Ang mga bahid nito ay likas sa pagiging kumplikado. Kasama sa iba ang kahirapan sa pagbuo ng maraming antas ng database all'interno del data bodega sa isang makatwirang oras at gastos.

Kimball's (1994) Approach to Warehouse ng Data Disenyo

Kimball (1994) ay nagmungkahi ng limang umuulit na hakbang para sa pagdidisenyo ng a data bodega (tingnan ang Mga Larawan 4). Ang kanyang diskarte ay partikular na nakatuon sa pagguhit ng isang solo data bodega at sa paggamit ng mga dimensional na modelo bilang kagustuhan sa entity at mga modelo ng relasyon. Sinusuri ni Kimball ang mga dimensional na modelong iyon dahil mas madaling maunawaan ng mga pinuno ng negosyo ang negosyo, mas mahusay ito kapag nakikitungo sa mga kumplikadong konsultasyon, at ang disenyo ng database mas mahusay ang pisikal (Kimball 1994). Kinikilala ni Kimball na ang pagbuo ng a data bodega ay umuulit, at iyon data bodega ang pinaghiwalay ay maaaring isama sa pamamagitan ng paghahati sa mga talahanayan ng mga karaniwang sukat.

Ang unang hakbang ay tukuyin ang partikular na lugar ng paksa na gagawing perpekto. Ang pangalawa at pangatlong hakbang ay may kasamang dimensional na paghubog. Sa ikalawang hakbang, tinutukoy ng mga panukala ang mga bagay na kawili-wili sa lugar ng paksa at pangkatin ang mga ito sa isang talahanayan ng katotohanan. Halimbawa, sa isang paksa ng pagbebenta, maaaring kabilang sa mga sukat ng interes ang halaga ng mga bagay na naibenta at ang dolyar bilang pera sa pagbebenta. Ang ikatlong hakbang ay nagsasangkot ng pagtukoy ng mga sukat na kung saan ay ang mga paraan kung saan ang mga katotohanan ay maaaring igrupo. Sa isang paksa ng pagbebenta, maaaring kabilang sa mga nauugnay na dimensyon ang item, lokasyon, at yugto ng panahon. Ang talahanayan ng katotohanan ay may isang multi-part key upang i-link ito sa bawat isa sa mga talahanayan ng dimensyon at karaniwang naglalaman ng napakaraming bilang ng mga katotohanan. Sa kabaligtaran, ang mga talahanayan ng dimensyon ay naglalaman ng mapaglarawang impormasyon tungkol sa mga dimensyon at iba pang mga katangian na maaaring magamit sa pagpapangkat ng mga katotohanan. Ang iminungkahing nauugnay na talahanayan ng katotohanan at dimensyon ay bumubuo ng tinatawag na star schema dahil sa hugis nito. Ang ikaapat na hakbang ay nagsasangkot ng pagbuo ng a database multidimensional upang maperpekto ang pattern ng bituin. Ang huling hakbang ay ang pagtukoy ng mga source system data kinakailangan at bumuo ng mga proseso ng pagbabago upang makuha, malinis at ma-format i data.

Kabilang sa mga kalakasan ng diskarte ni Kimball ang paggamit ng mga dimensional na modelo upang kumatawan sa i data nakaimbak na ginagawang madaling maunawaan at humahantong sa isang mahusay na pisikal na disenyo. Isang dimensional na modelo na madaling gumamit ng parehong system database ang relational ay maaaring gawing perpekto o mga sistema database multidimensional. Kasama sa mga bahid nito ang kakulangan ng ilang mga diskarte upang mapadali ang pagpaplano o pagsasama-sama ng maraming star scheme sa loob ng a data bodega at ang kahirapan ng pagdidisenyo mula sa matinding denormalized na istraktura sa isang dimensional na modelo a data sa mga legacy system.

McFadden's (1996) Approach to Data Disenyo ng Warehouse

Ang McFadden (1996) ay nagmumungkahi ng limang hakbang na diskarte sa pagguhit ng a data bodega (tingnan ang Larawan 5).
Ang kanyang diskarte ay batay sa isang synthesis ng mga ideya mula sa panitikan at nakatuon sa disenyo ng isang solong data bodega. Ang unang hakbang ay nagsasangkot ng pagsusuri ng mga kinakailangan. Bagama't hindi inireseta ang mga teknikal na pagtutukoy, tinutukoy ng mga tala ni McFadden ang mga entity data mga detalye at kanilang mga katangian, at tumutukoy sa mga mambabasa na sina Watson at Frolick (1993) para sa pagkuha ng mga kinakailangan.
Sa ikalawang hakbang, iginuhit ang modelo ng relasyon ng entity data bodega at pagkatapos ay napatunayan ng mga executive ng kumpanya. Kasama sa ikatlong hakbang ang pagtukoy sa pagmamapa mula sa mga legacy system at panlabas na pinagmumulan ng data bodega. Ang ikaapat na hakbang ay nagsasangkot ng mga proseso sa pagbuo, pag-deploy at pag-synchronize data sa data bodega. Sa huling hakbang, ang paghahatid ng system ay binuo na may diin sa isang user interface. Sinabi ni McFadden na ang proseso ng pagguhit ay karaniwang umuulit.

Ang mga lakas ng diskarte ni McFadden ay ang paglahok ng mga pinuno ng negosyo sa pagtukoy ng mga kinakailangan pati na rin ang kahalagahan ng mga mapagkukunan. datakanilang paglilinis at pagkolekta. Ang mga bahid nito ay ang kawalan ng proseso para sa paghahati ng isang malaking proyekto data bodega sa maraming pinagsama-samang yugto, at doon

kahirapan sa pag-unawa sa entity at mga modelo ng relasyon na ginamit sa disenyo ng data bodega.

Hindi lamang ang mga malapit sa atin ang pumili sa atin.

0/5 (0 Review)

Alamin ang higit pa mula sa Online Web Agency

Mag-subscribe upang makatanggap ng pinakabagong mga artikulo sa pamamagitan ng email.

admin Pinuno ng Kumpanya

👍Online na Web Agency | Dalubhasa sa Web Agency sa Digital Marketing at SEO. Ang Web Agency Online ay isang Web Agency. Para sa Agenzia Web Online, ang tagumpay sa digital transformation ay batay sa mga pundasyon ng Iron SEO version 3. Mga Espesyalidad: System Integration, Enterprise Application Integration, Service Oriented Architecture, Cloud Computing, Data warehouse, business intelligence, Big Data, portal, intranet, Web Application Disenyo at pamamahala ng relational at multidimensional database Pagdidisenyo ng mga interface para sa digital media: usability at Graphics. Ang Online Web Agency ay nag-aalok sa mga kumpanya ng mga sumusunod na serbisyo: -SEO sa Google, Amazon, Bing, Yandex; -Web Analytics: Google Analytics, Google Tag Manager, Yandex Metrica; -Mga conversion ng user: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM sa Google, Bing, Amazon Ads; -Social Media Marketing (Facebook, Linkin, Youtube, Instagram).

Tingnan ang Buong Bio

Ibahagi ang:

Gusto ko:

Alamin ang higit pa mula sa Online Web Agency