https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

Andmehoidla ja ettevõtte ressursside planeerimine | DWH ja ERP

ARHIIV ANDMED KESK: AJALUGU ED EVOLUTSIOON

Korporatiivtehnoloogia kaks domineerivat teemat 90. aastatel olid i andmekogus ja ERP. Pikka aega on need kaks võimsat voogu olnud ettevõtte IT osad, ilma et neil oleks kunagi olnud ristumiskohta. Tundus, nagu oleksid need mateeria ja antiaine. Kuid mõlema nähtuse kasv on paratamatult viinud nende ristumiseni. Tänapäeval seisavad ettevõtted silmitsi probleemiga, mida teha ERP ja andmekogus. See artikkel selgitab, millised on probleemid ja kuidas ettevõtted neid lahendavad.

ALGUSES…

Alguses oli andmekogus. Andmeladu see sündis tehingute töötlemise rakendussüsteemi vastu võitlemiseks. Esimestel päevadel päheõppimine andma see oli mõeldud lihtsalt kontrapunktiks tehingute töötlemise rakendustele. Kuid tänapäeval on palju keerukamaid nägemusi sellest, mida a andmekogus. Tänapäeva maailmas on andmekogus see on sisestatud struktuuri, mida võib nimetada ettevõtte teabetehaseks.

ETTEVÕTETE INFOTEHAS (CIF)

Ettevõtte teabetehasel on standardsed arhitektuurikomponendid: koodide integreerimise ja teisenduskiht, mis integreerib i andma kuni ma andma nad liiguvad rakenduskeskkonnast keskkonda andmekogus ettevõttest; a andmekogus ettevõttest, kus i andma üksikasjalikud ja integreeritud ajaloolased. The andmekogus Ettevõte on vundamendiks, millele saab rajada kõik muud keskkonnaosad andmekogus; operatiivne andmesalv (ODS). ODS on hübriidstruktuur, mis sisaldab mõnda aspekti andmekogus ja muud OLTP-keskkonna aspektid; andmeturud, kus erinevatel osakondadel võib olla oma versioon andmekogus; a andmekogus uurimine, kus ettevõtte mõtlejad saavad esitada oma 72-tunniseid päringuid, ilma et see kahjustaks andmekogus; ja lähirea mälu, milles andma vana ja andma hulgi detaile saab salvestada odavalt.

KUS ERP ÜHENDAB ETTEVÕTETE INFOTEHAS

ERP ühineb kahes kohas Corporate Information Factoryga. Peamiselt baasrakendusena, mis pakub i andma rakendusest andmekogus. Sel juhul i andma, mis luuakse tehinguprotsessi kõrvalsaadusena, integreeritakse ja laaditakse andmekogus ettevõttest. Teine lüli ERP ja CIF vahel on ODS. Tõepoolest, paljudes keskkondades kasutatakse ERP-d klassikalise ODS-ina.

Kui ERP-d kasutatakse põhirakendusena, saab sama ERP-d kasutada ka CIF-is ODS-ina. Igal juhul, kui ERP-d kasutatakse mõlemas rollis, peavad need kaks olemit selgelt eristama. Teisisõnu, kui ERP mängib põhirakenduse ja ODS-i rolli, tuleb neid kahte arhitektuuriüksust eristada. Kui üks ERP-i juurutus üritab mõlemat rolli korraga täita, tekib paratamatult probleeme selle struktuuri kujundamisel ja rakendamisel.

ERALDI ODS-ID JA PÕHIRAKENDUSED

Arhitektuurikomponentide jagunemiseni on palju põhjuseid. Võib-olla on arhitektuuri erinevate komponentide eraldamise kõige kõnekam punkt see, et igal arhitektuurikomponendil on oma vaade. Algtaseme rakendus täidab teist eesmärki kui ODS. Proovige kattuda

ODS-i maailma või vastupidi rakenduse baasvaade ei ole aus viis töötada.

Järelikult on CIF-is ERP-i esimene probleem kontrollida, kas baasrakendused ja ODS-id eristuvad.

ANDMEMUDELID ETTEVÕTES INFOTEHAS

CIF-arhitektuuri erinevate komponentide vahelise sidususe saavutamiseks peab olema mudel andma. Mudelid andma need toimivad lülina arhitektuuri erinevate komponentide, nagu baasrakendused ja ODS-id, vahel. Mudelid andma neist saab "intellektuaalne teekaart", et saada CIF-i erinevatest arhitektuurikomponentidest õige tähendus.

Selle arusaamaga käsikäes on idee, et peaks olema üks suur ja ühtne muster andma. Ilmselgelt peab olema muster andma iga komponendi jaoks ja lisaks peab olema mõistlik tee, mis ühendab erinevaid mudeleid. Arhitektuuri iga komponent – ODS, baasrakendused, andmekogus ettevõttest ja nii edasi.. – vajab oma mudelit andma. Ja seega peab olema täpne määratlus selle kohta, kuidas need mudelid toimivad andma nad liidetakse üksteisega.

LIIKUMINE I ANDMED ERP-st ANDMETES LADUS

Kui päritolu andma on baasrakendus ja/või ODS, kui ERP lisab i andma sisse andmekogus, peab see sisestamine toimuma "teralisuse" madalaimal tasemel. Lihtsalt tehke kokkuvõte või koondage i andma kuna need tulevad välja ERP baasrakendusest või ERP ODS-ist, pole õige tegu. THE andma üksikasjad on vajalikud andmekogus moodustada DSS protsessi alus. Sellised andma Andmeturud ja -uuringud kujundavad neid mitmel viisil ümber andmekogus.

nihkumine andma ERP baastaseme rakenduskeskkonnast andmekogus ettevõtte tegevus toimub mõistlikult pingevabalt. See liigutamine toimub umbes 24 tundi pärast värskendamist või loomist ERP-s. Asjaolu, millel on "laisk" liikumine andma sisse andmekogus ettevõtte lubab andma tulevad ERP-st "arveldama". Kord i andma on algtaseme rakenduses salvestatud, siis saate neid ohutult teisaldada andma ERP-st ettevõttes. Teine eesmärk, mida saab saavutada tänu "laisale" liikumisele andma on tööprotsesside ja DSS-i selge piiritlemine. "Kiire" liikumisega andma piir DSS-i ja töökorra vahel jääb ebamääraseks.

Liikumine andma ERP ODS-ist kuni andmekogus ettevõtte tegevust tehakse perioodiliselt, tavaliselt kord nädalas või kuus. Sel juhul liikumine andma see põhineb vajadusel "puhastada" vana andma ajaloolased. Loomulikult sisaldab ODS i andma mis on palju uuemad kui andma aastal leidsid ajaloolased andmekogus.

nihkumine andma sisse andmekogus seda ei tehta peaaegu kunagi hulgi (hulgimüüja viisil). Kopeerige tabel ERP-keskkonnast kohta andmekogus see ei ole loogiline. Palju realistlikum lähenemine on valitud ühikute teisaldamine andma. Ainult andma mis on pärast viimast värskendust muutunud andmekogus on need, mis tuleks teisaldada andmekogus. Üks viis teada saada, millised andma on pärast viimast värskendust muutunud, on vaadata ajatempleid andma leitud ERP keskkonnas. Kujundaja valib kõik muudatused, mis on toimunud pärast viimast värskendust. Teine lähenemisviis on muutuste püüdmise tehnikate kasutamine andma. Nende tehnikate abil analüüsitakse logisid ja päevikulinde, et teha kindlaks, millised neist andma tuleb ERP-keskkonnast teisaldada andmekogus. Need tehnikad on parimad, kuna logisid ja päevikulinde saab lugeda ERP-failidest, ilma et see mõjutaks teisi ERP-ressursse.

MUUD TÜSUSED

Üks CIF-i ERP-probleeme on see, mis juhtub teiste rakenduste allikatega või ai-ga andma mis peab kaasa aitama andmekogus kuid need ei ole osa ERP keskkonnast. Arvestades ERP-i, eriti SAP-i suletud olemust, püüdes integreerida võtmeid välistest allikatest andma koos i andma mis pärinevad ERP-st kolimise ajal i andma sisse andmekogus, see on suur väljakutse. Ja millised on täpselt tõenäosused, et i andma rakenduste või ODS väljaspool ERP keskkonda integreeritakse andmekogus? Tõenäosus on tegelikult väga kõrge.

LEIA ANDMED AJALUGU ERP-st

Teine probleem seoses andma ERP on see, mis tuleneb vajadusest omada andma ajalooline sees andmekogus. Tavaliselt andmekogus vajadustele andma ajaloolased. Ja ERP-tehnoloogia tavaliselt neid ei salvesta andma ajalooline, vähemalt mitte sel määral, kui see on vajalik andmekogus. Kui suures koguses andma logid hakkavad ERP keskkonnas lisanduma, see keskkond tuleb puhastada. Oletame näiteks, et a andmekogus peaks olema koormatud viie aastaga andma ajaloolised, samas kui ERP säilitab neist maksimaalselt kuus kuud andma. Niikaua kui ettevõte on rahul koguda mitmeid andma ajalooline aja möödudes, siis pole probleemi kasutada ERP-i allikana andmekogus. Aga kui andmekogus tuleb minna ajas tagasi ja võtta jumalad andma ajalugu, mida ERP pole varem kogunud ja salvestanud, muutub ERP keskkond ebaefektiivseks.

ERP JA METAANDMED

Veel üks kaalutlus, mida ERP ja andmekogus on see, mis asub ERP keskkonnas olemasolevatel metaandmetel. Nii nagu metaandmed liiguvad ERP keskkonnast andmekogus, tuleb metaandmeid teisaldada samal viisil. Lisaks tuleb metaandmed teisendada taristu nõutavasse vormingusse ja struktuuri andmekogus. Operatiivsetel metaandmetel ja DSS-i metaandmetel on suur erinevus. Töötavad metaandmed on enamasti mõeldud arendajale ja

programmeerija. DSS-i metaandmed on mõeldud eelkõige lõppkasutajale. ERP-rakendustes või ODS-ides olemasolevad metaandmed tuleb teisendada ja see teisendamine ei ole alati lihtne ja arusaadav.

ERP ANDMETE ALLIKAS

Kui ERP-d kasutatakse pakkujana andma per il andmekogus peab olema kindel liides, mis liigutab i andma ERP keskkonnast keskkonda andmekogus. Liides peab:

▪ olema lihtne kasutada
▪ võimaldama juurdepääsu andma ERP-st
▪ mõista selle tähendust andma kuhu kolitakse andmekogus
▪ teadma ERP piiranguid, mis võivad tekkida juurdepääsul andma ERP-st:
▪ referentsiaalne terviklikkus
▪ hierarhilised suhted
▪ kaudsed loogilised seosed
▪ rakenduskonventsioon
▪ kõik struktuurid andma toetab ERP ja nii edasi...
▪ olema juurdepääsul tõhus andma, pakkudes:
▪ otsene liikumine andma
▪ muudatuse omandamine andma
▪ toetada õigeaegset juurdepääsu andma
▪ mõista vormingut andma, ja nii edasi… LIIDES SAP-iga Liides võib olla kahte tüüpi, kodumaine või kaubanduslik. Mõned peamised kaubanduslikud liidesed hõlmavad järgmist:

▪ SAS
▪ Peamised lahendused
▪ D2k ja nii edasi… MITU ERP-TEHNOLOOGIAT ERP-keskkonna käsitlemine nii, nagu see oleks üksainus tehnoloogia, on suur viga. On palju ERP-tehnoloogiaid, millest igaühel on oma tugevad küljed. Tuntuimad müüjad turul on:

▪ SAP
▪ Oracle Financials
▪ PeopleSoft
JD Edwards
▪ Baans SAP SAP on suurim ja kõige põhjalikum ERP-tarkvara. SAP-rakendused hõlmavad mitut tüüpi rakendusi paljudes valdkondades. SAP-il on maine selle poolest, et on:

▪ väga suur
▪ väga raske ja kulukas rakendada
▪ vajab rakendamiseks palju inimesi ja konsultante
▪ vajab rakendamiseks spetsialiseerunud inimesi
▪ vajab juurutamiseks palju aega. Samuti on SAP-il oma päheõppija maine andma tihedalt, muutes neile juurdepääsu väljaspool SAP-piirkonda raskeks. SAP-i tugevus seisneb selles, et see suudab hõivata ja salvestada suures koguses andma. SAP teatas hiljuti oma kavatsusest laiendada oma rakendusi andmekogus. SAP-i kasutamisel tarnijana on palju plusse ja miinuseid andmekogus. Eelis on see, et SAP on juba installitud ja enamik konsultante on SAP-iga juba tuttav.
SAP-i kui tarnija puudused andmekogus on palju: SAP-il pole kogemusi maailmas andmekogus Kui SAP on tarnija andmekogus, on vaja “välja võtta” i andma SAP al andmekogus. Dato SAP-i suletud süsteemi kogemus, ei ole tõenäoliselt lihtne i-d SAP-ist sellesse hankida (???). SAP-i toiteallikaks on palju pärandkeskkondi, nagu IMS, VSAM, ADABAS, ORACLE, DB2 jne. SAP nõuab lähenemist "ei ole siin leiutatud". SAP ei soovi selle kasutamiseks või loomiseks teiste tarnijatega koostööd teha andmekogus. SAP nõuab kogu oma tarkvara ise loomist.

Kuigi SAP on suur ja võimas ettevõte, on tõsiasi, et üritatakse ümber kirjutada ELT, OLAP-i tehnoloogia, süsteemihaldus ja isegi koodibaasi. dbms see on lihtsalt hull. Selle asemel, et tarnijatega koostööd teha andmekogus SAP on pikka aega järginud lähenemisviisi, et nad teavad kõige paremini. Selline suhtumine takistab SAP-i edu selles valdkonnas andmekogus.
SAP-i keeldumine lubada välistel tarnijatel omadele kiiresti ja elegantselt juurde pääseda andma. Kasutamise põhiolemus a andmekogus on lihtne juurdepääs andma. Kogu SAP-i lugu põhineb juurdepääsu raskendamiseks andma.
SAP-i kogemuste puudumine suurte mahtude käsitlemisel andma; valdkonnas andmekogus on mahud andma SAP-ist kunagi näinud ja nende suurte koguste haldamiseks andma teil peab olema õige tehnoloogia. Ilmselt ei ole SAP teadlik sellest tehnoloogilisest tõkkest, millega valdkonda siseneda andmekogus.
SAP-i ettevõttekultuur: SAP on loonud ettevõtte i hankimisel andma süsteemist. Kuid selleks peab teil olema erinev mentaliteet. Traditsiooniliselt ei ole tarkvaraettevõtted, kes olid head andmete keskkonda viimisel, olnud head andmete muutmisel. Kui SAP-il õnnestub seda tüüpi vahetus teha, on see esimene ettevõte, kes seda teeb.

Lühidalt öeldes on küsitav, kas ettevõte peaks valima SAP-i tarnijaks andmekogus. Ühelt poolt on väga tõsised riskid ja teisest küljest väga vähe hüvesid. Kuid on veel üks põhjus, mis ei soovita SAP-i tarnijaks valida andmekogus. Sest igal ettevõttel peaks olema sama andmekogus kõigist teistest ettevõtetest? The andmekogus see on konkurentsieelise tuum. Kui iga ettevõte võtaks kasutusele sama andmekogus konkurentsieelise saavutamine oleks raske, kuigi mitte võimatu. SAP näib arvavat, et a andmekogus võib vaadelda kui küpsist ja see on järjekordne märk nende mentaliteedist "andmed sisse" rakendustesse.

Ükski teine ERP-müüja ei ole nii domineeriv kui SAP. Kahtlemata leidub ettevõtteid, kes lähevad SAP-i teed enda jaoks andmekogus aga arvatavasti need andmekogus SAP-id on suured, kallid ja nende loomine võtab aega.

Need keskkonnad hõlmavad selliseid tegevusi nagu pangatellijate töötlemine, lennufirmade broneerimisprotsessid, kindlustuskaebuste protsessid jne. Mida paremini toimis tehingusüsteem, seda ilmsem oli vajadus tööprotsessi ja DSS-i (Decision Support System) eraldamiseks. Personali- ja personalisüsteemide puhul ei seisa aga kunagi silmitsi suurte tehingumahtudega. Ja muidugi, kui inimene võetakse tööle või lahkub ettevõttest, on see tehingu kirje. Kuid võrreldes teiste süsteemidega ei ole personali- ja personalisüsteemides lihtsalt palju tehinguid. Seetõttu ei ole personali- ja personalisüsteemides täiesti ilmne, et DataWarehouse on vaja. Need süsteemid on paljuski DSS-süsteemide liited.

Kuid on veel üks tegur, mida tuleb andmehoidla ja PeopleSofti käsitlemisel arvestada. Paljudes ringkondades, st andma Personali- ja isiklikud ressursid on ettevõtte põhitegevuse kõrval teisejärgulised. Enamik ettevõtteid toodab, müüb, osutab teenuseid ja nii edasi. Personali- ja personalisüsteemid on tavaliselt ettevõtte põhitegevuse kõrval teisejärgulised (või seda toetavad). Seetõttu on kahemõtteline ja ebamugav a andmekogus personali- ja isiklike ressursside toe jaoks eraldi.

PeopleSoft on selles osas SAP-ist väga erinev. SAP-i puhul on kohustuslik, et on olemas a andmekogus. PeopleSofti puhul pole see kõik nii selge. Andmeladu on PeopleSoftiga valikuline.

Parim, mida selle kohta öelda saab andma PeopleSoft on see andmekogus saab kasutada i arhiveerimiseks andma seotud vanade inim- ja isiklike ressurssidega. Teine põhjus, miks ettevõte soovib kasutada a andmekogus a

PeopleSofti keskkonna puuduseks on juurdepääsu võimaldamine ja vaba juurdepääs analüüsivahenditele, ai andma poolt PeopleSoft. Kuid lisaks nendele põhjustele võib esineda juhtumeid, kus eelistatakse andmeladu mitte omada andma PeopleSoft.

Kokkuvõttes

On palju ideid, mis on seotud a ehitamisega andmekogus ERP tarkvara sees.
Mõned neist on:

▪ Mõistlik on omada a andmekogus kes näeb välja nagu mõni teine selles valdkonnas?
▪ Kui paindlik on ERP andmekogus tarkvara?
▪ ERP andmekogus tarkvara saab hakkama mahuga andma mis asub kohas "andmekogus areen"?
▪ Mida teeb ERP-müüja jälgi logimine, pidades silmas lihtsat ja odavat, aeganõudvat andma? (Millised on ERP-müüjate tulemused odavate, õigeaegsete ja hõlpsasti juurdepääsetavate andmete tarnimisel?)
▪ Milline on ERP-müüja arusaam DSS-i arhitektuurist ja ettevõtte teabetehasest?
▪ ERP-müüjad mõistavad, kuidas saada andma keskkonnas, vaid ka mõista, kuidas neid eksportida?
▪ Kui avatud on ERP-müüja andmelao tööriistadele?
Kõiki neid kaalutlusi tuleb arvesse võtta, kui otsustate, kuhu panna andmekogus mis majutab i andma ERP ja teised andma. Üldiselt, kui pole mõjuvat põhjust teisiti teha, on soovitatav ehitada andmekogus väljaspool ERP tarnija keskkonda. 1. PEATÜKK BI organisatsiooni ülevaade Põhipunktid:
Teabehoidlad töötavad ärianalüüsi (BI) arhitektuurile vastupidiselt:
Ettevõttekultuur ja IT võivad BI-organisatsioonide ülesehitamist piirata.

Tehnoloogia ei ole enam BI organisatsioonide jaoks piirav tegur. Arhitektide ja projektiplaneerijate probleem ei seisne selles, kas tehnoloogia on olemas, vaid selles, kas nad suudavad olemasolevat tehnoloogiat tõhusalt rakendada.

Paljude ettevõtete jaoks a andmekogus on midagi enamat kui passiivne hoius, mis jagab i andma kasutajatele, kes seda vajavad. THE andma eraldatakse lähtesüsteemidest ja asustatakse sihtstruktuuridesse andmekogus. Ma andma neid saab ka hea õnne korral puhastada. Kuid see ei lisa ega kogu täiendavat väärtust andma selle protsessi käigus.

Põhimõtteliselt pakub passiivne dw parimal juhul ainult i andma kasutajate ühendustele puhas ja toimiv. Teabe loomine ja analüütiline mõistmine sõltuvad täielikult kasutajatest. Otsustades, kas DW (Andmeladu) kas edu on subjektiivne. Kui hindame edu selle järgi, kas suudame tõhusalt koguda, integreerida ja puhastada i andma ettearvatava alusel, siis jah, DW on edukas. Teisest küljest, kui vaatame organisatsiooni kui terviku teabe kogumist, konsolideerimist ja kasutamist, on DW ebaõnnestunud. DW pakub vähe või üldse mitte teavet. Selle tulemusena on kasutajad sunnitud hakkama saama, luues nii infosiilud. See peatükk tutvustab kõikehõlmavat visiooni ettevõtte BI (business Intelligence) arhitektuuri kokkuvõtmiseks. Alustame BI kirjeldusega ja seejärel liigume aruteludesse teabe kujundamise ja arendamise, mitte lihtsalt pakkumise üle andma kasutajatele. Seejärel keskenduvad arutelud teie BI-alaste jõupingutuste väärtuse arvutamisele. Lõpetuseks määratleme, kuidas IBM täidab teie organisatsiooni BI arhitektuurinõudeid.

Arhitektuuri kirjeldus BI organisatsioon

Võimsad tehingutele orienteeritud infosüsteemid on nüüd igas suurettevõttes päevakorras, mis ühtlustab tõhusalt konkurentsitingimusi korporatsioonidele üle kogu maailma.

Konkurentsis püsimiseks on aga nüüd vaja analüütiliselt orienteeritud süsteeme, mis võivad muuta ettevõtte võimet taasavastada ja kasutada juba olemasolevat teavet. Need analüütilised süsteemid tulenevad rikkusest arusaamisest andma saadaval. BI võib parandada kogu ettevõtte teabe jõudlust. Ettevõtted saavad parandada klientide ja tarnijate suhteid, parandada toodete ja teenuste kasumlikkust, luua uusi ja paremaid tehinguid, kontrollida riske ja paljude muude tulude hulgas kärpida drastiliselt kulusid. BI-ga hakkab teie ettevõte lõpuks tänu turueesmärkidega rakendustele kasutama klienditeavet konkurentsivõimelise varana.

Õigete ärivahendite olemasolu tähendab kindlate vastuste omamist sellistele võtmeküsimustele nagu:

▪ Milline meie oma kliendid Kas need panevad meid rohkem teenima või panevad meid raha kaotama?
▪ Kus elavad meie parimad kliendid suhtes pood/ ladu nad sagedased?
▪ Milliseid meie tooteid ja teenuseid saab kõige tõhusamalt müüa ja kellele?
▪ Milliseid tooteid saab kõige tõhusamalt müüa ja kellele?
▪ Milline müügikampaania on edukam ja miks?
▪ Millised müügikanalid on milliste toodete puhul kõige tõhusamad?
▪ Kuidas saame parandada suhteid oma parimatega kliendid? Enamikul ettevõtetel on andma raske neile küsimustele vastata.
Operatsioonisüsteemid tekitavad suures koguses tooteid, kliente ja kulusid andma müügikohtadest, broneeringutest, klienditeenindusest ja tehnilise toe süsteemidest. Väljakutseks on selle teabe hankimine ja kasutamine. Paljud ettevõtted saavad kasu vaid väikesest osast andma strateegiliste analüüside jaoks.
I andma järelejäänud, sageli kombineerituna i-ga andma välised allikad, nagu valitsuse aruanded ja muu ostetud teave, on kullakaevandus, mis ootab vaid uurimist ja andma neid tuleb lihtsalt teie organisatsiooni teabekontekstis täpsustada.

Neid teadmisi saab rakendada mitmel viisil, alates üldise ettevõtte strateegia kavandamisest kuni isikliku suhtlemiseni tarnijatega, kõnekeskuste, arvete esitamise, Internet ja muud punktid. Tänapäeva ärikeskkond nõuab, et DW ja sellega seotud BI-lahendused arenevad kaugemale kui traditsioonilised äristruktuurid. andma mis i andma aatomitasemel normaliseeritud ja “täht/kuubikufarmid”.

Konkurentsis püsimiseks on vaja traditsiooniliste ja arenenud tehnoloogiate sulandumist, et toetada laiaulatuslikku analüütilist maastikku.
Lõpuks peab üldine keskkond parandama teadmisi ettevõttest kui tervikust, jälgides, et läbiviidud analüüside tulemusel tehtud tegevused oleksid kasulikud, et sellest kasu saaksid kõik.

Oletame näiteks, et asetate omale järjestuse kliendid kõrge või madala riskiga kategooriates.
Olenemata sellest, kas see teave on genereeritud kaevandamismudeli või muul viisil, tuleb see sisestada DW-sse ja teha kõigile juurdepääsetavaks mis tahes juurdepääsutööriista, näiteks staatiliste aruannete, arvutustabelite, tabelite või veebipõhise analüütilise töötlemise (OLAP) abil.

Kuid praegu jääb suur osa seda tüüpi teabest silodesse andma üksikisikute või osakondade kohta, kes analüüsi koostasid. Organisatsioonil tervikuna on mõistmiseks vähe nähtavust või puudub see üldse. Ainult seda tüüpi teabesisu oma ettevõtte DW-sse segades saate kõrvaldada teabehoidlad ja tõsta oma DW-keskkonda.
BI-organisatsiooni arendamisel on kaks peamist takistust.
Esiteks on meil probleem organisatsiooni enda ja selle distsipliiniga.
Kuigi me ei saa aidata organisatsiooni poliitika muudatustega, saame aidata mõista organisatsiooni BI komponente, selle arhitektuuri ja seda, kuidas IBMi tehnoloogia selle arengut hõlbustab.
Teine ületatav takistus on integreeritud tehnoloogia puudumine ja meetodi tundmine, mis kutsub esile kogu BI-ruumi, mitte ainult väikese komponendi.

IBM reageerib muutustele tehnoloogia integreerimisel. Teie kohustus on pakkuda teadlikku disaini. See arhitektuur tuleb välja töötada tehnoloogiaga, mis on valitud piiramatuks integreerimiseks, või vähemalt tehnoloogiaga, mis järgib avatud standardeid. Samuti peab teie ettevõtte juhtkond tagama, et Bi-ettevõtte tegevus toimuks ajakava järgi, mitte lubama omakasupüüdvatest tegevuskavadest või eesmärkidest tulenevate teabehoidlate arendamist.
See ei tähenda, et BI-keskkond ei oleks tundlik erinevate kasutajate erinevatele vajadustele ja nõudmistele reageerimise suhtes; selle asemel tähendab see, et nende individuaalsete vajaduste ja nõuete rakendamine toimub kogu BI organisatsiooni hüvanguks.
BI organisatsiooni arhitektuuri kirjelduse leiate lk 9 joonisel 1.1. Arhitektuur demonstreerib rikkalikku tehnoloogiate ja tehnikate kombinatsiooni.
Traditsioonilise vaate järgi sisaldab arhitektuur järgmisi laokomponente

Aatomikiht.

See on kogu Dw ja seega ka strateegilise aruandluse alus, süda.
I andma siia salvestatud säilitab ajaloolise terviklikkuse, aruanded andma ja sisaldavad tuletatud mõõdikuid, samuti kaevandamismudelite abil puhastamist, integreerimist ja salvestamist.
Nende kogu edasine kasutamine andma ja sellega seotud teave tuletatakse sellest struktuurist. See on suurepärane allikas kaevandamiseks andma ja struktureeritud SQL-päringutega aruannete jaoks

Töötav ladu andma või aruandebaas andma(Operational data store (ODS) või aruandlus andmebaas.)

See on struktuur andma spetsiaalselt loodud tehniliseks aruandluseks.

I andma ülalpool salvestatud ja teatatud struktuurid võivad lõpuks levida lattu peatusala kaudu, kus seda saab kasutada strateegiliseks signaalimiseks.

Lavastusala.

Enamiku jaoks esimene peatus andma laokeskkonna jaoks mõeldud on organisatsiooni tsoon.
Siin i andma need integreeritakse, puhastatakse ja muudetakse andma kasum, mis täidab laostruktuuri

Kuupäev marts.

See arhitektuuri osa esindab selle struktuuri andma kasutatakse spetsiaalselt OLAP-i jaoks. Datamartide olemasolu, kui i andma need on salvestatud täheskeemides, millega nad üle katavad andma mitmemõõtmeline relatsioonikeskkonnas või selle failides andma OLAP-tehnoloogia (nt DB2 OLAP Server) poolt kasutatav omandiõigus ei ole asjakohane.

Ainus piirang on see, et arhitektuur hõlbustab kasutamist andma mitmemõõtmeline.
Arhitektuur hõlmab ka kriitilisi Bi-tehnoloogiaid ja -tehnikaid, mida eristatakse järgmiselt:

Ruumianalüüs

Ruum on analüütiku jaoks ootamatu teabeallikas ja on lahenduse täielikuks lahendamiseks ülioluline. Ruum võib esindada teavet teatud asukohas elavate inimeste kohta, aga ka teavet selle kohta, kus see asukoht muu maailma suhtes füüsiliselt asub.

Selle analüüsi tegemiseks peate alustama teabe sidumisest laius- ja pikkuskraadi koordinaatidega. Seda nimetatakse "geokodeerimiseks" ja see peab olema osa väljavõtmis-, teisendus- ja laadimisprotsessist (ETL) teie lao aatomitasandil.

Andmete kaevandamine.

Ekstraheerimine andma võimaldab meie ettevõtetel arvu suurendada kliendid, et ennustada müügitrende ja võimaldada suhete haldamist i-ga kliendid (CRM) muude BI-algatuste hulgas.

Ekstraheerimine andma seepärast tuleb see integreerida struktuuridega andma ladu ja seda toetavad laoprotsessid, et teha kindlaks tehnoloogia ja sellega seotud tehnikate tõhus ja tõhus kasutamine.

Nagu on näidatud BI arhitektuuris, on aatomitaseme Dwhouse ja ka datamarts suurepärane allikas andma kaevandamiseks. Need samad atribuudid peavad olema ka kaevandamistulemuste adressaadid, et tagada kättesaadavus kõige laiemale vaatajaskonnale.

Esindajad.

Kliendi kontrollimiseks on olemas erinevad "agendid", näiteks ettevõtte operatsioonisüsteemid ja dw ise. Need agendid võivad olla arenenud närvivõrgud, mida on koolitatud tundma õppima igas punktis suundumusi, nagu näiteks müügiedendustel põhinev tulevane tootenõudlus, reeglipõhised mootorid reageerimiseks andmeid asjaolude kogum või isegi lihtsad agendid, kes teatavad eranditest tippjuhtidele. Need protsessid toimuvad tavaliselt reaalajas ja seetõttu peavad need olema tihedalt seotud protsesside liikumisega andma. Kõik need struktuurid andma, tehnoloogiad ja tehnikad tagavad, et te ei kuluta ööd oma BI organisatsiooni loomisele.

Seda tegevust arendatakse järk-järgult väikeste punktide jaoks.
Iga samm on iseseisev projektitöö ja seda nimetatakse teie BI dw-s või algatuses iteratsiooniks. Iteratsioonid võivad hõlmata uute tehnoloogiate rakendamist, alustades uutest tehnikatest, uute raamistike lisamist andma , laadimine i andma täiendavalt või teie keskkonna analüüsi laiendamisega. Seda lõiku käsitletakse üksikasjalikumalt 3. peatükis.

Lisaks traditsioonilistele DW-raamistikele ja BI-tööriistadele on teie BI-organisatsioonil ka muid aspekte, mille jaoks peate kujundama, näiteks:

Kliendi puutepunktid (Customer touch punktid).

Nagu iga moodsa organisatsiooni puhul, on ka mitmeid klientide kokkupuutepunkte, mis näitavad, kuidas saada enda jaoks positiivne kogemus kliendid. On traditsioonilisi kanaleid, nagu kaupmehed, elektrikilbi operaatorid, otsepost, multimeedia ja trükireklaam, aga ka uuemaid kanaleid, nagu e-post ja veeb, andma teatud kokkupuutepunktiga tooted tuleb hankida, transportida, puhastada, töödelda ja seejärel rajatistesse paigutada andma BI-st.

Alused andma operatiiv- ja kasutajaühendused (Operational

andmebaasid ja kasutajakogukonnad).
Lõpus kontaktpunktid kliendid leiate põhitõed andma ettevõtte ja kasutajakogukondade rakendus. THE andma olemasolevad on andma traditsiooniline, mis tuleb uuesti ühendada ja ühendada andma puutepunktidest vajaliku teabe saamiseks.

Analüütikud. (Analüütikud)

BI keskkonna peamine kasusaaja on analüütik. Tema on see, kes saab kasu praegusest kaevandamisest andma toimiv, integreeritud erinevate allikatega andma , mida on täiendatud selliste funktsioonidega nagu geograafiline analüüs (geokodeerimine) ja mis on esitatud BI-tehnoloogiates, mis võimaldavad kaevandamist, OLAP-i, täiustatud SQL-i aruandlust ja geograafilist analüüsi. Analüütiku peamine liides aruandluskeskkonnale on BI-portaal.

Kuid analüütik pole ainus, kes BI arhitektuurist kasu saab.
Juhid, suured kasutajate ühendused ja isegi liikmed, tarnijad ja i kliendid nad peaksid leidma ettevõtte BI-st kasu.

Tagasisööta silmus.

BI arhitektuur on õpikeskkond. Arengu iseloomulikuks põhimõtteks on püsivate struktuuride võimaldamine andma mida värskendatakse kasutatud BI-tehnoloogia ja kasutajate tegevuste järgi. Näiteks võib tuua klientide punktiarvestuse.

Kui müügiosakond koostab klientide skooride mudeli, näiteks kasutab uut teenust, ei tohiks müügiosakond olla ainus teenusest kasu saav rühm.

Selle asemel tuleks mudelite kaevandamine läbi viia ettevõttesisese andmevoo loomuliku osana ja klientide hinded peaksid muutuma lao teabekonteksti lahutamatuks osaks, mis on nähtav kõigile kasutajatele. Bi-bI-keskne IBM Suite, sealhulgas DB2 UDB, DB2 OLAP Server sisaldab kõige olulisemaid tehnoloogiakomponente, mis on määratletud joonisel 1.1.

Kasutame arhitektuuri, nagu see raamatu sellel joonisel on näha, et anda meile järjepidevuse tase ja näidata, kuidas kõik IBMi tooted sobivad üldisesse BI-skeemi.

Infosisu pakkumine (pakkumine Teabe sisu)

BI-keskkonna kujundamine, arendamine ja juurutamine on hirmuäratav ülesanne. Disain peab hõlmama nii praegusi kui ka tulevasi ärinõudeid. Arhitektuurijoonis peab olema kõikehõlmav, et sisaldada kõiki projekteerimisetapis leitud järeldusi. Teostus peab jääma pühenduma ühele eesmärgile: arendada BI-arhitektuuri nii, nagu see on ametlikult esitatud kujunduses ja põhinedes ärinõuetel.

Eriti raske on väita, et distsipliin tagab suhtelise edu.
See on lihtne, sest te ei arenda BI keskkonda korraga, vaid väikeste sammude kaupa aja jooksul.

Arhitektuuri BI-komponentide tuvastamine on aga oluline kahel põhjusel: kõik järgnevad tehnilised arhitektuuriotsused juhivad teid.
Suudate teadlikult kavandada teatud tehnoloogia kasutamist, isegi kui teil ei pruugi tekkida korduvat tehnoloogiat mitme kuu jooksul.

Oma ärinõuete piisav mõistmine mõjutab teie arhitektuuri jaoks soetavate toodete tüüpi.
Teie arhitektuuri projekteerimine ja arendamine tagab, et teie ladu on

mitte juhuslik sündmus, vaid pigem läbimõeldud, hoolikalt üles ehitatud reklaam töötama kunstist kui segatehnoloogia mosaiigist.

Kujundage teabe sisu

Kogu esialgne disain peab keskenduma ja tuvastama peamised BI-komponendid, mida kogu keskkond praegu ja tulevikus vajab.
Ettevõtte nõuete tundmine on oluline.

Isegi enne ametliku planeerimise algust suudab projektiplaneerija sageli kohe tuvastada ühe või kaks komponenti.
Teie arhitektuuri jaoks vajalike komponentide tasakaalu ei ole aga lihtne leida. Disainifaasis seob põhiosa arhitektuurist rakenduste arendamise seansi (JAD) ärinõuete tuvastamiseks.

Mõnikord võib need nõuded usaldada päringu- ja aruandlustööriistadele.
Näiteks väidavad kasutajad, et kui nad soovivad praegust aruannet automatiseerida, peavad nad käsitsi looma, integreerides kaks praegust aruannet ja lisades arvutused, mis on tuletatud andma.
Kuigi see nõue on lihtne, määratleb see teatud funktsioonifunktsioonid, mille peate oma organisatsioonile aruandlustööriistade ostmisel kaasama.

Tervikpildi saamiseks peab disainer järgima ka lisanõudeid. Kas kasutajad soovivad selle aruande tellida?
Kas aruannete alamhulgad luuakse ja saadetakse erinevatele kasutajatele? Kas soovite seda aruannet ettevõtteportaalis näha? Kõik need nõuded on osa lihtsast vajadusest asendada käsitsi aruanne vastavalt kasutajate nõudmistele. Seda tüüpi nõuete eeliseks on see, et kõik, nii kasutajad kui ka kujundajad, on aruannete kontseptsiooniga tuttavad.

Siiski on ka teist tüüpi ettevõtteid, mida peame planeerima. Kui ärinõuded on esitatud strateegiliste äriküsimuste vormis, on kogenud planeerijal lihtne eristada mõõtmete ja mõõtmise/fakti nõudeid.

Kui JAD-i kasutajad ei tea, kuidas oma nõudeid äriprobleemi vormis esitada, toob disainer sageli näiteid nõuete kogumise seansi vahelejätmiseks ja alustamiseks.
Ekspertplaneerija aitab kasutajatel mõista mitte ainult strateegilist äri, vaid ka seda, kuidas seda kujundada.
Nõuete kogumise lähenemisviisi käsitletakse 3. peatükis; praegu tahame lihtsalt juhtida tähelepanu vajadusele kujundada kõikvõimalike BI-nõuete jaoks.

Strateegiline äriprobleem pole mitte ainult ärinõue, vaid ka disainilahendus. Kui peate vastama mitmemõõtmelisele küsimusele, siis peate selle pähe õppima, esitama andma mõõtmed ja kui teil on vaja i andma mitmemõõtmeline, peate otsustama, millist tüüpi tehnoloogiat või tehnikat kavatsete kasutada.

Kas rakendate reserveeritud kuubiku tähe skeemi või mõlemat? Nagu näete, võib isegi lihtne äriprobleem disaini oluliselt mõjutada. Kuid seda tüüpi ärinõuded on tavalised ja loomulikult vähemalt kogenud projektiplaneerijate ja disainerite poolt.

OLAP-tehnoloogiate ja toe üle on arutatud piisavalt ning saadaval on lai valik lahendusi. Siiani oleme käsitlenud vajadust koondada lihtne aruandlus dimensiooniliste ärinõuetega ja kuidas need nõuded mõjutavad tehnilise arhitektuuri otsuseid.

Kuid millised on nõuded, millest kasutajad ega Dw meeskond lihtsalt aru ei saa? Kas teil on kunagi vaja ruumianalüüsi (ruumianalüüsi)?
Kaevandamise mudelid andma Kas need on teie tuleviku vajalik osa? Kes teab?

Oluline on märkida, et seda tüüpi tehnoloogiaid ei tunne üldkasutajate kogukonnad ja DW meeskonnaliikmed, osaliselt võib see olla tingitud sellest, et tavaliselt tegelevad nendega mõned ettevõttesisesed või kolmanda osapoole tehnilised eksperdid. See on seda tüüpi tehnoloogiate tekitatud probleemide terav juhtum. Kui kasutajad ei suuda kirjeldada ärinõudeid või kujundada neid disaineritele juhiste andmiseks, võivad nad jääda märkamatuks või, mis veelgi hullem, lihtsalt ignoreerida.

Probleemsemaks muutub see, kui disainer ja arendaja ei suuda ära tunda ühe neist täiustatud, kuid kriitilistest tehnoloogiatest.
Nagu oleme sageli kuulnud disainereid ütlemas: "Noh, miks me ei jäta seda enne, kui saame selle teise asja?" „Kas nad on tõesti huvitatud prioriteetidest või väldivad lihtsalt nõudeid, millest nad aru ei saa? Tõenäoliselt on see viimane oletus. Oletame, et teie müügimeeskond on edastanud ärinõude, nagu on näidatud joonisel 1.3, nagu näete, on nõue esitatud äriprobleemi kujul. Selle probleemi ja tüüpilise mõõtmeprobleemi erinevus seisneb kauguses. Sel juhul soovib müügimeeskond igakuiselt teada kogu müüki toodetest, ladudest ja kliendid kes elavad 5 miili raadiuses laost, kus nad sisseoste teevad.

Kahjuks võivad disainerid või arhitektid ruumilist komponenti lihtsalt ignoreerida, öeldes: "Meil on klient, toode ja andma deposiidist. Hoiame vahemaad kuni uue iteratsioonini.

"Vale vastus. Seda tüüpi äriprobleemid on seotud BI-ga. See esindab meie äritegevuse sügavamat mõistmist ja meie analüütikute jaoks tugevat analüütilist ruumi. BI on kaugemale lihtsast päringu tegemisest või standardsest aruandlusest või isegi OLAP-ist. See ei tähenda, et need tehnoloogiad poleks teie BI jaoks olulised, kuid need iseenesest ei esinda BI keskkonda.

Disain teabe konteksti jaoks (Infosisu kujundamine)

Nüüd, kui oleme tuvastanud ärinõuded, mis eristavad erinevaid põhikomponente, tuleb need lisada üldisesse arhitektuurijoonisesse. Mõned BI komponendid on osa meie esialgsetest jõupingutustest, samas kui mõnda ei rakendata mitu kuud.

Kuid kõik teadaolevad nõuded kajastuvad disainis, nii et kui meil on vaja teatud tehnoloogiat rakendada, oleme selleks valmis. Midagi projektist peegeldab traditsioonilist mõtlemist.

See komplekt andma kasutatakse hilisema kasutuse toetamiseks andma dimensiooniline, mis tuleneb tuvastatud äriprobleemidest. Kuna luuakse täiendavaid dokumente, näiteks projekti arendamine andma, alustame vormistamisest kui i andma nad levivad keskkonnas. Oleme välja selgitanud vajaduse esindada i andma dimensiooniliselt, jagades need (vastavalt konkreetsetele spetsiifilistele vajadustele) andmekeskusteks.

Järgmine küsimus, millele tuleb vastata, on: kuidas neid andmeturte ehitatakse?
Kas ehitate tähti kuubikute toetamiseks või lihtsalt kuubikuid või ainult tähti? (või parempoolsed kuubikud või parempoolsed tähed). Looge arhitektuur sõltuvate andmekeskuste jaoks, mis nõuavad kõigi jaoks aatomikihti andma aquisites? Luba sõltumatutel andmeturgudel omandada andma otse operatsioonisüsteemidest?

Millist kuubitehnoloogiat proovite standardida?

Teil on tohutul hulgal jumalaid andma kas vajate mõõtmete analüüsi jaoks või vajate oma riikliku müügipersonali kuubikuid iganädalaselt või mõlemat? Kas ehitate oma müügiorganisatsiooni jaoks võimsa objekti, nagu DB2 OLAP Server rahanduse jaoks või Cognos PowerPlay kuubikud või mõlemad? Need on suured arhitektuurse disaini otsused, mis mõjutavad teie BI-keskkonda edasi. Jah, olete tuvastanud vajaduse OLAP-i järele. Nüüd, kuidas kavatsete sellist tehnikat ja tehnoloogiat rakendada?

Kuidas mõned arenenumad tehnoloogiad teie disainilahendusi mõjutavad? Oletame, et olete oma organisatsioonis tuvastanud ruumilise vajaduse. Nüüd tuleb arhitektuursete jooniste väljaandeid meenutada ka siis, kui ruumilisi komponente ei plaani teha mitu kuud. Arhitekt peab täna kavandama sellest, mida vaja on. Ennetage vajadust ruumianalüüsi järele, mis genereerib, salvestab, hooldab ja pakub juurdepääsu andma ruumiline. See omakorda peaks piirama seda, millist tarkvaratehnoloogiat ja platvormi spetsifikatsioone saate praegu kaaluda. Näiteks haldussüsteem andmebaasi relatsioonilisel (RDBMS-il), mida oma aatomikihi jaoks säilitate, peab olema saadaval tugev ruumiline ulatus. See tagaks maksimaalse jõudluse, kui kasutate analüütilistes rakendustes geomeetriat ja ruumiobjekte. Kui teie RDBMS ei saa sellega hakkama andma (ruumikeskne) sisemiselt, seega peate looma a andmebaasi (ruumikeskne) väline. See raskendab probleemide haldamist ja seab ohtu teie üldise jõudluse, rääkimata täiendavatest probleemidest, mis tekivad teie DBA-de jaoks, kuna neil on tõenäoliselt minimaalne arusaam andma ka ruumiline. Teisest küljest, kui teie RDMBS-i mootor käsitleb kõiki ruumikomponente ja selle optimeerija on teadlik ruumiobjektide erivajadustest (nt indekseerimine), saavad teie DBA-d hõlpsasti haldusprobleemidega hakkama ja saate jõudlust maksimeerida.

Samuti peate kohandama lavastusala ja aatomikeskkonna kihti, et hõlmata aadresside puhastamist (a

ruumianalüüsi võtmeelement), samuti ruumiobjektide hilisemat salvestamist. Disainväljaannete järgnevus jätkub nüüd, kui oleme võtnud kasutusele aadressi puhtuse mõiste. Esiteks määrab see rakendus ETL-i jõupingutuste jaoks vajaliku tarkvara tüübi.

Kas vajate selliseid tooteid nagu Trillium, et pakkuda teile puhast aadressi, või teie valitud ETL-i tarnijat selle funktsiooni pakkumiseks?
Praegu on oluline, et hindaksite disaini taset, mis tuleb enne ladu hooldama asumist lõpetada. Ülaltoodud näited peaksid näitama paljusid disainiotsuseid, mis peavad järgnema mis tahes konkreetse ärinõude tuvastamisele. Õigesti tehtud disainiotsused soodustavad vastastikust sõltuvust teie keskkonna füüsiliste struktuuride, kasutatava tehnoloogia valiku ja teabesisu levitamise vahel. Ilma selle tavapärase BI-arhitektuurita on teie organisatsioon allutatud olemasolevate tehnoloogiate kaootilisele segule, mis on parimal juhul lõdvalt kokku ühendatud, et tagada näiline stabiilsus.

Säilitage teabe sisu

Teabe väärtuse toomine oma organisatsiooni on väga raske ülesanne. Ilma piisava mõistmise ja kogemusteta või korraliku inseneritöö ja disainita ebaõnnestuksid isegi parimad meeskonnad. Teisest küljest, kui teil on suurepärane intuitsioon ja detailne disain, kuid teil pole distsipliini, mida teostada, olete lihtsalt oma raha ja aega raisanud, sest teie pingutused on määratud läbikukkumisele. Sõnum peaks olema selge: kui teil puudub üks või mitu neist oskustest, mõistmisest/kogemusest või planeerimise/disaini või rakendamise distsipliinist, põhjustab see BI organisatsiooni hoone sandistamist või hävitamist.

Kas teie meeskond on piisavalt ette valmistatud? Kas keegi teie BI-meeskonnast mõistab BI-keskkondades saadaolevat tohutut analüütilist maastikku ning selle maastiku säilitamiseks vajalikke tehnikaid ja tehnoloogiaid? Kas teie meeskonnas on keegi, kes oskab edasijõudnute taotlemisel vahet teha?

staatiline aruandlus ja OLAP või ROLAPi ja OLAPi erinevused? Kas üks teie meeskonnaliikmetest tunneb selgelt ära kaevandamise viisi ja kuidas see võib ladu mõjutada või kuidas ladu saab kaevandamist toetada? Meeskonnaliige mõistab selle väärtust andma kosmose- või agendipõhine tehnoloogia? Kas teil on keegi, kes hindab ETL vs Message Broker tehnoloogia ainulaadset tööriistarakendust? Kui teil seda pole, hankige üks. BI on palju suurem kui normaliseeritud aatomikiht, OLAP, täheskeemid ja ODS.

Teadmised ja kogemused BI-nõuete ja nende lahenduste äratundmiseks on hädavajalikud selleks, et saaksite õigesti vormistada kasutajate vajadusi ning kujundada ja rakendada nende lahendusi. Kui teie kasutajate kogukonnal on raskusi nõuete kirjeldamisega, peab laomeeskond seda mõistma. Aga kui meeskond lao

ei tunne BI spetsiifilist rakendust – näiteks andmekaevet –, siis pole parim, kui BI keskkonnad piirduvad sageli passiivsete hoidlatena. Kuid nende tehnoloogiate eiramine ei vähenda nende tähtsust ega mõju teie organisatsiooni äriteabe võimete tekkele ega ka teabevarale, mida kavatsete reklaamida.

Disain peab sisaldama joonise mõistet ja mõlemad nõuavad pädevat isikut. Lisaks eeldab planeerimine meeskonnatöö filosoofiat ja vastavust standarditele. Näiteks kui teie ettevõte on kehtestanud platvormistandardi või tuvastanud konkreetse RDBMS-i, mida ta soovib kogu platvormil standardida, peavad kõik meeskonnaliikmed neid standardeid järgima. Tavaliselt väljendab meeskond standardimise vajadust (kasutajate kogukondadele), kuid meeskond ise ei soovi järgida ettevõtte teistes valdkondades või isegi sarnastes ettevõtetes kehtestatud standardeid. See pole mitte ainult silmakirjalik, vaid näitab, et ettevõte ei ole võimeline kasutama olemasolevaid ressursse ja investeeringuid. See ei tähenda, et ei oleks olukordi, mis nõuavad mittestandardset platvormi või tehnoloogiat; aga lao jõupingutusi

nad peaksid kadedalt valvama ettevõtte standardeid, kuni ärinõuded teisiti nõuavad.

Kolmas põhikomponent, mis on vajalik BI-organisatsiooni ülesehitamiseks, on distsipliin.
See sõltub kokkuvõttes võrdselt nii üksikisikutest kui ka keskkonnast. Projekti planeerijad, sponsorid, arhitektid ja kasutajad peavad hindama distsipliini, mis on vajalik ettevõtte teabevarade ehitamiseks. Disainerid peavad suunama oma disainialased jõupingutused täiendama teisi ühiskonnas vajalikke jõupingutusi.

Oletame näiteks, et teie ettevõte loob ERP-rakenduse, millel on laokomponent.
Seega on ERP disainerite kohustus teha koostööd laokeskkonna meeskonnaga, et mitte konkureerida ega dubleerida juba alustatud tööd.

Distsipliin on ka teema, millega peab tegelema kogu organisatsioon ja mis on tavaliselt kehtestatud ja volitatud täitevvõimu tasandil.
Kas juhid on valmis järgima kavandatud lähenemisviisi? Lähenemisviis, mis lubab luua teabesisu, mis annab lõppkokkuvõttes väärtust kõigile ettevõtte valdkondadele, kuid võib-olla seab ohtu üksikute või osakondade tegevuskava? Pidage meeles ütlust "Mõelda kõigele on olulisem kui mõelda ühele asjale". See ütlus kehtib BI organisatsioonide kohta.

Kahjuks keskenduvad paljud laod oma jõupingutused konkreetse osakonna või konkreetsete kasutajate sihtimisele ja väärtuse pakkumisele, pöörates vähe tähelepanu organisatsioonile laiemalt. Oletame, et juht palub abi majade meeskonnalt. Meeskond reageerib 90-päevase jõupingutusega, mis hõlmab mitte ainult juhi määratud teavitusnõuete esitamist, vaid ka selle tagamist, et andma alused segatakse enne kavandatavasse kuubitehnoloogiasse kasutuselevõttu aatomitasandile.
See tehniline täiendus tagab, et majapidamisettevõte saab sellest kasu andma mida juht vajab.
Juht rääkis aga väliste konsultatsioonifirmadega, kes pakkusid välja sarnase rakenduse, mille tarneaeg on vähem kui 4 nädalat.

Eeldusel, et sisemine wastupanu meeskond on pädev, on juhil valida. Kes saab toetada täiendavat inseneridistsipliini, mis on vajalik ettevõtte teabevara kasvatamiseks, või saab valida kiiresti oma lahenduse. Viimast näib olevat valitud liiga sageli ja see aitab luua teabemahuteid, millest saavad kasu vähesed või üksikisikud.

Lühi- ja pikaajalised eesmärgid

Arhitektid ja projektiplaneerijad peavad vormistama pikaajalise visiooni üldisest arhitektuurist ja plaanid BI-organisatsiooni kasvatamiseks. See lühiajalise kasu ja pikaajalise planeerimise kombinatsioon on BI jõupingutuste kaks poolt. Lühiajaline tulu on BI tahk, mis on seotud teie lao iteratsioonidega.

See on koht, kus planeerijad, arhitektid ja sponsorid keskenduvad konkreetsete ärinõuete täitmisele. Just sellel tasemel ehitatakse füüsilisi struktuure, ostetakse tehnoloogiat ja rakendatakse tehnikaid. Need ei ole mingil juhul loodud konkreetsete kasutajakogukondade määratletud konkreetsete nõuete täitmiseks. Kõik tehakse eesmärgiga täita konkreetse kogukonna määratletud konkreetseid nõudeid.
Pikaajaline planeerimine on aga BI teine tahk. See on koht, kus plaanid ja projektid tagasid, et igasugune füüsiline struktuur ehitati, tehnoloogiad valiti ja tehnikad teostati ettevõttesse suhtudes. Just pikaajaline planeerimine tagab sidususe, mis on vajalik tagamaks, et mis tahes leitud lühiajalisest kasust saadakse kindel kasu.

Põhjendage oma BI jõupingutusi

Un andmekogus sel iseenesest pole loomuomane väärtus. Teisisõnu, laotehnoloogiate ja rakendustehnikate vahel puudub loomupärane väärtus.

Iga laotöö väärtus peitub laokeskkonna ja aja jooksul kultiveeritud infosisu tulemusena tehtud toimingutes. See on kriitiline punkt, mida tuleb mõista, enne kui proovite hinnata mis tahes wherehouse algatuse väärtust.

Liiga sageli püüavad arhitektid ja planeerijad rakendada väärtust lao füüsilistele ja tehnilistele komponentidele, kuigi tegelikult põhineb väärtus äriprotsessidel, mida ladu ja hästi kogutud teave positiivselt mõjutavad.

Siin peitub väljakutse BI asutamisele: kuidas põhjendate investeeringut? Kui majal endal pole sisemist väärtust, peavad projekti planeerijad uurima, määratlema ja vormistama kasu nendele isikutele, kes kasutavad ladu konkreetsete äriprotsesside või kaitstud teabe väärtuse või mõlema suurendamiseks.

Asjade keerulisemaks muutmiseks võib mis tahes äriprotsess, mida laotööd mõjutavad, pakkuda "olulist" või "kerget" kasu. Märkimisväärne kasu annab käegakatsutava mõõdiku investeeringutasuvuse (ROI) mõõtmiseks – näiteks saate varusid teatud perioodi jooksul täiendavalt ümber pöörata või saadetise transpordikulu madalamaks. Peent kasu, nagu parem juurdepääs teabele, on käegakatsutava väärtusena keerulisem määratleda.

Ühendage oma projekt, et teada saada ärisoovid

Liiga sageli üritavad projektiplaneerijad siduda laoväärtust ettevõtte amorfsete eesmärkidega. Deklareerides, et "lao väärtus põhineb meie võimel täita strateegilisi taotlusi", avame arutelu meeldival viisil. Kuid sellest üksi ei piisa, et teha kindlaks, kas lattu investeerimine on mõttekas. Parim on ühendada lao esindajad konkreetsete äripäringute ja märkmetega.

ROI mõõtmine

ROI arvutamine laosättes võib olla eriti keeruline. See on eriti raske, kui plii

teatud kordus on midagi immateriaalset või kergesti mõõdetavat. Ühes uuringus leiti, et kasutajad tajuvad BI-algatuste kahte peamist eelist:

▪ Loo oskus teha otsuseid
▪ Loo juurdepääs teabele
Need hüved on pehmed (või kerged) hüved. On lihtne mõista, kuidas saame arvutada investeeringutasuvuse sellise raske (või suurema) kasu alusel nagu veokulude vähendamine, kuid kuidas mõõta paremate otsuste tegemise võimet?
See on kindlasti väljakutse projektiplaneerijatele, kui nad üritavad panna ettevõtet investeerima konkreetsesse laotöösse. Müügi kasv või kulude vähenemine ei ole enam BI-keskkonda juhtivad kesksed teemad.
Selle asemel otsite äritaotlusi teabele parema juurdepääsu saamiseks, et konkreetne osakond saaks kiiremini otsuseid teha. Need on strateegilised jõud, mis on ettevõtte jaoks sama olulised, kuid on mitmetähenduslikumad ja neid on käegakatsutava mõõdikuga raskem iseloomustada. Sel juhul võib ROI arvutamine olla eksitav, kui mitte asjakohane.
Projekti kujundajad peavad suutma näidata juhtide jaoks käegakatsutavat väärtust, et otsustada, kas investeering konkreetsesse iteratsiooni on seda väärt. Kuid me ei paku välja uut meetodit ROI arvutamiseks ega esita selle poolt ega vastu argumente.
Saadaval on palju artikleid ja raamatuid, mis käsitlevad ROI arvutamise põhialuseid. Sellised rühmad nagu Gartner pakuvad spetsiaalseid väärtuspakkumisi, nagu investeeringu väärtus (VOI), mida saate uurida. Selle asemel keskendume investeeringutasuvuse või muude väärtuspakkumiste põhiaspektidele, mida peate kaaluma. ROI rakendamine Lisaks BI jõupingutustega seotud "kõva" ja "pehme" eeliste argumendile on investeeringutasuvuse rakendamisel ka muid probleeme. Näiteks:

Liiga suure säästu omistamine DW jõupingutustele, mis niikuinii tuleks
Oletame, et teie ettevõte kolis suurarvuti arhitektuurilt hajutatud UNIX-i keskkonda. Seega ei tohiks säästu, mida selle pingutusega saavutada (või mitte), ainult laoga, kui üldse (?), seostada.

Kõigega arvestamata jätmine on kallis. Ja sellega tuleb arvestada paljude asjadega. Kaaluge järgmist loendit:

▪ Käivitamise kulud, sealhulgas teostatavus.
▪ Spetsiaalse riistvara maksumus koos salvestusruumi ja sidega
▪ Tarkvara maksumus, sh haldamine andma ja kliendi/serveri laiendused, ETL-tarkvara, DSS-tehnoloogiad, visualiseerimistööriistad, ajastamis- ja töövoorakendused ning seiretarkvara, .
▪ Konstruktsiooni projekteerimise maksumus andma, loomise ja optimeerimisega
▪ BI-tööga otseselt seotud tarkvara arenduskulud
▪ Kodutoe maksumus, sealhulgas jõudluse optimeerimine, sealhulgas tarkvara versioonikontroll ja abitoimingud Rakendage "Big-Bang" ROI-d. Lao ehitamine ühe hiiglasliku jõupingutusena on määratud läbikukkumisele, nii et arvutage ka suurettevõtte initsiatiivi ROI. Pakkumine on üllatav ja planeerijad jätkavad nõrkade katsete tegemist kogu jõupingutuse väärtuse hindamiseks. Miks püüavad planeerijad anda ärialgatusele rahalist väärtust, kui on laialt teada ja aktsepteeritud, et konkreetsete iteratsioonide hindamine on keeruline? Kuidas on see võimalik? Väheste eranditega pole see võimalik. Ära tee seda. Nüüd, kui oleme kindlaks teinud, mida ROI arvutamisel mitte teha, on siin mõned punktid, mis aitavad teil luua usaldusväärse protsessi oma BI-alaste jõupingutuste väärtuse hindamiseks.

ROI nõusoleku saamine. Sõltumata sellest, millise tehnika valite oma BI-alaste jõupingutuste väärtuse hindamiseks, peavad sellega kokku leppima kõik osapooled, sealhulgas projektiplaneerijad, sponsorid ja ettevõtete juhid.

Jaotage ROI tuvastatavateks osadeks. Vajalik samm mõistliku ROI arvutamise suunas on selle arvutuse keskendumine konkreetsele projektile. See võimaldab teil hinnata väärtust konkreetsete ärinõuete alusel, mis on täidetud

Määratlege kulud. Nagu mainitud, tuleb arvestada paljude kuludega. Lisaks peavad kulud hõlmama mitte ainult individuaalse iteratsiooniga seotud kulusid, vaid ka ettevõtte standarditele vastavuse tagamisega seotud kulusid.

Määratlege eelised. Sidudes selgelt investeeringutasuvuse konkreetsete ärinõuetega, peaksime suutma tuvastada eelised, mis nõuete täitmiseni viivad.

Vähendage kulusid ja tulusid peatse kasumi korral. See on parim viis oma hinnangute aluseks võtta nüüdispuhasväärtus (NPV), mitte proovida ennustada tulevase tulu tulevast väärtust.

Hoidke oma ROI jagamiseks aega minimaalseks. See on pikas perspektiivis hästi dokumenteeritud, seda on teie ROI-s kasutatud.

Kasutage rohkem kui ühte ROI valemit. ROI ennustamiseks on palju meetodeid ja peaksite plaanima kasutada ühte või mitut neist, sealhulgas nüüdispuhasväärtust, sisemist tulumäära (IRR) ja tasuvust.

Määratlege korratav protsess. See on mis tahes pikaajalise väärtuse arvutamisel ülioluline. Kõigi järgnevate projekti alamjadade jaoks tuleks dokumenteerida üks korratav protsess.

Loetletud probleemid on kõige levinumad, mille on määratlenud werehouse keskkonnaeksperdid. Juhtkonna nõudmine saavutada "Big-Bang" ROI on väga segane. Kui alustate kõiki oma ROI arvutusi, jagades need tuvastatavateks, käegakatsutavateks osadeks, on teil hea võimalus hinnata täpset ROI hinnangut.

Küsimused ROI eeliste kohta

Olenemata teie eelistest, pehmest või kõvast, saate nende väärtuse määramiseks kasutada mõnda põhiküsimust. Näiteks kasutades lihtsat skaalat 1 kuni 10, saate mõõta mis tahes pingutuse mõju järgmiste küsimuste abil:

Kuidas hindaksite arusaamist andma jälgite seda oma ettevõtte projekti?
Kuidas hindaksite protsessi täiustusi selle projekti tulemusena?
Kuidas mõõtksite selle iteratsiooniga nüüd kättesaadavaks tehtud uute arusaamade ja järelduste mõju
Milline oli uute ja paremate arvutikeskkondade mõju õpitu tulemusena? Kui vastuseid neile küsimustele on vähe, on võimalik, et ettevõte ei ole tehtud investeeringut väärt. Kõrge punktiskooriga küsimused viitavad olulisele väärtuse kasvule ja peaksid olema edasise uurimise juhised. Näiteks protsesside täiustamise kõrge skoor peaks panema disainerid uurima, kuidas protsesse on täiustatud. Võite avastada, et osa või kõik saadud tulud on käegakatsutavad ja seetõttu saab hõlpsasti määrata rahalise väärtuse. Esimesest iteratsioonist maksimumi võtmine ladu Teie ettevõtte jõupingutuste suurim tulu on sageli esimestel iteratsioonidel. Need varased jõupingutused loovad traditsiooniliselt avalikkuse jaoks kõige kasulikuma teabesisu ja aitavad luua tehnoloogilise aluse järgmistele BI-rakendustele. Tavaliselt iga järgnev järgnevus andma laoprojektidest toovad ettevõttele tervikuna üha vähem lisaväärtust. See kehtib eriti siis, kui iteratsioon ei lisa uusi teemasid ega vasta uue kasutajakogukonna vajadustele.

See salvestusfunktsioon kehtib ka virnade kasvatamisel andma ajaloolased. Kuna hilisemad jõupingutused nõuavad rohkem andma ja kuidas veel andma valatakse aja jooksul lattu, enamik andma see muutub kasutatava analüüsi jaoks vähem oluliseks. Need andma neid nimetatakse sageli andma seisvad ja nende hoidmine on alati kallis, sest neid ei kasutata peaaegu kunagi.

Mida see projekti sponsorite jaoks tähendab? Põhimõtteliselt jagavad esimesed sponsorid rohkem kui investeerimiskulud. See on esmatähtis, kuna need on tõukejõuks lao laia tehnoloogilise ja ressursikeskkonnakihi, sealhulgas orgaanilise, rajamisel.

Kuid need esimesed sammud on kõige suurema väärtusega ja seetõttu peavad projekti planeerijad sageli investeeringut põhjendama.
Pärast teie BI algatust tehtud projektidel võivad olla madalamad (võrreldes esimesega) ja otsesed kulud, kuid need toovad ettevõttele vähem väärtust.

Ja organisatsioonide omanikud peavad hakkama kaaluma kogunemist andma ja vähem asjakohased tehnoloogiad.

Andmekaevandamine: kaevandamine Andma

Paljud arhitektuurilised komponendid nõuavad andmekaevetehnoloogiate ja -tehnikate variatsioone.
näiteks erinevad "agendid" huvipunktide uurimiseks kliendid, ettevõtte operatsioonisüsteemid ja sama dw. Need agendid võivad olla arenenud närvivõrgud, mis on koolitatud suundumuste, näiteks müügiedenduste põhjal tulevase tootenõudluse järgi; reeglitel põhinevad mootorid komplektile reageerimiseks andmeid asjaolud, näiteks meditsiiniline diagnoos ja ravisoovitused; või isegi lihtsad agendid, kelle ülesanne on tippjuhtidele eranditest teatada. Üldiselt need ekstraheerimisprotsessid andma si

kontrollida reaalajas; seetõttu peavad need olema täielikult ühendatud liikumisega andma ise.

Veebipõhine analüütiline töötlemine

Interneti-analüütika

Võimalus viilutada, tükeldatud, veeretada, puurida ja analüüsida
mis-kui, kuulub IBM-i tehnoloogiakomplekti ulatusse. Näiteks on DB2 jaoks olemas onlain-analüütilise töötlemise (OLAP) funktsioonid, mis toovad mõõtmete analüüsi andmebaas sama.

Funktsioonid lisavad SQL-ile dimensioonilist utiliiti, kasutades samal ajal kõiki DB2 loomuliku osa eeliseid. Teine näide OLAP-i integreerimisest on ekstraktimise tööriist DB2 OLAP Analyzer Server. See tehnoloogia võimaldab DB2 OLAP Serveri kuubikuid kiiresti ja automaatselt skannida, et leida ja koostada aruanded andma kauplemisanalüütiku jaoks ebatavaline või ootamatu. Ja lõpuks, DW Centeri funktsioonid pakuvad arhitektidele võimalust kontrollida muu hulgas DB2 OLAP-kuubikuserveri profiili kui ETL-protsesside loomulikku osa.

Ruumiline analüüs Ruumianalüüs

Ruum esindab poolt panoraami jaoks vajalikest analüütilistest ankrutest (juhtivustest).
lai analüütiline (aeg esindab teist poolt). Lao aatomitasand, mis on kujutatud joonisel 1.1, sisaldab vundamente nii ajas kui ruumis. Ajatemplid ankurdavad analüüsid aja järgi ja aadressiteabe ankuranalüüsid ruumi järgi. Ajatemplid teostavad analüüsi aja järgi ja aadressiteave teostab analüüsi ruumi järgi. Diagramm näitab geokodeerimist – aadresside teisendamist punktideks kaardil või punktideks ruumis, nii et analüüsis saab kasutada selliseid mõisteid nagu kaugus ja sees/väljas – see viiakse läbi aatomitasandil ja ruumianalüüs tehakse analüütikule kättesaadavaks. IBM pakub ruumilisi laiendusi, mis on välja töötatud koos Keskkonnasüsteemide uurimisinstituudiga (ESRI), al andmebaas DB2 nii, et ruumiobjekte saab säilitada tavapärase osana andmebaas suhteline. db2

Ruumilaiendid, pakuvad ka kõiki SQL-i laiendusi, et ruumianalüüsi eeliseid kasutada. Näiteks SQL-laiendid, mille kohta päringuid teha
aadresside vaheline kaugus või see, kas punkt asub määratletud hulknurkse ala sees või väljaspool, on ruumilaiendiga analüütiline standard. Lisateabe saamiseks vaadake 16. peatükki.

andmebaas-Resident Tools Tools andmebaas- Elanik

DB2-l on palju SQL BI-residentide funktsioone, mis aitavad sõelumist. Need sisaldavad:

Rekursioonifunktsioonid analüüsi tegemiseks, näiteks „leida kõik võimalikud lennutrajektoorid San Francisco a New York".
Analüütilised funktsioonid järjestamiseks, kumulatiivseks, kuubiks ja koondfunktsiooniks, et hõlbustada ülesandeid, mis tavaliselt esinevad ainult OLAP-tehnoloogiaga, on nüüdseks süsteemi mootori loomulik osa. andmebaas
Võimalus luua tulemusi sisaldavaid tabeleid
Müüjad andmebaas juhid segavad rohkem BI funktsioone andmebaas sama.
Peamised tarnijad andmebaasi nad segavad rohkem BI-funktsioone andmebaas sama.
See tagab BI-lahenduste parema jõudluse ja rohkem täitmisvõimalusi.
DB2 V8 funktsioone ja funktsioone käsitletakse üksikasjalikult järgmistes peatükkides:
Tehniline arhitektuur ja andmehalduse alused (5. peatükk)

DB2 BI põhialused (6. peatükk)
DB2 materialiseeritud päringute tabelid (peatükk 7)
DB2 OLAP-i funktsioonid (peatükk 13)
DB2 täiustatud BI funktsioonid ja funktsioonid (peatükk 15) Lihtsustatud andmeedastussüsteem Tarnesüsteem andma lihtsustatud

Joonisel 1.1 kujutatud arhitektuur sisaldab mitmeid struktuure andma füüsiline. Üks on ladu andma tegutsevad. Üldiselt on ODS objektorienteeritud, integreeritud ja ajakohane. Te peaksite ehitama ODS-i, et toetada näiteks müügiesindust. ODS müük täiendaks andma paljudest erinevatest süsteemidest, kuid säilitaks vaid näiteks tänased tehingud. ODS-i saab värskendada ka mitu korda päevas. Samal ajal suruvad protsessid i andma integreeritud teistesse rakendustesse. See struktuur on spetsiaalselt loodud integreerimiseks andma praegune ja dünaamiline ning oleks tõenäoliselt kandidaat reaalajas analüüsi toetamiseks, näiteks teenindusagentide pakkumiseks kliendid kliendi praegune müügiteave, eraldades müügitrendide teabe laoseisust endast. Teine joonisel 1.1 näidatud struktuur on dw formaalne olek. See pole mitte ainult vajaliku integratsiooni ja kvaliteedi teostamise koht andma, ja ümberkujundamisest andma sissetuleva lao jaoks, kuid on ka usaldusväärne ja ajutine laopind andma replikatsioonid, mida saaks kasutada reaalajas analüüsides. Kui otsustate kasutada ODS-i või lavastusala, on üks parimaid tööriistu nende struktuuride asustamiseks andma erinevate tööallikate kasutamine on DB2 heterogeenne hajutatud päring. Seda võimalust pakuvad valikuline DB2 funktsioon nimega DB2 Relational Connect (ainult päringud) ja DB2 DataJoiner (eraldi toode, mis pakub päringu-, lisamis-, värskendamis- ja kustutamisvõimalusi heterogeensetele hajutatud RDBMS-idele).

See tehnoloogia võimaldab arhitektidel andma siduma andma tootmine koos analüütiliste protsessidega. Tehnoloogia ei saa mitte ainult kohaneda praktiliselt kõigi replikatsiooninõuetega, mis võivad tekkida reaalajas analüütikaga, vaid see võib ühendada ka paljude erinevate andma kõige populaarsemad, sealhulgas DB2, Oracle, Sybase, SQL Server, Informix ja teised. DB2 DataJoinerit saab kasutada struktuuri täitmiseks andma formaalne, näiteks ODS või isegi laos esindatud alaline tabel, mis on loodud hetkeliste värskenduste kiireks taastamiseks või müügiks. Muidugi need struktuurid ise andma saab asustada kasutades

veel üks oluline tehnoloogia, mis on loodud replikatsiooniks andma, IBM DataPropagator Relational. (DataPropagator on eraldi toode kesksüsteemide jaoks. DB2 UNIX, Linux, Windows ja OS/2 sisaldavad paljundusteenuseid andma standardfunktsioonina).
Teine meetod liikumiseks andma ettevõtte ümber tegutsev ettevõtte rakenduste integraator, mida tuntakse ka sõnumivahendajana. See ainulaadne tehnoloogia võimaldab sihtimist ja teisaldamist ületamatult juhtida andma ettevõtte ümber. IBM-il on kõige laialdasemalt kasutatav sõnumivahendaja MQSeries või toote variatsioon, mis sisaldab nõudeid e-kaubandus, IBM WebSphere MQ.
Per più discussione su come sfruttare MQ per sostenere un magazzino e un ambiente BI, visitare veebisait del libro. Per ora, è sufficiente dire che questa tecnologia è un mezzo eccellente per catturare e trasformare (utilizzando MQSeries Integrator) andma BI-lahenduste jaoks värvatud sihttöötajad. MQ-tehnoloogia on integreeritud ja pakitud UDB V8-sse, mis tähendab, et sõnumijärjekordi saab nüüd hallata nii, nagu need oleksid DB2 tabelid. Keevitusjärjekorra teadete kontseptsioon ja universum andmebaas relatsiooniline suunab võimsa tarnekeskkonna poole andma.

Null-latentsus Null-latentsus

IBMi ülim strateegiline eesmärk on nulllatentsusanalüüs. Nagu on määratlenud
Gartner, BI-süsteem peab suutma järeldada, neelata ja anda analüütikutele nõudmisel teavet. Väljakutse on muidugi see, kuidas segada andma jooksev ja reaalajas koos vajaliku ajaloolise teabega, näiteks i andma seotud trend/muster või väljavõetud ülevaade, näiteks klientide profiilide koostamine.

Selline teave hõlmab näiteks identifitseerimist kliendid kõrge või madala riskiga või millised tooted i kliendid nad ostavad suure tõenäosusega, kui neil on juba ostukorvis juust.

Nulllatentsusaja saavutamine sõltub tegelikult kahest põhimehhanismist:

Täielik liit andma mida analüüsitakse väljakujunenud tehnikate ja BI loodud vahenditega
Tarnesüsteem andma tõhus, et tagada reaalajas analüütika tõeliselt kättesaadavus. Need nulllatentsuse eeldused ei erine kahest IBMi püstitatud ja ülalkirjeldatud eesmärgist. Tihe ühendus andma see on osa IBMi sujuvast integratsiooniprogrammist. Ja luua kohaletoimetamise süsteem andma tõhusus sõltub täielikult olemasolevast tehnoloogiast, mis lihtsustab tarneprotsessi andma. Järelikult on kaks IBMi kolmest eesmärgist kolmanda saavutamiseks kriitilise tähtsusega. IBM arendab teadlikult oma tehnoloogiat tagamaks, et latentsus null on laotöö reaalsus. Kokkuvõte / Süntees Teie BI-organisatsioon pakub teie keskkonna ülesehitamiseks tegevuskava
iteratiivselt. Seda tuleb kohandada nii, et see peegeldaks teie ettevõtte nii praegusi kui ka tulevasi vajadusi. Ilma laiaulatusliku arhitektuurse visioonita on lao iteratsioonid midagi enamat kui kesklao juhuslikud teostused, mis ei aita suurt ja informatiivset ettevõtet luua. Projektijuhtide esimene takistus on see, kuidas põhjendada BI organisatsiooni kasvatamiseks vajalikku investeeringut. Kuigi ROI-arvutused on jäänud laoseisude saavutamise alustalaks, on seda raskem täpselt ennustada. See on viinud muude meetoditeni, mille abil saate kindlaks teha, kas saate oma raha väärt. Lahendusena hangitakse näiteks Value on Investment2 (VOI). See on ülesandeks arhitektidele andma ja projektiplaneerijad loovad ja edastavad teadlikult teavet kasutajate ühendustele, mitte ei paku lihtsalt teenust andma. Nende kahe vahel on tohutu erinevus. Teave on midagi, mis muudab otsuste tegemise ja tõhususe; suhteliselt, st andma need on selle teabe tuletamise ehitusplokid.

Isegi kui kriitiline allika suhtes andma ärivajaduste rahuldamiseks peaks BI-keskkond teabesisu loomisel mängima suuremat rolli. Peame astuma täiendavaid samme, et puhastada, integreerida, muuta või muul viisil luua teabesisu, mille alusel kasutajad saavad tegutseda, ning seejärel tagama, et need toimingud ja otsused kajastuksid BI keskkonnas, kui see on mõistlik. Kui me paigutame lao ainult teenindamiseks andma, võite olla kindlad, et kasutajate ühendused loovad tegutsemiseks vajaliku teabesisu. See tagab, et nende kogukond saab teha paremaid otsuseid, kuid ettevõte kannatab teadmiste puudumise tõttu, mida nad on kasutanud. Dato et arhitektid ja projektiplaneerijad algatavad BI keskkonnas konkreetseid projekte, jäävad nad vastutavaks ettevõtte kui terviku ees. Selle BI-iteratsioonide kahepoolse funktsiooni lihtsa näite leiate allikast andma. Kõik andma konkreetsete kommertspäringute jaoks vastuvõetud, tuleb sisestada esimesse aatomikihti. See tagab ettevõtte teabevara arendamise ning haldab ja käsitleb iteratsioonis määratletud konkreetseid kasutajataotlusi.

Mis on andmeladu?

Andmeladu on olnud infosüsteemide arhitektuuri süda alates 1990. aastast ja toetab infoprotsesse, pakkudes kindlat integreeritud platvormi andma hilisemate analüüside aluseks. THE andmekogus need pakuvad lihtsat integreerimist ühildumatute rakendussüsteemide maailma. Andmeladu see on muutunud moeröögatuseks. Andmeladu organiseerima ja meelde jätma i andma vajalik teabe- ja analüütiliste protsesside jaoks pika ajaloolise ajalise perspektiivi alusel. Kõik see hõlmab märkimisväärseid ja pidevaid jõupingutusi hoone ehitamisel ja hooldamisel andmekogus.

Mis on siis a andmekogus? andmekogus on:

▪ ainele orienteeritud
▪ integreeritud süsteem
▪ ajaline kõikumine
▪ püsiv (ei tühista)

kogumik andma kasutatakse juhtimisotsuste toetamiseks protsesside elluviimisel.
I andma sisestatud andmekogus need tulenevad enamikul juhtudel töökeskkondadest. The andmekogus see on valmistatud salvestusseadmest, mis on füüsiliselt eraldatud ülejäänud süsteemist, mida see sisaldab andma varem muudetud rakenduste poolt, mis töötavad töökeskkonnast pärineva teabe põhjal.

Sõnasõnaline määratlus a andmekogus see väärib põhjalikku selgitust, kuna lao omadusi kirjeldavad olulised motiivid ja aluseks olevad tähendused.

ÕPPEAINE ORIENTATSIOON TEMAATILINE

Esimene omadus a andmekogus on see, et see on orienteeritud ettevõtte peamistele teemadele. Protsesside juhend läbi andma see on vastupidine klassikalisemale meetodile, mis näeb ette rakenduste orientatsiooni protsessidele ja funktsioonidele, meetodit, mida enamasti jagab enamik vähem hiljutisi juhtimissüsteeme.

Operatsioonimaailm on loodud selliste rakenduste ja funktsioonide ümber, nagu laenud, säästud, pangakaardid ja finantsasutuse usaldus. Dw maailm on korraldatud selliste peamiste teemade ümber nagu klient, müüja, toode ja tegevus. Teemade ümber joondamine mõjutab kavandamist ja rakendamist andma leitud dw-st. Kõige tähtsam on see, et põhiteema mõjutab võtmestruktuuri kõige olulisemat osa.

Rakenduste maailma mõjutavad nii andmebaaside disain kui ka protsesside disain. Dw maailm on keskendunud ainult video modelleerimisele andma ja kujunduse kohta andmebaas. Protsessi kujundamine (selle klassikalisel kujul) ei kuulu dw keskkonna alla.

Erinevused protsessi/funktsiooni rakenduse valiku ja subjekti valiku vahel ilmnevad ka erinevusena programmi sisus. andma üksikasjalikul tasemel. THE andma del dw ei sisalda i andma mida ei kasutata rakenduste ajal DSS-i töötlemiseks

tegevusele orienteeritud andma sisaldavad i andma et täita viivitamatult funktsionaalseid/töötlusnõudeid, millest võib DSS-i analüütiku jaoks kasu olla või mitte.
Veel üks oluline viis, kuidas toimimisele orienteeritud rakendused andma erineda andma dw kohta on aruannetes andma. Ma andma operaatorid säilitavad aktiivsel ärireeglil põhineva pideva suhte kahe või enama tabeli vahel. THE andma dw hõlmab ajaspektrit ja dw-st leitud teateid on palju. Paljud kaubandusreeglid (ja vastavalt ka paljud aruanded andma ) on esindatud laos andma kahe või enama laua vahel.

(Üksikasjaliku selgituse saamiseks selle kohta, kuidas seosed andma mida hallatakse DW-s, vaadake selle teema kohta tehnilist teemat.)
Kui vaadata põhimõttelist erinevust funktsionaalse/protsessirakenduse valiku ja subjekti valiku vahel, siis pole operatsioonisüsteemide ja andma ja DW.

INTEGRATSIOON INTEGRATSIOON

Dw keskkonna kõige olulisem aspekt on see, et i andma dw-s leiduvad on kergesti integreeritavad. ALATI. ILMA ERANDITETA. Dw keskkonna olemus seisneb selles, et i andma lao piires sisalduvad on integreeritud.

Integratsioon avaldub mitmel erineval viisil – järjekindlates kindlaksmääratud kokkulepetes, muutujate järjekindlas mõõtmises, järjekindlates kodeeritud struktuurides, füüsilistes atribuutides. andma järjepidev ja nii edasi.

Aastate jooksul on erinevate rakenduste disainerid teinud palju otsuseid selle kohta, kuidas rakendust arendada. Disainerite rakenduste stiil ja individualiseeritud disainiotsused ilmnevad sajal viisil: erinevustes kodeerimises, võtmestruktuuris, füüsilistes omadustes, identifitseerimiskonventsioonides jne. Paljude rakenduste kujundajate kollektiivne võime luua ebajärjekindlaid rakendusi on legendaarne. Joonisel 3 on toodud mõned kõige olulisemad erinevused rakenduste kavandamisel.

Kodeerimine: kodeerimine:

Rakenduste kujundajad on välja kodeerimise – soo – valinud mitmel viisil. Disainer esindab sugu tähtedega "m" ja "f". Teine disainer esindab sugu kui "1" ja "0". Teine disainer esindab sugu kui "x" ja "y". Teine disainer esindab sugu kui "meest" ja "naist". Pole vahet, kuidas seks DW-sse jõuab. "M" ja "F" on tõenäoliselt sama head kui mis tahes esitus.

Oluline on see, et olenemata allikast, kust seksiväli pärineb, jõuab see väli DW-sse järjepidevas integreeritud olekus. Järelikult, kui väli laaditakse DW-sse rakendusest, kus see on väljaspool vormingus “M” ja “F”, andma tuleb teisendada DW-vormingusse.

Atribuutide mõõtmine: Measurement of Atribuudid:

Rakenduste kujundajad on aastate jooksul valinud torujuhtme mõõtmise mitmel viisil. Disainer kauplustes i andma torujuhtme suurus sentimeetrites. Teine rakenduste kujundaja salvestab andma torujuhtmest tollides. Teine rakenduste kujundaja salvestab andma torujuhtmest miljonites kuupjalgades sekundis. Ja veel üks projekteerija salvestab torujuhtmeteavet jadade osas. Olenemata allikast, kui konveieriteave jõuab DW-sse, tuleb seda mõõta samal viisil.

Nagu on näidatud joonisel 3, mõjutavad integratsiooniprobleemid peaaegu kõiki projekti aspekte – projekti füüsilisi omadusi andma, dilemma omada rohkem kui ühte allikat andma, probleem ebajärjekindlate tuvastatud näidiste, vormingute kohta andma ebajärjekindel ja nii edasi.

Ükskõik, milline on disainiargument, on tulemus sama – st andma tuleb salvestada DW-sse ainulaadsel ja globaalselt vastuvõetaval viisil isegi siis, kui aluseks olevad operatsioonisüsteemid salvestavad i andma.

Kui DSS-i analüütik vaatab DW-d, peaks analüütik keskenduma andma mis on laos,

selle asemel, et mõelda selle usaldusväärsuse või järjepidevuse üle andma.

AJA VARIANTSUS

Kõik i andma DW-s on need teatud ajahetke täpsed. See põhiomadus andma DW-s on väga erinev andma leitud tegevuskeskkonnas. THE andma töökeskkonna andmed on sama täpsed kui juurdepääsu ajal. Teisisõnu, töökeskkonnas, kui seadmele ligi pääsetakse andma, eeldatakse, et see kajastab väärtusi nii täpselt kui juurdepääsu ajal. Miks mina andma DW-s on täpsed teatud ajahetkel (st mitte "praegu"), st andma DW-s on "aja dispersioon".
Ajaline dispersioon andma DW poolt on viidatud mitmel viisil.
Lihtsaim viis on see, et i andma DW-st andma üle pika aja – viis kuni kümme aastat. Tegevuskeskkonna jaoks kujutatud ajahorisont on tänastest hetkeväärtustest palju lühem kuni kuuekümne üheksakümne võrra
Rakendused, mis peavad hästi töötama ja olema tehingute töötlemiseks saadaval, peavad sisaldama minimaalset kogust andma kui need võimaldavad mingit paindlikkust. Seega on töörakendustel lühike ajahorisont, näiteks helirakenduste kujundamise teema.
Teine viis, kuidas aja dispersioon DW-s ilmub, on võtmestruktuuris. Iga DW võtmestruktuur sisaldab kaudselt või otseselt ajaelementi, nagu päev, nädal, kuu jne. Ajaelement on peaaegu alati DW-s leiduva ühendatud võtme allosas. Sellistel juhtudel eksisteerib ajaelement kaudselt, näiteks juhul, kui kuu või kvartali lõpus dubleeritakse terve fail.
Kolmas viis aja dispersiooni kuvamiseks on see, et i andma äsja õigesti registreeritud DW-st ei saa värskendada. THE andma DW-st on praktilistel eesmärkidel pikk hetktõmmiste seeria. Muidugi, kui hetktõmmis on tehtud valesti, saab pilte muuta. Kuid eeldades, et hetktõmmised on tehtud õigesti, ei muudeta neid kohe pärast nende tegemist. Mõnes

juhtudel võib DW-s olevate hetktõmmiste muutmine olla ebaeetiline või isegi kehtetu. THE andma töökorras, olles sama täpne kui juurdepääsu hetkel, saab vajaduse korral uuendada.

EI PÜÜV

DW neljas oluline omadus on see, et see ei ole lenduv.
Töökeskkonda värskendatakse, lisatakse, kustutatakse ja muudetakse regulaarselt, kirjete kaupa. Kuid põhiline manipuleerimine andma DW-s vajalik on palju lihtsam. DW-s esineb ainult kahte tüüpi toiminguid – alglaadimine andma ja juurdepääs andma. Puudub värskendus andma (uuendamise üldises tähenduses) DW-s tavalise töötlemistoiminguna. Sellel põhilisel erinevusel operatiivtöötluse ja DW-töötluse vahel on mõned väga võimsad tagajärjed. Disaini tasandil ei ole vajadus krahhi värskendamise suhtes DW-s oluline tegur, kuna andma seda ei teostata. See tähendab, et disaini füüsilisel tasandil saab juurdepääsu optimeerimiseks kasutada vabadusi andma, eriti normaliseerimise ja füüsilise denormaliseerimise teemade käsitlemisel. Teine DW toimimise lihtsuse tagajärg on DW keskkonna käitamiseks kasutatav tehnoloogia. Interneti-kirje kaupa värskenduste toetamine (nagu sageli operatiivtöötluse puhul) nõuab, et tehnoloogial oleks näilise lihtsuse all väga keeruline alus.
Tehnoloogia, mis toetab varundust ja taastamist, tehinguid ja andmete terviklikkust andma ummikseisu tuvastamine ja kõrvaldamine on DW töötlemiseks üsna keeruline ja ebavajalik. DW omadused, disaini orientatsioon, integreerimine andma DW-s, ajaline erinevus ja haldamise lihtsus andma, viib see kõik keskkonda, mis on klassikalisest töökeskkonnast väga-väga erinev. Peaaegu kõige allikas andma DW-st on töökeskkond. On ahvatlev arvata, et tegemist on tohutu koondamisega andma kahe keskkonna vahel.
Tõepoolest, paljude inimeste esimene mulje on suur koondamine andma tegevuskeskkonna ja keskkonna vahel

DW laiendus. Selline tõlgendus on pealiskaudne ja näitab arusaamatust DW-s toimuvast.
Tõepoolest, koondamine on minimaalne andma tegevuskeskkonna ja i vahel andma DW-st. Mõelge järgmisele: I andma need filtreeritakse andmeid et lülitate töökeskkonnast DW-keskkonda. Palju andma nad ei lähe kunagi väljapoole tegevuskeskkonda. Ainult et i andma mis on vajalikud DSS-i töötlemiseks, leiavad oma suuna keskkonnas

▪ ajahorisont andma see on keskkonnati väga erinev. THE andma tegevuskeskkonnas on nad väga värsked. THE andma DW-s on nad palju vanemad. Ajahorisondi perspektiivist vaadates on töökeskkonna ja DW vahel väga vähe kattumist.

▪ DW sisaldab andma kokkuvõte, mida pole kunagi keskkonnas

▪ ma andma läbivad põhimõttelise ümberkujundamise, kui nad üleminekul joonisele 3 näitab, et enamik neist andma on oluliselt muudetud eeldusel, et need valitakse ja teisaldatakse DW-sse. Teisisõnu, enamik andma see on füüsiliselt ja radikaalselt muutunud, kui see viiakse DW-sse. Integratsiooni seisukohalt pole need samad andma kes elab tegevuskeskkonnas. Arvestades neid tegureid, koondatakse andma Kahe keskkonna vahel on haruldane sündmus, mis toob kaasa alla 1% koondamise kahe keskkonna vahel. LAO STRUKTUUR DW-del on selge struktuur. DW-de piiritlemiseks on erinevad kokkuvõtte ja üksikasjalikkuse tasemed.
DW erinevad komponendid on:

Metaandmed
Andma praegused üksikasjad
Andma vanadest detailidest
Andma veidi kokku võetud
Andma väga kokku võetud

Peamine murekoht on i andma praegused üksikasjad. See on peamine mure, sest:

I andma Praegused üksikasjad kajastavad kõige värskemaid sündmusi, mis pakuvad alati suurt huvi ja
i andma praegused üksikasjaandmed on mahukad, kuna neid salvestatakse madalaimal detailsustasemel ja
i andma Praegused üksikasjad salvestatakse peaaegu alati kettamällu, millele on kiire juurdepääs, kuid mis on I-st kallis ja keeruline andma detailid on vanemad andma mis on salvestatud mõnele mällu mass. Sellele pääseb juurde juhuslikult ja seda salvestatakse üksikasjade tasemel, mis ühildub andma praegused üksikasjad. Kuigi selle suure mahu tõttu pole alternatiivsel andmekandjal salvestamine kohustuslik andma ühendatud sporaadilise juurdepääsuga andma, salvestusmeediumi jaoks andma vanemaid detaile tavaliselt kettale ei salvestata. THE andma kergelt kokku võttes need on andma mis on leitud madalast detailsusastmest destilleeritud praegusele detailsustasemele. See DW tase salvestatakse peaaegu alati kettamällu. Disainiprobleemid, mis esitavad end arhitektile andma selle DW taseme ehitamisel on:

Mis ajaühikus on ülaltoodud kokkuvõte
Mis sisu, atribuudid veidi kokkuvõtlikult sisu andma Järgmine tase andma DW-st leitud on see andma väga kokku võetud. THE andma kokkuvõtlikult on kompaktsed ja kergesti ligipääsetavad. THE andma väga kokkuvõtteid leidub mõnikord DW keskkonnas ja muudel juhtudel i andma väga abstraktsed on väljaspool DW-d hostiva tehnoloogia vahetuid seinu. (igal juhul, st andma väga kokkuvõtlikult on osa DW-st olenemata sellest, kus i andma on füüsiliselt majutatud). DW viimane komponent on metaandmete komponent. Paljudes aspektides on metaandmed teistsuguses dimensioonis kui teised andma DW-st, kuna metaandmed ei sisalda ühtegi andmeid otse töökeskkonnast võetud. Metaandmetel on DW-s eriline ja väga oluline roll. Metaandmeid kasutatakse järgmiselt:

kataloog, mis aitab DSS-i analüütikul DW sisu leida,
kaardistamise juhend andma sellest, kuidas ma andma on muudetud töökeskkonnast DW keskkonnaks,
i vahel kokkuvõtete tegemiseks kasutatavate algoritmide juhend andma praegused andmed ei andma veidi kokkuvõtlikult, st andma Kokkuvõtteks võib öelda, et metaandmed mängivad DW keskkonnas palju suuremat rolli kui kunagi varem operatsioonikeskkonnas VANA DETAILI SÄILUSTUSKESKMINE Sellise hoidmiseks saab kasutada magnetlinti andma. Tõepoolest, vanade andmekandjate salvestamisel tuleks kaaluda mitmesuguseid andmekandjaid andma detailidest. Sõltuvalt mahust andma, juurdepääsu sagedus, tööriistade maksumus ja juurdepääsu tüüp, on täiesti tõenäoline, et teised tööriistad vajavad DW vana üksikasjalikkust. ANDMEVOOG Seal on normaalne ja prognoositav vool andma DW sees.
I andma nad sisenevad DW-sse töökeskkonnast. (MÄRKUS: sellel reeglil on mõned väga huvitavad erandid. Kuid peaaegu kõik andma sisestage töökeskkonnast DW). Dato et mina andma nad sisenevad töökeskkonnast DW-sse, teisendatakse see ülalkirjeldatud viisil. Eeldusel, et sisestate DW, st andma sisestage praegune üksikasjalikkuse tase, nagu näidatud. See asub seal ja seda kasutatakse seni, kuni toimub üks kolmest sündmusest:

on puhastatud,
on kokku võetud ja/või ▪ on DW sees vananenud protsess liigub i andma praegused üksikasjad a andma detailid vanad, vastavalt vanusele andma. Protsess

kokkuvõte kasutab detaili andma arvutada andma veidi kokku võetud ja väga kokkuvõtlikud tasemed andma. Näidatud voost on mõned erandid (räägitakse hiljem). Kuid tavaliselt enamiku jaoks andma leitud DW-st, voost andma see on nagu kujutatud.

ANDMELAO KASUTAMINE

Pole üllatav, et erinevad tasemed andma DW sees ei saa nad erinevat kasutustaset. Üldjuhul, mida kõrgem on kokkuvõtte tase, seda rohkem i andma neid kasutatakse.
Paljud kasutusalad esinevad andma väga kokkuvõtlikult, samas kui vana andma detaile ei kasutata peaaegu kunagi. Organisatsiooni üleviimiseks ressursside kasutamise paradigmale on hea põhjus. Rohkem kokkuvõtvalt i andma, seda kiirem ja tõhusam on selleni jõudmine andma. Kui a pood leiab, et teeb palju DW detailitasemel töötlust, siis kulub vastavalt palju masinaressursse. Nii kõrgetasemelise kokkuvõtte võimalikult kiire töötlemine on igaühe huvides.

Paljude kaupluste jaoks on DSS-i analüütik DW-eelses keskkonnas kasutanud andma detailide tasemel. Paljuski saabumine kl andma üksikasjalik näeb välja nagu turvakate, isegi kui on saadaval muud kokkuvõttetasemed. aasta arhitekti üks tegevusi andma eesmärk on võõrutada DSS-i kasutaja pidevast kasutamisest andma madalaimal detailsusastmel. Arhitektil on kaks motivatsiooni andma:

tagasimaksesüsteemi paigaldamine, kus lõppkasutaja tasub tarbitud ressursside eest e
mis näitavad, et väga hea reaktsiooniaja võib saada, kui käitumine i-ga andma on kokkuvõtte kõrgel tasemel, samas kui kehv reageerimisaeg tuleneb selle käitumisest andma madalal tasemel MUUD KAALUTLUSED On veel mõned DW ehitus- ja halduskaalutlused.
Esimene kaalutlus on indeksite küsimus. THE andma kõrgemal kokkuvõtlikul tasemel saab neid vabalt indekseerida, samas kui i andma

madalamal detailsusastmel on need nii mahukad, et neid saab säästlikult indekseerida. Samast märgist, st andma kõrgel detailsustasemel saab suhteliselt lihtsalt ümber struktureerida, samas kui maht andma madalamatel tasanditel on see nii suur, et i andma neid ei saa lihtsalt taastada. Sellest tulenevalt on mudel andma ja disainiga tehtud formaalne töö paneb aluse DW-le, mida rakendatakse peaaegu eranditult praegusele üksikasjalikkuse tasemele. Teisisõnu, modelleerimistegevus andma need ei kehti peaaegu igal juhul kokkuvõtte tasemete kohta. Teine struktuurne kaalutlus on alajaotus andma autor DW.

Jaotamist saab teha kahel tasemel – tasemel dbms ja rakenduse tasemel. Jaotuses tasemel dbms, dbms on osakondadest informeeritud ja kontrollib neid vastavalt. Rakenduse tasemel jaotuse puhul on jaotustest teadlik ainult programmeerija ja vastutus nende haldamise eest on jäetud tema kanda

Taseme all dbms, tehakse suur osa tööst automaatselt. Jaoskondade isehaldamisega kaasneb palju paindumatust. Jaoskonnatasandi kohaldamise korral andma kohta andmekogus, langeb suur osa tööst programmeerija õlule, kuid lõpptulemuseks on paindlikkus programmi haldamisel andma sisse andmekogus

MUUD ANOMAALIAD

Kuigi komponendid andmekogus töötab peaaegu kõigi puhul kirjeldatud viisil andma, on mõned kasulikud erandid, mida tuleb arutada. Erandiks on see andma avalikud kokkuvõtted (avalikud kokkuvõtlikud andmed). Need on andma kokkuvõtted, mis on välja arvutatud andmekogus kuid ühiskond kasutab neid. THE andma avalikud kokkuvõtted salvestatakse ja hallatakse andmekogus, kuigi nagu eespool mainitud, on need välja mõeldud. Raamatupidajad töötavad selle nimel, et seda teha kord kvartalis andma nagu tulud, kvartalikulud, kvartalikasum jne. Raamatupidajate tehtud töö on väline andmekogus. Siiski, i andma kasutatakse ettevõttesiseselt – alates turundus, müük jne. Teine anomaalia, mida ei käsitleta, on see andma väline.

Veel üks silmapaistev tüüp andma mida võib leida a andmekogus on püsivate üksikasjade andmed. Need põhjustavad vajaduse püsivalt hoiustada andma üksikasjalikul tasemel eetilistel või juriidilistel põhjustel. Kui ettevõte puutub oma töötajad kokku ohtlike ainetega, on seda vaja andma üksikasjalik ja püsiv. Kui ettevõte toodab toodet, mis hõlmab avalikku turvalisust, näiteks lennuki osi, on selleks vajadus andma püsiandmed, samuti kui ettevõte sõlmib ohtlikke lepinguid.

Ettevõte ei saa endale lubada detailidest mööda vaadata, sest lähiaastatel kohtusse pöördumise, tagasikutsumise, vaidlustatud ehitusdefekti jms korral. ettevõtte riskipositsioon võib olla suur. Selle tulemusena on ainulaadne tüüp andma mida tuntakse püsivate detailandmetena.

KOKKUVÕTE

Un andmekogus see on objektorienteeritud, integreeritud, pingestatud variant, kogum andma muutumatu, et toetada administratsiooni otsustusvajadusi. Iga silmapaistvam funktsioon a andmekogus sellel on oma tagajärjed. Lisaks on neli taset andma kohta andmekogus:

Vanad detailid
Praegune detail
Andma veidi kokku võetud
Andma väga kokkuvõtlikud metaandmed on samuti oluline osa andmekogus. ABSTRAKTNE Säilitamise kontseptsioon andma sellele on viimasel ajal palju tähelepanu pööratud ja sellest on saanud 90ndate trend. Selle põhjuseks on andmekogus et ületada juhtimist toetavate süsteemide, nagu otsustustoetussüsteemid (DSS) ja juhtide infosüsteemid (EIS) piirangud. Kuigi kontseptsiooni andmekogus tundub paljulubav, rakenda i andmekogus võib olla problemaatiline suuremahuliste laoprotsesside tõttu. Vaatamata laoprojektide keerukusele andma, paljud tarnijad ja konsultandid, kes laos andma väidavad, et ladustamine andma ei tekita probleemi. Selle uurimisprojekti alguses polnud aga peaaegu ühtegi sõltumatut, ranget ja süstemaatilist uurimistööd tehtud. Järelikult on raske öelda, mis tööstuses tegelikult toimub, kui neid ehitatakse andmekogus. Selles uuringus uuriti laopraktikat andma kaasaegsed, mille eesmärk on arendada rikkamat arusaama Austraalia praktikast. Kirjanduse ülevaade andis empiirilise uuringu konteksti ja aluse. Sellel uuringul on mitmeid tulemusi. Esiteks paljastas see uuring selle väljatöötamise ajal toimunud tegevused andmekogus. Paljudes valdkondades, st andma kogutud kinnitasid kirjanduses kirjeldatud praktikat. Teiseks probleemid ja probleemid, mis võivad selle arengut mõjutada andmekogus tuvastati selle uuringuga. Lõpuks kasu, mida Austraalia organisatsioonid on saanud seoses kasutamisega andmekogus on selgunud.

Peatükk 1

Otsingu kontekst

Andmehoidla kontseptsioon sai laialdaselt avalikuks ja sai 90. aastatel esilekerkivaks trendiks (McFadden 1996, TDWI 1996, Shah ja Milstein 1997, Shanks jt 1997, Eckerson 1998, Adelman ja Oates 2000). Seda võib näha andmehoidlust käsitlevate artiklite arvu kasvust kaubandusväljaannetes (Little ja Gibson 1999). Palju artikleid (vt nt Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett ja King 1996, Graham jt 1996, Sakaguchi ja Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, McCarell 1997. Edwards 1997, TDWI 1998) on teatanud olulistest eelistest organisatsioonidele, kes rakendavad andmekogus. Nad toetasid oma teooriat anekdootlike tõenditega edukate rakenduste, kõrge investeeringutasuvuse (ROI) näitajatega ning pakkudes suuniseid või metoodikaid arendamiseks. andmekogus

(Shanks et al. 1997, Seddon ja Benjamin 1998, Little ja Gibson 1999). Äärmuslikul juhul Graham et al. (1996) teatasid kolmeaastase investeeringu keskmiseks tootluseks 401%.

Suur osa praegusest kirjandusest on aga jätnud tähelepanuta selliste projektide elluviimise keerukuse. aasta projektid andmekogus need on tavaliselt keerulised ja suuremahulised ning seetõttu on neil suur ebaõnnestumise tõenäosus, kui neid hoolikalt ei kontrollita (Shah ja Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs ja Clymer 1998, Rao 1998). Nende ehitamiseks kulub tohutul hulgal inim- ja rahalisi ressursse, aega ja vaeva (Hill 1998, Crofts 1998). Tavaliselt kulub aega ja rahalisi vahendeid vastavalt umbes kaks aastat ja kaks kuni kolm miljonit dollarit (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Seda aega ja rahalisi vahendeid on vaja andmehoidla paljude erinevate aspektide kontrollimiseks ja konsolideerimiseks (Cafasso 1995, Hill 1998). Lisaks riist- ja tarkvaraalastele kaalutlustele on ka muid funktsioone, mis erinevad kaevandamisest andma laadimisprotsessidele andma, mälumaht värskenduste ja meta haldamiseks andma kasutajate koolitamiseks, tuleb kaaluda.

Selle uurimisprojekti alguse ajal viidi andmehoidla valdkonnas läbi väga vähe akadeemilisi uuringuid, eriti Austraalias. See ilmnes ajakirjade või muude tolleaegsete akadeemiliste kirjutiste andmehoidlust käsitlevate artiklite vähesusest. Paljud olemasolevad akadeemilised kirjutised kirjeldasid USA kogemust. Akadeemiliste uuringute puudumine andmehoidla valdkonnas on põhjustanud nõudmise põhjalike uuringute ja empiiriliste uuringute järele (McFadden 1996, Shanks et al. 1997, Little ja Gibson 1999). Eelkõige uurimisuuringud rakendusprotsessi kohta andmekogus tuleb teha üldiste teadmiste laiendamiseks rakendamise kohta andmekogus ja see on tulevase uurimistöö aluseks (Shanks et al. 1997, Little ja Gibson 1999).

Selle uuringu eesmärk on seega uurida, mis tegelikult juhtub, kui organisatsioonid rakendavad ja kasutavad i andmekogus Austraalias. Täpsemalt hõlmab see uuring kogu a andmekogus, alustades algatamisest ja kujundamisest kuni disaini ja juurutamise ning hilisema kasutamiseni Austraalia organisatsioonides. Lisaks aitab uuring kaasa ka praegusele praktikale, selgitades välja valdkonnad, kus praktikat saab veelgi parandada ning ebatõhusust ja riske minimeerida või vältida. Lisaks on see aluseks muudele uuringutele andmekogus Austraalias ja täidab kirjanduses praegu esineva tühimiku.

Uurimisküsimused

Käesoleva uurimistöö eesmärgiks on uurida elluviimisega seotud tegevusi andmekogus ja nende kasutamine Austraalia organisatsioonide poolt. Eelkõige uuritakse elemente, mis puudutavad projekti planeerimist, arendust, käitamist, kasutamist ja sellega seotud riske. Seega on selle uuringu küsimus järgmine:

"Kuidas on praegune praktika andmekogus Austraalias?"

Sellele küsimusele tõhusaks vastamiseks on vaja mitmeid täiendavaid uurimisküsimusi. Eelkõige on selle uurimisprojekti juhtimiseks 2. peatükis esitatud kirjandusest välja toodud kolm alamküsimust: Kuidas läheb andmekogus Austraalia organisatsioonide poolt? Millised on tekkinud probleemid?

Millised on kogetud eelised?
Nendele küsimustele vastamisel kasutati uurimuslikku uuringukava, milles kasutati küsitlust. Uurimusliku uuringuna ei ole vastused ülaltoodud küsimustele täielikud (Shanks et al. 1993, Denscombe 1998). Sel juhul on nendele küsimustele vastuste parandamiseks vaja mõningast triangulatsiooni. Siiski loob uurimine tugeva aluse edaspidiseks tööks nende küsimuste uurimisel. Üksikasjalik arutelu uurimismeetodi põhjendatuse ja ülesehituse üle on toodud 3. peatükis.

Uurimisprojekti struktuur

See uurimisprojekt on jagatud kaheks osaks: andmehoidla kontseptsiooni kontekstuaalne uurimine ja empiiriline uurimus (vt joonis 1.1), millest kumbagi käsitletakse allpool.

I osa: Kontekstuaalne uuring

Uurimistöö esimene osa koosnes praeguse kirjanduse ülevaatest erinevat tüüpi andmehoidlate kohta, sealhulgas otsuste tugisüsteemid (DSS), juhtide infosüsteemid (EIS), juhtumiuuringud. andmekogus ja mõisted andmekogus. Samuti foorumite tulemused kohta andmekogus ning Monash DSS-i uurimisrühma juhitud ekspertide ja praktikute kohtumisrühmad aitasid kaasa sellesse uuringufaasi, mille eesmärk oli saada ülevaade andmekogus ja teha kindlaks nende vastuvõtmisega kaasnevad riskid. Selle kontekstuaalse uurimise perioodi jooksul loodi probleemivaldkonna mõistmine, et luua teadmistebaasi järgnevateks empiirilisteks uuringuteks. See oli aga uurimistöö läbiviimise ajal pidev protsess.

II osa: Empiiriline uurimus

Suhteliselt uus andmehoidla kontseptsioon, eriti Austraalias, on tekitanud vajaduse uuringu järele, et saada laiaulatuslik pilt kasutuskogemusest. See osa viidi läbi pärast seda, kui probleemvaldkond oli ulatusliku kirjanduse ülevaate abil kindlaks tehtud. Kontekstuaalse uuringu faasis kujunenud andmehoidla kontseptsiooni kasutati selle uuringu esialgse küsimustiku sisendina. Pärast seda vaadati küsimustik üle. Kas olete asjatundja andmekogus osales testis. Esialgse küsimustiku testimise eesmärk oli kontrollida küsimuste täielikkust ja õigsust. Testitulemuste põhjal ankeeti muudeti ja muudetud versioon saadeti uuringus osalejatele posti teel. Seejärel analüüsiti tagastatud küsimustikke i andma tabelites, diagrammides ja muudes vormingutes. THE

analüüsi tulemused andma moodustavad ülevaate Austraalia andmehoidla praktikast.

ANDMELAOD ÜLEVAADE

Andmehoidla mõiste on arenenud koos arvutitehnoloogia täiustumisega.
Selle eesmärk on ületada probleemid, millega puutuvad kokku rakenduste tugirühmad, nagu otsuste tugisüsteem (DSS) ja juhiteabesüsteem (EIS).

Varem on nende rakenduste suurim takistus olnud nende rakenduste suutmatus pakkuda a andmebaasi analüüsiks vajalik.
Seda põhjustab peamiselt juhtkonna töö iseloom. Ettevõtte juhtkonna huvid varieeruvad pidevalt olenevalt käsitletavast valdkonnast. Seetõttu i andma nende rakenduste põhialused peavad saama kiiresti muutuda sõltuvalt töödeldavast osast.
See tähendab, et i andma peavad olema nõutavate analüüside jaoks sobival kujul kättesaadavad. Tegelikult oli rakenduste tugirühmadel minevikus väga raske koguda ja integreerida andma keerulistest ja mitmekesistest allikatest.

Selle jaotise ülejäänud osas antakse ülevaade andmehoidla mõistest ja arutatakse, kuidas andmekogus suudab ületada rakenduste tugirühmade probleeme.
Mõiste “Andmeladupopulariseeris William Inmon 1990. aastal. Tema sageli tsiteeritud definitsioon näeb Andmeladu kogumikuna andma õppeainele orienteeritud, integreeritud, muutumatu ja ajas muutuv, juhtimisotsuste toetamiseks.

Seda määratlust kasutades juhib Inmon tähelepanu sellele, et i andma elukoht a andmekogus peab olema 4 järgmist omadust:

▪ Õppeainele orienteeritud
▪ Integreeritud
▪ Mittelenduv
▪ Aja jooksul muutuv Ainekeskse Inmon tähendab, et i andma sisse andmekogus suurimates organisatsioonilistes valdkondades, mis on olnud

mudelis määratletud andma. Näiteks kõik andma i kohta kliendid sisalduvad ainevaldkonnas KLIENDID. Samamoodi kõik andma toodetega seotud teave sisaldub teemavaldkonnas TOOTED.

Integreeritud Inmon tähendab, et i andma erinevatest platvormidest, süsteemidest ja asukohtadest on kombineeritud ja salvestatud ühte kohta. Järelikult andma sarnased tuleb muundada ühtseteks vorminguteks, et neid oleks lihtne lisada ja võrrelda.
Näiteks mees- ja naissugu on ühes süsteemis tähistatud tähtedega M ja F ning teises süsteemis 1 ja 0. Nende õigeks integreerimiseks tuleb üks või mõlemad vormingud teisendada nii, et need kaks vormingut oleksid võrdsed. Sel juhul saame muuta M väärtuseks 1 ja F väärtuseks 0 või vastupidi. Õppeainele orienteeritud ja integreeritud näitavad, et andmekogus on loodud pakkuma funktsionaalset ja transversaalset nägemust andma ettevõtte poolt.

Mittelenduva all mõtleb ta seda, et i andma sisse andmekogus olema järjepidev ja ajakohastatud andma see pole vajalik. Selle asemel, mis tahes muudatused andma originaalid on lisatud andmebaas kohta andmekogus. See tähendab, et ajaloolane andma sisaldub andmekogus.

Ajaga muutujate puhul näitab Inmon, et i andma sisse andmekogus sisaldavad alati temponäitajaid ei andma nad ületavad tavaliselt teatud ajahorisondi. Näiteks a
andmekogus võib sisaldada 5 aastat ajaloolisi väärtusi kliendid 1993–1997. Ajaloolise ja aegrea kättesaadavus andma võimaldab analüüsida trende.

Un andmekogus ta saab ise koguda andma OLTP-süsteemidest; päritolust andma organisatsiooniväliselt ja/või muudest spetsiaalsetest püünisjahisüsteemide projektidest andma.
I andma ekstraktid võivad läbida puhastusprotsessi, antud juhul i andma enne sellesse salvestamist muudetakse ja integreeritakse andmebaas kohta andmekogus. Siis ma andma

kes elab andmebaas kohta andmekogus tehakse kättesaadavaks lõppkasutajate sisselogimistele ja taastamistööriistadele. Neid tööriistu kasutades pääseb lõppkasutaja juurde organisatsiooni organisatsiooni integreeritud vaatele andma.

I andma kes elab andmebaas kohta andmekogus neid salvestatakse nii üksikasjalikus kui kokkuvõtlikus vormingus.
Kokkuvõtte tase võib sõltuda selle olemusest andma. Ma andma üksikasjalikud võivad koosneda andma praegune ja andma ajaloolased
I andma päris ei kuulu andmekogus kuni i andma sisse andmekogus uuendatakse uuesti.
Lisaks säilitamisele andma ise, a andmekogus see võib salvestada ka erinevat tüüpi andmeid nimega METAANDMED, mis kirjeldavad i andma elab tema juures andmebaas.
Metaandmeid on kahte tüüpi: arendusmetaandmed ja analüüsi metaandmed.
Arendusmetaandmeid kasutatakse ekstraktimise, puhastamise, kaardistamise ja üleslaadimise protsesside haldamiseks ja automatiseerimiseks andma sisse andmekogus.
Arendusmetaandmetes sisalduv teave võib sisaldada üksikasju operatsioonisüsteemide kohta, ekstraheeritavate elementide üksikasju, mudelit andma kohta andmekogus ja ärireeglid andmete teisendamiseks andma.

Teist tüüpi metaandmed, mida nimetatakse analüütilisteks metaandmeteks, võimaldavad lõppkasutajal uurida veebilehe sisu. andmekogus leida i andma kättesaadavad ja nende tähendus selgetes, mittetehnilistes mõistetes.

Seega toimivad analüütika metaandmed sillana nende vahel andmekogus ja lõppkasutaja rakendused. Need metaandmed võivad sisaldada ärimudelit ja kirjeldusi andma ärimudelile vastav, eelnevalt määratletud päringud ja aruanded, teave kasutajate juurdepääsuks ja indeks.

Analüüsi ja arenduse metaandmed tuleb korralikult toimimiseks ühendada üheks integreeritud isolatsiooni metaandmeteks.

Kahjuks on paljudel olemasolevatel tööriistadel oma metaandmed ja praegu puuduvad vastavad standardid

lubada andmehoidla tööriistadel need metaandmed integreerida. Selle olukorra parandamiseks moodustasid paljud juhtivate andmeladutööriistade müüjad Meta Data Councili, millest hiljem sai Meta Data Coalition.

Selle koalitsiooni eesmärk on luua standardne metaandmete kogum, mis võimaldab erinevatel andmehoidla tööriistadel metaandmeid teisendada
Nende jõupingutuste tulemusel sündis metaandmete vahetamise spetsifikatsioon (MDIS), mis võimaldab vahetada teavet Microsofti arhiivide ja seotud MDIS-failide vahel.

Olemasolu andma nii kokkuvõtlikult/indekseeritud kui ka üksikasjalikult, see annab kasutajale võimaluse teha PUURIMINE (puurimine) alates andma indekseeritud üksikasjalikele ja vastupidi. Olemasolu andma detailne ajalugu võimaldab luua aja jooksul trendianalüüse. Lisaks saab analüüsi metaandmeid kasutada del-kataloogina andmebaas kohta andmekogus et aidata lõppkasutajatel i asukohta leida andma vajalik.

Võrreldes OLTP-süsteemidega, nende võimega toetada analüüsi andma ja aruandlus, andmekogus seda peetakse sobivamaks süsteemiks teabeprotsesside jaoks, nagu päringute tegemine ja neile vastamine ning aruannete koostamine. Järgmises jaotises tuuakse üksikasjalikult välja kahe süsteemi erinevused.

ANDMELADU OLTP-SÜSTEEMIDE VASTU

Paljud organisatsioonisisesed infosüsteemid on mõeldud igapäevaste toimingute toetamiseks. Need süsteemid, mida tuntakse OLTP-SÜSTEEMIDE nime all, salvestavad igapäevaseid tehinguid, mida pidevalt uuendatakse.

I andma nendes süsteemides neid sageli muudetakse, lisatakse või kustutatakse. Näiteks muutub kliendi aadress, kui ta liigub ühest kohast teise. Sel juhul registreeritakse uus aadress aadressivälja muutmisega andmebaas. Nende süsteemide peamine eesmärk on vähendada tehingukulusid ja samal ajal lühendada töötlemisaega. OLTP-süsteemide näited hõlmavad kriitilisi toiminguid, nagu tellimuste päevik, palgaarvestus, arved, tootmine, klienditeenindus kliendid.

Erinevalt OLTP-süsteemidest, mis loodi tehingu- ja sündmusepõhiste protsesside jaoks, st andmekogus loodi analüüsipõhiste protsesside toe pakkumiseks andma ja otsustusprotsesside kohta.

Tavaliselt saavutatakse see i andma erinevatest OLTP-dest ja välistest süsteemidest ühes "konteineris". andma, nagu arutati eelmises jaotises.

Monashi andmeladustamisprotsessi mudel

Protsessi mudel andmekogus Monashi töötasid välja Monash DSS-i uurimisrühma teadlased ja see põhineb kirjandusel andmekogus, kogemus arendustugisüsteemide valdkondades, arutelud rakenduste tarnijatega kasutamiseks andmekogus, kasutamise ekspertide rühma kohta andmekogus.

Faasid on: algatamine, planeerimine, arendus, toimingud ja selgitamine. Diagramm selgitab a arendamise iteratiivset või evolutsioonilist olemust andmekogus protsessi kasutades kahesuunalisi nooli, mis asetatakse erinevate faaside vahele. Selles kontekstis tähendavad "iteratiivne" ja "evolutsiooniline" seda, et protsessi igas etapis võivad rakendustegevused alati liikuda tagasi eelmisesse etappi. See on tingitud projekti olemusest andmekogus kus lõppkasutaja esitab igal ajal lisapäringuid. Näiteks protsessi arendusfaasis andmekogusKui lõppkasutaja soovib uut aine suurust või ala, mis ei kuulunud esialgsesse plaani, tuleb see süsteemi lisada. See toob kaasa muutuse projektis. Tulemuseks on see, et projekteerimismeeskond peab projekteerimisfaasis muutma seni loodud dokumentide nõudeid. Paljudel juhtudel peab projekti hetkeseis jõudma tagasi projekteerimisfaasi, kus uus nõue tuleb lisada ja dokumenteerida. Lõppkasutaja peab nägema konkreetset läbivaadatud dokumentatsiooni ja arendusfaasis tehtud muudatusi. Selle arendustsükli lõpus peab projekt saama head tagasisidet nii arendus- kui ka kasutajameeskondadelt. Seejärel kasutatakse tagasisidet tulevase projekti täiustamiseks.

Võimekuse planeerimine
dw kipuvad olema väga suured ja kasvavad väga kiiresti (Best 1995, Rudin 1997a) tulenevalt andma ajaloolised, mida nad säilitavad oma kestusest. Kasvu võib põhjustada ka andma lisandmoodulid, mida kasutajad väärtuse suurendamiseks taotlevad andma mis neil juba on. Järelikult säilitamisnõuded andma võib oluliselt suurendada (Eckerson 1997). Seega on võimsuse planeerimise kaudu hädavajalik tagada, et ehitatav süsteem saaks kasvada vastavalt vajadustele (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Dw skaleeritavuse planeerimisel peab teadma lao suuruse eeldatavat kasvu, tõenäoliselt esitatavate küsimuste tüüpe ja toetatavate lõppkasutajate arvu (Best 1995, Rudin 1997b, Foley 1997a). Skaleeritavate rakenduste loomine nõuab skaleeritavate serveritehnoloogiate ja skaleeritavate rakenduste kujundamise tehnikate kombinatsiooni (Best 1995, Rudin 1997b. Mõlemad on väga skaleeritavate rakenduste loomiseks vajalikud. Skaleeritavad serveritehnoloogiad võivad muuta salvestusruumi, mälu ja protsessori lisamise lihtsaks ja kulutõhusaks alandav esitus (Lang 1997, Telephony 1997).

On kaks peamist skaleeritavat serveritehnoloogiat: sümmeetriline mitmetöötlus (SMP) ja massiliselt paralleelne töötlemine (MPP)) (IDC 1997, Humphries et al. 1999). SMP-serveril on tavaliselt mitu protsessorit, mis jagavad mälu, süsteemisiine ja muid ressursse (IDC 1997, Humphries et al. 1999). Selle suurendamiseks saab lisada täiendavaid protsessoreid võimsus arvutuslik. Teine meetod suurendada võimsus SMP-serveri arvutamine on paljude SMP-seadmete ühendamine. Seda tehnikat tuntakse klastritena (Humphries et al. 1999). MPP-serveril on seevastu mitu protsessorit, millest igaühel on oma mälu, siinisüsteem ja muud ressursid (IDC 1997, Humphries et al. 1999). Iga protsessorit nimetatakse sõlmeks. Kasv võimsus arvutuslikud on võimalik saada

täiendavate sõlmede lisamine MPP-serveritele (Humphries et al. 1999).

SMP-serverite nõrkus seisneb selles, et liiga palju sisend-väljund (I/O) toiminguid võib siinisüsteemi üle koormata (IDC 1997). Seda probleemi MPP-serverites ei esine, kuna igal protsessoril on oma siinisüsteem. Kuid iga sõlme vahelised ühendused on üldiselt palju aeglasemad kui SMP siinisüsteem. Lisaks võivad MPP-serverid lisada rakenduste arendajatele täiendavat keerukust (IDC 1997). Seega võivad valikut SMP- ja MPP-serverite vahel mõjutada paljud tegurid, sealhulgas rakenduste keerukus, hinna ja jõudluse suhe, vajalik läbilaskevõime, takistatud dw-rakendused ja serveri suuruse suurenemine. andmebaas dw-st ja lõppkasutajate arvust.

Võimsuse planeerimisel saab kasutada mitmeid skaleeritavaid rakenduste kujundamise tehnikaid. Üks kasutab erinevaid aruandlusperioode, nagu päevad, nädalad, kuud ja aastad. Erinevate teatamistähtaegadega andmebaas saab jagada juhitavalt rühmitatud tükkideks (Inmon et al. 1997). Teine meetod on kasutada kokkuvõtvaid tabeleid, mis koostatakse kokkuvõtete tegemise teel andma da andma üksikasjalik. Seega, i andma kokkuvõtted on kompaktsemad kui üksikasjalikud, mis nõuab vähem mäluruumi. Seega andma üksikasju saab arhiveerida odavamasse salvestusruumi, mis säästab veelgi rohkem salvestusruumi. Kuigi kokkuvõtvate tabelite kasutamine võib säästa salvestusruumi, nõuab palju pingutusi, et hoida neid ajakohasena ja ärivajadustega kooskõlas. Seda tehnikat kasutatakse aga laialdaselt ja sageli koos eelmise tehnikaga (Best 1995, Inmon 1996a, Chauduri ja Dayal
1997).

Defineerimine Andmeladu Tehnilised arhitektuurid Dw-arhitektuuri tehnikate määratlus

Andmehoidla varased kasutuselevõtjad nägid peamiselt ette tsentraliseeritud andmelao juurutamist, kus kõik andma, sealhulgas i andma välised, integreeriti ühtseks,
füüsiline hoidla (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Selle lähenemisviisi peamine eelis on see, et lõppkasutajatel on juurdepääs kogu ettevõtte vaatele andma organisatsiooniline (Ovum 1998). Teine pluss on see, et see pakub standardimist andma kogu organisatsioonis, mis tähendab, et iga hoidla metaandmetes kasutatava terminoloogia jaoks on ainult üks versioon või definitsioon (Flanagan ja Safdie 1997, Ovum 1998). Selle lähenemisviisi miinuseks on seevastu kallis ja keeruline konstrueerida (Flanagan ja Safdie 1997, Ovum 1998, Inmon et al. 1998). Mitte kaua pärast salvestusarhitektuuri andma tsentraliseeritud sai populaarseks, arenes kontseptsioon jumalate väikseimate alamhulkade kaevandamisest andma konkreetsete rakenduste vajaduste toetamiseks (Varney 1996, IDC 1997, Berson ja Smith 1997, peacock 1998). Need väikesed süsteemid on tuletatud suuremast andmekogus tsentraliseeritud. Neid nimetatakse andmekogus töötaja osakonna või töötajate andmemartsid. Sõltuv andmemart-arhitektuur on tuntud kui kolmetasandiline arhitektuur, kus esimene tasand koosneb andmekogus tsentraliseeritud, teine koosneb hoiustest andma osakond ja kolmas koosneb juurdepääsust andma ja analüüsivahenditega (Demarest 1994, Inmon et al. 1997).

Andmemargid ehitatakse tavaliselt pärast seda andmekogus tsentraliseeritud ehitati konkreetsete üksuste vajaduste rahuldamiseks (White 1995, Varney 1996).
Data Marts Store i andma konkreetsete üksuste jaoks (Inmon et al. 1997, Inmon jt 1998, IA 1998).

Selle meetodi eeliseks on see, et seda ei teki andmeid ei ole integreeritud ja et i andma on andmeturgudel vähem üleliigne, kuna kõik andma pärit deposiit andma integreeritud. Teine eelis on see, et iga andmemargi ja selle allikate vahel on vähem linke andma sest igal andmeturul on ainult üks allikas andma. Peale selle pääsevad lõppkasutajad sellele arhitektuurile endiselt juurde andma

korporatiivsed organisatsioonid. Seda meetodit tuntakse ülalt-alla meetodina, kus andmemargid ehitatakse pärast seda andmekogus (paabulind 1998, Goff 1998).
Suurendades vajadust tulemuste varajase näitamise järele, on mõned organisatsioonid hakanud looma sõltumatuid andmeturte (Flanagan ja Safdie 1997, White 2000). Sel juhul saavad andmekeskused oma andma otse põhitõdedest andma OLTP ja mitte-OLTP tsentraliseeritud ja integreeritud hoidlast, välistades seega vajaduse keskse hoidla järele.

Iga andmemart nõuab vähemalt ühte linki selle allikatele andma. Iga andmekeskusega mitme lingi üks puudus on see, et võrreldes kahe eelmise arhitektuuriga on andma suureneb oluliselt.

Iga andmekeskus peab salvestama kõik andma kohalikul tasandil, et see OLTP-süsteeme ei mõjutaks. See põhjustab i andma neid hoitakse erinevates andmekeskustes (Inmon et al. 1997). Selle arhitektuuri teine puudus on see, et see viib keerukate ühenduste loomiseni andmeturgude ja nende andmeallikate vahel. andma mida on raske rakendada ja kontrollida (Inmon et al. 1997).

Teine puudus on see, et lõppkasutajad ei pruugi pääseda ligi ettevõtte teabe ülevaatele, kuna i andma erinevatest andmemartidest ei ole integreeritud (Ovum 1998).
Veel üks puudus on see, et iga andmeturgudel kasutatava terminoloogia jaoks võib olla rohkem kui üks määratlus, mis tekitab andmete ebakõlasid. andma organisatsioonis (Ovum 1998).
Vaatamata ülalpool käsitletud puudustele, äratavad eraldiseisvad andmeturud endiselt paljude organisatsioonide huvi (IDC 1997). Üks tegur, mis muudab nad atraktiivseks, on see, et nad arenevad kiiremini ning nõuavad vähem aega ja ressursse (Bresnahan 1996, Berson ja Smith 1997, Ovum 1998). Järelikult toimivad need peamiselt testide kavanditena, mida saab kasutada disaini eeliste ja/või puuduste kiireks tuvastamiseks (Parsaye 1995, Braly 1995, Newing 1996). Sel juhul peab pilootprojektis rakendatav osa olema väike, kuid organisatsiooni jaoks oluline (Newing 1996, Mansell-Lewis 1996).

Prototüüpi uurides saavad lõppkasutajad ja juhtkond otsustada, kas projekti jätkata või peatada (Flanagan ja Safdie 1997).
Kui otsustatakse jätkata, tuleks teiste tööstusharude andmemargid ehitada ükshaaval. Lõppkasutajatel on kaks võimalust, mis põhinevad nende vajadustel sõltumatute andmemaatrite koostamisel: integreeritud/liit ja integreerimata (Ovum 1998)

Esimese meetodi puhul tuleks iga uus andmemart üles ehitada praeguste andmemartide ja mudelite põhjal andma mida ettevõte kasutab (Varney 1996, Berson ja Smith 1997, Peacock 1998). Mudeli kasutamise vajadus andma Ettevõtte mõiste tähendab, et tuleb tagada, et igale andmekeskustes kasutatavale terminile on ainult üks definitsioon, samuti tuleb tagada, et erinevaid andmemarte saaks ühendada, et anda ülevaade ettevõtte teabest (Bresnahan 1996). Seda meetodit nimetatakse alt-üles meetodiks ja seda on kõige parem kasutada siis, kui rahalised vahendid ja aeg on piiratud (Flanagan ja Safdie 1997, Ovum 1998, peacock 1998, Goff 1998). Teise meetodi puhul suudavad ehitatud andmekeskused rahuldada ainult konkreetse üksuse vajadusi. Ühendatud andmemargi variant on andmekogus levitatud, milles andmebaas Hub serveri vahevara kasutatakse paljude andmeturgude liitmiseks ühte hoidlasse andma levitatud (Valge 1995). Sel juhul i andma äritegevust levitatakse mitmes andmekeskuses. Lõppkasutajate taotlused edastatakse aadressile andmebaas hub serveri vahevara, mis ekstraktib kõik andma taotlevad andmeturud ja edastavad tulemused lõppkasutaja rakendustele. See meetod pakub lõppkasutajatele äriteavet. Sõltumatute andmeturgude probleemid pole aga endiselt kõrvaldatud. Kasutada saab ka teist arhitektuuri, mida nimetatakse andmekogus virtuaalne (White 1995). Kuid see arhitektuur, mida on kujutatud joonisel 2.9, ei ole andmesalvestusarhitektuur andma tõeline, kuna see ei liiguta koormust OLTP-süsteemidelt andmekogus (Demarest 1994).

Tegelikult taotlused andma lõppkasutajad edastavad need OLTP-süsteemidele, mis tagastavad tulemused pärast kasutaja päringute töötlemist. Kuigi see arhitektuur võimaldab lõppkasutajatel koostada aruandeid ja esitada päringuid, ei saa see pakkuda i

andma ajalugu ja ülevaade ettevõtte teabest alates i andma kuna erinevad OLTP-süsteemid pole integreeritud. Seetõttu ei saa see arhitektuur analüüsile rahuldada andma nagu ennustused.

Juurdepääsu- ja andmete taastamise rakenduste valik andma

Ehitamise eesmärk a andmekogus on edastada teavet lõppkasutajatele (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks jt 1997, Hammergren 1998); üks või mitu juurdepääsu- ja taasterakendust andma tuleb pakkuda. Praeguseks on kasutajal võimalik valida paljude selliste rakenduste vahel (Hammergren 1998, Humphries et al. 1999). Valitud rakendused määravad laotöö edukuse andma organisatsioonis, sest rakendused on kõige nähtavam osa andmekogus lõppkasutajale (Inmon et al. 1997, Poe 1996). Et olla edukas a andmekogus, peab suutma toetada andmeanalüüsi tegevusi andma lõppkasutaja kohta (Poe 1996, Seddon ja Benjamin 1998, Eckerson 1999). Seega tuleb kindlaks teha lõppkasutaja soovide "tase" (Poe 1996, Mattison 1996, Inmon jt 1997, Humphries et al. 1999).

Üldiselt võib lõppkasutajad rühmitada kolme kategooriasse: juhtivad kasutajad, ärianalüütikud ja energiakasutajad (Poe 1996, Humphries et al. 1999). Juhtkasutajad vajavad lihtsat juurdepääsu eelnevalt määratletud aruannete kogumitele (Humphries et al. 1999). Nendele aruannetele pääseb hõlpsasti juurde menüüs navigeerimisega (Poe 1996). Lisaks peaksid aruanded teabe kiireks edastamiseks esitama teabe graafilise esituse, näiteks tabelite ja mallide abil (Humphries et al. 1999). Ärianalüütikud, kellel ei pruugi olla tehnilisi võimalusi aruannete iseseisvaks väljatöötamiseks nullist, peavad olema suutelised muutma praeguseid aruandeid oma spetsiifiliste vajaduste rahuldamiseks (Poe 1996, Humphries et al. 1999). Võimsad kasutajad on seevastu seda tüüpi lõppkasutajad, kellel on võimalus päringuid ja aruandeid nullist genereerida ja kirjutada (Poe 1996, Humphries et al. 1999). Nemad on need, kes

nad loovad suhteid teist tüüpi kasutajate jaoks (Poe 1996, Humphries et al. 1999).

Kui lõppkasutaja nõuded on kindlaks määratud, tuleb valida juurdepääsu- ja taasterakendused andma kõigi olemasolevate hulgas (Poe 1996, Inmon et al. 1997).
Juurdepääsu andma ja otsingutööriistad saab liigitada 4 tüüpi: OLAP-tööriist, EIS/DSS-tööriist, päringu- ja aruandlustööriist ning andmekaevandamise tööriist.

OLAP-i tööriistad võimaldavad kasutajatel luua nii ad hoc päringuid kui ka sellel tehtud päringuid andmebaas kohta andmekogus. Lisaks võimaldavad need tooted kasutajatel põhjalikumalt uurida andma üldisest detailseni.

EIS-i/DSS-i tööriistad pakuvad juhtimisaruandlust, näiteks "mis siis, kui" analüüsi ja juurdepääsu menüüpõhistele aruannetele. Aruanded peaksid olema eelnevalt määratletud ja menüüdega ühendatud, et navigeerida oleks lihtsam.
Päringu- ja aruandlustööriistad võimaldavad kasutajatel koostada eelnevalt määratletud ja spetsiifilisi aruandeid.

Andmekaevandamise tööriistu kasutatakse suhete tuvastamiseks, mis võivad unustatud toimingutele uut valgust heita andma andmelaost.

Lisaks igat tüüpi kasutajate nõuete optimeerimisele peavad valitud tööriistad olema intuitiivsed, tõhusad ja hõlpsasti kasutatavad. Samuti peavad need ühilduma teiste arhitektuuri osadega ja suutma töötada olemasolevate süsteemidega. Samuti on soovitatav valida mõistliku hinna ja jõudlusega andmetele juurdepääsu ja otsingu tööriistad. Muud kriteeriumid, mida tuleb arvesse võtta, hõlmavad tööriista müüja kohustust toetada oma toodet ja selle tulevastes versioonides toimuvaid arendusi. Et tagada kasutajate kaasatus andmelao kasutamisele, kaasab arendusmeeskond kasutajad tööriistade valiku protsessi. Sel juhul tuleks läbi viia kasutaja praktiline hindamine.

Andmelao väärtuse suurendamiseks saab arendusmeeskond pakkuda oma andmeladudele ka veebijuurdepääsu. Veebipõhine andmeladu võimaldab kasutajatel pääseda juurde andma kaugetest kohtadest või reisil olles. Samuti võib teave

pakkuda madalama hinnaga koolituskulude vähendamise kaudu.

2.4.3 Andmeladu Operatsioonifaas

See etapp koosneb kolmest tegevusest: andmete värskendamise strateegiate määratlemine, andmelao tegevuste kontroll ja andmelao turvalisuse juhtimine.

Andmete värskendamise strateegiate määratlus

Pärast esmast laadimist, st andma sisse andmebaas Andmeladu tuleb perioodiliselt värskendada, et taasesitada lehel tehtud muudatusi andma originaalid. Seega peate otsustama, millal värskendada, kui sageli ajastada värskendust ja kuidas värskendada andma. Soovitatav on värskendada andma kui süsteemi saab võrgust välja lülitada. Värskendussageduse määrab arendusmeeskond, lähtudes kasutaja nõudmistest. Andmelao värskendamiseks on kaks lähenemisviisi: täielik värskendamine ja pidev muudatuste üleslaadimine.

Esimene lähenemine, täielik värskendamine, nõuab kõigi uuesti laadimist andma algusest. See tähendab, et kõik andma nõutud tuleb ekstraheerida, puhastada, teisendada ja integreerida igasse värskendusse. Seda lähenemisviisi tuleks võimaluse korral vältida, kuna see on aeganõudev ja nõuab ressursse.

Alternatiivne lähenemisviis on muudatuste pidev üleslaadimine. See lisab i andma mis on pärast viimast andmelao värskendustsüklit muutunud. Uute või muudetud kirjete tuvastamine vähendab oluliselt nende mahtu andma mida tuleb igas värskenduses andmelattu levitada ainult nendena andma lisatakse andmebaas andmelaost.

I tagasivõtmiseks saab kasutada vähemalt 5 lähenemist andma uus või muudetud. Tõhusa video värskendamise strateegia saavutamiseks andma kasu võib olla nende lähenemisviiside kombinatsioon, mis tõmbab kõik süsteemi muudatused.

Esimene lähenemine, mis kasutab ajatempleid, eeldab, et kõik on määratud andma muutis ja värskendas ajatemplit, et saaksite kõik hõlpsasti tuvastada andma muudetud ja uus. Seda lähenemist pole aga enamikus operatsioonisüsteemides tänapäeval laialdaselt kasutatud.
Teine võimalus on kasutada rakenduse loodud deltafaili, mis sisaldab ainult failis tehtud muudatusi andma. Selle faili kasutamine võimendab ka värskendustsüklit. Kuid isegi seda meetodit pole paljudes rakendustes kasutatud.
Kolmas lähenemisviis on logifaili skannimine, mis sisaldab põhimõtteliselt deltafailiga sarnast teavet. Ainus erinevus seisneb selles, et taasteprotsessi jaoks luuakse logifail ja sellest võib olla raske aru saada.
Neljas lähenemisviis on rakenduse koodi muutmine. Enamus rakenduse koodidest on aga vanad ja haprad; seetõttu tuleks seda tehnikat vältida.
Viimane lähenemine on võrrelda i andma allikad põhifailiga dei andma.

Andmelao tegevuse jälgimine

Kui andmeladu on kasutajatele välja antud, tuleb seda aja jooksul jälgida. Sel juhul saab andmelao administraator andmelao kasutamise jälgimiseks kasutada üht või mitut haldus- ja kontrollitööriista. Eelkõige saab koguda teavet inimeste ja andmelaole juurdepääsu aja kohta. Ole nüüd andma kogutud tööst saab luua profiili, mida saab kasutada sisendiks kasutaja tagasimaksete juurutamisel. Tagasimakse võimaldab kasutajatel saada teavet andmelao töötlemise kuludest.

Lisaks saab andmelao auditi abil tuvastada päringutüüpe, nende suurust, päringute arvu päevas, päringu reaktsiooniaegu, saavutatud sektoreid ja päringute hulka. andma töödeldud. Andmelao auditi tegemise teine eesmärk on tuvastada andma mida ei kasutata. Need andma neid saab aja parandamiseks andmelaost eemaldada

päringu täitmise vastust ja kontrolli kasvu andma mis asuvad sees andmebaasi andmelaost.

Andmelao turvahaldus

Andmeladu sisaldab andma integreeritud, kriitiline, tundlik, millele on lihtne jõuda. Sel põhjusel tuleks seda kaitsta volitamata kasutajate eest. Üks viis turvalisuse rakendamiseks on kasutada funktsiooni del DB-süsteemid eri tüüpi kasutajatele erinevate õiguste määramiseks. Sel viisil tuleb iga kasutajatüübi jaoks säilitada juurdepääsuprofiil. Teine võimalus andmelao turvamiseks on krüpteerida see, nagu on kirjutatud andmebaasi andmelaost. Juurdepääsu andma ja otsingutööriistad peavad dekrüpteerima andma enne tulemuste kasutajatele esitamist.

2.4.4 Andmeladu Kasutuselevõtu faas

See on andmelao juurutamistsükli viimane etapp. Selles etapis tehtavad tegevused hõlmavad kasutajate koolitamist andmelao kasutamiseks ja andmelao ülevaatuste läbiviimist.

Kasutaja koolitus

Enne juurdepääsu tuleks läbida kasutaja koolitus andma andmelaost ja otsingutööriistade kasutamisest. Üldjuhul peaksid seansid algama salvestamise kontseptsiooni tutvustamisega andma, andmelao sisu, meta andma ja tööriistade põhiomadused. Seejärel võivad kogenumad kasutajad uurida ka andmetele juurdepääsu ja otsingu tööriistade kasutajate füüsilisi tabeleid ja funktsioone.

Kasutajakoolituse läbiviimiseks on palju lähenemisviise. Üks neist hõlmab paljude kasutajate või analüütikute valikut, kes valitakse kasutajate hulgast nende juhtimis- ja suhtlemisoskuste põhjal. Neid koolitatakse isiklikult kõiges, mida nad peavad süsteemiga tutvumiseks teadma. Pärast koolitust lähevad nad tagasi oma töökohale ja hakkavad teistele kasutajatele süsteemi kasutamist õpetama. peal

Teised kasutajad saavad õpitu põhjal hakata andmelaoga tutvuma.
Teine lähenemine on koolitada palju kasutajaid korraga, justkui treeniksite klassiruumis. See meetod sobib siis, kui on palju kasutajaid, keda tuleb korraga koolitada. Veel üks meetod on koolitada iga kasutajat eraldi, ükshaaval. See meetod sobib siis, kui kasutajaid on vähe.

Kasutajakoolituse eesmärk on tutvuda juurdepääsuga andma ja otsingutööriistad ning andmelao sisu. Mõnele kasutajale võib aga koolituse ajal pakutava teabe hulk rabada. Seejärel tuleb pideva toe saamiseks ja konkreetsetele küsimustele vastamiseks teha mitmeid täiendusseansse. Mõnel juhul moodustatakse seda tüüpi toe pakkumiseks kasutajarühm.

Tagasiside kogumine

Kui andmeladu on kasutusele võetud, saavad kasutajad kasutada i andma erinevatel eesmärkidel andmelaos elamine. Enamasti kasutavad analüütikud või kasutajad i andma andmelaos:

1 Tehke kindlaks ettevõtte suundumused
2. Analüüsige ostuprofiile kliendid
3 Jaga i kliendid toim i
4 Pakkuge parimaid teenuseid kliendid - kohandada teenuseid
5 Sõnastage strateegiad turundus
6 Tehke konkurentsivõimelisi hinnapakkumisi kuluanalüüside jaoks ja aidake neid kontrollida
7 Toetada strateegiliste otsuste tegemist
8 Tehke kindlaks võimalused esilekerkimiseks
9 Parandada praeguste äriprotsesside kvaliteeti
10 Kontrollige kasumit

Andmelao arendussuunda järgides võiks tagasiside saamiseks teha süsteemi ülevaatusi

nii arendusmeeskonna kui ka lõppkasutajate kogukonna poolt.
Saadud tulemusi saab arvestada järgmise arendustsükli jaoks.

Kuna andmeladu on inkrementaalse lähenemisega, on oluline õppida varasemate arenduste õnnestumistest ja vigadest.

2.5 Kokkuvõte

Selles peatükis on käsitletud kirjanduses esinevaid lähenemisviise. Peatükis 1 käsitleti andmelao kontseptsiooni ja selle rolli otsustusteaduses. 2. osas kirjeldati peamisi erinevusi andmeladude ja OLTP-süsteemide vahel. Jaotises 3 käsitleti Monashi andmelao mudelit, mida 4. osas kasutati andmelao arendamise protsessiga seotud tegevuste kirjeldamiseks, need väited ei põhinenud rangetel uuringutel. Tegelikkuses toimuv võib olla väga erinev kirjanduses kirjeldatust, kuid neid tulemusi saab kasutada põhipagasi loomiseks, mis rõhutab selle uurimistöö jaoks andmelao kontseptsiooni.

Peatükk 3

Uurimis- ja disainimeetodid

See peatükk käsitleb selle uuringu uurimis- ja disainimeetodeid. Esimeses osas on esitatud üldine ülevaade teabe otsimiseks kasutatavatest uurimismeetoditest, lisaks käsitletakse konkreetse uuringu jaoks parima meetodi valimise kriteeriume. 2. osas käsitletakse seejärel kahte ülaltoodud kriteeriumide alusel valitud meetodit; üks neist valitakse ja võetakse vastu punktis 3 sätestatud põhjustel, kus on ära toodud ka teise kriteeriumi väljajätmise põhjused. 4. jaos esitatakse uurimisprojekt ja 5. osas järeldused.

3.1 Infosüsteemide uurimine

Infosüsteemide uurimine ei piirdu lihtsalt tehnoloogilise valdkonnaga, vaid seda tuleb laiendada ka käitumis- ja organisatsiooniliste eesmärkidega.
Me võlgneme selle erinevate distsipliinide teesidele, alates sotsiaalteadustest kuni loodusteadusteni; see toob kaasa vajaduse infosüsteemide jaoks kasutada teatud uurimismeetodite spektrit, mis hõlmab kvantitatiivseid ja kvalitatiivseid meetodeid.
Kõik kättesaadavad uurimismeetodid on olulised, tegelikult on mitmed teadlased, nagu Jenkins (1985), Nunamaker jt. (1991) ja Galliers (1992) väidavad, et infosüsteemide eri valdkondade uuringute läbiviimiseks ei ole spetsiifilist universaalset meetodit; tegelikult võib meetod sobida konkreetse uurimuse jaoks, kuid mitte teiste jaoks. See viib meid vajaduseni valida meetod, mis sobib meie konkreetse uurimisprojekti jaoks: selle valiku jaoks on Benbasat et al. (1987) väidavad, et tuleks kaaluda uurimistöö olemust ja eesmärki.

3.1.1 Uuringu laad

Erinevad looduspõhised uurimismeetodid võib liigitada kolme infoteaduse laialt tuntud traditsiooni: positivistlik, interpretatiivne ja kriitiline uurimine.

3.1.1.1 Positivistlik uurimus

Positivistlikku uurimistööd tuntakse ka kui teaduslikku või empiirilist uuringut. Selle eesmärk on: "selgitada ja ennustada, mis sotsiaalses maailmas juhtub, vaadeldes seaduspärasusi ja põhjus-tagajärg seoseid selle moodustavate elementide vahel" (Shanks et al 1993).

Positivistlikku uurimistööd iseloomustavad ka korratavus, lihtsustused ja ümberlükkamised. Lisaks tunnistavad positivistlikud uuringud uuritud nähtuste vahel a priori seoseid.
Galliersi (1992) järgi on taksonoomia positivistliku paradigmaga hõlmatud uurimismeetod, mis aga ei piirdu sellega, tegelikult on olemas laborikatsed, välikatsed, juhtumiuuringud, teoreemide demonstratsioonid, prognoosid ja simulatsioonid. Neid meetodeid kasutades tunnistavad teadlased, et uuritud nähtusi on võimalik objektiivselt ja rangelt jälgida.

3.1.1.2 Tõlgendusuuringud

Interpreteerivat uurimistööd, mida sageli nimetatakse fenomenoloogiaks või antipositivismiks, kirjeldab Neuman (1994) kui "tegevuse sotsiaalse tähenduse süstemaatilist analüüsi inimeste otsese ja üksikasjaliku jälgimise kaudu loomulikes olukordades, et jõuda arusaamani ja tõlgendus sellest, kuidas inimesed loovad ja hoiavad oma sotsiaalset maailma”. Interpreteerivad uuringud lükkavad ümber eelduse, et vaadeldavaid nähtusi saab vaadelda objektiivselt. Tegelikult põhinevad need subjektiivsetel tõlgendustel. Lisaks ei suru interpretatsiooniuurijad uuritavatele nähtustele a priori tähendusi.

See meetod hõlmab subjektiivseid/argumenteerivaid uuringuid, tegevusuuringuid, kirjeldavaid/tõlgendavaid uuringuid, tulevikuuuringuid ja rollimänge. Lisaks nendele küsitlustele ja juhtumiuuringutele võib see lähenemisviis hõlmata, kuna need puudutavad üksikisikute või organisatsioonide uuringuid keerulistes reaalsetes olukordades.

3.1.1.3 Kriitilised uuringud

Kriitiline otsing on sotsiaalteadustes kõige vähem tuntud lähenemisviis, kuid on hiljuti pälvinud infosüsteemide areenil teadlaste tähelepanu. Filosoofiline eeldus, et sotsiaalset reaalsust toodavad ja reprodutseerivad ajalooliselt inimesed, aga ka sotsiaalsed süsteemid oma tegevuste ja interaktsioonidega. Nende võimet vahendavad aga mitmed sotsiaalsed, kultuurilised ja poliitilised kaalutlused.

Nagu tõlgendusuuringud, väidavad ka kriitilised uuringud, et positivistlikel uuringutel pole sotsiaalse kontekstiga mingit pistmist ja nad eirab selle mõju inimtegevusele.
Kriitilised uuringud seevastu kritiseerivad tõlgendusuuringuid, kuna need on liiga subjektiivsed ja ei kavatse aidata inimestel oma elu parandada. Suurim erinevus kriitilise uurimistöö ja kahe teise lähenemisviisi vahel on selle hindav mõõde. Kui positivistlike ja tõlgenduslike traditsioonide objektiivsus on status quo või sotsiaalse reaalsuse ennustamine või selgitamine, siis kriitilise uurimistöö eesmärk on uuritavat sotsiaalset reaalsust kriitiliselt hinnata ja muuta.

Kriitilised uurijad seisavad tavaliselt status quo vastu, et eemaldada sotsiaalsed erinevused ja parandada sotsiaalseid tingimusi. Kriitilised uuringud on pühendunud huvipakkuvate nähtuste protsessivaatele ja on seetõttu tavaliselt pikisuunalised. Uurimismeetoditeks on näiteks pikaajalised ajaloouuringud ja etnograafilised uuringud. Kriitilist otsingut pole aga infosüsteemide uurimisel laialdaselt kasutatud

3.1.2 Uuringu eesmärk

Koos uurimistöö olemusega saab selle eesmärki kasutada teadlase suunamiseks konkreetse uurimismeetodi valikul. Uurimisprojekti ulatus on tihedalt seotud uurimistöö positsiooniga uurimistsükli suhtes, mis koosneb kolmest faasist: teooria koostamine, teooria testimine ja teooria täpsustamine. Seega, lähtudes uurimistsükli hoogust, võib uurimisprojektil olla selgitav, kirjeldav, uuriv või ennustav eesmärk.

3.1.2.1 Uurimuslikud uuringud

Uurimuslik uurimistöö on suunatud täiesti uue teema uurimisele ning küsimuste ja hüpoteeside sõnastamisele edasiseks uurimiseks. Seda tüüpi uuringuid kasutatakse teooria ehitamisel, et saada uues valdkonnas esialgseid viiteid. Tavaliselt kasutatakse kvalitatiivseid uurimismeetodeid, näiteks juhtumiuuringuid või fenomenoloogilisi uuringuid.

Siiski on võimalik kasutada ka kvantitatiivseid meetodeid, nagu uurimuslikud uuringud või katsed.

3.1.3.3 Kirjeldav otsing

Kirjeldavad uuringud on mõeldud konkreetse olukorra või organisatsioonilise praktika üksikasjalikuks analüüsimiseks ja kirjeldamiseks. See sobib teooriate koostamiseks ja seda saab kasutada ka hüpoteeside kinnitamiseks või vaidlustamiseks. Kirjeldavad uuringud hõlmavad tavaliselt mõõtmiste ja proovide kasutamist. Sobivad uurimismeetodid hõlmavad küsitlusi ja taustaanalüüse.

3.1.2.3 Selgitav uurimine

Selgitavad uuringud püüavad selgitada, miks asjad juhtuvad. See tugineb juba uuritud faktidele ja püüab leida nende faktide põhjuseid.
Seega on selgitavad uuringud tavaliselt üles ehitatud uurimuslikule või kirjeldavale uurimistööle ning on teooriate testimise ja täpsustamise kõrval. Selgitavad uuringud kasutavad tavaliselt juhtumiuuringuid või küsitluspõhiseid uurimismeetodeid.

3.1.2.4 Ennetav uurimine

Ennetava uurimistöö eesmärk on ennustada vaadeldud sündmusi ja käitumist, mida uuritakse (Marshall ja Rossman 1995). Ennustamine on standardne teaduslik tõe test. Seda tüüpi uuringutes kasutatakse tavaliselt küsitlusi või andmeanalüüsi andma ajaloolased. (Yin 1989)

Ülaltoodud arutelu näitab, et on mitmeid võimalikke uurimismeetodeid, mida saab konkreetses uuringus kasutada. Siiski peab olema konkreetne meetod, mis sobib teatud tüüpi uurimisprojekti jaoks teistest paremini. (Galliers 1987, Yin 1989, De Vaus 1991). Seetõttu peab iga teadlane hoolikalt hindama erinevate meetodite tugevaid ja nõrku külgi, et võtta kasutusele uurimisprojektiga sobivaim uurimismeetod. (Jenkins 1985, Pervan ja Klass 1992, Bonomia 1985, Yin 1989, Himilton ja Ives 1992).

3.2. Võimalikud otsingumeetodid

Selle projekti eesmärk oli uurida Austraalia organisatsioonide kogemusi i andma salvestatud koos arendusega andmekogus. Dato et praegu on Austraalias andmelao valdkonna uuringutest puudus, on see uurimisprojekt alles uurimistsükli teoreetilises faasis ja sellel on uurimuslik eesmärk. Andmehoidlat kasutusele võtnud Austraalia organisatsioonide kogemuste uurimine nõuab tegeliku ühiskonna tõlgendamist. Järelikult järgib uurimisprojekti aluseks olev filosoofiline eeldus traditsioonilist tõlgendust.

Pärast olemasolevate meetodite põhjalikku uurimist on kindlaks tehtud kaks võimalikku uurimismeetodit: küsitlused ja juhtumiuuringud, mida saab kasutada uurimuslikuks uurimistööks (Shanks et al. 1993). Galliers (1992) väidab oma muudetud taksonoomias nende kahe meetodi sobivust selle konkreetse uuringu jaoks, öeldes, et need sobivad teoreetiliseks konstrueerimiseks. Järgmises kahes alajaotuses käsitletakse iga meetodit üksikasjalikult.

3.2.1 Küsitluse uurimismeetod

Küsitluse uurimismeetod pärineb iidsest loendusmeetodist. Loendus on teabe kogumine terve elanikkonna kohta. See meetod on kallis ja ebapraktiline, eriti kui rahvastik on suur. Seega on küsitlus rahvaloendusega võrreldes tavaliselt keskendunud teabe kogumisele väikese arvu ehk valimi kohta elanikkonna esindajatest (Fowler 1988, Neuman 1994). Valim peegeldab populatsiooni, millest see on koostatud, erineva täpsusastmega, olenevalt valimi struktuurist, suurusest ja kasutatud valikumeetodist (Fowler 1988, Babbie 1982, Neuman 1994).

Küsitlusmeetodit defineeritakse kui "hetktõmmiseid tavadest, olukordadest või vaadetest teatud ajahetkel, mis on tehtud küsimustike või intervjuude abil, millest saab teha järeldusi
tehtud” (Galliers 1992:153) [hetktõmmis tavadest, olukordadest või vaadetest konkreetsel ajahetkel, tehtud küsimustike või intervjuude abil, millest saab teha järeldusi]. Küsitlused on seotud teabe kogumisega uuringu teatud aspektide kohta paljudelt osalejatelt küsimuste esitamise teel (Fowler 1988). Need küsimustikud ja intervjuud, mis hõlmavad näost näkku telefoniintervjuusid ja struktureeritud intervjuusid, on samuti kogumismeetodid andma kasutatakse uuringutes (Blalock 1970, Nachmias ja Nachmias 1976, Fowler 1988), saab kasutada vaatlusi ja analüüse (Gable 1994). Kõigist nendest jumalate kogumise meetoditest andma, on küsimustiku kasutamine kõige populaarsem tehnika, kuna see tagab, et i andma

kogutud on struktureeritud ja vormindatud ning hõlbustavad seega teabe klassifitseerimist (Hwang 1987, de Vaus 1991).

Analüüsides i andmaküsitlusstrateegias kasutatakse sageli kvantitatiivseid meetodeid, näiteks statistilist analüüsi, kuid kasutada võib ka kvalitatiivseid meetodeid (Galliers 1992, Pervan

ja Klass 1992, Gable 1994). Tavaliselt, st andma kogutud kasutatakse assotsiatsioonide jaotuste ja mustrite analüüsimiseks (Fowler 1988).

Kuigi küsitlused on üldiselt sobivad otsingute jaoks, mis käsitlevad küsimust "mis?" (mida) või sellest tulenevalt, nagu 'quanto' (kui palju) ja 'quant'è' (mitu), saab neid küsida läbi küsimuse 'miks' (Sonquist ja Dunkelberg 1977, Yin 1989). Sonquisti ja Dunkelbergi (1977) järgi on uurimistöö eesmärgiks rasked hüpoteesid, hindamisprogrammid, populatsiooni kirjeldamine ja inimkäitumise mudelite väljatöötamine. Lisaks saab uuringuid kasutada teatud elanikkonna arvamuse, tingimuste, uskumuste, omaduste, ootuste ja isegi mineviku või praeguse käitumise uurimiseks (Neuman 1994).

Küsitlused võimaldavad uurijal avastada rahvastikusuhteid ja tulemused on tavaliselt üldisemad kui muud meetodid (Sonquist ja Dunkelberg 1977, Gable 1994). Küsitlused võimaldavad teadlastel katta laiemat geograafilist piirkonda ja jõuda suure hulga vastajateni (Blalock 1970, Sonquist ja Dunkelberg 1977, Hwang ja Lin 1987, Gable 1994, Neuman 1994). Lõpuks võivad küsitlused anda teavet, mis pole mujal või analüüside jaoks vajalikul kujul kättesaadav (Fowler 1988).

Küsitluse läbiviimisel on siiski mõned piirangud. Puuduseks on see, et uurija ei saa uuritava objekti kohta palju teavet. Selle põhjuseks on asjaolu, et küsitlusi tehakse ainult kindlal ajal ja seetõttu on teadlasel piiratud arv muutujaid ja inimesi, keda uurija saab

uuring (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Teine puudus on see, et küsitluse läbiviimine võib olla aja ja ressursside osas väga kulukas, eriti kui see hõlmab näost näkku intervjuusid (Fowler 1988).

3.2.2. Küsitluse uurimismeetod

Uurimismeetod hõlmab konkreetse olukorra süvauuringut selle tegelikus kontekstis kindlaksmääratud aja jooksul, ilma uurija sekkumiseta (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Peamiselt kasutatakse seda meetodit konkreetses olukorras uuritavate muutujate vaheliste seoste kirjeldamiseks (Galliers 1992). Sõltuvalt analüüsitavast nähtusest võivad uuringud hõlmata ühte või mitut juhtumit (Franz ja Robey 1987, Eisenhardt 1989, Yin 1989).

Uurimismeetodit määratletakse kui "empiirilist uurimist, mis uurib kaasaegset nähtust selle tegelikus kontekstis, kasutades mitut allikat, mis pärinevad ühest või mitmest üksusest, nagu inimesed, rühmad või organisatsioonid" (Yin 1989). Nähtuse ja selle konteksti vahel puudub selge lahusus ning muutujate kontroll või eksperimentaalne manipuleerimine puudub (Yin 1989, Benbasat et al. 1987).

Jumalate kogumiseks on mitmesuguseid tehnikaid andma mida saab kasutada päringumeetodis, mis hõlmab otseseid vaatlusi, arhiividokumentide ülevaatusi, küsimustikke, dokumentide läbivaatamist ja struktureeritud intervjuusid. Omades mitmekesist saagikoristustehnikat andma, küsitlused võimaldavad teadlastel mõlemaga tegeleda andma kvalitatiivne ja kvantitatiivne üheaegselt (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Sarnaselt küsitlusmeetodiga on küsitlusuurija vaatleja või uurija, mitte aga aktiivne osaleja uuritavas organisatsioonis.

Benbasat jt (1987) väidavad, et uurimismeetod sobib eriti hästi uurimusteooria konstrueerimiseks, mis algab uurimisküsimusega ja jätkub koolitusega.

teooriast kogumise käigus andma. Olles ka lavale sobiv

teooria ehitamisest, Franz ja Robey (1987) viitavad sellele, et uurimismeetodit saab kasutada ka keeruka teooriafaasi jaoks. Sel juhul kontrollitakse või lükatakse ümber kogutud tõendite põhjal antud teooria või hüpotees. Lisaks sobib uurimine ka uuringute jaoks, mis käsitlevad „kuidas” või „miks” küsimusi (Yin 1989).

Võrreldes teiste meetoditega võimaldavad küsitlused uurijal olulist informatsiooni põhjalikumalt tabada (Galliers 1992, Shanks et al. 1993). Lisaks võimaldavad uuringud uurijal mõista uuritavate protsesside olemust ja keerukust (Benbasat et al. 1987).

Päringumeetodil on neli peamist puudust. Esimene on kontrollitud mahaarvamiste puudumine. Uurija subjektiivsus võib muuta uuringu tulemusi ja järeldusi (Yin 1989). Teine puudus on kontrollitud vaatluse puudumine. Erinevalt eksperimentaalsetest meetoditest ei saa uurija uuritavaid nähtusi kontrollida, kuna neid uuritakse nende loomulikus kontekstis (Gable 1994). Kolmas puudus on korratavuse puudumine. See on tingitud asjaolust, et tõenäoliselt ei jälgi uurija samu sündmusi ja ta ei saa kontrollida konkreetse uuringu tulemusi (Lee 1989). Lõpuks on mittekordavuse tõttu raske ühe või mitme uuringu tulemusi üldistada (Galliers 1992, Shanks et al. 1993). Kõik need probleemid ei ole aga ületamatud ja tegelikult saab uurija neid asjakohaste tegevuste abil minimeerida (Lee 1989).

3.3. Põhjendage uurimismetoodikat vastu võetud

Selle uuringu kahest võimalikust uurimismeetodist peetakse sobivaimaks küsitlusmeetodit. Uurimisnõue lükati pärast asja põhjalikku kaalumist tagasi

eelised ja nõrkused. Iga meetodi mugavust või sobimatust selle uuringu jaoks käsitletakse allpool.

3.3.1. Sobimatu uurimismeetod järelepärimise kohta

Uurimismeetod nõuab konkreetse olukorra süvitsi uurimist ühes või mitmes organisatsioonis teatud aja jooksul (Eisenhardt 1989). Sel juhul võib periood ületada selle uuringu jaoks ettenähtud ajavahemikku. Teine põhjus, miks uurimismeetodit mitte kasutada, on see, et tulemused võivad kannatada ranguse puudumise tõttu (Yin 1989). Uurija subjektiivsus võib mõjutada tulemusi ja järeldusi. Teine põhjus on see, et see meetod sobib rohkem "kuidas" või "miks" tüüpi uurimisküsimuste jaoks (Yin 1989), samas kui selle uuringu uurimisküsimus on "mis" tüüpi. Viimaseks, kuid mitte vähem tähtsaks, on raske üldistada vaid ühe või mõne uuringu tulemusi (Galliers 1992, Shanks et al. 1993). Sellest põhjendusest lähtudes ei valitud küsitlusmeetodit, kuna see ei sobinud antud uuringu jaoks.

3.3.2. Otsingumeetodi mugavus uurimine

Kui see uuring läbi viidi, ei olnud Austraalia organisatsioonid andmehoidla tavasid laialdaselt omaks võtnud. Seetõttu ei olnud Austraalia organisatsioonides nende rakendamise kohta palju teavet. Olemasolev teave pärines organisatsioonidelt, kes olid rakendanud või kasutanud a andmekogus. Antud juhul on kõige sobivam küsitlusuuringu meetod, mis võimaldab saada teavet, mida mujal ei ole või analüüsiks vajalikul kujul (Fowler 1988). Lisaks võimaldab uurimuslik uurimismeetod uurijal saada hea ülevaate tavadest, olukordadest või vaadetest antud ajahetkel (Galliers 1992, Denscombe 1998). Sooviti ülevaadet, et tõsta teadlikkust Austraalia andmehoidla kogemusest.

Lisaks väidavad Sonquist ja Dunkelberg (1977), et küsitlusuuringu tulemused on üldisemad kui muud meetodid.

3.4. Uuringute uuringute disain

Andmelaopraktika uuring viidi läbi 1999. aastal. Sihtrühm koosnes Austraalia organisatsioonidest, kes olid huvitatud andmehoidla uuringutest, kuna tõenäoliselt olid nad sellest juba teadlikud. andma mida nad talletavad ja võivad seetõttu anda selle uuringu jaoks kasulikku teavet. Sihtpopulatsioon tuvastati kõigi Austraalia Andmehoidla Instituudi (Tdwi-aap) liikmete esialgse küsitlusega. Selles jaotises käsitletakse selle uuringu empiirilise uurimisfaasi ülesehitust.

3.4.1. Kogumise tehnika andma

Kolmest küsitlusuuringus tavaliselt kasutatavast tehnikast (st postiküsimustik, telefoniintervjuu ja isiklik intervjuu) (Nachmias 1976, Fowler 1988, de Vaus 1991) võeti selle uuringu jaoks kasutusele postiküsimustik. Esimene põhjus viimase kasutuselevõtuks on see, et see võib jõuda geograafiliselt hajutatud populatsioonini (Blalock 1970, Nachmias ja Nachmias 1976, Hwang ja Lin 1987, de Vaus 1991, Gable 1994). Teiseks sobib postiankeet kõrgelt haritud osalejatele (Fowler 1988). Selle uuringu postiküsimustik adresseeriti andmehoidlaprojekti sponsoritele, direktoritele ja/või projektijuhtidele. Kolmandaks on posti teel ankeetküsitlus asjakohased, kui on olemas turvaline aadresside nimekiri (Salant ja Dilman 1994). TDWI, antud juhul usaldusväärne andmelaoühendus, esitas oma Austraalia liikmete meililisti. Teine postiküsimustiku eelis telefoniküsimustiku või isiklike intervjuude ees on see, et see võimaldab vastajatel täpsemalt vastata, eriti kui vastajatel on vaja tutvuda dokumentidega või arutada küsimusi teiste inimestega (Fowler 1988).

Võimalik puudus võib olla posti teel küsimustike täitmiseks kuluv aeg. Tavaliselt viiakse postiküsimustik läbi selles järjestuses: saatke kirjad, oodake vastuseid ja saatke kinnitus (Fowler 1988, Bainbridge 1989). Seega võib koguaeg olla pikem kui näost näkku intervjuude või telefoniintervjuude jaoks kuluv aeg. Koguaeg on aga ette teada (Fowler 1988, Denscombe 1998). Isikliku intervjuu läbiviimiseks kuluvat aega ei saa ette teada, kuna see on intervjuude lõikes erinev (Fowler 1988). Telefoniintervjuud võivad olla kiiremad kui e-postiga ankeetküsitlused ja isiklikud intervjuud, kuid neil võib olla kõrge vastuseta määr, kuna mõned inimesed ei ole kättesaadavad (Fowler 1988). Lisaks piirduvad telefoniintervjuud üldiselt suhteliselt lühikeste küsimuste loeteludega (Bainbridge 1989).

Teine posti teel saadetud küsimustiku nõrkus on kõrge vastamata jätmise määr (Fowler 1988, Bainbridge 1989, Neuman 1994). Siiski võeti vastumeetmed, seostades selle uuringu usaldusväärse andmeladuasutusega (st TDWI) (Bainbridge 1989, Neuman 1994), mis väljastab mittevastajatele kaks meeldetuletuskirja (Fowler 1988, Neuman 1994) ja sisaldab ka täiendavat selgitust. uuringu eesmärk (Neuman 1994).

3.4.2. Analüüsiüksus

Selle uuringu eesmärk on saada teavet andmehoidla rakendamise ja selle kasutamise kohta Austraalia organisatsioonides. Sihtrühmaks on kõik Austraalia organisatsioonid, kes on rakendanud või rakendavad, st andmekogus. Seejärel registreeritakse üksikud organisatsioonid. Küsimustik saadeti lapsendamisest huvitatud organisatsioonidele andmekogus. See meetod tagab, et kogutav teave pärineb iga osaleva organisatsiooni kõige sobivamatest ressurssidest.

3.4.3. Uuringu näidis

Küsitluses osalejate meililisti saadi TDWI-st. Sellest nimekirjast valiti valimi moodustamise aluseks 3000 Austraalia organisatsiooni. Valimile saadeti projekti ja küsitluse eesmärki selgitav jätkukiri koos vastusevormi ja ettemakstud ümbrikuga täidetud küsimustiku tagastamiseks. 3000 organisatsioonist nõustus uuringus osalema 198. Oodati nii väikest vastuste arvu andmeid suur hulk Austraalia organisatsioone, kes olid siis oma organisatsioonide sees andmehoidla strateegia omaks võtnud või kasutusele võtmas. Seega koosneb selle uuringu sihtrühm ainult 198 organisatsioonist.

3.4.4. Küsimustiku sisu

Küsimustiku koostamisel kasutati Monashi andmeladu mudelit (seda käsitleti varem osas 2.3). Küsimustiku sisu põhines 2. peatükis esitatud kirjanduse ülevaatel. Küsitluses osalejatele saadetud küsimustiku koopia on toodud lisas B. Küsimustik koosneb kuuest osast, mis järgivad käsitletava mudeli samme. Järgmised kuus lõiku võtavad lühidalt kokku iga jaotise sisu.

Jaotis A: põhiteave organisatsiooni kohta
See jaotis sisaldab küsimusi, mis on seotud osalevate organisatsioonide profiiliga. Lisaks on mõned küsimused seotud osaleja andmelaoprojekti olekuga. Konfidentsiaalset teavet, nagu organisatsiooni nimi, uuringu analüüsis ei avalikustatud.

Jaotis B: algus
Selle jaotise küsimused on seotud andmeladustamise alustamisega. Küsiti projekti algatajaid, sponsoreid, vajalikke oskusi ja teadmisi, andmehoidla arendamise eesmärke ja lõppkasutajate ootusi.

Jaotis C: Disain
See jaotis sisaldab küsimusi, mis on seotud ettevõtte planeerimistegevusega andmekogus. Eelkõige olid küsimused elluviimise ulatuse, projekti kestuse, projekti maksumuse ja tasuvusanalüüsi kohta.

Jaotis D: Arendus
Arendusrubriigis on küsimused, mis on seotud ettevõtte arendustegevusega andmekogus: lõppkasutaja nõuete kogumine, allikad andma, loogiline mudel andma, prototüübid, võimsuse planeerimine, tehnilised arhitektuurid ja andmehoidla arendustööriistade valik.

E osa: toimimine
Operatiivsed küsimused, mis on seotud selle toimimise ja laiendatavusega andmekogus, nagu see areneb järgmises arenguetapis. Seal andmete kvaliteet, värskendusstrateegiad andma, detailsus andma, skaleeritavus andmekogus ja turvaküsimused andmekogus olid esitatud küsimuste hulgas.

Jaotis F: Arendus
See jaotis sisaldab küsimusi, mis on seotud rakenduse kasutamisega andmekogus lõppkasutajate poolt. Teadlast huvitas selle eesmärk ja kasulikkus andmekogus, vastuvõetud läbivaatamis- ja koolitusstrateegiad ning kontrollistrateegia andmekogus vastu võetud.

3.4.5. Reageerimismäär

Kuigi meiliküsitlusi kritiseeritakse madala vastamismäära pärast, on astutud samme tagastusmäära suurendamiseks (nagu on kirjeldatud eespool punktis 3.4.1). Mõiste "vastamismäär" viitab inimeste protsendile konkreetses küsitlusvalimis, kes vastavad küsimustikule (Denscombe 1998). Selle uuringu vastuse määra arvutamiseks kasutati järgmist valemit:

Vastanute arv
Vastamismäär = —————————————————————————— X 100 Saadetud küsimustike koguarv

3.4.6. Katsepiloot

Enne küsimustiku valimile saatmist testiti küsimusi pilootkatsetega, nagu soovitasid Luck ja Rubin (1987), Jackson (1988) ja de Vaus (1991). Pilootkatsete eesmärk on paljastada kõik ebamugavad, mitmetähenduslikud väljendid ja raskesti tõlgendatavad küsimused, selgitada kasutatud definitsioone ja termineid ning teha kindlaks küsimustiku täitmiseks kuluv ligikaudne aeg (Warwick ja Lininger 1975, Jackson 1988, Salant ja Dilman 1994). Pilootkatsed viidi läbi, valides katsealused, kelle omadused olid sarnased lõplike katsealuste omadustega, nagu soovitas Davis e. Cosenza (1993). Selles uuringus valiti katseisikuteks kuus andmehoidla spetsialisti. Pärast iga pilootkatset tehti vajalikud parandused. Läbiviidud piloottestidest panustasid osalejad küsimustiku lõpliku versiooni ümberkujundamisele ja lähtestamisele.

3.4.7. Analüüsimeetodid Andma

I andma Suletud küsimustikest kogutud uuringuandmeid analüüsiti statistilise tarkvarapaketi SPSS abil. Paljusid vastuseid analüüsiti kirjeldava statistika abil. Mitu küsimustikku tagastati puudulikult. Neid on hoolikamalt koheldud tagamaks, et i andma Puudumine ei olnud andmete sisestamise vigade tagajärg, vaid seetõttu, et küsimused ei sobinud registreerijale või registreerija otsustas ühele või mitmele konkreetsele küsimusele mitte vastata. Neid puuduvaid vastuseid eirati andmete sõelumisel andma ja kodeeriti kui "-9", et tagada nende väljajätmine analüüsiprotsessist.

Küsimustiku koostamisel olid suletud küsimused eelkodeeritud, määrates igale variandile numbri. Seejärel kasutati numbrit i treenimiseks andma analüüsi käigus (Denscombe 1998, Sapsford ja Jupp 1996). Näiteks jaotise B 1. küsimuses oli loetletud kuus võimalust: direktorite nõukogu, tippjuht, IT-osakond, äriüksus, konsultandid ja teised. failis andma SPSS-ist genereeriti muutuja projekti algataja jaoks kuue väärtussildiga: '1' tähistab 'board', '2' on 'vanem executive' ja nii edasi Street. Likertini skaala kasutamine mõnes suletud küsimuses võimaldas ka vaevatut tuvastamist, kasutades vastavaid SPSS-i sisestatud arvväärtusi. Mittetäielike vastustega küsimuste puhul, mis ei välistanud üksteist, käsitleti iga valikut ühe muutujana, millel oli kaks väärtussildi: '1' tähistab 'kontrollitud' ja '2' 'märkimata'.

Avatud küsimusi käsitleti erinevalt suletud küsimustest. Vastuseid neile küsimustele ei ole SPSS-i sisestatud. Selle asemel analüüsiti neid käsitsi. Seda tüüpi küsimuste kasutamine võimaldab hankida teavet vastajate vabalt väljendatud ideede ja isiklike kogemuste kohta (Bainbridge 1989, Denscombe 1998). Võimaluse korral jaotati vastused kategooriatesse.

Analüüsi jaoks andmakasutatakse lihtsa statistilise analüüsi meetodeid, nagu vastuste sagedus, keskmine, standardhälve ja mediaan (Argyrous 1996, Denscombe 1998).
Gamma test oli mõeldud vaheliste seoste kvantitatiivsete mõõtmiste saamiseks andma järgarvud (Norusis 1983, Argyrous 1996). Need testid olid asjakohased, kuna kasutatud järguskaaladel ei olnud palju kategooriaid ja neid sai näidata tabelis (Norusis 1983).

3.5 Kokkuvõte

Selles peatükis käsitleti selle uuringu jaoks vastuvõetud uurimismetoodikat ja ülesehitust.

Konkreetse uuringu jaoks kõige sobivama uurimismeetodi valimine nõuab
võttes arvesse mitmeid reegleid, sealhulgas uurimistöö olemust ja tüüpi, samuti iga võimaliku meetodi eeliseid ja nõrkusi (Jenkins 1985, Benbasat jt 1097, Galliers ja Land 1987, yin 1989, Hamilton ja ives 1992, Galliers 1992, neuman 1994). Arvestades olemasolevate teadmiste ja teooriate puudumist andmehoidla kasutuselevõtu kohta Austraalias, nõuab see uuring tõlgendavat uurimismeetodit, millel on uurimuslik võime uurida Austraalia organisatsioonide kogemusi. Valitud uurimismeetod valiti selleks, et koguda teavet andmehoidla kontseptsiooni kasutuselevõtu kohta Austraalia organisatsioonide poolt. Kogumistehnikaks valiti postiankeet andma. Uurimismeetodi ja kogumistehnika põhjendused andma valikud esitatakse selles peatükis. Lisaks arutati analüüsiühikut, kasutatud valimit, vastuste protsenti, küsimustiku sisu, ankeedi eeltesti ja analüüsimeetodit. andma.

Projekteerimine a Andmeladu:

Olemisuhete ja mõõtmete modelleerimise kombineerimine

ABSTRACT
Kauplus i andma on paljude organisatsioonide jaoks aktuaalne probleem. Laonduse arendamise võtmeprobleem andma see on tema disain.
Joonis peab toetama mõistete tuvastamist andmekogus pärandsüsteemile ja muudele allikatele andma samuti lihtne arusaamine ja tõhusus selle rakendamisel andmekogus.
Suur osa säilitamist käsitlevast kirjandusest andma soovitab kujunduse esitamiseks kasutada olemisuhete modelleerimist või mõõtmete modelleerimist andmekogus.
Selles artiklis näitame, kuidas saab mõlemat esitust kombineerida lähenemisviisi kujundamisele andmekogus. Kasutatud lähenemisviis on süstemaatiline

uuritakse juhtumiuuringus ja tuvastatakse mitmetes olulistes mõjudes spetsialistidele.

ANDMETE LADU

Un andmekogus seda defineeritakse tavaliselt kui "subjektile orienteeritud, integreeritud, ajas varieeruvat ja muutumatut andmete kogumist juhtkonna otsuste toetamiseks" (Inmon ja Hackathorn, 1994). Õppeainele orienteeritud ja integreeritud näitab, et andmekogus on loodud ületama pärandsüsteemide funktsionaalsed piirid, et pakkuda integreeritud perspektiivi andma.
Ajavariant on seotud video ajaloolise või aegridade olemusega andma sees andmekogus, mis võimaldab suundumusi analüüsida. Mittelenduv näitab, et andmekogus seda ei uuendata pidevalt nagu a andmebaas OLTP-st. Pigem ajakohastatakse seda perioodiliselt andma sisemistest ja välistest allikatest. The andmekogus see on spetsiaalselt loodud uurimiseks, mitte terviklikkuse ja toimivuse värskendamiseks.
Idee salvestada i andma ei ole uus, see oli üks juhtimise eesmärke andma alates kuuekümnendatest (Il Martin, 1982).
I andmekogus nad pakuvad infrastruktuuri andma juhtimise tugisüsteemide jaoks. Juhtimise tugisüsteemide hulka kuuluvad otsuste tugisüsteemid (DSS) ja juhi infosüsteemid (EIS). DSS on arvutipõhine infosüsteem, mis on loodud protsesside ja sellest tulenevalt inimeste otsuste tegemise parandamiseks. EIS on tavaliselt kohaletoimetamissüsteem andma mis võimaldab ettevõtete juhtidel hõlpsasti juurdepääsu vaatele andma.
Üldarhitektuur a andmekogus rõhutab rolli andmekogus juhtimise toetamisel. Lisaks taristu pakkumisele andma EIS-i ja DSS-i jaoks, al andmekogus sellele pääseb otse päringute kaudu juurde. THE andma sisaldub a andmekogus põhinevad juhtimisteabe nõuete analüüsil ja on saadud kolmest allikast: sisemised pärandsüsteemid, eriotstarbelised andmehõivesüsteemid ja välised andmeallikad. THE andma sisemistes pärandsüsteemides on need sageli üleliigsed, ebajärjekindlad, madala kvaliteediga ja salvestatud erinevates vormingutes, nii et need tuleb enne süsteemi laadimist kooskõlastada ja puhastada.

andmekogus (Inmon, 1992; McFadden, 1996). THE andma salvestussüsteemidest andma ad hoc ja allikatest andma väliseid kasutatakse sageli suurendamiseks (värskendamiseks, asendamiseks) i andma pärandsüsteemidest.

On palju kaalukaid põhjuseid, miks a andmekogus, mis hõlmavad paremat otsuste langetamist rohkema teabe tõhusa kasutamise kaudu (Ives 1995), kogu asjadele keskendumise toetamist (Graham 1996) ja otsustuskulude vähendamist. andma EIS ja DSS jaoks (Graham 1996, McFadden 1996).

Hiljutine empiiriline uuring leidis keskmiselt investeeringutasuvuse i andmekogus kolme aasta pärast 401% võrra (Graham, 1996). Kuid teised empiirilised uuringud andmekogus leidis olulisi probleeme, sealhulgas raskused kasu mõõtmisel ja jaotamisel, selge eesmärgi puudumine, säilitamisprotsessi ulatuse ja keerukuse alahindamine. andma, eriti mis puudutab allikaid ja puhtust andma. Kauplus i andma võib pidada juhtimisprobleemi lahenduseks andma organisatsioonide vahel. Manipuleerimine andma sotsiaalse ressursina on see olnud paljude aastate jooksul üheks võtmeprobleemiks infosüsteemide haldamisel kogu maailmas (Brancheau jt 1996, Galliers jt 1994, Niederman jt 1990, Pervan 1993).

Populaarne lähenemine varahaldusele andma kaheksakümnendatel oli mudeli väljatöötamine andma sotsiaalne. Mudel andma sotsiaalne oli loodud pakkuma stabiilset alust uute rakendussüsteemide väljatöötamiseks e andmebaas ning pärandsüsteemide rekonstrueerimine ja integreerimine (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kim ja Everest 1994). Sellel lähenemisviisil on aga mitmeid probleeme, eelkõige iga ülesande keerukus ja maksumus ning käegakatsutavate tulemuste saavutamiseks kuluv pikk aeg (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997). ).

Il andmekogus see on eraldi andmebaas, mis eksisteerib koos pärandandmebaasidega, mitte ei asenda neid. Seetõttu võimaldab see teil juhtida andma ja vältida pärandsüsteemide kulukat ümberehitamist.

OLEMASOLEVAD LÄHENEMISVIISID ANDMETE KUJUNDAMISEKS

LADUS

Ehitamise ja täiustamise protsess a andmekogus tuleks mõista pigem evolutsiooniprotsessi kui traditsioonilise süsteemide arendamise elutsüklina (Soov, 1995, Shanks, O'Donnell ja Arnott 1997a). Projektis on palju protsesse andmekogus nagu lähtestamine, ajastamine; ettevõtte juhtidelt nõutud nõuetest saadud teave; allikad, teisendused, puhastamine andma ja sünkroonida pärandsüsteemidest ja muudest allikatest andma; väljatöötamisel olevad tarnesüsteemid; jälgimine andmekogus; evolutsiooniprotsessi ja ülesehitamise mõttetus a andmekogus (Stinchi, O'Donnell ja Arnott 1997b). Selles ajakirjas keskendume sellele, kuidas joonistada i andma salvestatakse nende muude protsesside kontekstis. Videoarhitektuurile on välja pakutud mitmeid lähenemisviise andmekogus kirjanduses (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Igal neist meetoditest on lühike ülevaade koos nende tugevate ja nõrkade külgede analüüsiga.

Inmoni (1994) Approach for Andmeladu Disain

Inmon (1994) pakkus välja neli iteratiivset sammu, et kujundada a andmekogus (vt joonis 2). Esimene samm on malli kujundamine andma sotsiaalne, et mõista, kuidas i andma saab integreerida organisatsioonisiseselt funktsionaalsete valdkondade vahel, jagades i andma hoida piirkondades. Mudel andma see on valmistatud ladustamiseks andma mis on seotud otsuste tegemisega, sealhulgas andma ajalooline ja kaasatud andma maha ja liita. Teine samm on rakendamiseks vajalike teemavaldkondade kindlaksmääramine. Need põhinevad konkreetse organisatsiooni määratud prioriteetidel. Kolmas samm hõlmab a joonistamist andmebaas teemavaldkonna puhul pöörake erilist tähelepanu asjakohaste detailsustasemete lisamisele. Inmon soovitab kasutada olemi- ja suhtemudelit. Neljas samm on lähtesüsteemide tuvastamine andma vaja ja arendada teisendusprotsesse jäädvustamiseks, puhastamiseks ja vormindamiseks i andma.

Inmoni lähenemise tugevad küljed seisnevad selles, et mudel andma sotsiaalne pakub lõimumise aluse andma organisatsioonisiseselt ja planeerides toetab iteratiivset arengut andmekogus. Selle puuduseks on mudeli kujundamise keerukus ja hind andma sotsiaalne, mõlemas mudelis kasutatud entiteetide ja suhete mudelite mõistmise raskus, et andma sotsiaalne ja see andma salvestatud teemavaldkondade kaupa ja asjakohasust andma joonisest andmekogus realiseerimiseks andmebaas suhteline, kuid mitte jaoks andmebaas mitmemõõtmeline.

Ives'i (1995) Approach to Andmeladu Disain

Ives (1995) pakub välja neljaastmelise lähenemisviisi infosüsteemi kujundamiseks, mis on tema arvates rakendatav infosüsteemi kujundamisel. andmekogus (vt joonis 3). Lähenemisviis põhineb väga palju infosüsteemide arendamiseks mõeldud infotehnoloogial (Martin 1990). Esimene samm on määrata kindlaks oma eesmärgid, edu ja kriitilised tegurid ning peamised tulemusnäitajad. Peamised äriprotsessid ja vajalik teave on modelleeritud, et viia meid mudelini andma sotsiaalne. Teine samm hõlmab määratleva arhitektuuri väljatöötamist andma salvestatud piirkonna järgi, andmebaas di andmekogus, vajalikud tehnoloogiakomponendid, juurutamiseks ja kasutamiseks vajaliku organisatsioonilise toe komplekt andmekogus. Kolmas samm hõlmab vajalike tarkvarapakettide ja tööriistade valikut. Neljas samm on detailne projekteerimine ja ehitamine andmekogus. Ives märgib, et kauplus andma see on piiratud iteratiivne protsess.

Ives'i lähenemisviisi tugevad küljed on tehniliste spetsifikatsioonide kasutamine teabenõuete kindlaksmääramiseks, struktureeritud protsessi kasutamine teabe integreerimise toetamiseks. andmekogus, sobiva riist- ja tarkvara valik ning mitme esitustehnika kasutamine andmekogus. Selle vead on omane keerukusest. Teised hõlmavad raskusi mitmel tasandil andmebaas all'interno del andmekogus mõistliku aja ja kuluga.

Kimballi (1994) lähenemine Andmeladu Disain

Kimball (1994) pakkus välja viis iteratiivset sammu a andmekogus (vt joonised 4). Tema lähenemine on eriti pühendunud soolo joonistamisele andmekogus ning dimensioonimudelite kasutamisest olemi- ja suhtemudelite eelistamisel. Kimball analüüsib neid dimensioonimudeleid, kuna ettevõtete juhtidel on lihtsam äri mõista, see on tõhusam keerukate konsultatsioonide läbiviimisel ja andmebaas füüsiline on tõhusam (Kimball 1994). Kimball tunnistab, et arendades a andmekogus on iteratiivne ja see andmekogus eraldatud saab integreerida ühiste mõõtmetega tabeliteks jagamise kaudu.

Esimene samm on määratleda konkreetne teemavaldkond, mida täiustada. Teine ja kolmas etapp hõlmavad mõõtmete kujundamist. Teises etapis tuvastavad meetmed teemavaldkonnas huvi pakkuvad asjad ja koondavad need faktitabelisse. Näiteks müügi teemavaldkonnas võivad huvipakkuvad mõõdikud hõlmata müüdud kaupade kogust ja dollarit müügivaluutana. Kolmas samm hõlmab mõõtmete kindlaksmääramist, mille abil saab fakte rühmitada. Müügivaldkonnas võivad asjakohased dimensioonid hõlmata eset, asukohta ja ajaperioodi. Faktitabelil on mitmeosaline võti, mis ühendab selle iga dimensioonitabeliga, ja sisaldab tavaliselt väga suurt hulka fakte. Seevastu dimensioonitabelid sisaldavad kirjeldavat teavet mõõtmete ja muude atribuutide kohta, mida saab kasutada faktide rühmitamiseks. Kavandatud seotud faktide ja mõõtmete tabel moodustab selle kuju tõttu nn täheskeemi. Neljas etapp hõlmab a andmebaas mitmemõõtmeline, et täiustada tähe mustrit. Viimane samm on lähtesüsteemide tuvastamine andma vaja ja arendada teisendusprotsesse jäädvustamiseks, puhastamiseks ja vormindamiseks i andma.

Kimballi lähenemise tugevused hõlmavad mõõtmete mudelite kasutamist i esindamiseks andma salvestatud, mis muudab selle hõlpsasti mõistetavaks ja viib tõhusa füüsilise disainini. Dimensioonimudel, mis kasutab hõlpsalt mõlemat süsteemi andmebaas relatsioonilist saab täiustada või süsteeme andmebaas mitmemõõtmeline. Selle puudused hõlmavad mõningate tehnikate puudumist, mis hõlbustaksid paljude täheskeemide planeerimist või integreerimist a andmekogus ja dimensioonimudeli äärmuslikust denormaliseeritud struktuurist projekteerimise keerukus a andma pärandsüsteemides.

McFaddeni (1996) Approach to Data Laokujundus

McFadden (1996) pakub välja viieastmelise lähenemise a joonistamisele andmekogus (vt joonis 5).
Tema lähenemine põhineb kirjanduse ideede sünteesil ja on keskendunud singli kujundamisele andmekogus. Esimene samm hõlmab nõuete analüüsi. Kuigi tehnilisi spetsifikatsioone ei ole ette nähtud, tuvastavad McFaddeni märkused üksused andma spetsifikatsioonid ja nende atribuudid ning viitab nõuete tabamiseks lugejatele Watson ja Frolick (1993).
Teises etapis koostatakse olemi suhte mudel andmekogus ja seejärel kinnitavad ettevõtte juhid. Kolmas samm hõlmab kaardistamise kindlaksmääramist pärandsüsteemide ja väliste allikate põhjal andmekogus. Neljas samm hõlmab arendamise, juurutamise ja sünkroonimise protsesse andma sisse andmekogus. Viimases etapis töötatakse välja süsteemi tarne, rõhuasetusega kasutajaliidesel. McFadden märgib, et joonistusprotsess on üldiselt iteratiivne.

McFaddeni lähenemise tugevateks külgedeks on ettevõtete juhtide kaasamine nõuete määramisse ning ressursside tähtsus. andmanende puhastamine ja kogumine. Selle puudused on suure projekti jagamise protsessi puudumine andmekogus paljudes integreeritud etappides ja seal

raskused projekteerimisel kasutatud olemi- ja suhtemudelite mõistmisel andmekogus.

Mitte ainult need, kes on meie lähedal, ei vali meid.

0/5 (0 arvustust)

Lisateavet leiate veebiagentuurist

Liituge, et saada uusimaid artikleid meili teel.

admin Tegevjuht & Turundus

👍Võrguveebiagentuur | Veebiagentuuri ekspert digitaalse turunduse ja SEO alal. Veebiagentuur Online on veebiagentuur. Agenzia Web Online'i jaoks põhineb edu digitaalse transformatsiooni vallas Iron SEO versiooni 3 alustel. Erialad: süsteemiintegratsioon, ettevõtte rakenduste integreerimine, teenusele orienteeritud arhitektuur, pilvandmetöötlus, andmeladu, äriteave, suurandmed, portaalid, sisevõrgud, veebirakendused Relatsiooniliste ja mitmemõõtmeliste andmebaaside projekteerimine ja haldamine Digitaalse meedia liideste kujundamine: kasutatavus ja graafika. Interneti-veebiagentuur pakub ettevõtetele järgmisi teenuseid: -SEO Google'is, Amazon, Bing, Yandex; -Web Analytics: Google Analytics, Google Tag Manager, Yandex Metrica; -Kasutajate konversioonid: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM Google'is, Bingis, Amazon Adsis; -Sotsiaalmeedia turundus (Facebook, Linkedin, Youtube, Instagram).

Vaata täielikku biograafiat

Share:

Mulle meeldib:

Lisateavet leiate veebiagentuurist