fbpx

Datawarehouse en ERP | CENTRALE GEGEVENSARCHIEF: GESCHIEDENIS EN EVOLUTIES

ARCHIEF GEGEVENS CENTRAAL: GESCHIEDENIS EN EVOLUTIE


De twee dominante thema’s van bedrijfstechnologie in de jaren negentig zijn:
stelt ik datawarehouse en het ERP-systeem. Lange tijd waren deze twee machtig
stromingen zijn onderdeel geweest van bedrijfs-IT zonder dat dit ooit het geval is geweest
kruispunten. Het was bijna alsof ze materie en antimaterie waren. Maar
de groei van beide verschijnselen leidde onvermijdelijk tot één
hun kruispunt. Tegenwoordig worden bedrijven geconfronteerd met het probleem van
wat te doen met ERP e datawarehouse. Dit artikel zal het illustreren
wat zijn de problemen en hoe worden deze door bedrijven aangepakt?
AAN HET BEGIN…
In het begin was er de datawarehouse. Gegevens magazijn voor geboren
tegen het transactieverwerkingsapplicatiesysteem.
In de begindagen memoriseren van gegevens het moest zo zijn
slechts een contrapunt voor e-mailverwerkingstoepassingen
transacties. Maar tegenwoordig bestaan ​​er veel verfijndere visies
van wat een mens kan doen datawarehouse. In de wereld van vandaag de
datawarehouse wordt ingevoegd in een structuur die dat kan zijn
genaamd Bedrijfsinformatiefabriek.
DE BEDRIJFSINFORMATIEFABRIEK
(CIF)
De Bedrijfsinformatiefabriek kent architectonische componenten
standaard: een niveau van transformatie en code-integratie
die integreert ik gegevens terwijl ik gegevens ze verplaatsen zich uit de omgeving van
toepassing op het milieu datawarehouse van het bedrijf; A
datawarehouse van het bedrijf waar de gegevens
gedetailleerde en geïntegreerde historici. De datawarehouse van het bedrijf fungeert als
fundament waarop alle andere onderdelen kunnen worden gebouwd
van de omgeving van datawarehouse; een operationele dataopslag (ODS).
Een ODS is een hybride structuur die een bepaald aspect van de gegevens bevat
magazijn en andere aspecten van een OLTP-omgeving; datamarts, waar i
verschillende afdelingen kunnen over hun eigen versie van de gegevens beschikken
magazijn; A datawarehouse van verkenning waarin ik
bedrijfs “filosofen” (denkers) kunnen hun vragen aan hen voorleggen
72 uur zonder schadelijk effect op datawarehouse; en een herinnering
nabije lijn, waarin gegevens oud en gegevens bulkdetails kunnen zijn
goedkoop opgeslagen.
WAAR COMBINEERT HET ERP MET DE
BEDRIJFSINFORMATIEFABRIEK
De ERP fuseert op twee plaatsen met de Corporate Information Factory.
In de eerste plaats als basistoepassing die i
gegevens van de aanvraag aan datawarehouse. In dit geval i gegevens,
gegenereerd als bijproduct van een transactieproces,
zijn geïntegreerd en geladen in de datawarehouse van het bedrijf. De
tweede punt van eenheid tussen ERP en CIF en de ODS. Sterker nog, velen
omgevingen wordt ERP gebruikt als een klassieke ODS.
Als ERP als kernapplicatie wordt gebruikt, is het
hetzelfde ERP kan ook in het CIF worden gebruikt als ODS. In
Als de ERP echter in beide rollen moet worden gebruikt, is dat wel het geval
er moet een duidelijk onderscheid zijn tussen de twee entiteiten. Met andere woorden,
wanneer ERP de rol speelt van basisapplicatie en ODS, bijv
Er moeten twee architecturale entiteiten worden onderscheiden. Indien een enkele
het implementeren van een ERP probeert beide rollen te vervullen
Tegelijkertijd zullen er onvermijdelijk problemen ontstaan ​​in de
ontwerp en implementatie van deze structuur.
AFZONDERLIJKE ODS EN BASISTOEPASSINGEN
Er zijn veel redenen die tot componentsplitsingen leiden
architectonisch. Misschien wel de meest welsprekende vraag om de
verschillende componenten van een architectuur is dat elk onderdeel
van de architectuur heeft zijn eigen visie. De basistoepassing dient
voor een ander doel dan dat van de ODS. Probeer overlappend
een basistoepassingsvisie op de wereld van een ODS of omgekeerd
het is geen juiste manier van werken.
Het eerste probleem van een ERP in het CIF is dus dat van
Controleer of er een onderscheid is tussen de basistoepassingen en de
SDG's.
GEGEVENSMODELLEN IN HET BEDRIJF
INFORMATIE FABRIEK
Het bereiken van samenhang tussen de verschillende onderdelen
van de architectuur van het CIF moet er een model van zijn gegevens. De
modellen van gegevens ze dienen als schakel tussen de verschillende componenten
architectuur zoals basistoepassingen en ODS. DE
modellen van gegevens uitgegroeid tot de “intellectuele routekaart” om de
juiste betekenis van de verschillende architectonische componenten van het CIF.
Hand in hand met dit idee is het idee dat dit wel zou moeten gebeuren
een geweldig en uniek model zijn gegevens. Natuurlijk moet hij dat doen
een voorbeeld zijn van gegevens voor elk van de componenten en verder daar
het moet een verstandig pad zijn dat de verschillende modellen met elkaar verbindt.
Elk onderdeel van de architectuur – ODS, basistoepassingen,
datawarehouse van het bedrijf, enzovoort.. – heeft zijn eigen nodig
model van gegevens. En dus moet er een nauwkeurige definitie zijn van
zoals deze modellen van gegevens ze communiceren met elkaar.
BEWEEG ik GEGEVENS VAN HET ERP IN DE GEGEVENS
MAGAZIJN
Als de oorsprong van de gegevens is een basistoepassing en/of een ODS, wanneer
de ERP voegt i gegevens in datawarehouse, deze invoer moet
vindt plaats op het laagste granulariteitsniveau. Samenvatting of
gewoon aggregeren i gegevens als ze naar buiten komen
vanuit de ERP-basistoepassing of ERP ODS is er niet
het juiste om te doen. DE gegevens Er zijn details nodig in de gegevens
magazijn dat de basis vormt van het DSS-proces. Zo een gegevens
ze zullen op veel manieren worden hervormd door datamarts en verkenning
del datawarehouse.
Het verhuizen van gegevens vanuit de basistoepassingsomgeving
van het ERP naar de omgeving van datawarehouse van het bedrijf gebeurt in a
redelijk ontspannen manier. Die verschuiving vindt daarna plaats
ongeveer 24 uur vanaf de update of creatie in het ERP. Het feit van
hebben een “luie” beweging van de gegevens in datawarehouse
van het bedrijf staat de gegevens afkomstig van het ERP om te "vereffenen".
Zodra ik gegevens worden gedeponeerd in de basisaanvraag,
dan kun je veilig i verplaatsen gegevens van het ERP
in de onderneming. Nog een doel dat dankzij beweging bereikt kan worden
‘luie’ goden gegevens is de duidelijke afbakening tussen operationele processen en
DS-extensie. Met een “snelle” beweging van de gegevens de demarcatielijn
tussen DSS en operationeel blijft vaag.
De beweging van gegevens van de ODS van het ERP naar datawarehouse
van het bedrijf gebeurt meestal periodiek
wekelijks of maandelijks. In dit geval is de beweging van
gegevens het is gebaseerd op de noodzaak om de oude te "schoonmaken". gegevens historici.
Uiteraard bevat de ODS i gegevens die veel recenter zijn
vergeleken gegevens historici gevonden in de datawarehouse.
Het verhuizen van gegevens in datawarehouse het wordt bijna nooit gedaan
“groothandel” (op groothandelsniveau). Kopieer een tabel
van de ERP-omgeving naar datawarehouse het slaat nergens op. Eén aanpak
veel realistischer is de beweging van geselecteerde eenheden van gegevens.
Alleen ik gegevens die zijn veranderd sinds de laatste update van de gegevens
magazijn zijn degenen die naar de gegevens moeten worden verplaatst
magazijn. Eén manier om te weten welke gegevens ze zijn gewijzigd
sinds de laatste update is het kijken naar de tijdstempels van de gegevens
gevonden in de ERP-omgeving. De ontwerper selecteert alle wijzigingen
die zijn ontstaan ​​sinds de laatste update. Een andere aanpak
is het gebruik van technieken voor het vastleggen van veranderingen gegevens. Met
deze technieken analyseren logboeken en journaalbanden om dit te kunnen doen
bepalen welke gegevens moet worden verplaatst van de ERP-omgeving naar
Dat van de datawarehouse. Deze technieken zijn het beste in
hoe logs en journaalbanden uit ERP-bestanden kunnen worden gelezen
zonder verder effect op andere ERP-middelen.
ANDERE COMPLICATIES
Een van de problemen met ERP in het CIF is wat er met anderen gebeurt
applicatiebronnen of ai gegevens van de ODS waaraan ze moeten bijdragen
datawarehouse maar ze maken geen deel uit van de ERP-omgeving. Datum de
gesloten karakter van ERP, vooral SAP, de poging om de
sleutels van externe bronnen van gegevens de gegevens die afkomstig zijn van het ERP al
tijd om te verhuizen i gegevens in datawarehouse, het is een grote uitdaging.
En wat zijn precies de kansen dat i gegevens van aanvragen of
ODS buiten de ERP-omgeving zal in de data worden geïntegreerd
magazijn? De kansen zijn eigenlijk heel hoog.
VINDEN GEGEVENS HISTORISCH UIT ERP
Een ander probleem met i gegevens van het ERP is het resultaat
vanuit de behoefte om te hebben gegevens historici binnen de datawarehouse.
meestal datawarehouse hij heeft nodig gegevens historici. EN
ERP-technologie slaat deze doorgaans niet op gegevens
historisch, althans niet voor zover dat in de datering nodig is
magazijn. Wanneer een grote hoeveelheid gegevens historici beginnen ad
toegevoegd moet worden aan de ERP-omgeving, dan moet die omgeving dat ook zijn
schoongemaakt. Stel bijvoorbeeld dat a datawarehouse moeten
worden geladen met vijf jaar gegevens historisch terwijl het ERP standhoudt
hiervan maximaal zes maanden gegevens. Zolang het bedrijf er maar tevreden mee is
een reeks verzamelen gegevens geschiedenis naarmate de tijd verstrijkt,
dan is er geen probleem om de ERP als bron voor de
datawarehouse. Maar wanneer de datawarehouse moet gaan
terug in de tijd en goden nemen gegevens historici die dat niet zijn geweest
eerder verzameld en opgeslagen door de ERP, daarna door de ERP-omgeving
het wordt inefficiënt.
ERP EN METADATA
Een andere overweging die u moet maken over ERP e datawarehouse het is dat
op bestaande metadata in de ERP-omgeving. Evenals metagegevens
ze verhuizen van de ERP-omgeving naar de del datawarehousede
metadata moeten op dezelfde manier worden verplaatst. Verder, ik
metadata moeten worden getransformeerd in formaat en structuur
vereist door de infrastructuur van de datawarehouse. Er is een grote
verschil tussen operationele metadata en DSS-metadata. De metagegevens
operationeel zijn vooral voor de ontwikkelaar en voor de
programmeur. DSS-metadata is in de eerste plaats voor jou bedoeld
de laatste. Bestaande metadata in ERP-applicaties of ODS'en
ze moeten worden omgezet en deze conversie is niet altijd gemakkelijk
en direct.
ZOEKEN VAN DE ERP-GEGEVENS
Als het ERP wordt gebruikt als leverancier van gegevens de datawarehouse ci
moet een solide interface zijn die i beweegt gegevens uit de omgeving
ERP voor het milieu datawarehouse. De interface moet:
▪ gemakkelijk te gebruiken zijn
▪ toegang verlenen tot gegevens van het ERP
▪ de betekenis oppikken van gegevens die op het punt staan ​​te worden verplaatst
in datawarehouse
▪ ken de beperkingen van het ERP die kunnen ontstaan
moment waarop toegang wordt verkregen gegevens van het ERP:
▪ referentiële integriteit
▪ hiërarchische relaties
▪ impliciete logische relaties
▪ toepassingsconventie
▪ alle structuren van gegevens ondersteund door het ERP, enzovoort...
▪ efficiënt zijn in de toegang gegevens, door aan te bieden:
▪ directe beweging van gegevens
▪ verandering verwerven gegevens
▪ ondersteunen van tijdige toegang tot gegevens
▪ begrijp het formaat van de gegevens, enzovoorts…
INTERFACE MET SAP
De interface kan van twee typen zijn: van eigen bodem of commercieel.
Enkele van de belangrijkste commerciële interfaces zijn:
▪ SAS
▪ Prime-oplossingen
▪ D2k, enzovoort…
MEERDERE ERP-TECHNOLOGIEËN
Het behandelen van de ERP-omgeving alsof het één enkele technologie is, is een
grote fout. Er zijn veel ERP-technologieën, elk met zijn eigen
sterke punten. De bekendste leveranciers op de markt zijn:
▪ SAP
▪ Oracle Financieel
▪ PeopleSoft
JD Edwards
▪ Banen
SAP
SAP is de grootste en meest uitgebreide ERP-software. De toepassingen
van SAP omvatten vele soorten toepassingen op vele gebieden. SAP heeft
de reputatie van:
▪ zeer groot
▪ zeer moeilijk en duur om te implementeren
▪ heeft veel mensen en adviseurs nodig
geïmplementeerd
▪ heeft gespecialiseerde mensen nodig voor de implementatie
▪ vergt veel tijd om te implementeren
SAP heeft ook de reputatie dat het zijn gegevens opslaat gegevens zeer
zorgvuldig, waardoor het moeilijk wordt om er toegang toe te krijgen
persoon buiten het SAP-gebied. De kracht van SAP is om
geschikt voor het vastleggen en opslaan van een grote hoeveelheid gegevens.
SAP heeft onlangs het voornemen aangekondigd om de
zijn toepassingen op datawarehouse. Er zijn veel voor- en nadelen
bij het gebruik van SAP als aanbieder van datawarehouse.
Een voordeel is dat SAP al is geïnstalleerd en dat het grootste deel van de
consultants kennen SAP al.
De nadelen van het hebben van SAP als leverancier van datawarehouse Sono
velen: SAP heeft geen ervaring in de wereld van datawarehouse
Als SAP de leverancier is van datawarehouse, het is noodzakelijk om “uit te schakelen”
i gegevens van SAP naar datawarehouse. Dato een SAP-trackrecord van
gesloten systeem, het is onwaarschijnlijk dat het gemakkelijk is om i vanuit SAP binnen te halen
Het (???). Er zijn veel oudere omgevingen die SAP aandrijven,
zoals IMS, VSAM, ADABAS, ORACLE, DB2, enzovoort.
SAP dringt aan op een ‘niet hier uitgevonden’-aanpak. SAP wil dat niet
samen te werken met andere leveranciers om de datawarehouse.
SAP staat erop alle software zelf te genereren.
Hoewel SAP een groot en machtig bedrijf is, is het een feit
poging om de technologie van ELT, OLAP, beheer van te herschrijven
systeem en zelfs de codebase van het dbm's het is gewoon krankzinnig.
In plaats van een coöperatieve houding aan te nemen met leveranciers
di datawarehouse SAP heeft al lang deze aanpak gevolgd
zij “weten het het beste”. Deze houding houdt het succes tegen
SAP heeft mogelijk op het gebied van datawarehouse.
De weigering van SAP om externe leveranciers toegang te verlenen
snel en gracieus naar hen toe gegevens. De essentie van gebruiken
un datawarehouse is gemakkelijk toegankelijk gegevens. Het hele verhaal van SAP is
gebaseerd op het moeilijk toegankelijk maken ervan gegevens.
Het gebrek aan ervaring van SAP met het omgaan met grote hoeveelheden gegevens;
op het gebied van datawarehouse er zijn volumes van gegevens sindsdien nooit meer gezien
SAP en het beheer van deze grote hoeveelheden gegevens je moet er een hebben
geschikte technologie. SAP is zich hier blijkbaar niet van bewust
technologische barrière die bestaat om het dataveld te betreden
magazijn.
De bedrijfscultuur van SAP: SAP heeft een bedrijf gecreëerd
bij het verkrijgen van ik gegevens uit het systeem. Maar om dit te doen moet je dat wel gedaan hebben
een andere mentaliteit. Traditioneel waren softwarebedrijven dat wel
goed in het verkrijgen van gegevens in een omgeving zijn er niet goed in geweest
gegevens de andere kant op laten gaan. Als SAP dit soort dingen kan doen
Switch zal het eerste bedrijf zijn dat dit doet.
Kortom, het is de vraag of een bedrijf moet selecteren
SAP als leverancier van datawarehouse. Er zijn zeer ernstige risico's
aan de ene kant en heel weinig beloningen aan de andere kant. Maar er is er nog een
reden die de keuze voor SAP als dataleverancier ontmoedigt
magazijn. Omdat elk bedrijf dezelfde datum zou moeten hebben
magazijn van alle andere bedrijven? De datawarehouse het is het hart
van het concurrentievoordeel. Als elk bedrijf hetzelfde zou adopteren
datawarehouse het zou moeilijk zijn, maar niet onmogelijk,
een concurrentievoordeel te behalen. SAP lijkt te denken dat a
datawarehouse kan gezien worden als een koekje en dat is een
nog een teken dat ze ‘de gegevens ophalen’
in".
Geen enkele ERP-leverancier is zo dominant als SAP.
Er zullen ongetwijfeld bedrijven zijn die de weg van SAP zullen inslaan
voor hen datawarehouse maar vermoedelijk dateren deze
SAP-magazijnen zullen groot en duur zijn en veel vereisen
tijd voor hun creatie.
Deze omgevingen omvatten activiteiten als de verwerking van bankbedienden,
reserveringsprocessen voor luchtvaartmaatschappijen, klachtenprocessen
verzekeringen, enzovoort. Het transactiesysteem was efficiënter,
duidelijker was de noodzaak van scheiding tussen operationeel en procesmatig
DSS (Beslissingsondersteunend Systeem). Echter, met bronsystemen
menselijk en persoonlijk, men heeft nooit te maken met grote hoeveelheden
transacties. En natuurlijk wanneer iemand wordt aangenomen
of het bedrijf verlaten. Dit is een registratie van een transactie.
Maar ten opzichte van andere systemen, HR-systemen en
contactadvertenties hebben gewoon niet veel transacties. Daarom, binnen
op het gebied van personeelszaken en personeelssystemen is het niet helemaal duidelijk dat dit zo is
een DataWarehouse nodig. In veel opzichten deze systemen
vertegenwoordigen de eenwording van DSS-systemen.
Maar er is nog een andere factor waarmee rekening moet worden gehouden als het moet
doen met datawarehouse en met PeopleSoft. In veel kringen heb ik gegevens
HR en persoonlijke hulpbronnen zijn ondergeschikt aan het bedrijfsleven
hoofd van het bedrijf. De meeste bedrijven presteren
productie, verkoop, dienstverlening enzovoort. DE
HR- en personeelssystemen zijn doorgaans secundair (of van secundair belang).
ondersteuning) voor de hoofdactiviteit van het bedrijf. Daarom is het
dubbelzinnig en ongemakkelijk a datawarehouse apart voor de
ondersteuning van menselijke en persoonlijke hulpbronnen.
PeopleSoft verschilt in dit opzicht heel erg van SAP. Met SAP is dat wel het geval
verplicht dat er een datawarehouse. Bij PeopleSoft is dat niet het geval
dan zo duidelijk. Een datawarehouse is optioneel bij PeopleSoft.
Het beste dat kan worden gezegd voor de gegevens PeopleSoft is dat de gegevens
magazijn kan worden gebruikt om i gegevens gerelateerd aan
oude menselijke en persoonlijke hulpbronnen. Een tweede reden voor de
waarvan een bedrijf gebruik wil maken datawarehouse a
nadeel van de PeopleSoft-omgeving is het toestaan ​​van toegang en
gratis toegang tot analysetools, ai gegevens van PeopleSoft. Maar
Naast deze redenen kunnen er gevallen zijn waarin het beter is dit niet te doen
hebben een datawarehouse voor gegevens MensenZacht.
In samenvatting
Er zijn veel ideeën over de constructie van gegevens
magazijn binnen een ERP-software.
Enkele hiervan zijn:
▪ Het is zinvol om een datawarehouse die er op lijkt
anders in de branche?
▪ Hoe flexibel een ERP is datawarehouse software?
▪ Een ERP datawarehouse software kan een volume van
gegevens die is gevestigd in eendatawarehouse arena"?
▪ Wat is de trace logging waarvan de ERP-leverancier gebruik maakt
geconfronteerd met gemakkelijke en goedkope, tijdrovende, ai gegevens? (Wat
is het trackrecord van ERP-leveranciers op het gebied van de levering van goedkope, on
tijd, gemakkelijk toegang tot gegevens?)
▪ Wat is het begrip van de DSS-architectuur en de
"bedrijfsinformatiefabriek" door de ERP-leverancier?
▪ ERP-leveranciers begrijpen hoe ze dit kunnen bereiken gegevens binnen
van het milieu, maar ook begrijpen hoe u deze kunt exporteren?
▪ Hoe open staat de leverancier van het ERP voor datatools
opslag?
Al deze overwegingen moeten in aanmerking worden genomen bij het bepalen
waar moet je de datawarehouse die i zal hosten gegevens van het ERP en anderen
gegevens. In het algemeen, tenzij daar een dwingende reden voor is
om anders te doen, wordt aanbevolen om te bouwen datawarehouse uit
vanuit de ERP-leveranciersomgeving.
HOOFDSTUK 1
Overzicht van de BI-organisatie
Hoofdpunten:
Informatieopslagplaatsen werken op de tegenovergestelde manier
naar business intelligence (BI)-architectuur:
Bedrijfscultuur en IT kunnen het succes beperken
het bouwen van BI-organisaties.
Technologie is niet langer de beperkende factor voor BI-organisaties. De
Het probleem voor architecten en projectplanners is niet of de
technologie bestaat, maar als ze deze effectief kunnen implementeren
beschikbare technologie.
Voor veel bedrijven a datawarehouse het is weinig meer dan een aanbetaling
passief die verdeelt i gegevens aan gebruikers die het nodig hebben. DE gegevens
ze worden uit bronsystemen gehaald en in doelstructuren geplaatst
di datawarehouse. De gegevens ze kunnen ook met het geheel schoongemaakt worden
fortuin. Er wordt echter ook geen extra waarde toegevoegd
verzameld door gegevens tijdens dit proces.
In wezen levert de passieve Dw op zijn best resultaten op
alleen ik gegevens schoon en operationeel voor gebruikersverenigingen. Daar
informatiecreatie en analytisch begrip zijn hiervan afhankelijk
volledig door gebruikers. Beoordelen of de DW (Gegevens magazijn)
succes is subjectief. Als we succes beoordelen op de
vermogen om efficiënt te verzamelen, integreren en opschonen i gegevens
zakelijk op een voorspelbare basis, dan is de DW inderdaad een succes.
Aan de andere kant, als we kijken naar de verzameling, consolidatie en lo
exploitatie van informatie door de organisatie als geheel
de DW is een mislukking. Een DW biedt weinig of geen waarde
informatie. Als gevolg hiervan worden gebruikers gedwongen het te doen,
waardoor er silo’s van informatie ontstaan. Dit hoofdstuk presenteert
een uitgebreid overzicht van de architectuur van BI(Business
Intelligence) van de bedrijven. Laten we beginnen met een beschrijving van BI en
dan gaan we verder met de discussies over het ontwerp en de
ontwikkeling van informatie, in tegenstelling tot het simpelweg verstrekken van i gegevens
aan gebruikers. De discussies zijn dan gericht op de berekening van de
waarde van uw BI-inspanningen. We sluiten af ​​door te definiëren hoe IBM
herinnert aan de BI-architectuurvereisten van uw organisatie.
Architectuurbeschrijving van
BI-organisatie
Krachtige transactiegerichte informatiesystemen zijn dat nu
op de agenda van elke grote onderneming, naarmate ze meer niveau bereiken
feitelijk het speelveld voor bedrijven in de wereld.
Om concurrerend te blijven zijn nu echter analytische systemen nodig
daarop gericht kan een revolutie teweegbrengen in de capaciteiten van het bedrijf door ed te herontdekken
gebruikmaken van de informatie die ze al hebben. Deze systemen
analytische voortkomen uit begrip van de rijkdom van gegevens
beschikbaar. BI kan de prestaties van alle informatie verbeteren
van de onderneming. Bedrijven kunnen de klant-tot-klantrelatie verbeteren
leveranciers, de winst van producten en diensten verbeteren, genereren
nieuwe en beste aanbiedingen, controleer risico's en vele anderen
de winsten hebben de kosten dramatisch verlaagd. Met BI van jou
bedrijf begint eindelijk klantinformatie te gebruiken
als een concurrentievoordeel dankzij toepassingen die doelstellingen hebben
markt.
Als u over de juiste zakelijke middelen beschikt, betekent dit dat u definitieve antwoorden heeft
belangrijke vragen als:
▪ Welke van de onze klanten ze zorgen ervoor dat we meer verdienen, of daar
verliezen ze?
▪ Waar onze besten wonen klanten in relatie tot winkel/
magazijn waar ze vaak komen?
▪ Welke van onze producten en diensten kunnen meer verkocht worden
effectief en aan wie?
▪ Welke producten kunnen het meest effectief verkocht worden en aan wie?
▪ Welke verkoopcampagne is succesvoller en waarom?
▪ Welke verkoopkanalen zijn voor welke producten het meest effectief?
▪ Hoe we de relaties met de besten kunnen verbeteren klanten?
De meeste bedrijven hebben dat wel gegevens ruw te beantwoorden
deze vragen.
Operationele systemen genereren grote hoeveelheden producten
klant en van gegevens van de markt via verkooppunten, via reserveringen,
van de klantenservice en technische ondersteuningssystemen. De uitdaging is
deze informatie te extraheren en te exploiteren.
Veel bedrijven profiteren slechts van kleine fracties van hun eigen inkomsten gegevens
voor strategische analyses.
I gegevens resterende, vaak gecombineerd met i gegevens het afleiden van externe bronnen zoals i
“Overheidsrapporten” en andere gekochte informatie zijn er één van
goudmijn die wacht om ontdekt te worden, ei gegevens moet
alleen verfijnd worden in de informatiecontext van jou
organisatie.
Deze kennis kan op verschillende manieren, variaties, worden toegepast
van het ontwerpen van een algemene bedrijfsstrategie tot
persoonlijke communicatie met leveranciers, via callcenters,
facturering, Internet en andere punten. Het huidige zakelijke klimaat dicteert
dat DW en aanverwante BI-oplossingen verder evolueren
de uitvoering van traditionele structuren van gegevens zoals ik gegevens genormaliseerd naar
atomair niveau en “ster/kubusboerderijen”.
Wat nodig is om concurrerend te blijven is een fusie van
traditionele en geavanceerde technologieën in een poging om a
uitgestrekt analytisch landschap.
Ten slotte moet de algemene omgeving de kennis verbeteren
van de onderneming als geheel, waarbij ervoor wordt gezorgd dat de ondernomen acties worden uitgevoerd
als gevolg van uitgevoerde analyses komen ze van pas, zodat iedereen dat is
voordeel.
Stel dat u uw eigen rangschikking heeft klanten in de categorieën
hoog of laag risico.
Of deze informatie wordt gegenereerd door een mijnbouwmodel of
op andere manieren moet het in de Dw worden geplaatst en toegankelijk worden gemaakt
iedereen, door middel van welke toegang dan ook, zoals i
statische rapporten, spreadsheets, tabellen of analytische verwerking in
lijn (OLAP).
Momenteel is er echter veel van dit soort informatie
ze blijven in de silo's van gegevens van de individuen of afdelingen die zij genereren
de analyse. De organisatie als geheel heeft weinig tot geen zichtbaarheid
voor begrip. Alleen door dit soort inhoud te mixen
informatie in uw onderneming waar u de silo's van kunt elimineren
informatie en verbeter uw Dw-omgeving.
Er zijn twee belangrijke hindernissen bij het ontwikkelen van een organisatie
van de BI.
Ten eerste hebben we het probleem van de organisatie zelf
van de bijbehorende discipline.
Zelfs als we niet kunnen helpen met beleidswijzigingen
van de organisatie, kunnen we helpen de componenten ervan te begrijpen
een BI-organisatie, haar architectuur en hoe
IBM-technologie vergemakkelijkt de ontwikkeling ervan.
De tweede barrière die moet worden overwonnen, is het gebrek aan technologie
geïntegreerd en kennis van een methode die de hele ruimte oproept
van BI, in plaats van slechts een klein onderdeel.
IBM reageert op technologische veranderingen
van geïntegreerd. Het is uw verantwoordelijkheid om een ​​ontwerp aan te leveren
zelfbewust. Deze architectuur moet worden ontwikkeld met
technologie gekozen voor integratie zonder beperkingen, of op zijn minst met
technologie die voldoet aan open standaarden. Ook de jouwe
Het bedrijfsmanagement moet ervoor zorgen dat Bi's onderneming dat is
uitgevoerd volgens het programma en niet toestaan
ontwikkeling van informatiesilo’s die voortkomen uit zelfbediening
agenda’s of doelen.
Dit wil niet zeggen dat de BI-omgeving er niet gevoelig voor is
reageren op de verschillende behoeften en eisen van verschillende gebruikers; in plaats daarvan betekent het
dat de implementatie van die individuele behoeften en eisen is
ten behoeve van de gehele BI-organisatie.
Een beschrijving van de BI-architectuur van de organisatie kan
vindt u op pagina 9 in figuur 1.1 De architectuur demonstreert
een rijke mix van technologieën en technieken.
Vanuit traditioneel perspectief omvat de architectuur de volgende componenten
van magazijn
Atomaire laag (Atoomlaag).
Dit is de basis, het hart van de hele Dw en dus van
strategische rapportage.
I gegevens hier opgeslagen zal de historische integriteit behouden, rapporten van
gegevens en de afgeleide metriek bevatten, maar ook schoon zijn,
geïntegreerd en opgeslagen met behulp van de mining-sjablonen.
Al het latere gebruik hiervan gegevens en gerelateerde informatie is
afgeleid van deze structuur. Dit is een uitstekende bron voor
extractie van gegevens en voor rapporten met gestructureerde SQL-query's
Operationeel magazijn van gegevens of rapporteer basis van
gegevens(Operational data store (ODS) of rapportage
databank.)
Dit is een structuur van gegevens speciaal ontworpen voor
technische rapportage.
I gegevens opgeslagen en gerapporteerd boven deze structuren kan eindelijk
verspreiden naar het magazijn via stagingzone (staging
gebied), waar het zou kunnen worden gebruikt voor strategische signalering.
Verzamelplaats.
Voor de meesten de eerste stop gegevens bedoeld voor het milieu van
magazijn is de organisatiezone.
Hier Ik gegevens worden geïntegreerd, opgeschoond en omgevormd tot gegevens handig dat
zij zullen de magazijnstructuur vullen
Datum marts.
Dit deel van de architectuur vertegenwoordigt de structuur van gegevens gebruikt
specifiek voor OLAP. De aanwezigheid van datamarts, als i gegevens Sono
opgeslagen in de sterschema's die ze overlappen gegevens
multidimensionaal in een relationele omgeving, of in archiefkasten
di gegevens bedrijfseigen gebruikt door specifieke OLAP-technologie, zoals de
DB2 OLAP-server is niet relevant.
De enige beperking is dat de architectuur het gebruik van faciliteert gegevens
multidimensionaal.
De architectuur omvat ook kritische Bi-technologieën en -technieken
die zich onderscheiden als:
Spatiële analyse
De ruimte is een informatiemeevaller voor de analist en
het is van cruciaal belang voor een volledige resolutie. Ruimte kan
vertegenwoordigen de informatie van mensen die in een bepaald gebied wonen
locatie, evenals informatie over waar die locatie zich bevindt
fysiek vergeleken met de rest van de wereld.
Om deze analyse uit te voeren, moet u beginnen met het koppelen van de uwe
lengte- en breedtegraadcoördinaatinformatie. Betekent wat
wordt “geocodering” genoemd en moet deel uitmaken van de extractie,
transformatie, en van het proces van laden (ETL) naar het niveau
atoomnummer van uw magazijn.
Datamining.
De extractie van gegevens stelt onze bedrijven in staat om te groeien
aantal klanten, om verkooptrends te voorspellen en mogelijk te maken
relatiebeheer met klanten (CRM), naast andere initiatieven van de
BI.
De extractie van gegevens het moet daarom worden geïntegreerd met de structuren van
gegevens van het Dwhouse en ondersteund door magazijnprocessen voor
zowel het effectieve als het efficiënte gebruik van technologie vaststellen
gerelateerde technieken.
Zoals aangegeven in de BI-architectuur, is het atomaire niveau van de
Dwhouse is, net als datamarts, een uitstekende bron van gegevens
voor extractie. Diezelfde structuren moeten dat ook zijn
ontvangers van extractieresultaten om de beschikbaarheid ervan te garanderen
grootste publiek (breedste publiek).
Agenten.
Er zijn verschillende "agenten" om de klant op elk punt te screenen, bijvoorbeeld:
bedrijfsbesturingssystemen en de dw zelf. Deze agenten kunnen dat
geavanceerde neurale netwerken zijn die zijn opgeleid om meer over te leren
trends van elk punt, zoals de toekomstige vraag naar producten
over verkooppromoties, op regels gebaseerde motoren om op te reageren
un dato reeks omstandigheden, of zelfs eenvoudige agenten die dat doen
zij wijzen op de uitzonderingen op de “topmanagers”. Deze processen ja
doorgaans in realtime aanwezig en daarom noodzakelijk
nauw verbonden zijn met hun beweging gegevens.
Al deze structuren van gegevens, technologieën en technieken garanderen
dat je de nacht niet doorbrengt met het genereren van een organisatie van de
jouw BI.
Deze activiteit zal in kleine stapjes worden ontwikkeld
punten.
Elke stap is een op zichzelf staande projectinspanning en wordt gerapporteerd
als iteratie in uw dw- of BI-initiatief. De iteraties
kan de implementatie van nieuwe technologieën omvatten
Begin met nieuwe technieken, voeg nieuwe structuren toe gegevens ,
laden ik gegevens aanvullende , of met de analyse-uitbreiding van de
jouw omgeving. Deze paragraaf wordt verder besproken
gedetailleerd in hoofdstuk 3.
Naast de traditionele structuren van Dw- en Bi-tools zijn er nog andere
functies van uw BI-organisatie die u verschuldigd bent
ontwerp, zoals:
Klantcontactpunten (Klantcontact
punten).
Zoals bij elke moderne organisatie zijn er een aantal
klantcontactpunten die aangeven hoe je een ervaring kunt beleven
positief voor de jouwe klanten. Er zijn de traditionele kanalen zoals i
handelaars, telefonisten, direct mail, multimedia en print
reclame, evenals de meest actuele kanalen zoals e-mail en internet, d.w.z gegevens
producten met een bepaald contactpunt moeten worden aangeschaft,
getransporteerd, schoongemaakt, getransformeerd en vervolgens bevolkt in structuren van gegevens van
BI.
Basis van gegevens operationele en gebruikersverenigingen (Operationeel
databases en gebruikersgemeenschappen).
Aan het einde van de contactpunten van de klanten de fundamenten zijn gevonden gegevens
van de applicatie- en gebruikersgemeenschappen van het bedrijf. DE gegevens bestaande
Sono gegevens traditionele die moet worden samengebracht en samengevoegd met de gegevens dat
ze vloeien voort uit de contactpunten om het noodzakelijke te vervullen
informatie.
analisten. (analisten)
De voornaamste begunstigde van de BI-omgeving is de analist. Hij is het die
profiteert van de huidige winning van gegevens operationeel, geïntegreerd met
verschillende bronnen van gegevens , aangevuld met functies zoals analyses
geografisch (geocodering) en gepresenteerd in BI-technologieën die
maken mining, OLAP en geavanceerde SQL-rapportage en -analyse mogelijk
geografisch. De primaire interface voor de analist naar de omgeving
rapportage is het BI-portaal.
De analist is echter niet de enige die profiteert van de architectuur van de
BI.
Leidinggevenden, grote gebruikersverenigingen en zelfs leden, leveranciers en i
klanten zouden voordelen moeten vinden in enterprise BI.
Terugvoerlus.
BI-architectuur is een leeromgeving. Een principe
Kenmerkend voor ontwikkeling is het mogelijk maken van blijvende structuren gegevens
te worden bijgewerkt door gebruikte BI-technologie en door acties
gebruikersondernemingen. Een voorbeeld is de evaluatie van
klant (klantscore).
Als de verkoopafdeling een mijnbouwmodel uitvoert
van de klantenscores wil graag een nieuwe dienst gebruiken, dan is de
De verkoopafdeling mag niet de enige begunstigde groep zijn
van de service.
In plaats daarvan moet het mijnbouwmodel als onderdeel worden uitgevoerd
aard van de datastroom binnen het bedrijf en de scores van de klant
moet een geïntegreerd onderdeel worden van de informatieomgeving van de
magazijn, zichtbaar voor alle gebruikers. De Bi-bI-centrische IBM Suite
inclusief DB2 UDB, DB2 OLAP Server bevat de meeste
onderdeel van de belangrijke componenten van de technologie, gedefinieerd in de figuur
1.1.
We gebruiken de architectuur zoals deze in deze boekfiguur verschijnt
geef ons een niveau van continuïteit en laat zien hoe elk product werkt
van IBM passen in het algemene patroon van BI.
Het verstrekken van informatie-inhoud (Providing
informatieve inhoud)
Ontwerp, ontwikkel en implementeer uw BI-omgeving
een zware taak. Het ontwerp moet beide omvatten
huidige en toekomstige zakelijke vereisten. Het architectonisch ontwerp
moet compleet zijn en alle gevonden conclusies omvatten
tijdens de ontwerpfase. De executie moet blijven
toegewijd aan één enkel doel: het ontwikkelen van de architectuur van BI
zoals formeel weergegeven in de tekening en gebaseerd op de vereisten van
bedrijf.
Het is bijzonder moeilijk te beweren dat discipline de veiligheid zal garanderen
relatief succes.
Dit is eenvoudig omdat je niet voor iedereen een BI-omgeving bouwt
plotseling, maar het gebeurt in kleine stapjes in de loop van de tijd.
Het identificeren van de BI-componenten van uw architectuur is dat wel
belangrijk om twee redenen: U begeleidt alle daaropvolgende beslissingen
architectuur technieken.
Je kunt bewust een bepaald gebruik van technologie ontwerpen
ook al krijg je misschien geen herhaling die het nodig heeft
technologie voor enkele maanden.
Het voldoende begrijpen van uw zakelijke vereisten zal het type beïnvloeden
van producten die u aanschaft voor uw architectuur.
De planning en ontwikkeling van uw architectuur zorgen ervoor
dat uw magazijn is
geen willekeurige gebeurtenis, maar eerder een "goed doordachte",
zorgvuldig opgebouwde advertentie opera van kunst als een mozaïek van
gemengde technologie.
Informatie-inhoud ontwerpen
Al het initiële ontwerp moet zich richten op en identificeren van de
belangrijkste BI-componenten die uw omgeving nodig heeft
algemeen in het heden en in de toekomst.
Het kennen van de zakelijke vereisten is belangrijk.
Nog voordat alle formele planning begint, wordt de
projectplanner kan er vaak een of twee identificeren
onderdeel meteen.
De balans van componenten die nodig kunnen zijn voor de
jouw architectuur is echter niet gemakkelijk te vinden.
Tijdens de ontwerpfase wordt het grootste deel van de architectuur uitgevoerd
bindt de applicatie-ontwikkelingssessie (JAD) tijdens een zoekopdracht
om zakelijke vereisten te identificeren.
Soms kunnen deze eisen worden uitbesteed aan tools
vragen en rapportage.
Gebruikers geven bijvoorbeeld aan dat ze willen automatiseren
momenteel moet een rapport handmatig worden geïntegreerd
twee stroomverhoudingen en het optellen van de daaruit afgeleide berekeningen
combinatie van gegevens.
Hoewel deze vereiste eenvoudig is, definieert deze een bepaalde eis
functionaliteit van de functie die u wanneer moet opnemen
koop rapportagetools voor de organisatie.
Ook moet de ontwerper aanvullende eisen stellen
krijg een compleet beeld. Gebruikers willen zich abonneren
dit verslag?
De subsets van het rapport worden gegenereerd en via e-mail naar de verschillende verzonden
gebruikers? Wilt u dit rapport inzien in het bedrijfsportaal?
Al deze vereisten maken deel uit van de eenvoudige noodzaak om
vervang een handmatig rapport zoals gevraagd door gebruikers. Het voordeel
van dit soort eisen is dat iedereen, zowel gebruikers als ontwikkelaars, heeft
inzicht in het concept van rapporten.
Er zijn echter nog andere soorten bedrijven waar we rekening mee moeten houden.
Wanneer zakelijke vereisten worden vermeld in de vorm van
Bedrijfsstrategische vragen, voor de ervaren planner is het makkelijk
onderscheid maken tussen dimensie- en maat-/feitvereisten.
Figuur 1.2 illustreert de grootte en dimensionale componenten van a
zakelijk probleem.
Als JAD-gebruikers niet weten hoe ze hun vereisten moeten declareren
in de vorm van een zakelijk probleem zal de ontwerper vaak leveren
voorbeelden voor het overslaan van de gegevensverzamelingssessie
eisen.
De deskundige ontwerper kan gebruikers helpen niet alleen de
strategische handel, maar ook hoe deze vorm te geven.
De benadering van het verzamelen van eisen wordt besproken in hoofdstuk 3; Voor
nu willen we alleen maar wijzen op de noodzaak om voor iedereen te ontwerpen
de soorten BI-vereisten
Een strategisch bedrijfsvraagstuk is niet alleen een vereiste
Zakelijk, maar ook een ontwerpaanwijzing. Als je moet antwoorden
op een multidimensionale vraag, dan moet je het onthouden,
indienen ik gegevens dimensionaal, en als je nodig hebt om de te onthouden
gegevens multidimensionaal, je moet beslissen wat voor soort technologie of
techniek die je gaat gebruiken.
Implementeert u een gereserveerd kubussterrenschema, of beide?
Zoals u kunt zien, zelfs een eenvoudig zakelijk probleem
kan het ontwerp aanzienlijk beïnvloeden. Echter
Dit soort zakelijke vereisten zijn natuurlijk op zijn minst gewoon
door ervaren projectplanners en ontwerpers.
Er is genoeg discussie geweest over de technologieën en de ondersteuning ervan
OLAP en een grote verscheidenheid aan oplossingen zijn beschikbaar. Tot nu
we noemden de noodzaak om eenvoudige rapportage samen te brengen met i
vereisten voor de bedrijfsomvang, en hoe deze vereisten zijn
invloed hebben op technische architectonische beslissingen.
Maar wat zijn de vereisten die niet gemakkelijk worden begrepen?
door gebruikers of door het Dw-team? Je zult de analyse ooit nodig hebben
ruimtelijk (ruimtelijke analyse)?
De mijnbouwmodellen van gegevens ze zullen een noodzakelijk onderdeel van jou zijn
toekomst? Wie weet?
Het is belangrijk op te merken dat dit soort technologieën niet veel zijn
bekend bij de algemene gebruikersgemeenschappen en teamleden van
Dw, gedeeltelijk kan dit gebeuren omdat ze doorgaans
worden afgehandeld door een aantal interne technische experts of externe technische experts. Het is een
grensgeval van de problemen die dit soort technologieën met zich meebrengen. Zelf
gebruikers kunnen de zakelijke vereisten niet beschrijven of inlijsten
om ontwerpers richtlijnen te geven, kunnen ze dat doen
onopgemerkt blijven of, erger nog, eenvoudigweg genegeerd worden.
Problematischer wordt het als de ontwerper en ontwikkelaar falen
kan de toepassing van een van deze geavanceerde maar herkennen
kritische technologieën.
Zoals we ontwerpers vaak hebben horen zeggen: “nou, waarom
Leggen we het niet opzij totdat we dat andere ding hebben?
“Zijn ze oprecht geïnteresseerd in prioriteiten, of vermijden ze simpelweg i
vereisten die ze niet begrijpen? Het is zeer waarschijnlijk de laatste veronderstelling.
Stel dat uw verkoopteam een ​​vereiste heeft gecommuniceerd
van het bedrijfsleven, zoals weergegeven in figuur 1.3, zoals u kunt zien, de
De eis wordt geformuleerd in de vorm van een bedrijfsprobleem. Daar
Het verschil tussen dit probleem en het typische dimensionale probleem is
de afstand. In dit geval wil het verkoopteam weten:
op maandbasis de totale omzet uit producten, magazijnen en
klanten die binnen een straal van 5 km van het magazijn wonen waar ze wonen
zij kopen.
Helaas kunnen ontwerpers of architecten dat gewoon doen
negeer de ruimtelijke component door te zeggen: “we hebben de klant, de
product en ik gegevens van de aanbetaling. Wij houden afstand tot
nog een iteratie.
‘Verkeerd antwoord. Dit soort zakelijke problemen betreft
geheel BI. Het vertegenwoordigt een dieper begrip van de
ons bedrijf en een robuuste analytische ruimte voor onze analisten.
BI gaat verder dan alleen eenvoudige bevragingen of standaardrapportage
zelfs OLAP. Dit wil niet zeggen dat deze technologieën falen
ze zijn belangrijk voor uw BI, maar op zichzelf zijn ze dat niet
de BI-omgeving.
Ontwerp voor informatiecontext
(Ontwerp voor informatie-inhoud)
Nu we de zakelijke vereisten hebben geïdentificeerd die opvallen
verschillende fundamentele componenten moeten in een ontwerp worden opgenomen
algemeen architectonisch. Een deel van de BI-componenten maakt deel uit
van onze initiële inspanningen, terwijl sommige niet zullen worden uitgevoerd
aantal maanden.
Alle bekende eisen zijn echter terug te vinden in het ontwerp, zodat
als we een bepaalde technologie moeten implementeren, doen we dat ook
maak je klaar om het te doen. Iets aan het project zal de gedachte weerspiegelen
Traditional.
Figuur 1.1, aan het begin van het hoofdstuk, toont bijvoorbeeld een gegevens
mart die handhaaft i gegevens dimensionaal.
Deze set van gegevens wordt gebruikt om later gebruik van te ondersteunen
gegevens dimensionaal gedreven door zakelijke kwesties
wij hebben geïdentificeerd. Zoals de aanvullende documenten
gegenereerd, zoals de ontwerpontwikkeling van gegevens, wij
we zullen beginnen te formaliseren hoe i gegevens ze verspreiden zich in het milieu.
We hebben de noodzaak vastgesteld om i gegevens dus
dimensionaal, waarbij ze worden onderverdeeld (volgens specifieke behoeften).
bepaald) op datamarts.
De volgende vraag die moet worden beantwoord, is hoe ze zullen worden gebouwd
deze datamarts?
Bouw je de sterren om de kubussen te ondersteunen, of alleen kubussen, of alleen de sterren?
(of rechterblokjes, of rechtersterren). Genereer de architectuur voor de gegevens
afhankelijke markten die voor iedereen een atomaire laag nodig hebben gegevens
verwerf je? Laat onafhankelijke datamarts i verwerven gegevens
rechtstreeks van besturingssystemen?
Welke kubustechnologie ga je proberen te standaardiseren?
Je hebt enorme hoeveelheden goden gegevens vereist voor dimensionale analyse
of heeft u de kubussen van uw nationale verkoopteam nodig?
wekelijks of allebei? Bouw een krachtig item
zoals DB2 OLAP Server for Finance of Cognos Cubes
PowerPlay voor uw verkooporganisatie of allebei?
Dit zijn de grote architectonische ontwerpbeslissingen die genomen moeten worden
ze zullen in de toekomst uw BI-omgeving beïnvloeden. Ja,
u heeft vastgesteld dat er behoefte is aan OLAP. Hoe ga je dat nu uitvoeren
soort techniek en technologie?
Hoe enkele van de meest geavanceerde technologieën de jouwe beïnvloeden
tekeningen? Laten we aannemen dat u een behoefte heeft geïdentificeerd
ruimte in uw organisatie. Nu moet je bellen met de
edities van architecturale tekeningen, zelfs als ze niet gepland zijn
ruimtecomponenten uitvoeren gedurende enkele maanden. De architect moet
ontwerp vandaag op basis van wat nodig is. Anticipeer op de behoefte aan
ruimtelijke analyse die genereert, opslaat, uitvoert en levert
toegang tot gegevens ruimtelijk. Dit zou op zijn beurt moeten dienen als een
beperkingen met betrekking tot het type technologie en specificaties
softwareplatform dat u momenteel wellicht overweegt. Voor
bijvoorbeeld het administratiesysteem van database relationele
(RDBMS) die u voor uw atomaire laag moet uitvoeren
een robuuste ruimtelijke omvang beschikbaar. Dit zou ervoor zorgen dat de
maximale prestaties bij het gebruik van geometrie en objecten
ruimte in uw analytische toepassingen. Als uw RDBMS dat niet doet
kan omgaan met ik gegevens (ruimtelijk centraal) intern, dus dat zal wel moeten
vestigen een database (ruimtelijk centraal) extern. Dit bemoeilijkt de
probleembeheer en invloed hebben op uw algehele prestaties,
om nog maar te zwijgen van de extra problemen die voor de jouwe worden gecreëerd
DBA's, omdat ze waarschijnlijk een minimaal begrip hebben
van de fundamenten van gegevens ook ruimtelijk. Aan de andere kant, als uw motor
RDMBS verzorgt alle ruimtelijke componenten en aanverwanten
optimizer is zich bewust van speciale behoeften (bijvoorbeeld
indexering) van ruimtelijke objecten, dan kunnen uw DBA's dit aan
Beheer problemen snel en u kunt ze naar een hoger niveau tillen
prestaties.
Ook moet u het verzamelgebied en de laag aanpassen
van de atomaire omgeving, inclusief het opschonen van adressen (un
sleutelelement voor ruimtelijke analyse), evenals het volgende
ruimtevoorwerpen opslaan. De opeenvolging van edities van
Het tekenen gaat door nu we het begrip schoonmaken hebben geïntroduceerd
adres. Om te beginnen zal deze applicatie het type dicteren
benodigde software voor uw ETL-inspanningen.
Om u van een adres te voorzien, heeft u producten als Trillium nodig
clean, of een ETL-leverancier van uw keuze om dat te leveren
functionaliteit?
Voor nu is het belangrijk dat je de standaard van het ontwerp waardeert
moet worden voltooid voordat u begint met de implementatie van uw programma
omgeving (magazijn). De bovenstaande voorbeelden zouden dat moeten doen
demonstreren de veelheid aan trekkingsbeslissingen die moeten volgen
de identificatie van een specifieke zakelijke vereiste. Als het klaar is
correct bevorderen deze ontwerpbeslissingen
de onderlinge afhankelijkheid tussen de fysieke structuren van je omgeving, de
selectie van de gebruikte technologie en de stroom van verspreiding van de
informatieve inhoud. Zonder deze conventionele architectuur
van BI krijgt uw organisatie te maken met een mix
chaotisch van bestaande technologieën, op zijn best verenigd op een bepaalde manier
onnauwkeurig om schijnbare stabiliteit te bieden.
Informatie-inhoud onderhouden
De waarde van informatie naar uw organisatie brengen is dat wel
een zeer moeilijke operatie. Zonder voldoende begrip
en ervaring, of een goede planning en ontwerp, zelfs de
betere teams zouden falen. Aan de andere kant, als je een geweldige hebt
intuïtie en gedetailleerde planning, maar geen discipline voor
uitvoering, je hebt gewoon je geld en tijd verspild
omdat je poging gedoemd is te mislukken. De boodschap moet
wees duidelijk: als u een of meer hiervan mist
vaardigheden, inzicht/ervaring of plannen/tekenen o
implementatiediscipline, dit zal leiden tot verlamming of
vernietig het gebouw van de BI-organisatie.
Is uw team voldoende voorbereid? Er is iemand bij je
BI-team dat het enorme beschikbare analytische landschap begrijpt
in BI-omgevingen, in de benodigde technieken en technologieën
om dat landschap te beïnvloeden? Er zit iemand in je team
die het verschil in toepassing tussen geavanceerd kan herkennen
statische rapportage en OLAP, of de verschillen tussen ROLAP en OLAP? Een van de
leden van uw team herkent duidelijk de weg van
extract en hoe dit het magazijn kan beïnvloeden of hoe
Kan het magazijn de mijnbouwprestaties ondersteunen? Een lid
van het team begrijpt de waarde van gegevens ruimte of technologie
agent gebaseerd? Heeft u iemand die de unieke toepassing weet te waarderen?
van ETL-tools tegen brokertechnologie
bericht? Als je het niet hebt, koop er dan een. BI is veel meer
groot van een genormaliseerde atomaire laag, van OLAP, van de schema's a
ster en een ODS.
Beschikken over het inzicht en de ervaring om vereisten te herkennen
van BI en hun oplossingen is essentieel voor jouw vaardigheden
de behoeften van gebruikers correct te formaliseren en te ontwerpen
en hun oplossingen implementeren. Als uw gebruikersgemeenschap dat heeft
moeilijkheid bij het beschrijven van de vereisten, het is de taak van het team van
magazijn biedt dat inzicht. Maar als het team van
magazijn
herkent de specifieke toepassing van BI – bijvoorbeeld data – niet
mining – dan is dit niet het beste wat BI-omgevingen doen
beperken zich vaak tot passieve stortingen. Negeer deze echter
technologieën doen niets af aan hun belang en het effect dat ze hebben
over de opkomst van eigen business intelligence-mogelijkheden
organisatie, maar ook de informatiestructuur die u ontwerpt
promoveren.
Bij de planning moet het begrip tekenen betrokken zijn, red
beide vereisen een competent individu. Bovendien ontwerpen
het vereist een teamfilosofie en observatie
van de normen. Als uw bedrijf bijvoorbeeld een
standaardplatform of heeft een bepaald RDBMS geïdentificeerd dat u
Als u het hele platform wilt standaardiseren, is dat onvermijdelijk
iedereen in het team houdt zich aan deze normen. Over het algemeen één
team legt de noodzaak van normalisatie bloot (voor gebruiker
communites), maar het team zelf wil zich niet bij de groep aansluiten
normen die ook op andere gebieden in het bedrijf of misschien zelfs in de onderneming worden gesteld
soortgelijke bedrijven. Dit is niet alleen hypocriet, maar het bevestigt ook dat het bedrijf dat niet doet
is in staat bestaande middelen en investeringen te benutten. Het betekent niet
dat er geen situaties zijn die een platform of een garanderen
niet-gestandaardiseerde technologie; echter de inspanningen van het magazijn
zou angstvallig de normen van de onderneming moeten bewaken
dat de zakelijke vereisten niet anders dicteren.
Het derde belangrijke onderdeel was nodig om een ​​BI te bouwen
organisatie is de discipline.
Het hangt in totaal zowel van individuen als van de omgeving af.
Projectplanners, sponsors, architecten en gebruikers moeten de
discipline die nodig is om de informatiestructuur van het bedrijf op te bouwen.
Ontwerpers moeten hun ontwerpinspanningen zo richten dat
andere noodzakelijke inspanningen in de samenleving voltooien.
Stel dat uw bedrijf bijvoorbeeld een
ERP-applicatie met een magazijncomponent.
Het is dus de verantwoordelijkheid van de ERP-ontwerpers om samen te werken met de
magazijnomgevingsteam om niet te concurreren of
dupliceer het reeds begonnen werk.
Ook discipline is een onderwerp waar je mee bezig moet zijn
door de hele organisatie en wordt doorgaans opgericht en toevertrouwd aan:
uitvoerend niveau.
Zijn leidinggevenden bereid zich te houden aan een ontworpen aanpak? A
aanpak die belooft informatie-inhoud te creëren
uiteindelijk zal het waarde toevoegen aan alle onderdelen van de onderneming, maar misschien
Brengt dit de individuele of afdelingsagenda in gevaar? Onthoud het gezegde
“Aan alles denken is belangrijker dan aan slechts één ding denken.”
Dit gezegde geldt voor BI-organisaties.
Helaas concentreren veel magazijnen hun inspanningen
die waarde wil toevoegen aan een bepaalde afdeling of een
specifieke gebruikers, met weinig aandacht voor organisatie
algemeen. Stel dat de manager hulp vraagt ​​aan het team van
weerhuis. Het team reageert met een taak van 90 dagen
omvat niet alleen de levering van de kennisgevingsvereisten gedefinieerd door de
manager, maar zorgt ervoor dat alles gegevens basis worden in het niveau gemengd
atomair voordat het werd geïntroduceerd in de kubustechnologie
voorstel.
Deze technische toevoeging zorgt ervoor dat de prestatie van
weerhuis zal profiteren gegevens nodig van de beheerder.
De directeur sprak hierover echter met externe adviesbureaus
hebben een soortgelijke toepassing voorgesteld met levering in minder dan 4
weken.
Ervan uitgaande dat het interne weerhuisteam competent is, zal de
leidinggevende heeft een keuze. Wie kan de discipline van ondersteunen
Er was extra techniek nodig om de put te bewerken
informatieve onderneming of kunnen ervoor kiezen om er zelf een te maken
oplossing snel. Dit laatste lijkt echt gekozen te zijn
te vaak en dient alleen om informatiecontainers te creëren
waarvan enkelen of het individu profiteren.
Doelen op korte en lange termijn
Architecten en projectplanners moeten een
langetermijnvisie op de algehele architectuur en plannen voor
groeien in een BI-organisatie. Deze combinatie van
winst op korte termijn en planning op lange termijn
vertegenwoordigen de twee gezichten van BI-inspanningen. Gewin op korte termijn
expiratie is het facet van BI dat wordt geassocieerd met iteraties van de
uw magazijn.
Dit is waar planners, architecten en sponsors zich op richten
voldoen aan specifieke zakelijke vereisten. Het is op dit niveau waar de
fysieke structuren worden gebouwd, technologie wordt aangeschaft en de
technieken worden geïmplementeerd. Ze zijn geenszins gemaakt om onder ogen te zien
specifieke vereisten zoals gedefinieerd door bepaalde gebruikersgemeenschappen.
Er wordt alles aan gedaan om aan de gedefinieerde specifieke eisen te voldoen
uit een bepaalde gemeenschap.
Langetermijnplanning is echter het andere facet
van BI. Dit is waar de plannen en ontwerpen ervoor zorgden dat dit zo was
welke fysieke structuur dan ook gebouwd, de geselecteerde technologieën en de
gerealiseerde technieken gemaakt met het oog op de onderneming. En de
langetermijnplanning die voor samenhang zorgt
noodzakelijk om ervoor te zorgen dat de zakelijke voordelen voor iedereen gelden
de gevonden kortetermijnwinsten.
Rechtvaardig uw BI-inspanning
Un datawarehouse op zichzelf heeft het geen inherente waarde. In andere
woorden: er is geen inherente waarde tussen de technologieën
magazijn- en implementatietechnieken.
De waarde van elke magazijninspanning zit in de acties
uitgevoerd als resultaat van de magazijnomgeving en inhoud
informatie die in de loop van de tijd is opgebouwd. Dit is een cruciaal punt om te begrijpen
voordat u ooit probeert de waarde van welk initiatief dan ook in te schatten
thuis.
Te vaak proberen architecten en planners waarde toe te passen
fysieke en technische componenten in het magazijn, terwijl dat in feite de waarde is
richt zich op bedrijfsprocessen die positief worden beïnvloed door de
magazijn en goed verworven informatie.
Hierin ligt de uitdaging voor het oprichten van BI: Hoe rechtvaardig je de investering?
Als het huis zelf geen intrinsieke waarde heeft, zeggen de ontwerpers van
project moet de voordelen onderzoeken, definiëren en formaliseren
bereikt door de personen waarvoor het magazijn wordt gebruikt
het verbeteren van specifieke bedrijfsprocessen of de waarde ervan
beschermde informatie of beide.
Om onderwerpen ingewikkelder te maken, elk bedrijfsproces
getroffen door magazijninspanningen, kunnen voordelen opleveren
‘aanzienlijk’ of ‘klein’. Aanzienlijke voordelen bieden een
tastbare maatstaf om het rendement op de investering (ROI) te meten – b.v
bijvoorbeeld door de voorraad tijdens een periode een extra keer om te draaien
specifiek of voor lagere transportkosten per zending. Het is meer
Het is moeilijk om de kleine voordelen, zoals verbeterde toegang tot, vast te stellen
informatie, in termen van tastbare waarde.
Verbind uw project om de
zakelijke verzoeken
Te vaak proberen projectontwerpers waarde aan elkaar te verbinden
van het magazijn met amorfe doelstellingen van de onderneming. dat verklaren
“De waarde van een magazijn is gebaseerd op ons vermogen om dat te doen
voldoen aan strategische verzoeken” openen wij op prettige wijze de
toespraak. Maar dat alleen is niet genoeg om te bepalen of dat zo is
de investering in het magazijn is zinvol. Het is beter om herhalingen met elkaar te verbinden
van magazijn met specifieke commerciële verzoeken en opmerkingen.
Meet de ROI
Het berekenen van de ROI in een magazijnomgeving kan dat wel zijn
bijzonder moeilijk. Het is vooral moeilijk als de leiding
Het principe van een bepaalde herhaling is iets ongrijpbaars of iets ongrijpbaars
gemakkelijk te meten. Uit een onderzoek is gebleken dat gebruikers waarnemen
de twee belangrijkste voordelen van BI-initiatieven:
▪ Creëer het vermogen om beslissingen te nemen
▪ Toegang tot informatie creëren
Deze voordelen zijn zachte (of milde) voordelen. Het is gemakkelijk te zien
hoe kunnen we een ROI berekenen op basis van een harde rand (o
groter) zoals de verlaging van de transportkosten, maar hoe
meten we het vermogen om betere beslissingen te nemen?
Dit is zeker een uitdaging voor projectplanners
ze proberen het bedrijf zover te krijgen dat het in één bepaald product investeert
magazijn inspanning. De omzet verhogen of de kosten verlagen
het zijn niet langer de centrale thema’s die de BI-omgeving aandrijven.
In plaats daarvan zoekt u naar toegang in zakelijke verzoeken
beste om de informatie zo te krijgen dat een bepaalde afdeling dat kan
sneller beslissingen nemen. Dit zijn strategische drijfveren
die even belangrijk zijn voor het bedrijf, maar dat ook wel zijn
dubbelzinniger en moeilijker te karakteriseren in een tastbare metriek.
In dit geval kan het berekenen van de ROI misleidend zijn, zo niet irrelevant.
Projectontwerpers moeten waarde kunnen aantonen
tastbaar voor leidinggevenden om te beslissen of de investering in
een bepaalde herhaling telt. Wij zullen echter geen nieuwe voorstellen
methode voor het berekenen van de ROI, noch zullen we een pro of argument maken
tegen het.
Er zijn veel artikelen en boeken beschikbaar waarin de basisprincipes worden besproken
ROI berekenen. Er zijn speciale waardeproposities zoals waarde
on Investment (VOI), aangeboden door groepen als Gartner, dat kan
onderzoeken. In plaats daarvan zullen we ons concentreren op de kernaspecten van elk
ROI of andere waardeproposities waarmee u rekening moet houden.
ROI toepassen
Naast het argument over ‘harde’ voordelen versus ‘zachte’ voordelen
In verband met BI-inspanningen zijn er nog andere zaken waarmee rekening moet worden gehouden
wanneer we ROI toepassen. Bijvoorbeeld:
Te veel besparingen toeschrijven aan de inspanningen van DW die zouden komen
echter
Stel dat uw bedrijf is overgestapt van een architectuur van
mainframe naar een gedistribueerde UNIX-omgeving. Dus wat dan ook
besparingen die door die inspanning al dan niet kunnen worden gerealiseerd
mag niet uitsluitend aan alle (?) worden toegeschreven
magazijn.
Niet alles verantwoorden is duur. En daar komen veel dingen bij kijken
rekening houden met. Beschouw de volgende lijst:
▪ Opstartkosten, inclusief haalbaarheid.
▪ Kosten van speciale hardware met bijbehorende opslag e
communicatie
▪ Kosten van de software, inclusief beheer ervan gegevens en uitbreidingen
client/server, ETL-software, DSS-technologieën, tools
visualisatie-, plannings- en stroomtoepassingen
werk- en trackingsoftware, .
▪ Ontwerpkosten structuur gegevens, met de realisatie, en
het optimaliseren van
▪ Softwareontwikkelingskosten die rechtstreeks verband houden met de inspanning
BI
▪ Kosten van thuisondersteuning, inclusief optimalisatie van
prestaties, inclusief softwareversiebeheer e
operaties helpen
Pas "Big-Bang" ROI toe.
De realisatie van het magazijn als één gigantische inspanning
gedoemd is te mislukken, dus bereken ook de ROI van een initiatief
van grote ondernemingen Het aanbod is verrassend, en dat vinden de ontwerpers ook
blijf zwakke pogingen ondernemen om de waarde van het geheel in te schatten
poging.
Omdat ontwerpers een geldwaarde proberen te geven
op het bedrijfsinitiatief als dit algemeen bekend en geaccepteerd is
Is het inschatten van specifieke herhalingen moeilijk? Hoe is het mogelijk? Het is niet
mogelijk op enkele uitzonderingen na. Doe het niet.
Nu we hebben vastgesteld wat we niet moeten doen bij het berekenen
ROI, er zijn enkele punten die ons zullen helpen bij het definiëren
een betrouwbaar proces om de waarde van uw BI-inspanningen in te schatten.
Het verkrijgen van ROI-consensus. Ongeacht de jouwe
De keuze van de techniek om de waarde van uw BI-inspanningen in te schatten, moet
worden goedgekeurd door alle partijen, inclusief projectontwerpers,
de sponsors en bedrijfsleiders.
Reduceer de ROI tot identificeerbare delen. Een noodzakelijke stap richting
Een redelijke berekening van een ROI is om die berekening te concentreren op:
specifiek project. Hiermee kunt u vervolgens een waarde schatten
op basis van specifieke zakelijke vereisten waaraan wordt voldaan
Definieer de kosten. Zoals gezegd moeten er tal van kosten zijn
beschouwd. Bovendien moeten de kosten niet alleen de daaraan verbonden kosten omvatten
aan de enkele iteratie, maar ook aan de bijbehorende kosten
om ervoor te zorgen dat de bedrijfsnormen worden nageleefd.
Definieer voordelen. ROI duidelijk koppelen aan vereisten
specifieke bedrijven, moeten we in staat zijn om de
voordelen die zullen leiden tot het voldoen aan de eisen.
Verlaag de kosten en baten bij dreigende winsten. Het is de weg
u kunt uw waarderingen het beste baseren op de netto contante waarde
(NPV) in plaats van te proberen de toekomstige waarde te voorspellen
toekomstige inkomsten.
Houd de timing van het splitsen van uw ROI tot een minimum beperkt. EN'
goed gedocumenteerd gedurende de lange periode dat het bij u is gebruikt
ROI.
Gebruik meer dan één ROI-formule. Er zijn talloze methoden voor
ROI-voorspelling en u moet plannen of u er een wilt gebruiken
plus, inclusief de netto contante waarde, de interne snelheid van het rendement
(IRR) en herstel.
Definieer een herhaalbaar proces. Dit is cruciaal bij het berekenen
enige langetermijnwaarde. Het moet worden gedocumenteerd a
één herhaalbaar proces voor alle deeltrajecten van projecten
volgen.
De genoemde problemen zijn de meest voorkomende problemen die door experts zijn gedefinieerd
van de weerhuisomgeving. Het aandringen van de kant van het management van
Het is erg verwarrend om een ​​“Big-Bang” ROI te krijgen. Als je alle
uw ROI-berekeningen door ze terug te brengen tot identificeerbare en tastbare stukken, dat heeft u gedaan
een goede kans om een ​​nauwkeurige ROI-waardering te schatten.
Vragen over ROI-voordelen
Wat uw voordelen ook zijn, zacht of hard, u kunt ze gebruiken
enkele basisvragen om de waarde ervan te bepalen. Naar
bijvoorbeeld met behulp van een eenvoudig schaalsysteem, van 1 tot 10, u
u kunt de impact van elke inspanning volgen met behulp van het volgende
vragen:
▪ Hoe beoordeelt u het begrip van gegevens dit volgen
project van uw bedrijf?
▪ Hoe schat u de procesverbeteringen als resultaat hiervan in?
dit project?
▪ Hoe zou u nu de impact van nieuwe inzichten en gevolgtrekkingen meten
beschikbaar gesteld door deze iteratie
▪ Wat is de impact geweest van nieuwe computeromgevingen e
presteren als gevolg van wat er is geleerd?
Als er maar weinig antwoorden op deze vragen zijn, is dat mogelijk
het bedrijf is de gedane investering niet waard. De vragen met een hoge
score wijst op aanzienlijke waardewinst en zou dat ook moeten doen
dienen als leidraad voor verder onderzoek.
Bijvoorbeeld een hoge score voor procesverbeteringen
het zou ontwerpers ertoe moeten aanzetten te onderzoeken hoe de processen zijn
verbeterd. Het kan zijn dat u een deel of alle winst behaalt
ze zijn tastbaar en daarom kan er gemakkelijk een geldwaarde worden verkregen
toegepast.
Haal het meeste uit de eerste iteratie van de
magazijn
Het grootste resultaat van uw zakelijke inspanningen zit vaak in de
eerste paar iteraties. Deze eerste pogingen traditioneel
de meest bruikbare informatie-inhoud voor het publiek vaststellen en
stelt technologische basissteun vast voor volgende projecten
BI-applicaties.
Meestal elke volgende deelreeks van gegevens van project
magazijnen brengen steeds minder toegevoegde waarde voor het bedrijf
algemeen. Dit geldt vooral als je niet itereert
nieuwe onderwerpen toevoegt of niet voldoet aan de behoeften van een nieuw onderwerp
gemeenschap van gebruikers.
Deze functie van opslaan is ook van toepassing op batterijen
groeien van gegevens historici. Omdat latere inspanningen meer vereisen
gegevens en hoe meer gegevens worden na verloop van tijd in het magazijn gegoten, de meeste
gegevens het wordt minder relevant voor de gebruikte analyse. Deze gegevens Sono
vaak genoemd gegevens slapend en het is altijd duur om ze te houden, omdat
ze worden bijna nooit gebruikt.
Wat betekent dit voor projectsponsors? In wezen, ik
Vroege sponsors delen meer over hoeveel de investeringskosten bedragen.
Dit is van primair belang omdat zij de aanzet vormen voor het stichten van de laag
brede technologische omgeving en magazijnmiddelen,
inclusief biologisch.
Maar deze eerste stappen brengen de hoogste waarde en dus de ontwerpers
projecten moeten vaak de investering rechtvaardigen.
Projecten die na uw BI-initiatief worden uitgevoerd, kunnen kosten met zich meebrengen
inferieur (vergeleken met de eerste) en direct, maar brengen minder waarde met zich mee
naar het bedrijf.
En eigenaren van organisaties moeten gaan nadenken
gooi de opeenhoping van weg gegevens en minder relevante technologieën.
Datamining: extractie Geven
Talrijke architecturale componenten vereisen variaties van
dataminingtechnologieën en -technieken –
bijvoorbeeld de verschillende "agenten" voor het onderzoeken van de aandachtspunten van de
klanten, de besturingssystemen van het bedrijf en voor de dw zelf. Deze
Agents kunnen geavanceerde neurale netwerken zijn waarop getraind wordt
pottrends, zoals de toekomstige vraag naar producten op basis van
verkooppromoties; op regels gebaseerde motoren voor
reageren op een set dato van omstandigheden, bijvoorbeeld een diagnose
medische en behandelaanbevelingen; of zelfs eenvoudige agenten
met de rol van het rapporteren van uitzonderingen aan senior managers (top
leidinggevenden). Over het algemeen zijn dit extractieprocessen gegevens si
in realtime verifiëren; daarom moeten ze verenigd zijn
volledig met de beweging van gegevens zichzelf.
Online analytische verwerking Verwerking
Online analyses
De mogelijkheid om te snijden, dobbelen, rollen en inzoomen
en voer de analyse uit
wat-als, valt binnen de reikwijdte en doelstelling van de suite
IBM-technologie. Bijvoorbeeld analytische verwerkingsfuncties
online (OLAP) bestaat voor DB2, wat dimensionale analyse in de
motor van databank dezelfde.
Functies voegen dimensionaal hulpprogramma toe aan SQL while
zij profiteren van alle voordelen die een natuurlijk onderdeel van DB2 met zich meebrengt. Een andere
Een voorbeeld van OLAP-integratie is de extractietool DB2
OLAP-serveranalyzer. Deze technologie maakt het mogelijk de kubussen van
DB2 OLAP-server snel en automatisch
geanalyseerd om waarden van te identificeren en erover te rapporteren gegevens ongebruikelijk of onverwacht
door de hele kubus heen naar de bedrijfsanalist. En tot slot de functies van de
DW Center biedt architecten de mogelijkheid om onder meer de
andere zaken: het profiel van een DB2 OLAP-serverkubus als onderdeel
natuurlijke aard van ETL-processen.
Ruimtelijke Analyse Ruimtelijke Analyse
Ruimte vertegenwoordigt de helft van de analytische ankers (leads).
nodig voor een panorama
analytisch breed (tijd vertegenwoordigt de andere helft). Het atomaire niveau
(atoomniveau) van het pakhuis, weergegeven in figuur 1.1,
omvat fundamenten voor zowel tijd als ruimte. De opnames
Tijdankeranalyse voor tijd- en adresinformatie
ankeranalyses vanuit de ruimte. Tijdstempels
zij voeren de analyse op tijd uit en geven de richting aan die informatie leidt
de analyse per ruimte. Het diagram toont het geocoderingsproces
adressen converteren naar punten op een kaart of punten in de ruimte
zodat begrippen als afstand en binnen/buiten kunnen zijn
gebruikt bij analyses – uitgevoerd op atomair niveau en ruimtelijke analyse
die ter beschikking wordt gesteld van de analist. IBM levert extensies
ruimte, ontwikkeld in samenwerking met het Environmental System Research Institute (ESRI),
al databank DB2 zodat er ruimteobjecten kunnen zijn
opgeslagen als een normaal onderdeel van databank relationeel. db2
Spatial Extenders bieden ook alle SQL-extensies voor
Maak gebruik van ruimtelijke analyses. Bijvoorbeeld SQL-extensies van
vraag over
afstand tussen adressen en of een punt zich binnen of buiten een gebied bevindt
gedefinieerde veelhoekige, zijn een analytische standaard met de ruimtelijke
Verlengers. Zie hoofdstuk 16 voor meer informatie.
Database-Resident Gereedschap Gereedschap Database-
Resident
DB2 beschikt over veel BI-residente SQL-functies die hierbij behulpzaam zijn
in de analyseactie. Deze omvatten:
▪ Recursiefuncties om analyses uit te voeren, zoals “find
alle mogelijke vliegroutes vanaf San Francisco a New York'.
▪ Analytische functies voor rangschikking, cumulatieve functies, kubus
en rollups om taken te vergemakkelijken die normaal voorkomen
alleen met OLAP-technologie zijn ze nu een natuurlijk onderdeel van de
motor van databank
▪ De mogelijkheid om tabellen te maken die resultaten bevatten
Verkopers van databank leiders mixen meer dan alleen BI-mogelijkheden
in databank hetzelfde.
De belangrijkste leveranciers van database ze mixen meer dan
BI-functionaliteit in databank hetzelfde.
Dit zorgt voor betere prestaties en meer hardloopopties voor uw
BI-oplossingen.
De kenmerken en functies van DB2 V8 worden besproken
in detail in de volgende hoofdstukken:
Technische architectuur en datamanagementfundamenten
(Hoofdstuk 5)
▪ DB2 BI Fundamentals (hoofdstuk 6)
▪ DB2 Gematerialiseerde querytabellen
Tabellen) (Hoofdstuk 7)
▪ DB2 OLAP-functies (hoofdstuk 13)
▪ DB2 Enhanced BI-voorzieningen en -functies (Enhanced BI
Kenmerken en functies) (hoofdstuk 15)
Vereenvoudigd systeem voor gegevenslevering
Leveringssysteem van gegevens vereenvoudigd
De architectuur afgebeeld in figuur 1.1 omvat talloze
structuren gegevens fysiek. Een daarvan is het magazijn van gegevens operationeel.
Over het algemeen is een ODS objectgeoriënteerd,
geïntegreerd en actueel. Zou u een ODS bouwen ter ondersteuning van b.v
bijvoorbeeld het verkoopkantoor. De ODS-verkoop zou een aanvulling vormen gegevens
afkomstig uit talloze verschillende systemen, maar zouden alleen b.v
bijvoorbeeld de transacties van vandaag. De ODS kan worden bijgewerkt
zelfs vele malen per dag. Tegelijkertijd de processen
ze duwen de gegevens geïntegreerd in andere applicaties. Deze structuur is
speciaal ontworpen om te integreren gegevens actueel en dynamisch e
zou een waarschijnlijke kandidaat zijn om realtime analyses te ondersteunen,
hoe u serviceagenten kunt leveren klanten verkoopinformatie
de huidige trends van een klant door informatie over verkooptrends te extraheren
uit het magazijn zelf. Een andere structuur weergegeven in figuur 1.1 is
een formele status voor de dw. Niet alleen is dit de plek voor
de uitvoering van de noodzakelijke integratie, de kwaliteit van gegevens, En
van de transformatie van gegevens voorraad binnenkort beschikbaar, maar dat is ook zo
een betrouwbare en tijdelijke opslagruimte voor gegevens antwoord dat
kan worden gebruikt in realtime analyses. Als u daartoe besluit
gebruik een ODS of een verzamelplaats, één
van de beste instrumenten om deze structuren te bevolken gegevens utilizzando
verschillende operationele bronnen is de heterogene gedistribueerde query van DB2.
Deze mogelijkheid wordt geboden door de optionele functie van DB2
genaamd DB2 Relational Connect (alleen query) en via DB2
DataJoiner (een apart product dat de applicatie levert,
de invoeging, de actualisering en de mogelijkheid tot verwijdering
Heterogene gedistribueerde RDBMS'en).
Deze technologie stelt architecten in staat om gegevens vastbinden gegevens di
productie met analytische processen. Niet alleen technologie kan dat
aan te passen aan vrijwel alle replicatieverzoeken die dat doen
ze kunnen verschijnen met realtime analyses, maar dat is het ook
Ze kunnen ook worden aangesloten op een breed scala aan bases gegevens meer
populair, waaronder DB2, Oracle, Sybase, SQL Server,
Informix en anderen. DB2 DataJoiner kan worden gebruikt om te vullen
een structuur gegevens formeel zoals een ODS of zelfs een tafel
permanent vertegenwoordigd in het voor restauratie ontworpen pakhuis
snel voor directe updates of voor verkoop. Van nature,
deze zelfde structuren gegevens kan worden ingevuld met behulp van
een andere belangrijke technologie ontworpen voor replicatie van gegevensIBM
DataPropagator relationeel. (DataPropagator is een apart product
voor centrale systemen. DB2 UNIX, Linux, Windows en OS/2 omvatten
replicatiediensten gegevens als standaardfunctie).
Een andere manier van verhuizen gegevens rond opereren
to enterprise is anders een enterprise-applicatie-integrator
bekend als message broker.This
Unieke technologie maakt ongeëvenaarde controle voor centrering mogelijk
(targeting) en bewegen gegevens rondom het bedrijf. IBM heeft de bemiddelaar
van het meest gebruikte bericht, MQSeries, of een variant ervan
van het product dat voldoet aan de vereisten van e-commerceIBM
WebSphere MQ.
Voor meer discussie over hoe u MQ kunt gebruiken ter ondersteuning van a
magazzino e un ambiente BI, visitare website del libro. Per ora, è
het volstaat te zeggen dat deze technologie daar een uitstekend middel voor is
vastleggen en transformeren (met behulp van MQSeries Integrator) gegevens
gecentreerde (gerichte) operators die zijn aangeworven voor BI-oplossingen. Daar
MQ-technologie is geïntegreerd en verpakt in UDB V8, dat
betekent dat berichtenwachtrijen nu kunnen worden beheerd
alsof het DB2-tabellen zijn. Het concept van het lassen van
berichten in de wachtrij en het universum van databank relationeel is gericht
naar een krachtige bezorgomgeving van gegevens.
Geen latentie Geen latentie
Het ultieme strategische doel voor IBM is zero latency-analyse (zerolatency).
Zoals gedefinieerd door
Gartner moet een BI-systeem kunnen afleiden en assimileren
en op verzoek informatie verstrekken aan analisten. De uitdaging,
Het gaat natuurlijk om de manier waarop je mixt gegevens actueel en in realtime
met de nodige historische informatie, zoals i gegevens gerelateerde model(len).
tendens, of het geëxtraheerde begrip, als een afbakening van het
klant.
Dergelijke informatie omvat bijvoorbeeld de identificatie van klanten ad
hoog of laag risico of welke producten i klanten ze zullen veel kopen
waarschijnlijk als ze al kaas in hun karren hebben
acquisities.
Het verkrijgen van nul latentie is eigenlijk afhankelijk van twee
fundamentele mechanismen:
▪ Volledige vereniging van gegevens die worden geanalyseerd met de
gevestigde technieken en tools gecreëerd door BI
▪ Een afleversysteem van gegevens efficiënt om dat te garanderen
real-time analyse is echt beschikbaar
Deze vereisten voor nul latentie verschillen niet van de twee
doelstellingen vastgesteld door IBM en hierboven beschreven.
De nauwe paring van gegevens maakt deel uit van de
naadloze integratie geregeld door IBM. En creëer een systeem
van levering van gegevens efficiënt is volledig afhankelijk van
beschikbare technologie die het leveringsproces van
gegevens. Als gevolg hiervan zijn twee van de drie doelstellingen van IBM van cruciaal belang
om de derde te maken. IBM ontwikkelt bewust zijn eigen technologie
technologie om nul latentie te garanderen is een realiteit voor gebruikers
magazijn inspanningen.
Samenvatting / Synthese
De BI-organisatie levert hiervoor een roadmap
creëer je omgeving
iteratief. Het moet worden aangepast om de behoeften van de bevolking te weerspiegelen
uw bedrijf, zowel nu als in de toekomst. Zonder architectonische visie
breed, de magazijnherhalingen zijn weinig meer dan
willekeurige centrale magazijnimplementaties die weinig doen
een brede, informatieve onderneming creëren.
Het eerste obstakel voor projectmanagers is hoe ze deze kunnen rechtvaardigen
investeringen die nodig zijn voor de ontwikkeling van de BI-organisatie.
Hoewel de ROI-berekening een belangrijke ondersteuning is gebleven
magazijnprestaties wordt het steeds moeilijker
precies voorspellen. Dit heeft geleid tot andere methoden voor
bepalen of u waar voor uw geld krijgt. De
er wordt bijvoorbeeld value on investment2 (VOI) verworven
als oplossing.
Het is de taak van de architecten van gegevens en projectplanners
doelbewust informatie genereren en verstrekken aan verenigingen
gebruikers en hen niet eenvoudigweg een dienst verlenen gegevens. Er is een
groot verschil tussen de twee. Informatie is iets dat men doet
verschil in besluitvormingsprocessen en effectiviteit; relatief, ik
gegevens het zijn bouwstenen om die informatie af te leiden.
Zelfs als ze kritisch zijn over de bron gegevens om verzoeken te behandelen
commerciële, BI-omgeving zou een grotere rol moeten spelen
bij het creëren van informatie-inhoud. Wij moeten nemen
aanvullende maatregelen om schoon te maken, te integreren, te transformeren of
creëer anders een informatie-inhoud op basis waarvan de
gebruikers kunnen actie ondernemen, en daarom moeten we ervoor zorgen dat die
acties en beslissingen worden, waar redelijk, ondersteund
in de BI-omgeving. Als we het magazijn degraderen om er alleen maar op te dienen gegevens,
het is gegarandeerd dat gebruikersverenigingen de inhoud zullen creëren
de informatie die nodig is om actie te ondernemen. Dit zorgt ervoor dat hun
gemeenschap in staat zal zijn om betere beslissingen te nemen, maar de onderneming
lijdt onder het gebrek aan kennis waarvan zij gebruik hebben gemaakt.
Dato dat architecten en projectplanners projecten initiëren
specifiek voor de BI-omgeving blijven zij verantwoording verschuldigd aan de onderneming
over het algemeen. Een eenvoudig voorbeeld van deze twee functies
gezichten van de BI-iteraties zijn te vinden in de bron gegevens. alle
gegevens ontvangen voor specifieke commerciële verzoeken moet zijn
bevolkt in de eerste atoomlaag. Dit zorgt voor de ontwikkeling van
troef van bedrijfsinformatie, evenals het beheren en sturen van de
Gebruikersspecifieke verzoeken gedefinieerd in de iteratie.

Wat is dat W arehouse?
Gegevens magazijn het is het hart van de architectuur van informatiesystemen
sinds 1990 en ondersteunt informatieprocessen door het aanbieden van solide
geïntegreerd platform gegevens historici genomen als basis voor latere
analyses. DE datawarehouse bieden het gemak van integratie in een
wereld van applicatiesystemen die niet compatibel zijn met elkaar. Datum
magazijn is uitgegroeid tot een trend. Gegevens magazijn
organiseren en onthouden i gegevens noodzakelijk voor informatieprocessen e
analytisch gebaseerd op een lang historisch tijdsperspectief. Alle
dit brengt een aanzienlijke en constante inzet met zich mee voor de bouw en
bij het onderhoud van datawarehouse.
Dus wat is een datawarehouse? Een datawarehouse het is:
▪ vakgericht
▪ geïntegreerd systeem
▪ varianttijd
▪ niet-vluchtig (kan niet worden gewist)
een verzameling van gegevens gebruikt om managementbeslissingen te ondersteunen
implementatie van processen.
I gegevens ingebracht datawarehouse ontstaan ​​in de meeste
cases uit operationele omgevingen. De datawarehouse het is gemaakt door één
opslagruimte, fysiek gescheiden van de rest van de opslagruimte
systeem, dat bevat gegevens eerder getransformeerd door
toepassingen die werken op informatie uit de omgeving
operationeel.
De letterlijke definitie van a datawarehouse verdient een diepgaande studie
uitleg omdat er belangrijke motivaties en betekenissen van zijn
achtergrond die de kenmerken van een magazijn beschrijven.
ONDERWERP ORIËNTATIE ORIËNTATIE
THEMATISCH
Het eerste kenmerk van een datawarehouse is waar het op gericht is
grote spelers in een bedrijf. De gids van de beproevingen door de
gegevens het staat in contrast met de meer klassieke methode die het biedt
de oriëntatie van applicaties op processen en functies,
methode die meestal door de meesten wordt gedeeld
oudere managementsystemen.
De operationele wereld is ontworpen rond applicaties en functies
zoals leningen, spaargeld, bankpassen en trusts voor een instelling
financieel. De wereld van dw is georganiseerd rond onderwerpen
principes zoals klant, verkoper, product en bedrijf.
Afstemming rond onderwerpen heeft invloed op het ontwerp en de vormgeving
op de realisatie van gegevens gevonden in de dw. Belangrijker,
het hoofdonderwerp beïnvloedt het belangrijkste deel van de
sleutelstructuur.
De wereld van de applicatie wordt beïnvloed door zowel het ontwerp van de data
op basis van het procesontwerp. De wereld van
dw richt zich uitsluitend op het modelleren van de gegevens en
tekening van databank. Het ontwerp van het proces (in zijn vorm
klassiek) maakt geen deel uit van de dw-omgeving.
De verschillen tussen de keuze van proces/functie en toepassing
de keuze per onderwerp komen ook naar voren als inhoudelijke verschillen
van gegevens op detailniveau. DE gegevens del dw exclusief i gegevens dat
wordt niet gebruikt voor het DSS-proces tijdens toepassingen
operationeel gericht gegevens bevatten ik gegevens bevredigen
direct de functionele/verwerkingseisen die o
minder hebben enig nut voor de DSS-analist.
Een andere belangrijke manier waarop operationeel gerichte applicaties worden ingezet
ai gegevens verschillen van gegevens van dw staat in de rapporten van gegevens. De gegevens
operationeel onderhoudt een continue relatie tussen twee of meer tabellen
gebaseerd op een bedrijfsregel die actief is. DE gegevens door dw
ze bestrijken een spectrum van tijd en de relaties die in de dw worden gevonden, zijn dat ook
veel. Veel handelsregels (en dienovereenkomstig veel
rapporten van gegevens ) zijn vertegenwoordigd in de voorraad van gegevens tussen twee o
meerdere tafels.
(Voor een gedetailleerde uitleg van hoe de relaties tussen de gegevens Sono
behandeld in de DW, verwijzen we daarover naar het Tech Topic
vraag.)
Vanuit geen ander perspectief dan dat van verschil
fundamenteel tussen een keuze voor functionele/procestoepassing en
bij een onderwerpkeuze is er een groter verschil tussen de systemen
operationeel ei gegevens en de DW.
INTEGRATIE INTEGRATIE
Het belangrijkste aspect van de dw-omgeving is dat i gegevens gevonden
binnen de dw zijn ze eenvoudig te integreren. ALTIJD. ZONDER
UITZONDERINGEN. De essentie van de dw-omgeving is dat i gegevens
binnen de grenzen van het magazijn zijn geïntegreerd.
Integratie openbaart zich op veel verschillende manieren – in conventies
geïdentificeerd consistent, bij het meten van consistente variabelen, in
gecodificeerde structuren bestaande uit de fysieke kenmerken van gegevens
consequent, enzovoort.
Door de jaren heen hebben de ontwerpers van verschillende applicaties dit gedaan
beschikken over veel beslissingen over hoe een aanvraag moet worden ingediend
ontwikkeld worden. Geïndividualiseerde stijl- en ontwerpbeslissingen
van de toepassingen van de ontwerpers openbaart zich op honderd manieren: in
coderingsverschillen, sleutelstructuur, fysieke kenmerken,
identificatie van conventies, enzovoort. Het collectieve vermogen van velen
Applicatieontwerpers creëren inconsistente applicaties
het is legendarisch. Figuur 3 toont enkele van de meer verschillen
belangrijk in de manier waarop applicaties worden ontworpen.
Coderen: Coderen:
Applicatieontwerpers kozen voor veldcodering –
seks - op verschillende manieren. Een ontwerper vertegenwoordigt seks als
een “m” en “f”. Een andere ontwerper stelt seks voor als een ‘1’
en een “0”. Een andere ontwerper stelt seks voor als een “x” en
“j”. Een andere ontwerper stelt seks voor als ‘mannelijk’ en
"vrouwelijk". Het maakt niet zoveel uit hoe het geslacht in de DW komt. Hen"
en “F” zijn waarschijnlijk net zo goed als alle andere
vertegenwoordiging.
Waar het om gaat is dat van welke oorsprong het gebied van seks ook afkomstig is,
dat veld arriveert in de DW in een consistente geïntegreerde staat. Van
gevolg wanneer het veld in de DW wordt geladen
een applicatie waarin deze in het formaat is weergegeven
“M” en “F”, d.w.z gegevens moet worden geconverteerd naar DW-formaat.
Meting van attributen: meting van
attributen:
De applicatieontwerpers kozen ervoor om de pijpleiding in te meten
verschillende manieren in de cursus
Enkele jaren. Een ontwerper bewaart de gegevens van de pijpleiding in
centimeter. Een andere applicatieontwerper slaat het gegevens
van de pijpleiding in inches. Een andere ontwerper van
applicatiewinkels i gegevens pijpleiding in miljoen kubieke voet
per seconde. En een andere ontwerper slaat de informatie op van de
pijpleiding in termen van yards. Wat de bron ook is, wanneer de
pijplijninformatie arriveert in de DW, het moet zo zijn
op dezelfde manier gemeten.
Volgens de indicaties in figuur 3 zijn er problemen met de integratie
ze beïnvloeden bijna elk aspect van het project: de functies
fysieke goden gegevens, het dilemma van het hebben van meer dan één bron van gegevens,
kwestie van inconsistent geïdentificeerde monsters, formaten van gegevens
inconsistent, enzovoort.
Wat het ontwerponderwerp ook is, het resultaat is hetzelfde:
i gegevens moet in een enkele e in de DW worden opgeslagen
wereldwijd aanvaardbare manier, zelfs als besturingssystemen van
onderaan slaan ze anders op i gegevens.
Wanneer de DSS-analist naar de DW kijkt, is dit het doel van de analist
het zou de exploitatie moeten zijn van gegevens die in het magazijn liggen,
in plaats van zich af te vragen over de geloofwaardigheid of consistentie van de
gegevens.
TIJDSVERSCHILLEN
alle gegevens in de DW zijn ze tot op een bepaald moment nauwkeurig.
Dit fundamentele kenmerk van de gegevens in DW is heel anders dan gegevens
gevonden in de besturingsomgeving. DE gegevens van de werkomgeving zijn
zo nauwkeurig als op het moment van toegang. Met andere woorden,
in de besturingsomgeving wanneer een schijf wordt benaderd gegevens, Maar ook
wacht tot het de exacte waarden weergeeft zoals op het moment van toegang.
Waarom ik gegevens in de DW zijn net zo nauwkeurig als op een bepaald punt in de
tijd (dat wil zeggen, niet “nu”), wordt er gezegd dat i gegevens gevonden in de DW
het zijn “tijdsvariaties”.
Het tijdsverschil van gegevens door DW wordt op tal van manieren genoemd.
De eenvoudigste manier is dat ik gegevens van een DW vertegenwoordigen gegevens een
lange tijdshorizon – vijf tot tien jaar. De horizon
Het tijdsbestek dat voor de besturingsomgeving wordt weergegeven, is veel korter
▪ van de huidige huidige waarden tot zestignegentig
Applicaties die goed moeten werken en dat ook moeten zijn
beschikbaar voor transactieverwerking moet de
minimale hoeveelheid gegevens als ze enige mate van toegeven
flexibiliteit. Operationele toepassingen hebben dus een horizon
korte tijdschaal, als ontwerponderwerp van
audiotoepassingen.
De tweede manier waarop 'tijdsvariantie' in de DW verschijnt, is in de
sleutelstructuur. Elke sleutelstructuur in de DW bevat:
impliciet of expliciet, een tijdselement, zoals
dag, week, maand, enz. Het element tijd is bijna altijd aanwezig
onderaan de samengevoegde sleutel in de DW. In deze
Soms zal het element tijd impliciet bestaan, net als toeval
waarbij een volledig bestand aan het einde van de maand of het kwartaal wordt gedupliceerd.
De derde manier waarop tijdsverschil wordt weergegeven, is dat i gegevens del
DW kan dat, zodra het correct is geregistreerd, niet zijn
bijgewerkt. DE gegevens van de DW zijn, voor alle praktische doeleinden, lang
reeks momentopnamen. Natuurlijk als de momentopnamen dat zijn
verkeerd zijn genomen, dan kunnen de snapshots dat wel zijn
gewijzigd. Maar ervan uitgaande dat de momentopnamen zijn gemaakt
correct, ze worden niet gewijzigd zodra ze zijn gemaakt. In bepaalde
gevallen kan het onethisch of zelfs ongeldig zijn dat de snapshots in de
DW zijn gewijzigd. DE gegevens operationeel, precies zoals in
login-moment, ze kunnen worden bijgewerkt zodra ze komen
de behoefte.
NIET VLUCHTIG
Het vierde belangrijke kenmerk van DW is dat het niet-vluchtig is.
Er worden updates, invoegingen, verwijderingen en wijzigingen aangebracht
regelmatig voor record-voor-record operationele omgevingen. Maar de
fundamentele manipulatie van gegevens die nodig zijn in de DW is veel meer
eenvoudig. Er zijn slechts twee soorten bewerkingen die plaatsvinden in de
DW – de initiële belasting van gegevens en toegang tot gegevens. Er is geen
geen update van de gegevens (in de algemene zin van
update) in de DW als een normale verwerkingsbewerking.
Er zijn enkele zeer krachtige gevolgen van dit verschil
basis tussen operationele verwerking en DW-verwerking. Op het niveau
door het ontwerp is het noodzakelijk voorzichtig te zijn met upgraden
abnormaal speelt geen rol meer in de DW sinds de update van gegevens niet
voerde uit. Dit betekent dat op fysiek ontwerpniveau
vrijheden kunnen worden aangegrepen om de toegang daartoe te optimaliseren gegevens,
in het bijzonder bij de behandeling van de onderwerpen normalisatie en
fysieke denormalisatie. Nog een gevolg van eenvoud
van de activiteiten van DW zit in de onderliggende technologie die daarvoor wordt gebruikt
voer de DW-omgeving uit. Updates moeten ondersteunen
record voor record inline (zoals vaak het geval is bij
operationele verwerking) is de technologie vereist om er een paar te hebben
zeer complexe fundamenten onder een schijnbare eenvoud.
De technologie die back-up en herstel, transacties ondersteunt
en integriteit van gegevens en de detectie en oplossing van een impasse is dat wel
behoorlijk complex en niet noodzakelijk voor DW-verwerking.
De kenmerken van een DW, ontwerporiëntatie,
Integratie van gegevens binnen de DW, tijdsvariantie en eenvoud
van het beheer van gegevens, alles leidt tot een omgeving die heel erg is
anders dan de klassieke besturingsomgeving. De bron van bijna alles
gegevens van DW zijn de besturingsomgeving. Het is verleidelijk om na te denken
dat er sprake is van een enorme overtolligheid gegevens tussen de twee omgevingen.
In feite is de eerste indruk die veel mensen hebben die van
grote redundantie van gegevens tussen de werkomgeving en de omgeving van
DW. Een dergelijke interpretatie is oppervlakkig en laat dit zien
gebrek aan begrip van wat er in de DW gebeurt.
Er is inderdaad een minimum aan redundantie gegevens tussen de werkomgeving
en gegevens van de DW. Laten we het volgende overwegen:
▪ Ik gegevens ze worden gefilterd dato die vanuit de werkomgeving overgaat
naar de DW-omgeving. Veel gegevens ze komen nooit buiten
vanuit de operationele omgeving. Behalve dat ik gegevens waarvoor nodig zijn
DSS-verwerking vindt zijn richting in de omgeving
▪ de tijdshorizon van gegevens het is heel anders dan een omgeving
naar de ander. DE gegevens in de werkomgeving zijn ze erg vers. DE gegevens
in de DW zijn ze veel ouder. Gewoon vanuit perspectief
van de tijdshorizon is er zeer weinig overlap
tussen de besturingsomgeving en de DW.
▪ De DW bevat gegevens van samenvattingen die nooit worden gevonden
in de leefomgeving
▪ Ik gegevens een fundamentele transformatie ondergaan
moment waarop ze overgaan naar figuur 3 illustreert dat het meest
deel van gegevens zijn aanzienlijk van toestand veranderd
geselecteerd en verplaatst worden naar de DW. Anders gezegd: de
maggior parte dei gegevens is fysiek gewijzigd en
radicaal hoe het naar de DW wordt verplaatst. Vanuit het standpunt
van integratie zijn niet hetzelfde gegevens die wonen
in de operationele omgeving.
In het licht van deze factoren is de redundantie van gegevens tussen de twee omgevingen is
een zeldzame gebeurtenis, die leidt tot minder dan 1% redundantie tussen de twee
omgevingen.
DE STRUCTUUR VAN HET MAGAZIJN
DW's hebben een aparte structuur. Er zijn verschillende niveaus van samenvatting en
detail dat de DW's afbakent.
De verschillende onderdelen van een DW zijn:
▪ Metagegevens
Geven actuele gegevens
Geven van oude details
Geven enigszins samengevat
Geven sterk samengevat
Verreweg de belangrijkste zorg is voor i gegevens van details
stromingen. Het is de voornaamste zorg omdat:
▪ Ik gegevens huidige details weerspiegelen de meest recente gebeurtenissen,
die altijd van groot belang zijn en
▪ ik gegevens van de huidige details zijn omvangrijk omdat dat zo is
opgeslagen op het laagste granulariteitsniveau e
▪ ik gegevens Actuele gegevens worden vrijwel altijd opgeslagen op
schijfopslag, die snel toegankelijk is, maar duur en
complex van
I gegevens van detail zijn ouder gegevens waarop zijn opgeslagen
enige herinnering aan massa. Het heeft sporadisch toegang en dat is het ook
opgeslagen op een detailniveau dat compatibel is met gegevens gedetailleerd
stromingen. Hoewel het niet verplicht is om op een medium op te slaan
alternatieve opslag, vanwege het grote volume van gegevens verenigd met
sporadische toegang van gegevens, het opslagmedium voor gegevens di
Oudere gegevens worden doorgaans niet op schijf opgeslagen.
I gegevens licht samengevat zijn ze gegevens die van onderaf worden gedestilleerd
detailniveau gevonden op het huidige detailniveau. Dit
Het DW-niveau wordt bijna altijd opgeslagen op schijfopslag. DE
ontwerpproblemen die zich voordoen voor de architect gegevens
bij de constructie van dit niveau van de DW zijn:
▪ Welke tijdseenheid is de bovenstaande samenvatting
▪ Welke inhoud en attributen zullen de inhoud enigszins samenvatten
inhoud van gegevens
Het volgende niveau van gegevens gevonden in de DW is die van gegevens zeer
samenvattingen. DE gegevens zeer samengevat zijn compact en gemakkelijk
toegankelijk. DE gegevens Soms worden zeer samengevatte teksten aangetroffen
in de DW-omgeving en in andere gevallen i gegevens zeer samengevat zijn
gevonden buiten de directe muren van de technologie waarin de DW is gehuisvest.
(in ieder geval, nl gegevens zeer samengevatte zijn onderdeel van de DW
ongeacht waar ik gegevens fysiek gehuisvest zijn).
Het laatste onderdeel van de DW zijn de metadata. In veel opzichten
metadata bevindt zich in een andere dimensie dan andere gegevens
van de DW, omdat de metadata er geen bevatten dato direct
overgenomen uit de werkomgeving. Metadata spelen een bijzondere rol e
heel belangrijk bij DW. Metagegevens worden gebruikt als:
▪ een map waarmee de DSS-analist de
inhoud van de DW,
▪ een gids voor het in kaart brengen van de gegevens van hoe ik gegevens waren
getransformeerd van de operationele omgeving naar de DW-omgeving,
▪ een gids voor de algoritmen die worden gebruikt voor de samenvatting tussen gegevens di
huidig ​​detail ei gegevens enigszins samengevat, i gegevens zeer
samenvattingen,
Metadata spelen een veel grotere rol in de DW-omgeving
dan ze ooit in de operationele omgeving hebben gehad
OUD DETAILOPSLAGMIDDEL
Magneetband kan worden gebruikt om dat soort op te slaan
gegevens. In feite is er een grote verscheidenheid aan opslaghulpmiddelen
ze moeten worden overwogen voor het behoud van oude gegevens di
detail.
Afhankelijk van het volume van gegevens, de frequentie van toegang, de kosten
van de tools en het type toegang is het volkomen waarschijnlijk
dat andere tools het oude detailniveau nodig hebben
in de DW.
STROOM VAN GEGEVENS
Er is een normale en voorspelbare stroom van de gegevens binnen de DW.
I gegevens ze komen de DW binnen vanuit de besturingsomgeving. (LET OP: die zijn er
enkele zeer interessante uitzonderingen op deze regel. Echter bijna
alle gegevens voer de DW in vanuit de besturingsomgeving). Dato dat gegevens
ze komen de DW binnen vanuit de besturingsomgeving, deze wordt getransformeerd zoals deze is geweest
eerder beschreven. Op voorwaarde dat u de DW betreedt, i gegevens zij komen binnen
huidige detailniveau, zoals weergegeven. Het staat daar en wordt gebruikt
totdat een van de volgende drie gebeurtenissen plaatsvindt:
▪ wordt gezuiverd,
▪ is samengevat, en/of
▪ is
Verouderd proces binnen een DW-beweging i gegevens actuele gegevens
a gegevens van detail oud, volgens de leeftijd van gegevens. Het proces
samenvatting maakt gebruik van de details van gegevens om de te berekenen gegevens
licht samengevatte en sterk samengevatte niveaus van de gegevens. Er zijn
enkele uitzonderingen op de getoonde stroom (zal later worden besproken).
Meestal geldt dit echter voor de overgrote meerderheid van de mensen gegevens gevonden
binnen een DW, de stroom van gegevens het is zoals weergegeven.
GEBRUIK VAN HET DATAWAREHOUSE
Niet verrassend zijn de verschillende niveaus van gegevens binnen de DW niet
verschillende gebruiksniveaus ontvangen. In de regel geldt: hoe hoger het niveau van
samenvatting, plus ik gegevens Ze zijn gebruikt.
Veel toepassingen komen voor in de gegevens sterk samengevat, terwijl de oude
gegevens details worden bijna nooit gebruikt. Er is een goede reden in de
verplaats de organisatie naar het paradigma van het gebruik van hulpbronnen. Hoe meer hij heeft
samenvatting ik gegevens, hoe sneller en efficiënter het is om aan te komen gegevens. Indien
un winkel vind dat het veel verwerking doet op DW-detailniveau,
vervolgens een overeenkomstige grote hoeveelheid machinebronnen
wordt geconsumeerd. Het is in ieders belang om te vervolgen
als op een hoog niveau van samenvatten, zo snel mogelijk.
Voor veel winkels heeft de DSS-analist in een pre-DW-omgeving gewerkt
gegevens op detailniveau. In veel opzichten is de aankomst bij gegevens gedetailleerd
het lijkt op een veiligheidsdeken, zelfs als ze beschikbaar zijn
andere samenvattingsniveaus. Eén van de activiteiten van de architect gegevens è
Zorg ervoor dat de DSS-gebruiker niet voortdurend gebruik maakt van gegevens op het hoogste niveau
laag detail. Er zijn twee redenen beschikbaar
van de architect van gegevens:
▪ het installeren van een chargeback-systeem, waarbij de eindgebruiker de kosten betaalt
verbruikte hulpbronnen e
▪ die aangeven dat de responstijd zeer goed kan zijn
verkregen wanneer het gedrag met i gegevens het staat op een hoog niveau
van samenvatting, terwijl de slechte responstijd afkomstig is van de
gedrag van gegevens op een laag pitje
ANDERE OVERWEGINGEN
Er zijn nog enkele andere constructie- en beheeroverwegingen
DW-extensie.
De eerste overweging is die van indices. DE gegevens op het hoogste niveau van
samenvatting kan vrij worden geïndexeerd, terwijl i gegevens
op lagere detailniveaus zijn ze zo omvangrijk als maar kan
zuinig geïndexeerd. Van hetzelfde teken, i gegevens op hoge niveaus
detail kan relatief eenvoudig worden gerenoveerd,
terwijl het volume van gegevens op de lagere niveaus is het zo groot dat i gegevens niet
ze kunnen gemakkelijk worden gerenoveerd. Dienovereenkomstig, het model
van gegevens en het formele werk van het ontwerp vormt de
fundering voor de DW vrijwel uitsluitend op het niveau toegepast
detail actueel. Met andere woorden, de modelleringsactiviteiten van
gegevens ze zijn in bijna alle gevallen niet van toepassing op samenvattingsniveaus.
Een andere structurele overweging is die van de onderverdeling van
gegevens door DW.
Partitioneren kan op twee niveaus: op het niveau van dbm's en
toepassingsniveau. In de verdeling op niveau dbm's, The dbm's è
op de hoogte van de divisies en controleert deze dienovereenkomstig. In het geval van
verdeling op applicatieniveau is alleen de programmeur
op de hoogte van de divisies en de verantwoordelijkheid van hen
het beheer wordt aan hem overgelaten
Onder niveau dbm's, veel werk wordt automatisch gedaan. Er bestaat
er is veel inflexibiliteit verbonden aan het automatische beheer van
divisies. Bij splitsingen op toepassingsniveau van gegevens del
datawarehouse, veel werk weegt op de programmeur, maar de
eindresultaat is flexibiliteit in de administratie van gegevens in de datum
magazijn
ANDERE AFWIJKINGEN
Terwijl de componenten van de datawarehouse Ze werken zoals beschreven
voor bijna allemaal gegevens, zijn er enkele nuttige uitzonderingen die dat wel moeten doen
ter sprake komen. Een uitzondering is die van gegevens openbare samenvattingen
(openbare samenvattende gegevens). Dit zijn gegevens samenvattingen dat waren
uit berekend datawarehouse maar ze worden gebruikt door de samenleving. DE gegevens
openbare samenvattingen worden opgeslagen en beheerd in de datawarehouse,
hoewel ze, zoals eerder vermeld, zijn berekend. DE
accountants werken eraan om deze driemaandelijks te produceren gegevens de
inkomsten, kwartaaluitgaven, kwartaalwinst, enzovoort. Het werk
gedaan door accountants is extern datawarehouse. Hoewel, ik gegevens Sono
gebruikt “intern” binnen het bedrijf – vanaf marketing, verkoop, enz.
Een andere anomalie, die niet zal worden besproken, is die van gegevens extern.
Een ander uitstekend type gegevens die in een gegeven te vinden is
magazijn is dat van permanente detailgegevens. Deze veroorzaken de
moet ik permanent opslaan gegevens op één niveau
gedetailleerd om ethische of juridische redenen. Als een bedrijf exposeert i
werknemers in verband brengen met gevaarlijke stoffen waar behoefte aan is gegevens
gedetailleerd en permanent. Als een bedrijf een product produceert dat
gaat over de openbare veiligheid, welke onderdelen van een vliegtuig er zijn
de behoefte voor gegevens gedetailleerd permanent, evenals als het een bedrijf is
sluit gevaarlijke contracten.
De samenleving kan het zich niet veroorloven om de details over het hoofd te zien, omdat
in de komende jaren, in geval van een rechtszaak, een terugroepactie, a
betwist constructiefout, etc. de blootstelling van het bedrijf
het kan groot zijn. Als gevolg hiervan is er een uniek type gegevens
bekend als permanente detailgegevens.
OVERZICHT
Un datawarehouse is een objectgeoriënteerde, geïntegreerde variant van
tijd, een verzameling van gegevens niet-vluchtig om de behoeften van te ondersteunen
bestuursbesluit. Elk van de meest opvallende functies van
un datawarehouse heeft zijn implicaties. Bovendien zijn het er vier
niveaus van gegevens del datawarehouse:
▪ Oud detail
▪ Huidig ​​detail
Geven enigszins samengevat
Geven zeer samengevat
Metadata is ook een belangrijk onderdeel van de datawarehouse.
ABSTRACT
Het concept van de opslag van gegevens onlangs ontvangen
veel aandacht en is een trend geworden uit de jaren 90. Dit is het geval
vanwege de capaciteit van a datawarehouse om ze te overwinnen
beperkingen van administratieve ondersteunende systemen zoals i
beslissingsondersteunende systemen (DSS) en informatiesystemen
uitvoerend (EIS).
Zelfs als het concept van datawarehouse ziet er veelbelovend uit,
implementeren ik datawarehouse kan problematisch zijn vanwege
van grootschalige opslagprocessen. Ondanks de
complexiteit van magazijnprojecten gegevens, veel leveranciers
en magazijnadviseurs gegevens betogen dat
de opslag van gegevens stroom levert geen problemen op.
Aan het begin van dit onderzoeksproject echter vrijwel geen
onafhankelijk, rigoureus en systematisch onderzoek was uitgevoerd. Van
Het is daarom moeilijk te zeggen wat er werkelijk gebeurt
in de industrie wanneer ze worden gebouwd datawarehouse.
In dit onderzoek werd de warehousingpraktijk van gegevens
tijdgenoten die tot doel hebben een rijker begrip te ontwikkelen
van de Australische praktijk. De literatuuranalyse leverde de
context en basis voor het empirische onderzoek.
Er zijn een aantal bevindingen uit dit onderzoek. Eerst
plaats bracht dit onderzoek de activiteiten aan het licht die plaatsvonden
tijdens de ontwikkeling van datawarehouse. Op veel gebieden, i gegevens verzameld
bevestigde de praktijk die in de literatuur wordt gerapporteerd. ten tweede
site, problemen en problemen die van invloed kunnen zijn op de
ontwikkeling datawarehouse werden door dit onderzoek geïdentificeerd.
Ten slotte worden de voordelen verkregen van Australische organisaties die ermee verbonden zijn
het gebruik van datawarehouse zijn onthuld.
Hoofdstuk 1
Zoekcontext
Het concept van datawarehousing heeft brede erkenning gekregen
blootstelling en is uitgegroeid tot een opkomende trend in de
Jaren 90 (McFadden 1996, TDWI 1996, Shah en Milstein 1997,
Shanks et al. 1997, Eckerson 1998, Adelman en Oates 2000). Dat is
blijkt uit het groeiend aantal artikelen over de data
opslag in handelspublicaties (Little en Gibson 1999).
Veel artikelen (zie bijvoorbeeld Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett en King 1996, Graham et al. 1996,
Sakaguchi en Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997, McCarthy 1997, O'Donnell 1997, Edwards 1998, TDWI
1999) hebben aanzienlijke voordelen gerapporteerd die voortvloeien uit organisaties
die implementeren i datawarehouse. Zij steunden hun theorie
met anekdotisch bewijs van succesvolle implementaties, het hoge rendement
op investeringscijfers (ROI) en ook het bieden van begeleiding
referentie of methodologieën voor de ontwikkeling van datawarehouse
(Shanks et al. 1997, Seddon en Benjamin 1998, Little en Gibson
1999). In een extreem geval hebben Graham et al. (1996) hebben
rapporteerde een gemiddeld rendement op een driejarige investering van 401%.
Een groot deel van de huidige literatuur heeft dit echter verwaarloosd
complexiteiten die gepaard gaan met het uitvoeren van dergelijke projecten. De projecten van
datawarehouse ze zijn normaal gesproken complex en grootschalig
daarom impliceren ze een grote kans op falen als dat niet het geval is
zorgvuldig gecontroleerd (Shah en Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs en Clymer 1998, Rao
1998). Ze vereisen enorme hoeveelheden mensen en middelen
financieel en de tijd en moeite om ze op te bouwen (Hill 1998, Crofts 1998). De
typische tijd en de benodigde financiële middelen zijn respectievelijk
ongeveer twee jaar en twee tot drie miljoen dollar (Braly 1995, Foley
1997b, Bort 1998, Humphries et al. 1999). Deze tijden en middelen
Financiële instellingen moeten veel aspecten controleren en consolideren
verschillen in datawarehousing (Cafasso 1995, Hill 1998). Aan de kant
van hardware- en softwareoverwegingen, andere functies, die variëren
uit de extractie van gegevens naar de laadprocessen van gegevens, Van
geheugencapaciteit om updates en metadata te beheren gegevens
voor gebruikerstraining, moet worden overwogen.
Toen dit onderzoeksproject begon, was er nog heel weinig
academisch onderzoek op het gebied van datawarehousing,
vooral in Australië. Dit bleek uit het gebrek aan spullen
gepubliceerd op datawarehousing door kranten of andere geschriften
academici van die tijd. Veel van de academische geschriften
beschikbaar, beschreef de Amerikaanse ervaring. Het gebrek aan
academisch onderzoek op het gebied van datawarehousing heeft geleid tot de
pleit voor rigoureus onderzoek en empirische studies (McFadden 1996,
Shanks et al. 1997, Little en Gibson 1999). In het bijzonder de onderzoeken
van onderzoek naar het implementatieproces van datawarehouse
moeten worden uitgevoerd om de kennis uit te breiden
algemeen over de uitvoering van datawarehouse e
zal als basis dienen voor toekomstig onderzoek (Shanks red
anderen. 1997, Little en Gibson 1999).
Het doel van dit onderzoek is dan ook om te onderzoeken wat er werkelijk is
Het gebeurt wanneer organisaties gegevens onderhouden en gebruiken
magazijn in Australië. Concreet zal dit onderzoek betrekking hebben op
een analyse van een geheel ontwikkelingsproces van a datawarehouse,
beginnend bij initiatie en planning tot en met ontwerp en
implementatie en vervolgens gebruik binnen organisaties
Australisch. Daarnaast zal het onderzoek ook een bijdrage leveren aan de huidige praktijk
het identificeren van gebieden waar de praktijk verder kan worden ontwikkeld
verbeterd en kunnen inefficiënties en risico's worden geminimaliseerd
voorkomen. Bovendien zal het als basis dienen voor ander onderzoek datawarehouse in
Australië en zal de leemte opvullen die momenteel in de literatuur bestaat.
Onderzoeksvragen
Het doel van dit onderzoek is om de betrokken activiteiten te bestuderen
bij de uitvoering van datawarehouse en hun gebruik door
Australische organisaties. In het bijzonder worden de elementen bestudeerd
op het gebied van projectplanning, ontwikkeling,
bediening, gebruik en risico's. Dus de vraag
van dit onderzoek is:
“Hoe is de huidige praktijk van de datawarehouse in Australië?"
Om dit probleem effectief aan te pakken, moet a
een aantal deelonderzoeksvragen. In het bijzonder drie
uit de literatuur zijn subvragen geïdentificeerd
gepresenteerd in hoofdstuk 2, als leidraad voor dit onderzoeksproject:
Hoe ze worden geïmplementeerd i datawarehouse door organisaties
Australisch? Welke problemen bent u tegengekomen?
Wat zijn de ervaren voordelen?
Bij het beantwoorden van deze vragen is gebruik gemaakt van een tekening
verkennend onderzoek waarbij gebruik wordt gemaakt van een enquête. Hoe ik studeer
verkennend zijn de antwoorden op bovenstaande vragen niet volledig
(Shanks et al. 1993, Denscombe 1998). In dit geval is dat zo
Om de respons hierop te verbeteren is triangulatie nodig
verzoeken. Het onderzoek zal er echter een solide basis voor bieden
toekomstig werk dat deze vragen onderzoekt. Een gedetailleerde
bespreking van de rechtvaardiging en het ontwerp van de onderzoeksmethode
wordt gepresenteerd in hoofdstuk 3.
Structuur van het onderzoeksproject
Dit onderzoeksproject is opgesplitst in twee delen: het contextueel onderzoek
van het concept van datawarehousing en empirisch onderzoek (zie
figuur 1.1), die hieronder stuk voor stuk worden besproken.
Deel I: Contextuele studie
Het eerste deel van het onderzoek bestond uit het opnieuw onderzoeken van de
huidige literatuur over verschillende soorten datawarehousing, waaronder i
beslissingsondersteunende systemen (DSS), informatiesystemen
executive (EIS), de casestudies van datawarehouse en de concepten van datum
magazijn. Verder de resultaten van de forums datawarehouse en
bijeenkomstgroepen voor deskundigen en professionals onder leiding van de groep van
Monash DSS-onderzoek heeft bijgedragen aan deze fase van het onderzoek
bedoeld om informatie te verkrijgen over de praktijk van data
magazijn en om de risico's te identificeren die gepaard gaan met de invoering ervan.
Tijdens deze periode van contextueel onderzoek, begrip
van het probleemgebied is opgezet om kennis over te verschaffen
basis voor daaropvolgend empirisch onderzoek. Echter, dit
het was een continu proces terwijl het onderzoek plaatsvond
onderzoek.
Deel II: Empirisch onderzoek
Het relatief nieuwe concept van datawarehousing, vooral
in Australië ontstond de behoefte om een ​​onderzoek uit te voeren
krijg een breed beeld van de gebruikservaring. Dit
een deel werd uitgevoerd zodra het probleemdomein zich voordeed
kwam tot stand door uitgebreid literatuuronderzoek. Het concept
van datawarehousing gevormd tijdens de contextuele studiefase
werd gebruikt als input voor de eerste vragenlijst van dit onderzoek.
Hierna werd de vragenlijst onderzocht. Jullie zijn date-experts
magazijn heeft deelgenomen aan de test. Het doel van de proef
De eerste vragenlijst was bedoeld om de volledigheid en nauwkeurigheid te controleren
een paar vragen. Op basis van de testresultaten is de vragenlijst samengesteld
gewijzigd en de gewijzigde versie is verzonden naar
deelnemers aan de enquête. De vragenlijsten die toen terugkwamen waren dat wel
geanalyseerd voor i gegevens in tabellen, diagrammen en andere formaten. DE
analyseresultaten van gegevens maak er meteen een foto van
datawarehousingpraktijk in Australië.
DATA WAREHOUSING OVERZICHT
Het concept van datawarehousing is geëvolueerd met verbeteringen
van computertechnologie.
Het is gericht op het overwinnen van de problemen waarmee groepen worden geconfronteerd
applicatieondersteuning zoals Decision Support System (DSS) e
Uitvoerend informatiesysteem (EIS).
In het verleden was het grootste obstakel voor deze toepassingen
het onvermogen van deze toepassingen om een database
nodig voor de analyse.
Dit wordt vooral veroorzaakt door de aard van de werkzaamheden
beheer. De belangen van het management van een onderneming lopen uiteen
voortdurend afhankelijk van het behandelde gebied. Daarom, ik gegevens
fundamenteel voor deze toepassingen moet kunnen
veranderen snel afhankelijk van het te behandelen onderdeel.
Dit betekent dat ik gegevens moet in vorm beschikbaar zijn
voldoende voor de vereiste analyses. In feite zijn de steungroepen van
toepassingen vonden het in het verleden erg moeilijk om ed te verzamelen
integratie gegevens uit complexe en diverse bronnen.
De rest van dit gedeelte geeft een overzicht van het concept
datawarehousing en gaat over hoe de datawarehouse kan overwinnen
Problemen met toepassingsondersteuningsgroepen.
De term "Datawarehouse'werd in 1990 uitgebracht door William Inmon.
Zijn vaak geciteerde definitie ziet de Datawarehouse hoe
collectie van gegevens onderwerpgericht, geïntegreerd, niet-vluchtig en variabel
in de loop van de tijd, ter ondersteuning van managementbeslissingen.
Met behulp van deze definitie wijst Inmon erop dat i gegevens Bewoners
in een datawarehouse moet over het volgende beschikken 4
features:
▪ Vakgericht
▪ Geïntegreerd
▪ Niet-vluchtig
▪ Variabel in de tijd
Met vakgericht bedoelt Inmon dat i gegevens in de datum
magazijn in de grootste organisatorische gebieden die er zijn geweest
gedefinieerd in het model gegevens. Bijvoorbeeld allemaal gegevens betreffende i klanten
zijn opgenomen in het onderwerpgebied KLANTEN. Evenzo alle
gegevens met betrekking tot de producten vindt u in het onderwerpgebied
PRODUCTEN.
Met Geïntegreerd bedoelt Inmon dat i gegevens afkomstig van anders
platforms, systemen en locaties worden gecombineerd en opgeslagen
enkele plaats. Als gevolg daarvan gegevens vergelijkbaar moet worden getransformeerd
in consistente formaten, zodat ze kunnen worden toegevoegd en vergeleken
gemakkelijk.
Zo zijn bijvoorbeeld het mannelijke en vrouwelijke geslacht vertegenwoordigd
door de letters M en F in het ene systeem, en met 1 en 0 in een ander systeem. Voor
ze op de juiste manier te integreren, een of beide formaten moeten
worden getransformeerd zodat de twee formaten hetzelfde zijn. In deze
In dat geval zouden we M in 1 en F in 0 kunnen veranderen, of omgekeerd. Gericht op
subject en Integrated geven aan dat de datawarehouse is ontworpen voor
bieden een functionele en transversale visie op gegevens geeft een deel
bedrijf.
Met niet-vluchtig bedoelt hij dat i gegevens in datawarehouse blijven
consistent en actueel gegevens het is niet nodig. In plaats daarvan, elke
veranderen in gegevens originelen wordt toegevoegd databank van de datum
magazijn. Dit betekent dat de historische dei gegevens zit erin
datawarehouse.
Voor variabelen met tijd geeft Inmon aan dat i gegevens in datawarehouse
bevatten altijd de tempo-indicatoren ei gegevens normaal
een bepaalde tijdshorizon overschrijden. Bijvoorbeeld een
datawarehouse kan 5 jaar aan historische waarden bevatten van klanten dal
1993 tot 1997. De beschikbaarheid van de geschiedenis en een tijdreeks
van gegevens stelt u in staat om trends te analyseren.
Un datawarehouse hij kan zijn eigen verzamelen gegevens uit systemen
OLTP;van oorsprong gegevens extern aan de organisatie en/of door andere specialisten
systeemprojecten vastleggen gegevens.
I gegevens extracten kunnen een reinigingsproces ondergaan
dit geval ik gegevens ze worden getransformeerd en geïntegreerd voordat ze bestaan
opgeslagen in databank del datawarehouse. Dan, ik gegevens
woonachtig binnen de databank del datawarehouse worden beschikbaar gesteld
toegang tot eindgebruikers en hersteltools. Gebruik makend van
Met deze tools heeft de eindgebruiker toegang tot de geïntegreerde weergave
van de organisatie van gegevens.
I gegevens woonachtig binnen de databank del datawarehouse Sono
zowel in detail als in samenvattingsformaten opgeslagen.
Het niveau van samenvatting kan afhangen van de aard van de gegevens. De gegevens
gedetailleerd kan bestaan ​​uit gegevens huidige en gegevens historici
I gegevens real zijn niet inbegrepen in de datawarehouse totdat ik gegevens
in datawarehouse worden opnieuw bijgewerkt.
Naast het opbergen van de gegevens zelf, een datawarehouse kan niet
een ander type opslaan dato genaamd METADATA die
beschrijf ik gegevens woonachtig in zijn databank.
Er zijn twee soorten metadata: ontwikkelingsmetadata en ontwikkelingsmetadata
analyses.
Ontwikkelingsmetadata worden gebruikt om de
extractie-, reinigings-, karterings- en laadprocessen gegevens in
datawarehouse.
De informatie in de ontwikkelingsmetadata kan bevatten
details van besturingssystemen, details van de te extraheren elementen, de
model gegevens del datawarehouse en bedrijfsregels voor
omzetten van gegevens.
Het tweede type metadata, bekend als analytische metadata
stelt de eindgebruiker in staat de inhoud van de gegevens te verkennen
magazijn om de gegevens beschikbaar zijn en wat ze in termen betekenen
duidelijk en niet-technisch.
Daarom werken analytische metadata als een brug tussen de gegevens
magazijn- en eindgebruikerstoepassingen. Deze metagegevens kunnen
bevatten het bedrijfsmodel en beschrijvingen ervan gegevens correspondenten
naar het bedrijfsmodel, vooraf gedefinieerde vragen en rapporten,
informatie voor gebruikersaanmeldingen en de index.
Metagegevens voor analyse en ontwikkeling moeten in één worden gecombineerd
geïntegreerde metadata-insluiting om goed te kunnen functioneren.
Helaas hebben veel van de bestaande tools hun eigen tools
metadata en daar bestaan ​​momenteel geen bestaande standaarden voor
Zorg ervoor dat datawarehousing-tools deze kunnen integreren
metagegevens. Om deze situatie te verhelpen, hebben veel handelaren van
belangrijkste tools voor datawarehousing hebben Meta Data gevormd
Raad die later de Meta Data Coalition werd.
Het doel van deze coalitie is het opbouwen van een metadataset
standaard die verschillende datawarehousingtools mogelijk maakt
metagegevens converteren
Hun inspanningen resulteerden in de geboorte van de Meta
Data Interchange Specification (MDIS) die de uitwisseling mogelijk maakt
van informatie tussen de Microsoft-archieven en de gerelateerde MDIS-bestanden.
Het bestaan ​​van gegevens zowel samengevat/geïndexeerd als gedetailleerd geeft
de gebruiker de mogelijkheid om een ​​BOOR VERDRINKEN uit te voeren
(boren) kom maar op gegevens geïndexeerd naar gedetailleerde en vice versa.
Het bestaan ​​van gegevens gedetailleerde geschiedenis maakt het mogelijk om
trendanalyse in de tijd. Daarnaast kunnen de analyse-metagegevens
worden gebruikt als de map van databank del datawarehouse voor
help eindgebruikers i gegevens vereist.
Vergeleken met OLTP-systemen, met hun vermogen om te ondersteunen
analyse van gegevens en rapportage, de datawarehouse het wordt gezien als een systeem
meer geschikt voor informatieprocessen zoals het maken en
reageren op vragen en maken rapporten. Het volgende gedeelte
zal de verschillen tussen de twee systemen in detail belichten.
GEGEVENS MAGAZIJN TEGEN OLTP-SYSTEMEN
Veel van de informatiesystemen binnen organisaties
Ze zijn bedoeld ter ondersteuning van de dagelijkse bedrijfsvoering. Deze
systemen die bekend staan ​​als OLTP SYSTEMS, leggen transacties vast
dagelijks voortdurend bijgewerkt.
I gegevens binnen deze systemen worden ze vaak aangepast, toegevoegd of aangepast
verwijderd. Het adres van een klant verandert bijvoorbeeld nauwelijks
hij beweegt van de ene plaats naar de andere. In dit geval het nieuwe adres
wordt geregistreerd door het adresveld van te wijzigen databank.
Het hoofddoel van deze systemen is het verlagen van de kosten
transacties en tegelijkertijd de verwerkingstijd verkorten.
Voorbeelden van OLTP-systemen zijn onder meer kritieke acties zoals schrijven
orderboekhouding, salarisadministratie, facturen, productie, ai-diensten klanten.
In tegenstelling tot OLTP-systemen, die per proces zijn gemaakt
gebaseerd op transacties en gebeurtenissen, i datawarehouse werden gecreëerd
om ondersteuning te bieden aan op analyses gebaseerde processen van gegevens en
beslissingsprocessen.
Dit wordt normaal gesproken bereikt door i te integreren gegevens uit diverse systemen
OLTP en extern in één "container". gegevens,zoals besproken
in het vorige gedeelte.
Monash Data Warehousing Procesmodel
Het procesmodel voor datawarehouse Monash is ontwikkeld door
onderzoekers van de Monash DSS Research Group, is gebaseerd op
literatuur van datawarehouse, over de ervaring met het ondersteunen van de
ontwikkeling van systeemvelden, over gesprekken met leveranciers van
toepassingen voor gebruik op datawarehouse, over een groep deskundigen
bij het gebruik van datawarehouse.
De fasen zijn: aanvang, planning, ontwikkeling en exploitatie
Uitleg. Het diagram legt het iteratieve karakter uit van
evolutionaire ontwikkeling van a datawarehouse proces gebruiken
tweerichtingspijlen geplaatst tussen de verschillende fasen. In deze
“iteratieve” en “evolutionaire” context betekenen dat beide
In deze stap van het proces kunnen implementatieactiviteiten worden uitgevoerd
altijd achterwaarts voortplanten naar de vorige fase. Dit is
vanwege de aard van het project a datawarehouse waarbij
Er kunnen op elk moment aanvullende verzoeken ontstaan
van de eindgebruiker. Bijvoorbeeld tijdens de ontwikkelingsfase van een
proces van datawarehouse, wordt er één aangevraagd door de eindgebruiker
nieuwe dimensie of vakgebied, die niet tot de
origineel plan, dit moet aan het systeem worden toegevoegd. Dit
zorgt voor een verandering in het project. Het resultaat is dat het team van
ontwerp moet de eisen van de tot nu toe gemaakte documenten veranderen
tijdens de ontwerpfase. In veel gevallen is de huidige staat van de
project moet teruggaan naar de ontwerpfase waar
de nieuwe aanvraag moet worden toegevoegd en gedocumenteerd. De gebruiker
final moet de specifieke documentatie kunnen zien die is beoordeeld ei
wijzigingen die in de ontwikkelingsfase zijn aangebracht. Aan het einde van
deze ontwikkelingscyclus moet het project goede feedback krijgen
beide teams, het ontwikkelteam en het gebruikersteam. DE
feedback wordt vervolgens hergebruikt om een ​​toekomstig project te verbeteren.
Capaciteits planning
Dw heeft de neiging erg groot te zijn en te groeien
zeer snel (Beste 1995, Rudin 1997a) na de
hoeveelheid van gegevens geschiedenissen die ze behouden van hun duur. Daar
groei kan ook veroorzaakt worden door gegevens aanvullende artikelen aangevraagd door
gebruikers om de waarde ervan te vergroten gegevens die ze al hebben. Van
bijgevolg de opslagvereisten voor gegevens kan
aanzienlijk worden verbeterd (Eckerson 1997). Zo is het
essentieel om ervoor te zorgen, door het uitvoeren van planning van
capaciteit waarmee het te bouwen systeem kan meegroeien
groei van behoeften (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
Bij het plannen van dw-schaalbaarheid moet men de
verwachte groei in voorraadomvang, soorten vragen
waarschijnlijk zal worden uitgevoerd, en het aantal ondersteunde eindgebruikers (Best
1995, Rudin 1997b, Foley 1997a). Bouw schaalbare applicaties
vereist een combinatie van schaalbare servertechnologieën en -technieken
van het ontwerpen van schaalbare applicaties (Best 1995, Rudin 1997b.
Beide zijn nodig bij het maken van een applicatie
extreem schaalbaar. Schaalbare servertechnologieën kunnen dat wel
maken het gemakkelijk en nuttig om opslagruimte, geheugen en
CPU zonder prestatieverlies (Lang 1997, Telephony 1997).
Er zijn twee belangrijke schaalbare servertechnologieën: compute
symmetrische meervoudige (SMP) en massale verwerking
parallel (MPP)) (IDC 1997, Humphries et al. 1999). Een server
SMP heeft normaal gesproken meerdere processors die één geheugen delen,
bussysteem en andere bronnen (IDC 1997, Humphries et al. 1999).
Voor uitbreiding kunnen extra processors worden toegevoegd
haar potenza rekenkundig. Een andere methode om de
potenza rekenkracht van de SMP-server, is het combineren van talloze
SMP-machines. Deze techniek staat bekend als clustering (Humphries
et al. 1999). Een MPP-server heeft daarentegen elk meerdere processors
met zijn eigen geheugen, bussysteem en andere bronnen (IDC 1997,
Humphries et al. 1999). Elke processor wordt een knooppunt genoemd. A
stijging van potenza rekenkundig kan worden verkregen
het toevoegen van extra knooppunten aan MPP-servers (Humphries et al.
1999).
Een zwak punt van SMP-servers is te veel invoer-uitvoerbewerkingen
(I/O) kan het bussysteem overbelasten (IDC 1997). Dit
probleem doet zich niet voor binnen MPP-servers sinds elke
processor heeft een eigen bussysteem. Echter, de onderlinge verbindingen
tussen elk knooppunt zijn ze over het algemeen veel langzamer dan het bussysteem
van de SMP’s. Bovendien kunnen MPP-servers een laag toevoegen
extra complexiteit voor applicatieontwikkelaars (IDC
1997). Zo kan de keuze tussen SMP- en MPP-servers worden beïnvloed
door vele factoren, waaronder de complexiteit van de vragen, de relatie
prijs/prestatie, de benodigde behandelcapaciteit, de
verhinderde dw-toepassingen en de toename in omvang van databank
van dw en in het aantal eindgebruikers.
Talrijke schaalbare applicatieontwerptechnieken
kan worden gebruikt bij capaciteitsplanning. Een
hanteert verschillende meldingstermijnen zoals dagen, weken, maanden en jaren.
Met verschillende opzegtermijnen kan de databank kan worden onderverdeeld in
stukken kunnen gemakkelijk bij elkaar worden gegroepeerd (Inmon et al. 1997). Nog een
techniek is om samenvattende tabellen te gebruiken die zijn geconstrueerd
opsommen gegevens da gegevens gedetailleerd. Dus ik gegevens samenvattingen zijn meer
compact dan gedetailleerd, waardoor minder geheugenruimte nodig is.
Dus de gegevens details kunnen op een schijf worden opgeslagen
goedkopere opslag, waardoor nog meer opslagruimte wordt bespaard.
Hoewel het gebruik van samenvattende tabellen ruimte kan besparen
geheugen, vereisen ze veel moeite om ze up-to-date en actueel te houden
in overeenstemming met de commerciële behoeften. Deze techniek is dat echter wel
veel gebruikt en vaak gebruikt in combinatie met de techniek
vorige(Beste 1995, Inmon 1996a, Chauduri en Dayal
1997).
Het definiëren Datawarehouse Technisch
Architecturen Definitie van technieken
dw-architecturen
De early adopters van datawarehousing waren in de eerste plaats bedacht
een gecentraliseerde implementatie van de dw waar alle gegevenscompresso
i gegevens externe, werden geïntegreerd in een enkele,
fysieke opslagplaats (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Het belangrijkste voordeel van deze aanpak is dat de eindgebruikers
Ik heb toegang tot de visie op ondernemersschaal
(bedrijfsbrede visie) dei gegevens organisatorisch (Ovum 1998). Een andere
voordeel is dat het standaardisatie biedt van gegevens door
de organisatie, wat betekent dat er maar één versie is of
definitie voor elke terminologie die in het dw-depot wordt gebruikt
(reposity) metadata (Flanagan en Safdie 1997, Ovum 1998). De
Het nadeel van deze aanpak is daarentegen dat deze duur en moeilijk is
te bouwen (Flanagan en Safdie 1997, Ovum 1998, Inmon et al.
1998). Niet lang na de opslagarchitectuur gegevens
gecentraliseerd populair werd, ontwikkelde het concept van extractie zich
van de kleinste subsets van de gegevens om de behoeften van te ondersteunen
specifieke toepassingen (Varney 1996, IDC 1997, Berson en Smith
1997, pauw 1998). Deze kleine systemen zijn afgeleid van de meer
groot datawarehouse gecentraliseerd. Ze heten datum
afhankelijke afdelingsmagazijnen of afhankelijke datamarts.
De afhankelijke datamart-architectuur staat bekend als
drieledige architectuur waarbij de eerste laag uit de gegevens bestaat
gecentraliseerd magazijn, het tweede bestaat uit magazijnen gegevens
departementaal en de derde bestaat uit toegang tot gegevens en van de instrumenten van
analyse (Demarest 1994, Inmon et al. 1997).
Datamarts worden normaal gesproken gebouwd na de datawarehouse
gecentraliseerd werd gebouwd om aan de behoeften van te voldoen
specifieke eenheden (White 1995, Varney 1996).
Datamarts winkel i gegevens zeer relevant met betrekking tot bijzonderheden
eenheid (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
Het voordeel van deze methode is dat er geen dato niet
geïntegreerd en dat ik gegevens ze zullen minder redundant zijn binnen de gegevens
marts sinds allemaal gegevens komen uit een storting van gegevens geïntegreerd.
Een ander voordeel is dat er weinig verbindingen tussen beide zullen zijn
datamarts en gerelateerde bronnen gegevens omdat elke datamart alleen maar heeft
een bron van gegevens. Plus met deze architectuur, de gebruikers
finales hebben nog steeds toegang tot het overzicht van gegevens
bedrijfsorganisaties. Deze methode staat bekend als de
top-down-methode, waarbij datamarts na de gegevens worden gebouwd
magazijn (pauw 1998, Goff 1998).
Sommigen vergroten de noodzaak om vroegtijdig resultaten te laten zien
organisaties zijn begonnen met het bouwen van onafhankelijke datamarts
(Flanagan en Safdie 1997, White 2000). In dit geval datamarts
zij nemen de hunne gegevens rechtstreeks uit de basis van gegevens OLTP en niet van
gecentraliseerde en geïntegreerde opslag, waardoor de noodzaak voor opslag wordt geëlimineerd
beschikken over een centrale berging op eigen terrein.
Elke datamart heeft minimaal één link naar de bronnen nodig
di gegevens. Een nadeel van het hebben van meerdere links voor elke datum
mart is dat, vergeleken met de twee voorgaande architecturen, de
overvloed aan gegevens neemt aanzienlijk toe.
Elke datamart moet alle gegevens opslaan gegevens lokaal aangevraagd
hebben geen effect op OLTP-systemen. Dit zorgt ervoor dat ik gegevens
ze worden opgeslagen in verschillende datamarts (Inmon et al. 1997).
Een ander nadeel van deze architectuur is dat het leidt tot
het creëren van complexe verbindingen tussen datamarts en hun netwerken
bronnen van gegevens die moeilijk uit te voeren en te controleren zijn (Inmon red
anderen. 1997).
Een ander nadeel is dat eindgebruikers geen stroom kunnen leveren
toegang tot het overzicht van bedrijfsinformatie als i gegevens
van de verschillende datamarts zijn niet geïntegreerd (Ovum 1998).
Nog een ander nadeel is dat er meer dan één kan zijn
definitie voor elke terminologie die wordt gebruikt in de datamarts die deze genereert
inconsistenties van gegevens in organisatie (Ovum 1998).
Ondanks de hierboven besproken nadelen, onafhankelijke datamarts
ze trekken nog steeds de belangstelling van veel organisaties (IDC 1997).
Eén factor die ze aantrekkelijk maakt, is dat ze zich sneller ontwikkelen
en vereisen minder tijd en middelen (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Dienovereenkomstig dienen ze voornamelijk
als testprojecten die kunnen worden gebruikt om te identificeren
snel de voordelen en/of onvolkomenheden van het project (Parsaye
1995, Braly 1995, Newing 1996). In dit geval het gedeelte uit
implementatie in het proefproject moet klein maar belangrijk zijn
voor de organisatie (Newing 1996, Mansell-Lewis 1996).
Door het prototype te onderzoeken kunnen eindgebruikers en administratie dit doen
beslissen of het project wordt voortgezet of stopgezet (Flanagan en Safdie
1997).
Als het besluit is om door te gaan, datamarts voor andere sectoren
ze moeten één voor één worden gebouwd. Er zijn twee opties voor
eindgebruikers op basis van hun behoeften op het gebied van dataconstructie
onafhankelijke matrs: geïntegreerd/gefedereerd en niet-geïntegreerd (Ovum
1998)
Bij de eerste methode moet elke nieuwe datamart worden gebouwd
gebaseerd op de huidige datamarts en modellen gegevens gebruikt
door de firma (Varney 1996, Berson en Smith 1997, Peacock 1998).
De noodzaak om het model te gebruiken gegevens van het bedrijf dit noodzakelijk maakt
Zorg ervoor dat er voor elke terminologie slechts één definitie bestaat
gebruikt via datamarts, dit is ook om ervoor te zorgen dat gegevens worden verzameld
Verschillende markten kunnen worden samengevoegd om een ​​overzicht te geven
bedrijfsinformatie (Bresnahan 1996). Deze methode is
Dit wordt bottom-up genoemd en is het beste als er beperkingen zijn
financiële middelen en tijd (Flanagan en Safdie 1997, Ovum 1998,
pauw 1998, Goff 1998). Bij de tweede methode, datamarts
gebouwd kan alleen voldoen aan de behoeften van een specifieke eenheid.
Een variant van de federatieve datamart is de datawarehouse gedistribueerde
waarin de databank hub-server-middleware wordt gebruikt om zich bij velen aan te sluiten
datamarts in één enkele opslagplaats van gegevens gedistribueerd (White 1995). In
dit geval, ik gegevens bedrijven zijn verspreid over verschillende datamarts.
Verzoeken van eindgebruikers worden doorgestuurd naar databank
hub-servermiddleware, die alle gegevens gevraagd door de gegevens
mart en stuurt de resultaten terug naar de eindgebruikersapplicaties. Dit
methode biedt zakelijke informatie aan eindgebruikers. Echter,
De problemen van datamarts zijn nog steeds niet opgelost
onafhankelijk. Er is nog een andere architectuur die kan worden gebruikt, namelijk
bel de datawarehouse virtueel (White 1995). Echter, dit
architectuur, beschreven in figuur 2.9, is geen architectuur
van opslag gegevens echt omdat het de last niet verplaatst
van OLTP-systemen tot datawarehouse (Demarest 1994).
In feite verzoeken om gegevens door eindgebruikers zijn overgegaan
OLTP-systemen die na verwerking resultaten retourneren
gebruikersverzoeken. Hoewel deze architectuur gebruikers toestaat
finals voor het genereren van rapporten en het formuleren van verzoeken, kan i
gegevens geschiedenis en overzicht van bedrijfsinformatie sinds i gegevens
van de verschillende OLTP-systemen zijn niet geïntegreerd. Deze dus
architectuur kan niet voldoen aan de analyse van gegevens complex zoals
voorbeeld voorspellingen.
Selectie van toegang en toegangsapplicaties
herstel van gegevens
Het doel van het bouwen van een datawarehouse is om door te geven
informatie aan eindgebruikers (Inmon et al. 1997, Poe 1996,
McFadden 1996, Shanks et al. 1997, Hammergren 1998); een of
meerdere toegangs- en hersteltoepassingen gegevens moet worden verstrekt. Naar
Tegenwoordig is er een grote verscheidenheid aan deze toepassingen waaruit de gebruiker kan kiezen
kiezen (Hammergren 1998, Humphries et al. 1999). De
geselecteerde toepassingen bepalen het succes van de inspanning
van opslag gegevens in een organisatie omdat de
toepassingen zijn daar het meest zichtbare onderdeel van datawarehouse aan de gebruiker
definitief (Inmon et al. 1997, Poe 1996). Om een ​​date te laten slagen
magazijn, moet de analyseactiviteiten van kunnen ondersteunen gegevens
van de eindgebruiker (Poe 1996, Seddon en Benjamin 1998, Eckerson
1999). Het ‘niveau’ van wat de eindgebruiker wil moet dus zijn
geïdentificeerd (Poe 1996, Mattison 1996, Inmon et al. 1997,
Humphries et al. 1999).
Over het algemeen kunnen eindgebruikers in drieën worden gegroepeerd
categorieën: uitvoerende gebruikers, bedrijfsanalisten en powerusers (Poe
1996, Humphries et al. 1999). Executive gebruikers nodig hebben
gemakkelijke toegang tot vooraf gedefinieerde sets rapporten (Humphries red
anderen 1999). Deze rapporten kunnen eenvoudig worden bereikt met
menunavigatie (Poe 1996). Bovendien zouden rapporten dat moeten doen
informatie presenteren met behulp van grafische weergave
zoals tabellen en sjablonen om snel te transporteren
informatie (Humphries et al. 1999). Bedrijfsanalisten, die dat niet doen
ze hebben misschien de technische mogelijkheden om relaties uit te ontwikkelen
nul op zichzelf, ze moeten de huidige relaties kunnen aanpassen
hun specifieke behoeften te bevredigen (Poe 1996, Humphries et al
1999). Hoofdgebruikers daarentegen zijn het type eindgebruikers dat
de mogelijkheid hebben om verzoeken en rapporten te genereren en te schrijven
nul (Poe 1996, Humphries et al. 1999). Zij zijn degenen die
rapporten ontwikkelen voor andere soorten gebruikers (Poe 1996, Humphries
en anderen 1999).
Zodra de eindgebruikersvereisten zijn bepaald, moeten ze worden uitgevoerd
een selectie van toegangs- en hersteltoepassingen gegevens onder alle
die beschikbaar zijn (Poe 1996, Inmon et al. 1997).
Toegang tot gegevens en ophaalhulpmiddelen kunnen zijn
ingedeeld in 4 typen: OLAP-tool, EIS/DSS-tool, query-tool en
rapportage- en dataminingtools.
Met OLAP-tools kunnen gebruikers ad-hocquery's maken en
die op gemaakt zijn databank del datawarehouse. Plus deze producten
laat gebruikers toe om verder in te zoomen gegevens algemeen voor hen
gedetailleerd.
EIS/DSS-tools bieden managementrapportage als ‘wat als’-analyse
en toegang tot menu-georganiseerde rapporten. Er moeten rapporten zijn
vooraf gedefinieerd en samengevoegd met menu's voor eenvoudiger navigatie.
Query- en rapportagetools stellen gebruikers in staat rapporten te produceren
vooraf gedefinieerd en specifiek.
Dataminingtools worden gebruikt om relaties te identificeren
nieuw licht zou kunnen werpen op vergeten operaties in de gegevens del
datawarehouse.
Naast het optimaliseren van de vereisten van elk type gebruiker, i
Geselecteerde tools moeten intuïtief, efficiënt en gebruiksvriendelijk zijn.
Ze moeten ook compatibel zijn met andere delen van de architectuur, bijvoorbeeld
in staat om met bestaande systemen te werken. Het wordt ook voorgesteld
kies tools voor gegevenstoegang en -herstel met prijzen en prestaties
redelijk. Andere criteria waarmee rekening moet worden gehouden, zijn onder meer de inzet van de
leverancier van de tool bij het ondersteunen van hun product en de ontwikkelingen die ermee gepaard gaan
hetzelfde zal in toekomstige releases gebeuren. Om gebruikersbetrokkenheid te garanderen
bij het gebruik van het datawarehouse betrekt het ontwikkelingsteam de
gebruikers in het gereedschapselectieproces. In dit geval
er moet een praktische gebruikersbeoordeling worden uitgevoerd.
Om de waarde van het datawarehouse te verbeteren kan het ontwikkelteam dat doen
bieden ook webtoegang tot hun datawarehouses. A
Via een web-enabled datawarehouse hebben gebruikers toegang tot de gegevens
van afgelegen plaatsen of tijdens het reizen. Ook de informatie kan
door kostenreductie tegen lagere kosten worden aangeboden
van training.
2.4.3 Datawarehouse Operatie Fase
Deze fase bestaat uit drie activiteiten: Datumstrategieën definiëren
vernieuwing, controle van datawarehouse-activiteiten en beheer van
beveiliging van datawarehouses.
Definitie van strategieën voor het vernieuwen van gegevens
Na de eerste keer laden, i gegevens in databank van het datawarehouse
moet periodiek worden vernieuwd om het bestand af te spelen
wijzigingen aangebracht op gegevens originelen. Wij moeten daarom beslissen
wanneer moet worden vernieuwd, hoe vaak de
vernieuwen en hoe u het gegevens. Er wordt voorgesteld om de
ververs dei gegevens wanneer het systeem offline kan worden gehaald. Daar
De vernieuwingsfrequentie wordt bepaald door het ontwikkelteam
op gebruikerseisen. Er zijn twee benaderingen voor het vernieuwen van de
datawarehouse: volledige vernieuwing en continu laden van
veranderingen.
De eerste benadering, volledige vernieuwing, vereist herladen
alle gegevens helemaal opnieuw. Dit betekent dat alle gegevens vereist moet
bij elke vernieuwing worden geëxtraheerd, gereinigd, getransformeerd en geïntegreerd. Dit
benadering moet zoveel mogelijk worden vermeden omdat
Het vergt veel tijd en middelen.
Een alternatieve benadering is om i continu te laden
veranderingen. Dit voegt ik toe gegevens die zijn veranderd
sinds de laatste vernieuwingscyclus van het datawarehouse. De identificatie van
nieuwe of gewijzigde records verminderen het aantal
gegevens die in elk naar het datawarehouse moeten worden doorgegeven
update sinds alleen deze gegevens zal worden toegevoegd databank
van het datawarehouse.
Er zijn minstens vijf benaderingen die kunnen worden gebruikt om zich terug te trekken
i gegevens nieuw of aangepast. Om een ​​efficiënte strategie te verkrijgen
ververs dei gegevens een combinatie van deze benaderingen kan nuttig zijn
pikt alle wijzigingen in het systeem op.
De eerste benadering, waarbij gebruik wordt gemaakt van tijdstempels, gaat ervan uit dat dit gebeurt
aan iedereen toegewezen gegevens een tijdstempel bewerkt en bijgewerkt
om alles gemakkelijk te kunnen identificeren gegevens aangepast en nieuw.
Deze aanpak wordt echter in de meeste landen niet op grote schaal toegepast
onderdeel van de hedendaagse besturingssystemen.
De tweede benadering is om een ​​deltabestand te gebruiken dat is gegenereerd door
een applicatie die alleen wijzigingen bevat die zijn aangebracht gegevens.
Het gebruik van dit bestand versterkt ook de updatecyclus.
Maar zelfs deze methode wordt door velen niet gebruikt
toepassingen.
De derde benadering is het scannen van een logbestand
bevat in principe vergelijkbare informatie als het deltabestand. De enige
Het verschil is dat er een logbestand wordt aangemaakt voor het herstelproces en
het kan moeilijk te begrijpen zijn.
De vierde benadering is het wijzigen van de applicatiecode.
Het grootste deel van de applicatiecode is echter oud en
breekbaar; daarom moet deze techniek worden vermeden.
De laatste benadering is om i gegevens bronnen met het bestand
belangrijkste goden gegevens.
Bewaken van datawarehouse-activiteiten
Zodra het datawarehouse is vrijgegeven voor gebruikers, is dat het geval
noodzakelijk om dit in de loop van de tijd te monitoren. In dit geval de beheerder
van het datawarehouse kan gebruik maken van een of meer beheertools en
controle om het gebruik van het datawarehouse te monitoren. In het bijzonder
informatie over mensen en het weer kan worden verzameld
waarmee ze toegang krijgen tot het datawarehouse. Kom op gegevens gewassen kunnen worden gemaakt
een profiel van de verrichte werkzaamheden dat als input kan dienen
bij het implementeren van terugboekingen door gebruikers. De terugvordering
Hiermee kunnen gebruikers worden geïnformeerd over de kosten van het verwerken van de
datawarehouse.
Bovendien kan datawarehouse-besturing ook worden gebruikt
identificeer de soorten zoekopdrachten, hun grootte en het aantal zoekopdrachten per
dag, reactietijden op de vraag, bereikte sectoren en hoeveelheid
di gegevens verwerkt. Een ander doel van het controleren van
datawarehouse is het identificeren van de gegevens die niet in gebruik zijn. Deze gegevens
ze kunnen uit het datawarehouse worden verwijderd om de tijd te verbeteren
van reactie op query-uitvoering en controle over de groei van
gegevens die verblijven binnen de database van het datawarehouse.
Beveiligingsbeheer van datawarehouses
Een datawarehouse bevat gegevens geïntegreerd, kritisch, gevoelig dat
gemakkelijk te bereiken. Om deze reden zou dat wel moeten
worden beschermd tegen ongeautoriseerde gebruikers. Een weg tot
beveiliging implementeren is het gebruik van de del-functie dbms
om verschillende rechten toe te kennen aan verschillende soorten gebruikers. In deze
Voor elk type gebruiker moet een profiel worden bijgehouden
toegang. Een andere manier om uw datawarehouse te beveiligen is door het te versleutelen
zoals het is geschreven database van het datawarehouse. Toegang tot
gegevens en de ophaaltools moeten de gegevens alvorens ik inlever
resultaten voor gebruikers.
2.4.4 Datawarehouse Implementatiefase:
Het is de laatste fase in de implementatiecyclus van het datawarehouse. De
Tot de activiteiten die in deze fase moeten worden uitgevoerd behoort onder meer het opleiden van
gebruikers om het datawarehouse te gebruiken en beoordelingen te maken
van het datawarehouse.
Gebruikerstraining
Er moet eerst een gebruikerstraining plaatsvinden
van toegang tot gegevens van het datawarehouse en het gebruik van tools
ophalen. Over het algemeen moeten sessies beginnen met
de introductie tot het concept van opslag van gegevens, To
inhoud van het datawarehouse, ai meta gegevens en de basisfuncties
van de gereedschappen. Dan kunnen meer gevorderde gebruikers ook de
fysieke tabellen en gebruikersfuncties van gegevenstoegang en hulpmiddelen
ophalen.
Er zijn veel benaderingen voor het geven van gebruikerstraining. Een van de
hierbij gaat het om een ​​selectie van vele gebruikers of analisten, gekozen door a
groep gebruikers, op basis van hun leiderschap en vaardigheden
communicatie. Deze worden op persoonlijke titel opgeleid
alles wat ze moeten weten om vertrouwd te raken met de
systeem. Zodra de training is afgelopen, gaan ze weer aan het werk en gaan ze aan de slag
ze beginnen andere gebruikers te leren hoe ze het systeem moeten gebruiken. Op de
op basis van wat ze hebben geleerd, kunnen andere gebruikers aan de slag
verken het datawarehouse.
Een andere aanpak is om veel gebruikers hierin te trainen
alsof u een klassikale cursus volgt. Deze methode
Het is geschikt als er veel gebruikers zijn die moeten worden getraind
tegelijkertijd. Nog een andere methode is trainen
elke gebruiker afzonderlijk, één voor één. Deze methode is
geschikt als er weinig gebruikers zijn.
Het doel van de gebruikerstraining is om u vertrouwd te maken
met toegang tot gegevens en de ophaalhulpmiddelen, evenals de inhoud van de
datawarehouse. Sommige gebruikers kunnen echter overweldigd raken
door de hoeveelheid informatie die tijdens de sessie wordt verstrekt
opleiding. Er moeten dus een aantal dingen gebeuren
voortdurende ondersteuning en opfrissessies om te reageren
op specifieke vragen. In sommige gevallen ontstaat er een groep
gebruikers om dit soort ondersteuning te bieden.
Feedback verzamelen
Zodra het datawarehouse is uitgerold, kunnen gebruikers dat doen
gebruik ik gegevens die zich voor verschillende doeleinden in het datawarehouse bevinden.
Meestal gebruiken analisten of gebruikers i gegevens in
datawarehouse voor:
1 Identificeer bedrijfstrends
2 Analyseer de aankoopprofielen van klanten
3 Verdeel ik klanten en
4 Bied de beste diensten aan klanten – diensten aanpassen
5 Formuleer strategieën marketing
6 Zorg voor concurrerende offertes voor kostenanalyses en hulp
onder controle te houden
7 Ondersteun strategische besluitvorming
8 Identificeer kansen om op te vallen
9 Verbeter de kwaliteit van huidige bedrijfsprocessen
10 Controleer de winst
Ze konden de ontwikkelingsrichting van het datawarehouse volgen
Voer een reeks systeembeoordelingen uit om feedback te verkrijgen
zowel van het ontwikkelingsteam als van de gemeenschap van
eindgebruikers.
De verkregen resultaten kunnen in aanmerking worden genomen voor de
volgende ontwikkelingscyclus.
Omdat het datawarehouse een incrementele aanpak kent,
het is essentieel om te leren van de successen en fouten van eerdere successen
ontwikkelingen.
2.5 Samenvatting
In dit hoofdstuk zijn de aanwezige benaderingen besproken
literatuur. In deel 1 werd het concept besproken
datawarehouse en zijn rol in de beslissingswetenschap. In de
sectie 2 de belangrijkste verschillen tussen
datawarehouse- en OLTP-systemen. In deel 3 bespraken we de
Monash datawarehouse-model dat werd gebruikt
in hoofdstuk 4 om de activiteiten te beschrijven die bij het proces betrokken zijn
ontwikkeling van een datawarehouse, waarop deze stellingen niet zijn gebaseerd
rigoureus onderzoek. Wat er in werkelijkheid gebeurt, kan zijn
heel anders dan wat de literatuur rapporteert, hoe dan ook
resultaten kunnen worden gebruikt om een ​​basisbagage te creëren die
benadrukken het concept van datawarehouse voor dit onderzoek.
Hoofdstuk 3
Onderzoeks- en ontwerpmethoden
Dit hoofdstuk behandelt onderzoeks- en ontwerpmethoden voor
deze studie. Het eerste deel geeft een generieke weergave van de methoden
van onderzoek dat bovendien beschikbaar is voor het verkrijgen van informatie
criteria voor het selecteren van de beste methode voor één worden besproken
bepaalde studie. Vervolgens worden in sectie 2 twee methoden besproken
geselecteerd op basis van de zojuist uiteengezette criteria; hiervan zullen worden gekozen en
heeft er één aangenomen met de redenen uiteengezet in deel 3, waar deze zich bevinden
Ook worden de redenen voor de uitsluiting van het andere criterium toegelicht. Daar
sectie 4 presenteert het onderzoeksontwerp en sectie 5 presenteert deze
conclusies.
3.1 Onderzoek in informatiesystemen
Onderzoek op het gebied van informatiesystemen is niet eenvoudigweg beperkt
op technologisch gebied, maar moet ook worden uitgebreid
doelen op het gebied van gedrag en organisatie.
Dit hebben we te danken aan de stellingen van verschillende disciplines, variërend van
sociale wetenschappen tot natuurlijke wetenschappen; dit leidt tot de noodzaak van a
een bepaald spectrum van onderzoeksmethoden waarbij kwantitatieve methoden betrokken zijn
en kwalitatieve voor informatiesystemen.
Alle beschikbare onderzoeksmethoden zijn belangrijk, meerdere zelfs
onderzoekers zoals Jenkins (1985), Nunamaker et al. (1991) en Galliers
(1992) stellen dat er geen specifieke universele methode bestaat
onderzoek doen op verschillende gebieden van informatiesystemen; Inderdaad
een methode kan geschikt zijn voor een bepaald onderzoek, maar niet
voor anderen. Dit brengt ons tot de noodzaak om een ​​methode te selecteren die
is geschikt voor ons specifieke onderzoeksproject: hiervoor
keuze Benbasat et al. (1987) stellen dat hiermee rekening moet worden gehouden
de aard en het doel van het onderzoek.
3.1.1 Aard van het onderzoek
Afhankelijk van de aard van het onderzoek kunnen er verschillende methoden zijn
ingedeeld in drie tradities die algemeen bekend zijn in de wetenschap
van informatie: positivistisch, interpretatief en kritisch onderzoek.
3.1.1.1 Positivistisch onderzoek
Positivistisch onderzoek wordt ook wel wetenschappelijk onderzoek of wetenschappelijk onderzoek genoemd
empirisch. Het probeert: “uit te leggen en te voorspellen wat er in de toekomst zal gebeuren
sociale wereld door te kijken naar regelmatigheden en oorzaak-gevolgrelaties
tussen de elementen waaruit het bestaat” (Shanks et al. 1993).
Positivistisch onderzoek wordt ook gekenmerkt door herhaalbaarheid,
vereenvoudigingen en weerleggingen. Bovendien geeft positivistisch onderzoek dit toe
het bestaan ​​van a priori relaties tussen de bestudeerde verschijnselen.
Volgens Galliers (1992) is taxonomie een onderzoeksmethode
opgenomen in het positivistische paradigma, dat zich hiertoe echter niet beperkt,
in feite zijn er laboratoriumexperimenten, veldexperimenten,
casestudies, stellingbewijzen, voorspellingen en simulaties.
Met behulp van deze methoden geven onderzoekers toe dat de verschijnselen
bestudeerd, objectief en rigoureus kan worden waargenomen.
3.1.1.2 Interpretatief onderzoek
Interpretatief onderzoek, dat vaak fenomenologie of fenomenologie wordt genoemd
antipositivisme wordt door Neuman (1994) beschreven als ‘analyse
systematiek van de sociale betekenis van actie door directe en
gedetailleerde observatie van mensen in natuurlijke situaties, in volgorde
om te komen tot begrip en interpretatie van hoe de
mensen creëren en onderhouden hun sociale wereld." Studies
interpretatieve methoden verwerpen de veronderstelling dat de waargenomen verschijnselen
objectief kan worden waargenomen. In feite zijn ze gebaseerd
op subjectieve interpretaties. Bovendien doen interpretatieve onderzoekers dat niet
ze leggen a priori betekenissen op aan de verschijnselen die ze bestuderen.
Deze methode omvat subjectieve/argumentatieve studies, acties van
onderzoek, beschrijvende/interpretatieve studies, toekomstonderzoek en games
rol. Daarnaast kunnen deze onderzoeken en casestudies worden uitgevoerd
opgenomen in deze benadering, aangezien zij betrekking hebben op de studies van
individuen of organisaties in complexe situaties
van de echte wereld.
3.1.1.3 Kritisch onderzoek
Kritisch onderzoek is de minst bekende benadering in de wetenschappen
sociaal, maar heeft onlangs aandacht gekregen van onderzoekers
op het gebied van informatiesystemen. De filosofische veronderstelling dat de
sociale realiteit wordt historisch geproduceerd en gereproduceerd door mensen,
evenals sociale systemen met hun acties en interacties. Hun
vermogen wordt echter gemedieerd door een zekere mate van overweging
sociaal, cultureel en politiek.
Net als interpretatief onderzoek stelt kritisch onderzoek dat de
positivistisch onderzoek heeft niets te maken met de sociale context en negeert deze
de invloed ervan op menselijk handelen.
Kritisch onderzoek daarentegen bekritiseert interpretatief onderzoek
te subjectief zijn en omdat het niet bedoeld is om te helpen
mensen om hun leven te verbeteren. Het grootste verschil tussen de
kritisch onderzoek en de andere twee benaderingen vormen de evaluatieve dimensie ervan.
Terwijl de objectiviteit van de positivistische en interpretatieve tradities voorop staat
de status quo of de sociale realiteit voorspellen of verklaren, kritisch onderzoek
heeft tot doel de onderliggende sociale realiteit kritisch te evalueren en te transformeren
studio.
Kritische onderzoekers verzetten zich doorgaans om de status quo
sociale verschillen wegnemen en sociale omstandigheden verbeteren. Daar
kritisch onderzoek heeft een commitment aan een procesmatige kijk op
interessante verschijnselen en is daarom normaal gesproken longitudinaal.
Voorbeelden van onderzoeksmethoden zijn historische langetermijnstudies en
etnografische studies. Kritisch onderzoek is dat echter niet geweest
veel gebruikt in onderzoek naar informatiesystemen
3.1.2 Doel van het onderzoek
Naast de aard van de zoekopdracht kan ook het doel ervan worden gebruikt
om de onderzoeker te begeleiden bij het selecteren van een bepaalde methode
onderzoek. Het doel van een onderzoeksproject hangt nauw met elkaar samen
naar de positie van de zoekopdracht ten opzichte van de zoekcyclus waaruit bestaat
drie fasen: theorievorming, theorietoetsing en theorieverfijning
theorie. Dus, gebaseerd op het momentum met betrekking tot de zoekcyclus, a
onderzoeksproject kan een verklarend, beschrijvend doel hebben
verkennend of voorspellend.
3.1.2.1 Verkennend onderzoek
Verkennend onderzoek is gericht op het onderzoeken van een onderwerp
totaal nieuw en formuleer onderzoeksvragen en hypothesen
toekomst. Dit type onderzoek wordt gebruikt bij de constructie van
theorie om eerste referenties op een nieuw gebied te krijgen.
Meestal worden kwalitatieve onderzoeksmethoden, zoals cases, gebruikt
van studie of fenomenologische studies.
Het is echter ook mogelijk om kwantitatieve technieken toe te passen, zoals
verkennende onderzoeken of experimenten.
3.1.3.3 Beschrijvend zoeken
Beschrijvend onderzoek is gericht op het analyseren en beschrijven van een groot deel
een specifieke situatie of organisatorische praktijk gedetailleerd beschrijven. Dit
is geschikt voor theorievorming en kan ook gebruikt worden voor
hypothesen bevestigen of betwisten. Meestal beschrijvend onderzoek
omvat het gebruik van metingen en monsters. De meest geschikte onderzoeksmethoden
onderzoeken en analyses van antecedenten omvatten.
3.1.2.3 Verklarende onderzoek
Verklarend onderzoek probeert uit te leggen waarom dingen gebeuren.
Het is gebouwd op feiten die al zijn bestudeerd en proberen te vinden
de redenen voor deze feiten.
Verklarend onderzoek is dus normaal gesproken gebaseerd op onderzoek
verkennend of beschrijvend en ondergeschikt aan testen en verfijnen
de theorieën. Bij verklarend onderzoek wordt normaal gesproken gebruik gemaakt van casestudies
of op enquêtes gebaseerde onderzoeksmethoden.
3.1.2.4 Preventief onderzoek
Preventief onderzoek heeft tot doel gebeurtenissen en gedrag te voorspellen
onder observatie die worden bestudeerd (Marshall en Rossman
1995). Voorspelling is de standaard wetenschappelijke test van de waarheid.
Bij dit type onderzoek wordt doorgaans gebruik gemaakt van enquêtes of analyses van
gegevens historici. (Yin 1989)
Uit bovenstaande discussie blijkt dat er een aantal zijn
mogelijke onderzoeksmethoden die in een onderzoek gebruikt kunnen worden
bijzonder. Er moet echter een specifieke methode zijn die geschikter is
van anderen voor een bepaald type onderzoeksproject. (Galliers
1987, Yin 1989, DeVaus 1991). Iedere onderzoeker heeft dat dus
moeten de sterke en zwakke punten zorgvuldig evalueren
verschillende methoden om te komen tot de meest geschikte onderzoeksmethode e
compatibel met het onderzoeksproject. (Jenkins 1985, Pervan en Klass
1992, Bonomia 1985, Yin 1989, Himilton en Ives 1992).
3.2. Mogelijke zoekmethoden
Het doel van dit project was het bestuderen van de ervaringen in
Australische organisaties met i gegevens opgeslagen met één
ontwikkeling datawarehouse. Dato waarvan er momenteel één is
gebrek aan onderzoek op het gebied van datawarehousing in Australië,
dit onderzoeksproject bevindt zich nog in de theoretische fase van de cyclus
onderzoek en heeft een verkennend doel. Het verkennen van de ervaring in
Australische organisaties die datawarehousing adopteren
vereist interpretatie van de echte samenleving. Bijgevolg is de
de filosofische veronderstelling die ten grondslag ligt aan het onderzoeksproject volgt
de traditionele interpretatie.
Na een rigoureus onderzoek van de beschikbare methoden werden ze geïdentificeerd
twee mogelijke onderzoeksmethoden: enquêtes en casestudies
(casestudies), die gebruikt kunnen worden voor onderzoek
verkennend (Shanks et al. 1993). Galliers (1992) stelt dat
de geschiktheid van deze twee methoden voor dit specifieke onderzoek
de herziene taxonomie zegt dat ze geschikt zijn voor constructie
theoretisch. In de volgende twee subsecties wordt elke methode besproken
detail.
3.2.1 Enquête onderzoeksmethode
De enquêteonderzoeksmethode komt voort uit de eeuwenoude methode van
volkstelling. Een volkstelling bestaat uit het verzamelen van informatie uit
een hele bevolking. Deze methode is duur en onpraktisch
vooral als de bevolking groot is. Dus vergeleken met
volkstelling, is een onderzoek normaal gesproken gericht op de
informatie verzamelen voor een klein aantal, of steekproef, van
vertegenwoordigers van de bevolking (Fowler 1988, Neuman 1994). A
steekproef weerspiegelt de populatie waaruit deze is getrokken, met verschillende
nauwkeurigheidsniveaus, afhankelijk van de monsterstructuur, de
grootte en de gebruikte selectiemethode (Fowler 1988, Babbie
1982, Neumann 1994).
De onderzoeksmethode wordt gedefinieerd als ‘momentopnamen van praktijken,
situaties of opvattingen op een bepaald tijdstip, uitgevoerd met behulp van
vragenlijsten of interviews, waaruit conclusies kunnen worden getrokken
gemaakt” (Galliers 1992:153) [onmiddellijke foto van praktijken,
situaties of opvattingen op een bepaald tijdstip, ondernomen met behulp van
vragenlijsten of interviews, waaruit conclusies kunnen worden getrokken. De
onderzoeken gaan over het verzamelen van informatie over bepaalde aspecten
van het onderzoek, door een bepaald aantal deelnemers, gemaakt
vragen (Fowler 1988). Zelfs deze vragenlijsten en interviews, die
omvatten face-to-face telefonische en gestructureerde interviews,
zijn de verzameltechnieken van gegevens meest gebruikt in
onderzoeken (Blalock 1970, Nachmias en Nachmias 1976, Fowler
1988), kunnen observaties en analyses worden gebruikt (Gable
1994). Van al deze methoden voor het verzamelen van de gegevens, het gebruik van
vragenlijst is de meest populaire techniek, omdat deze ervoor zorgt dat i gegevens
verzameld zijn gestructureerd en geformatteerd, en vergemakkelijkt daarom
classificatie van informatie (Hwang 1987, de Vaus 1991).
Bij het analyseren van i gegevens, maakt een onderzoeksstrategie vaak gebruik van de
kwantitatieve technieken, zoals statistische analyse, maar dat kan ook
Er worden ook kwalitatieve technieken gebruikt (Galliers 1992, Pervan
en Klass 1992, Gable 1994). Normaal gesproken, ik gegevens verzameld zijn
gebruikt om verdelingen en associatiepatronen te analyseren
(Fowler-1988).
Hoewel enquêtes over het algemeen geschikt zijn voor onderzoek
die gaan over de vraag 'wat?' (wat) of ervan
afleiden, zoals 'hoeveel' en 'hoeveel', ze
kan gesteld worden via de ‘waarom’-vraag (Sonquist en
Dunkelberg 1977, Yin 1989). Volgens Sonquist en Dunkelberg
(1977), het onderzoeksonderzoek richt zich op moeilijke hypothesen, programma van
evaluatie, het beschrijven van de bevolking en het ontwikkelen van modellen van
menselijk gedrag. Daarnaast kunnen enquêtes worden gebruikt
om een ​​bepaalde mening over de bevolking, omstandigheden,
meningen, kenmerken, verwachtingen en zelfs gedrag uit het verleden
of heden (Neuman 1994).
Door het onderzoek kan de onderzoeker de relaties tussen de
populatie en de resultaten zijn doorgaans algemener dan
andere methoden (Sonquist en Dunkelberg 1977, Gable 1994). De
enquêtes stellen onderzoekers in staat een geografisch gebied te bestrijken
breder en om veel leiders te bereiken (Blalock 1970,
Sonquist en Dunkelberg 1977, Hwang en Lin 1987, Gable 1994,
Neuman 1994). Ten slotte kunnen enquêtes informatie opleveren
die niet elders of in de voor de analyses vereiste vorm beschikbaar zijn
(Fowler-1988).
Er zijn echter enkele beperkingen bij het uitvoeren van een enquête. Een
nadeel is dat de onderzoeker niet veel informatie kan verkrijgen
over het bestudeerde object. Dit komt doordat de
onderzoeken worden alleen op een bepaald tijdstip uitgevoerd en daarom
er zijn een beperkt aantal variabelen en mensen waar de onderzoeker mee aan de slag kan
studie (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Een ander nadeel is wat het uitvoeren van een enquête kan zijn
erg duur in termen van tijd en middelen, vooral als dat zo is
omvat face-to-face interviews (Fowler 1988).
3.2.2. Onderzoeksmethode
De onderzoekende onderzoeksmethode omvat een diepgaande studie van
een bepaalde situatie binnen zijn werkelijke context in a
bepaalde periode, zonder enige tussenkomst van de kant van de
onderzoeker (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Deze methode wordt voornamelijk gebruikt om de relaties tussen
de variabelen die in een bepaalde situatie worden bestudeerd
(Galliers 1992). Onderzoeken kunnen betrekking hebben op individuele gevallen of op individuele gevallen
meerdere, afhankelijk van het geanalyseerde fenomeen (Franz en Robey 1987,
Eisenhardt 1989, Yin 1989).
De onderzoekende onderzoeksmethode wordt gedefinieerd als ‘een onderzoek’
empirische studie die een hedendaags fenomeen binnen de wereld bestudeert
relatieve reële context, waarbij gebruik wordt gemaakt van meerdere bronnen verzameld uit één of
meerdere entiteiten zoals mensen, groepen of organisaties” (Yin 1989).
Er is geen duidelijke scheiding tussen het fenomeen en zijn context e
er is geen controle of experimentele manipulatie van de variabelen (Yin
1989, Benbasat et al. 1987).
Er zijn verschillende technieken om goden te verzamelen gegevens che possono
worden gebruikt in de onderzoeksmethode, waaronder de
directe observaties, beoordelingen van archiefstukken, vragenlijsten,
beoordeling van documentatie en gestructureerde interviews. Hebben
een breed scala aan oogsttechnieken gegevens, onderzoeken
laat onderzoekers met beide omgaan gegevens kwalitatief dat
hoeveelheden tegelijkertijd (Bonoma 1985, Eisenhardt 1989, Yin
1989, gevel 1994). Zoals het geval is bij de onderzoeksmethode, a
onderzoekende onderzoeker fungeert als waarnemer of onderzoeker en niet
als actieve deelnemer in de onderzochte organisatie.
Benbasat et al. (1987) beweren dat de onderzoeksmethode dat wel is
bijzonder geschikt voor theorievormingsonderzoek
begin met een onderzoeksvraag en ga verder met trainen
van een theorie tijdens het verzamelen gegevens. zijnde
ook geschikt voor op het podium
van theorievorming suggereren Franz en Robey (1987).
Ook voor het complex kan de bevragingsmethode worden toegepast
theorie fase. In dit geval, gebaseerd op het verzamelde bewijsmateriaal, één
gegeven theorie of hypothese wordt geverifieerd of weerlegd. Bovendien is het onderzoek
ook geschikt voor onderzoek dat zich bezighoudt met 'hoe'- of 'hoe'-vragen
'waarom' (Yin 1989).
Vergeleken met andere methoden biedt enquêtes de onderzoeker de mogelijkheid dit te doen
essentiële informatie gedetailleerder vastleggen (Galliers
1992, Shanks et al. 1993). Bovendien laten onderzoeken toe dat de
onderzoeker om de aard en complexiteit van de bestudeerde processen te begrijpen
(Benbasat et al. 1987).
Er zijn vier belangrijke nadelen verbonden aan de methode
onderzoek. De eerste is het gebrek aan gecontroleerde aftrekposten. Daar
subjectiviteit van onderzoekers kan de resultaten en conclusies veranderen
van de studie (Yin 1989). Het tweede nadeel is het ontbreken van
gecontroleerde observatie. In tegenstelling tot experimentele methoden is de
De onderzoekende onderzoeker heeft geen controle over de bestudeerde verschijnselen
zoals ze worden onderzocht in hun natuurlijke context (Gable 1994). De
derde nadeel is het gebrek aan repliceerbaarheid. Dit komt door het feit
dat het onwaarschijnlijk is dat de onderzoeker dezelfde gebeurtenissen zal waarnemen, en
kunnen de resultaten van een bepaald onderzoek niet verifiëren (Lee 1989).
Ten slotte is het, als gevolg van de niet-repliceerbaarheid, moeilijk
generaliseer de resultaten verkregen uit een of meer onderzoeken (Galliers
1992, Shanks et al. 1993). Al deze problemen echter niet
zijn onoverkomelijk en kunnen in feite worden geminimaliseerd door
onderzoeker die passende acties toepast (Lee 1989).
3.3. Motiveer de onderzoeksmethodiek
geadopteerd
Van de twee mogelijke onderzoeksmethoden voor dit onderzoek, de methode van
onderzoek wordt als het meest geschikt beschouwd. Dat van onderzoek is
werd verworpen na een zorgvuldige afweging van de relevante zaken
verdiensten en zwakheden. Het gemak of de ongepastheid van elk
methode voor dit onderzoek wordt hieronder besproken.
3.3.1. Ongepaste onderzoeksmethode
van onderzoek
De onderzoeksmethode vereist diepgaande studie over één
bijzondere situatie binnen een of meer organisaties voor a
tijdsperiode (Eisenhardt 1989). In dit geval kan de periode
het voor dit onderzoek gegeven tijdsbestek overschrijden. Een andere
De reden om de onderzoeksmethode niet toe te passen is dat de resultaten
ze kunnen last hebben van een gebrek aan nauwkeurigheid (Yin 1989). Subjectiviteit
van de onderzoeker kan de resultaten en conclusies beïnvloeden. Een andere
De reden hiervoor is dat deze methode meer geschikt is voor onderzoek naar vragen
van het ‘hoe’- of ‘waarom’-type (Yin 1989), terwijl de onderzoeksvraag centraal staat
voor dit onderzoek is het van het 'wat'-type. Tenslotte
Belangrijk is dat het moeilijk is om de bevindingen van slechts één of meerdere bevindingen te generaliseren
weinig onderzoeken (Galliers 1992, Shanks et al. 1993). Op de basis van
deze rationele verklaring, de onderzoeksmethode van onderzoek is dat niet
Er werd voor gekozen omdat het niet geschikt was voor dit onderzoek.
3.3.2. Gemak van de zoekmethode van
overzicht
Toen dit onderzoek werd uitgevoerd, was de praktijk van datawarehousing
was nog niet algemeen aanvaard door
Australische organisaties. Veel informatie was er dus niet
over de implementatie ervan binnen de
Australische organisaties. De beschikbare informatie kwam
van organisaties die een data hadden geïmplementeerd of gebruikt
magazijn. In dit geval is de enquêteonderzoeksmethode het meest
geschikt omdat u hierdoor informatie kunt verkrijgen die dat niet is
elders beschikbaar of in de voor analyse vereiste vorm (Fowler 1988).
Bovendien biedt de enquêteonderzoeksmethode de onderzoeker de mogelijkheid dit te doen
goed inzicht krijgen in praktijken, situaties of
gezien op een bepaald tijdstip (Galliers 1992, Denscombe 1998).
Er was een totaaloverzicht nodig om de
Kennis over de Australische datawarehousing-ervaring.
Opnieuw stellen Sonquist en Dunkelberg (1977) dat de resultaten van
Surveyonderzoek is algemener dan andere methoden.
3.4. Enquête Onderzoeksontwerp
Het onderzoek naar de datawarehousingpraktijk is in 1999 uitgevoerd.

De doelgroep bestond uit organisaties
Australiërs waren net als zij geïnteresseerd in datawarehousingstudies
waarschijnlijk al geïnformeerd over i gegevens die ze opslaan en,
daarom zou het nuttige informatie voor dit onderzoek kunnen opleveren. Daar
doelgroep werd geïdentificeerd met een eerste onderzoek onder
alle Australische leden van 'The Data Warehousing Institute' (Tdwiaap).
In deze paragraaf wordt de opzet van de onderzoeksfase besproken
empirisch bewijs van deze studie.
3.4.1. Verzamel techniek gegevens
Van de drie technieken die vaak worden gebruikt in enquêteonderzoek
(d.w.z. een vragenlijst per post, een telefonisch interview en een interview
persoonlijk) (Nachmias 1976, Fowler 1988, de Vaus 1991), voor
In dit onderzoek is gebruik gemaakt van de vragenlijst per post. De eerste
De reden om dit laatste te adopteren is dat het een doel kan bereiken
geografisch verspreide bevolking (Blalock 1970, Nachmias e
Nachmias 1976, Hwang en Lin 1987, de Vaus 1991, Gable 1994).
Ten tweede is de vragenlijst per post geschikt voor deelnemers
hoogopgeleid (Fowler 1988). De mailvragenlijst hiervoor
Het onderzoek was gericht aan de sponsors van datawarehousingprojecten,
directeuren en/of projectmanagers. Ten derde, de vragenlijsten weg
mail zijn geschikt als u een beveiligde lijst heeft van
adressen (Salant en Dilman 1994). TDWI, in dit geval één
Trusted Data Warehouse Association leverde de adreslijst
van zijn Australische leden. Nog een voordeel van de vragenlijst
via mail versus telefonische vragenlijst of interviews
persoonlijk is dat inschrijvers hierdoor meer kunnen reageren
nauwkeurigheid, vooral wanneer registranten overleg moeten plegen
maakt aantekeningen of bespreekt vragen met andere mensen (Fowler
1988).
Een potentieel nadeel kan de benodigde tijd zijn
vragenlijsten per post versturen. Normaal gesproken is een vragenlijst weg
e-mail wordt in deze volgorde uitgevoerd: brieven verzenden, wachten op
antwoorden en een bevestiging sturen (Fowler 1988, Bainbridge 1989).
De totale tijd kan dus langer zijn dan de benodigde tijd
persoonlijke interviews of voor telefonische interviews. echter, de
totale tijd kan vooraf bekend zijn (Fowler 1988,
Dencombe 1998). De tijd die besteed wordt aan het afnemen van interviews
persoonsgegevens kunnen niet vooraf bekend zijn omdat deze variëren
het ene interview naar het andere (Fowler 1988). Telefonische interviews
kan sneller zijn dan vragenlijsten per post en
persoonlijke interviews, maar er kan een hoog percentage gemist worden
reactie vanwege de onbeschikbaarheid van sommige mensen (Fowler 1988).
Bovendien zijn telefonische interviews over het algemeen beperkt tot lijsten van
relatief korte vragen (Bainbridge 1989).
Een ander zwak punt van een vragenlijst per post is het hoge percentage
gebrek aan respons (Fowler 1988, Bainbridge 1989, Neuman
1994). Er zijn echter tegenmaatregelen genomen, die associëren
dit onderzoek bij een vertrouwde instelling op het gebied van data
warehousing (d.w.z. TDWI) (Bainbridge 1989, Neuman 1994), de
die twee herinneringsbrieven stuurt naar degenen die niet hebben gereageerd
(Fowler 1988, Neuman 1994) en bevat ook een brief
supplement waarin het doel van het onderzoek wordt uitgelegd (Neuman 1994).
3.4.2. Analyse eenheid
Het doel van dit onderzoek is het verkrijgen van informatie over
de implementatie van datawarehousing en het gebruik ervan
binnen Australische organisaties. De doelgroep
bestaat uit alle Australische organisaties die dat hebben gedaan
geïmplementeerd of zijn aan het implementeren, i datawarehouse. in
vervolgens worden de individuele organisaties geregistreerd. De vragenlijst
het werd per post verzonden naar organisaties die geïnteresseerd waren in adoptie
di datawarehouse. Deze methode zorgt ervoor dat de informatie
verzameld, komen uit de meest geschikte bronnen van elke organisatie
deelnemer.
3.4.3. Enquête steekproef
De “mailinglijst” van deelnemers aan de enquête werd verkregen van
TDWI. Uit deze lijst, 3000 Australische organisaties
werden geselecteerd als basis voor de bemonstering. A
aanvullende brief legde het project en het doel van het onderzoek uit,
samen met een antwoordblad en een vooraf betaalde envelop voor
de ingevulde vragenlijst terugsturen naar de steekproef.
Van de 3000 organisaties stemden er 198 in met deelname aan het
studie. Er was zo weinig respons verwacht dato il
groot aantal Australische organisaties die ze toen hadden
omarmden of omarmden de date-strategie
opslag binnen hun organisaties. Dus de
De doelgroep voor dit onderzoek bestaat uit slechts 198
organisaties.
3.4.4. Inhoud van de vragenlijst
De structuur van de vragenlijst was gebaseerd op het datummodel
Monash warehousing (eerder besproken in deel 2.3). De
De inhoud van de vragenlijst was gebaseerd op de analyse van
literatuur gepresenteerd in hoofdstuk 2. Een kopie van de vragenlijst
die naar de deelnemers aan de enquête zijn verzonden, kunt u vinden
in bijlage B. De vragenlijst bestaat uit zes delen
de fasen van het besproken model volgen. De volgende zes paragrafen
ze vatten kort de inhoud van elke sectie samen.
Sectie A: Basisinformatie over de organisatie
Deze sectie bevat vragen met betrekking tot het profiel van
deelnemende organisaties. Bovendien zijn sommige vragen dat wel
met betrekking tot de toestand van het datawarehousingproject
deelnemer. Vertrouwelijke informatie zoals uw naam
van de organisatie zijn in de enquêteanalyse niet naar voren gekomen.
Sectie B: Begin
De vragen in dit onderdeel hebben betrekking op de startactiviteit
data opslagplaats. Er werd gevraagd voor hoe lang
betreft projectinitiatiefnemers, garanten, vaardigheden en kennis
verzoeken, de doelstellingen van de ontwikkeling van datawarehousing en de
verwachtingen van eindgebruikers.
Sectie C: Ontwerp
Deze sectie bevat vragen met betrekking tot de activiteiten van
planning van datawarehouse. Vooral de vragen zijn
geef informatie over de omvang van de uitvoering, de duur van het project, de kosten
van het project en de kosten-batenanalyse.
Sectie D: Ontwikkeling
In het ontwikkelingsgedeelte staan ​​vragen met betrekking tot de activiteiten van
ontwikkeling datawarehouse: verzameling van gebruikersvereisten
tenslotte, de bronnen van gegevens, het logische model van gegevens, prototypen, de
capaciteitsplanning, technische architecturen en selectie van
ontwikkelingstools voor datawarehousing.
Sectie E: Bediening
Operatievragen gerelateerd aan operatie ed
naar de uitbreidbaarheid van datawarehouse, hoe het zich ontwikkelt
volgende ontwikkelingsfase. Daar data kwaliteit, de strategieën van
ververs dei gegevens, de granulariteit van gegevens, schaalbaarheid van gegevens
magazijn en de veiligheidsproblemen van datawarehouse ze zaten ertussen
het soort vragen dat wordt gesteld.
Sectie F: Ontwikkeling
Dit gedeelte bevat vragen over datagebruik
magazijn door eindgebruikers. De onderzoeker was geïnteresseerd
naar het doel en nut van datawarehouse, beoordeling en strategieën
van de gevolgde opleidingen en de strategie voor gegevenscontrole
magazijn aangenomen.
3.4.5. Responspercentage
Hoewel postenquêtes worden bekritiseerd omdat ze een percentage hebben van
lage respons, er zijn maatregelen genomen om de respons te vergroten
rendement (zoals eerder gedeeltelijk besproken
3.4.1). De term 'responspercentage' verwijst naar het percentage van
mensen in een bepaalde enquêtesteekproef die reageren op de
vragenlijst (Denscombe 1998). Het volgende werd gebruikt
formule om het responspercentage voor dit onderzoek te berekenen:
Aantal mensen dat heeft gereageerd
Reactiepercentage =
——————————————————————————– X 100
Totaal aantal verzonden vragenlijsten
3.4.6. Test piloot
Voordat de vragenlijst naar de steekproef wordt gestuurd, worden de vragen gesteld
onderzocht door het uitvoeren van pilottests, zoals voorgesteld door Luck
en Rubin (1987), Jackson (1988) en de Vaus (1991). Het doel van
pilottests is om alle lastige, dubbelzinnige en uitdrukkingen te onthullen
vragen die moeilijk te interpreteren zijn, om ze te verduidelijken
gebruikte definities en termen en om de geschatte tijd te identificeren
vereist om de vragenlijst in te vullen (Warwick en Lininger 1975,
Jackson 1988, Salant en Dilman 1994). De pilottests waren
uitgevoerd door onderwerpen te selecteren met soortgelijke kenmerken
van de eindvakken, zoals voorgesteld Davis e Cosenza (1993). In
voor dit onderzoek waren dat zes datawarehousingprofessionals
geselecteerd als proefonderwerpen. Na elke pilottest zijn ze dat
noodzakelijke correcties zijn aangebracht. Uit de uitgevoerde pilottests blijkt dat i
deelnemers hielpen bij het hervormen en resetten van de
definitieve versie van de vragenlijst.
3.4.7. Analysemethoden van Geven
I gegevens van het onderzoek verzameld uit vragenlijsten met gesloten vragen
werden geanalyseerd met behulp van een statistisch softwarepakket
genaamd SPSS. Veel van de reacties zijn geanalyseerd
gebruik van beschrijvende statistiek. Een bepaald aantal vragenlijsten
ze kwamen onvolledig terug. Deze werden met groter behandeld
aandacht om ervoor te zorgen dat i gegevens vermist waren er niet één
gevolg van fouten bij het invoeren van gegevens, maar waarom de vragen dat niet doen
geschikt waren voor de leider, of de leider besloot dat niet te doen
een of meer specifieke vragen beantwoorden. Deze antwoorden
ontbrekende gegevens werden tijdens de analyse genegeerd gegevens en dat waren ze
gecodeerd als '- 9' om hun uitsluiting van het proces te garanderen
analyses.
Bij het opstellen van de vragenlijst waren de vragen gesloten
vooraf gecodeerd door aan elke optie een nummer toe te wijzen. Het nummer
vervolgens werd het gebruikt om i gegevens tijdens de analyse
(Denscombe 1998, Sapsford en Jupp 1996). Die waren er bijvoorbeeld
zes opties genoemd in vraag 1 van deel B: advies
bestuur, senior executive, IT-afdeling, eenheid
van bedrijven, consultants en meer. In het bestand van gegevens van SPSS, nl
er is een variabele gegenereerd om 'de projectinitiator' aan te duiden,
met zes waardelabels: '1' voor 'raad van bestuur', '2'
voor 'de leidinggevende op hoog niveau', enzovoort. Het gebruik van de Likertin-schaal
bij sommige gesloten vragen was dit ook toegestaan
een identificatie die geen inspanning vergt gezien het gebruik van waarden
overeenkomstige nummers ingevoerd in SPSS. Voor vragen met de
niet-uitputtende antwoorden, die elkaar niet uitsluiten,
elke optie werd behandeld als een enkele variabele met twee
waardelabels: '1' voor 'gemarkeerd' en '2' voor 'ongemarkeerd'.
Open vragen werden anders behandeld dan vragen
gesloten. De antwoorden op deze vragen zijn niet ingevuld
SPSS. In plaats daarvan werden ze met de hand geanalyseerd. Het gebruik hiervan
Met dit soort vragen kunt u informatie over ideeën verkrijgen
vrijelijk geuit en de persoonlijke ervaringen van de respondenten
(Bainbridge 1989, Denscombe 1998). Waar mogelijk is dat gedaan
een categorisering van de antwoorden.
Voor de analyse van gegevensworden eenvoudige statistische analysemethoden gebruikt,
zoals de frequentie van de reacties, het gemiddelde, de standaarddeviatie
gemiddelde en de mediaan (Argyrous 1996, Denscombe 1998).
De Gamma-test was effectief voor het verkrijgen van kwantitatieve metingen
van de associaties tussen gegevens rangtelwoorden (Norusis 1983, Argyrous 1996).
Deze tests waren geschikt omdat de gebruikte ordinale schalen dat niet waren
ze hadden veel categorieën en konden in een tabel worden weergegeven
(Norusis 1983).
3.5 Samenvatting
In dit hoofdstuk worden de onderzoeksmethodologie en de
ontwerpen die voor dit onderzoek zijn aangenomen.
Het selecteren van de meest geschikte onderzoeksmethode voor a
bepaalde studie in beslag neemt
rekening houden met een aantal regels, waaronder aard en type
van onderzoek, evenals de voordelen en zwakke punten van elk mogelijk onderzoek
methode (Jenkins 1985, Benbasat et al. 1097, Galliers en Land 1987,
yin 1989, Hamilton en Ives 1992, Galliers 1992, neuman 1994). Weergave
het gebrek aan bestaande kennis en theorie erover
van de adoptie van datawarehousing in Australië, blijkt uit dit onderzoek van
onderzoek vereist een interpretatieve onderzoeksmethode met een vaardigheid
verkennend om de ervaringen van organisaties te verkennen
Australisch. Er is gekozen voor de gekozen onderzoeksmethode
informatie verzamelen over de adoptie van het datumconcept
opslag door Australische organisaties. A
Als verzameltechniek werd gekozen voor een vragenlijst per post gegevens. De
rechtvaardigingen voor de onderzoeksmethode en verzameltechniek gegevens
geselecteerd, vindt u in dit hoofdstuk. Dat was het ook
presenteerde een discussie over de eenheid van analyse, het monster
gebruikt, de percentages antwoorden, de inhoud van de vragenlijst, de
pre-test van de vragenlijst en de analysemethode van de gegevens.

Het ontwerpen van een Datawarehouse:
Combinatie van entiteitsrelaties en dimensionale modellering
SAMENVATTING
Winkel ik gegevens Het is voor velen een groot actueel onderwerp
organisaties. Een sleutelprobleem in de ontwikkeling
van de opslag van gegevens het is zijn ontwerp.
Het ontwerp moet de detectie van concepten in de data ondersteunen
magazijn naar een verouderd systeem en andere bronnen van gegevens en ook een
eenvoudig begrip en efficiëntie bij de implementatie van gegevens
magazijn.
Een groot deel van de magazijnliteratuur gegevens aanbevolen
het gebruik van entiteitsrelatiemodellering of dimensionale modellering voor
vertegenwoordigen het ontwerp van datawarehouse.
In dit artikel laten we zien hoe beide
representaties kunnen worden gecombineerd in één benadering voor de
tekening van datawarehouse. De gehanteerde aanpak is systematisch
onderzocht in een casestudy en wordt in een aantal geïdentificeerd
belangrijke implicaties voor professionals.
DATA OPSLAGPLAATS
Un datawarehouse wordt gewoonlijk gedefinieerd als een “vakgerichte,
geïntegreerde, tijdsvariante en niet-vluchtige verzameling van gegevens ter ondersteuning
van de beslissingen van het management” (Inmon en Hackathorn, 1994).
Vakgericht en geïntegreerd geeft aan dat de datawarehouse è
ontworpen om de functionele grenzen van oudere systemen te overschrijden
een geïntegreerd perspectief bieden gegevens.
Tijdvariant houdt zich bezig met het historische of tijdreekskarakter van video gegevens in
un datawarehouse, waarmee trends kunnen worden geanalyseerd.
Niet-vluchtig geeft aan dat de datawarehouse het is niet continu
bijgewerkt als een databank van OLTP. Het wordt eerder bijgewerkt
periodiek, met gegevens uit interne en externe bronnen. De
datawarehouse het is specifiek ontworpen voor onderzoek
in plaats van voor de integriteit van de updates en de prestaties van de
activiteiten.
Het idee om i gegevens het is niet nieuw, het was een van de doeleinden
van het beheer van gegevens sinds de jaren zestig (Il Martin, 1982).
I datawarehouse zij bieden de infrastructuur gegevens voor beheer
ondersteunende systemen. Managementondersteunende systemen omvatten besluitvorming
ondersteunende systemen (DSS) en uitvoerende informatiesystemen (EIS).
Een DSS is een computergebaseerd informatiesysteem
ontworpen om het proces en daarmee de grip te verbeteren
menselijke beslissing. Een EIS is doorgaans een leveringssysteem van
gegevens waardoor bedrijfsleiders eenvoudig toegang hebben tot de weergave
van gegevens.
De algemene architectuur van een datawarehouse benadrukt de rol van
datawarehouse op het gebied van managementondersteuning. Naast het aanbieden
de infrastructuur gegevens voor EIS en DSS, al datawarehouse è possibile
krijg er rechtstreeks toegang toe via queries. DE gegevens opgenomen in een datum
magazijn zijn gebaseerd op een analyse van de informatiebehoefte
management en worden verkregen uit drie bronnen: interne legacy-systemen,
systemen voor het vastleggen van gegevens voor speciale doeleinden en externe gegevensbronnen. DE
gegevens in interne legacy-systemen zijn ze vaak overbodig,
inconsistent, van lage kwaliteit en opgeslagen in meerdere formaten
ze moeten dus worden afgestemd en schoongemaakt voordat u ze in de
datawarehouse (Inmon, 1992; McFadden, 1996). DE gegevens van
uit opslagsystemen gegevens ad hoc en uit bronnen gegevens
extern worden vaak gebruikt om i te vergroten (bijwerken, vervangen).
gegevens uit verouderde systemen.
Er zijn veel dwingende redenen om een datawarehouse,
waaronder betere besluitvorming door gebruik
effectief meer informatie (Ives 1995), ondersteuning voor een focus
op complete business (Graham 1996), en de verlaging van de kosten van
bepaling van gegevens voor EIS en DSS (Graham 1996, McFadden
1996).
Uit een recent empirisch onderzoek bleek gemiddeld een rendement van
investeringen voor i datawarehouse met 401% na drie jaar (Graham,
1996). Echter, de andere empirische studies van datawarehouse hebben
aanzienlijke problemen gevonden, waaronder problemen bij het meten van ed
het toekennen van voordelen, het ontbreken van een duidelijk doel, het onderschatten ervan
doel en complexiteit van het opslagproces i gegevensin
bijzonder met betrekking tot de bronnen en de netheid van de gegevens.
Winkel ik gegevens kan als oplossing worden beschouwd
op het probleem van het beheer van gegevens tussen organisaties. Daar
manipulatie van gegevens als sociale hulpbron is het een van de belangrijkste gebleven
belangrijke kwesties bij het beheer van informatiesystemen in de hele wereld
wereld gedurende vele jaren (Brancheau et al. 1996, Galliers et al. 1994,
Niederman et al. 1990, Pervan 1993).
Een populaire benadering van vermogensbeheer gegevens in de jaren tachtig was dat zo
het ontwikkelen van een model gegevens sociaal. Model gegevens sociaal geweest
ontworpen om een ​​stabiele basis te bieden voor de ontwikkeling van nieuwe systemen
toepassingen e databank en het opnieuw opbouwen en integreren van erfgoed
systemen (Brancheau et al.
1989, Goodhue et al. 1988:1992, Kim en Everest 1994).
Er kleven echter veel problemen aan deze aanpak
met name de complexiteit en de kosten van elke taak, en de lange tijd
vereist om tastbare resultaten te behalen (Beynon-Davies 1994, Earl
1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997).
Il datawarehouse het is een aparte database die naast de oudere databases bestaat
databases in plaats van deze te vervangen. Het staat je daarom toe
leiding geven aan het bestuur gegevens en vermijd kostbare wederopbouw
van oudere systemen.
BESTAANDE BENADERINGEN VAN DATA DESIGN
MAGAZIJN
Het proces van bouwen en perfectioneren van een datawarehouse
moet meer worden begrepen als een evolutionair proces dan als een
ontwikkelingslevenscyclus van traditionele systemen (Desio, 1995, Shanks,
O'Donnell en Arnott 1997a). Er zijn veel processen betrokken bij een
project van datawarehouse zoals initialisatie, planning;
informatie verkregen uit de eisen die aan bedrijfsmanagers worden gesteld;
bronnen, transformaties, schoonmaak van gegevens en synchronisatie vanuit de oude versie
systemen en andere bronnen van gegevens; leveringssystemen in ontwikkeling;
Toezicht houden op datawarehouse; en zinloosheid van het proces
evolutionaire en constructie van a datawarehouse (Stinchs, O'Donnell
en Arnott 1997b). In dit tijdschrift besteden we aandacht aan hoe
teken ik gegevens opgeslagen in de context van deze andere processen.
Er zijn een aantal benaderingen voorgesteld voor data-architectuur
magazijn in de literatuur (Inmon 1994, Ives 1995, Kimball 1994
McFadden 1996). Elk van deze methodieken heeft een korte inhoud
beoordelen met een analyse van hun sterke en zwakke punten.
Inmon's (1994) benadering voor Datawarehouse
Design
Inmon (1994) stelde vier iteratieve stappen voor om gegevens te verzamelen
magazijn (zie figuur 2). De eerste stap is het ontwerpen van een sjabloon
gegevens sociaal om te begrijpen hoe ik gegevens kan worden geïntegreerd
over functionele gebieden binnen een organisatie
het verdelen van ik gegevens opslaan in gebieden. Model gegevens het is gemaakt voor
opslaan gegevens met betrekking tot besluitvorming, inclusief gegevens
historisch, en inbegrepen gegevens afgeleid en samengevoegd. De tweede stap is
onderwerpen voor implementatie identificeren. Deze zijn gebaseerd
op prioriteiten die door een bepaalde organisatie zijn bepaald. De derde
stap omvat het tekenen van a databank voor het vakgebied, poses
besteed bijzondere aandacht aan het opnemen van passende niveaus van granulariteit.
Inmon raadt aan het entiteiten- en relatiesmodel te gebruiken. Vierde
stap is het identificeren van bronsystemen gegevens nodig hebben en ontwikkelen
transformatieprocessen om vast te leggen, op te schonen en te formatteren i gegevens.
De sterke punten van de aanpak van Inmon zijn dat het model gegevens sociaal
biedt de basis voor de integratie van gegevens binnen de organisatie
en ondersteuning van de planning voor iteratieve gegevensontwikkeling
magazijn. De tekortkomingen zijn de moeilijkheidsgraad en de kosten van tekenen
het model gegevens sociaal, de moeilijkheid om modellen van entiteiten te begrijpen en
relaties die in beide modellen worden gebruikt, dat gegevens sociaal en dat van gegevens
opgeslagen per onderwerp, en de geschiktheid van de gegevens del
tekening van datawarehouse voor de realisatie van databank
relationeel maar niet voor databank multidimensionaal.
Ives' (1995) benadering van Datawarehouse
Design
Ives (1995) stelt een aanpak in vier stappen voor voor het ontwerpen van een
informatiesysteem dat hij van toepassing acht op het ontwerp van een data
magazijn (zie figuur 3). De aanpak is zeer gebaseerd op
Information Engineering voor de ontwikkeling van informatiesystemen
(Martijn 1990). De eerste stap is het bepalen van de doelstellingen, de factoren
kritische en succesvolle en belangrijke prestatie-indicatoren. DE
belangrijkste bedrijfsprocessen en noodzakelijke informatie zijn
gemodelleerd om ons naar een model te leiden gegevens sociaal. De tweede stap
omvat de ontwikkeling van een bepalende architectuur gegevens
opgeslagen per gebied, databank di datawarehouse, de onderdelen
van de technologie die nodig is, de set van organisatorische ondersteuning
vereist om te implementeren en ermee te werken datawarehouse. De derde
stap omvat het selecteren van de vereiste softwarepakketten en tools.
De vierde stap is het gedetailleerde ontwerp en de constructie van de
datawarehouse. Ives merkt die winkel op gegevens hij is een gebonden man
iteratief proces.
De kracht van Ives' aanpak is het gebruik van specifieke technieken voor
bepalen informatie-eisen, het gebruik van een gestructureerde
proces ter ondersteuning van de integratie van datawarehouse,
de juiste hardware- en softwareselectie en het gebruik van meerdere
representatietechnieken voor de datawarehouse. Zijn gebreken
ze zijn inherent aan complexiteit. Anderen omvatten moeilijkheden in
vele niveaus ontwikkelen databank binnen de datawarehouse in
redelijke tijden en kosten.
Kimball's (1994) benadering van Datawarehouse
Design
Kimball (1994) stelde vijf iteratieve stappen voor om gegevens te verzamelen
magazijn (zie figuur 4). Zijn aanpak is bijzonder
gewijd aan het ontwerp van slechts één datawarehouse en over het gebruik van modellen
dimensionaal in plaats van modellen van entiteiten en relaties. Kimbal
analyseer die dimensionale modellen omdat het voor mij gemakkelijker is om ze te begrijpen
zakenlieden zakendoen, is het efficiënter bij het handelen
complexe consultaties, en het ontwerp ervan databank fysiek is meer
efficiënt (Kimball 1994). Kimball erkent dat de ontwikkeling van een
datawarehouse is iteratief, en dat datawarehouse gescheiden kunnen ze
geïntegreerd worden door de indeling in dimensietabellen
gemeenschappelijk.
De eerste stap is het identificeren van het specifieke onderwerpgebied dat moet worden behandeld
geperfectioneerd. De tweede en derde stap hebben betrekking op het vormgeven
dimensionaal. In de tweede stap brengen de metingen zaken in kaart
interesse in het vakgebied en gegroepeerd in een feitentabel.
In een verkooponderwerp zijn bijvoorbeeld de maatregelen van belang
kan het aantal verkochte artikelen en de dollar omvatten
als verkoopvaluta. De derde stap betreft het identificeren
dimensies, wat de manieren zijn waarop ze kunnen worden gegroepeerd i
feiten. In een verkooponderwerpgebied: relevante dimensies
kan item, locatie en tijdsperiode bevatten. Daar
feitentabel heeft een meerdelige sleutel die aan elke tabel kan worden gekoppeld
van dimensietabellen en bevat doorgaans een heel aantal
vol feiten. Dimensietabellen bevatten daarentegen
beschrijvende informatie over dimensies en andere attributen
kan worden gebruikt om feiten te groeperen. De feitentabel e
dimensies geassocieerd met het voorstel vormen wat één wordt genoemd
sterpatroon vanwege zijn vorm. De vierde stap houdt in
de bouw van een databank multidimensionaal om het te perfectioneren
ster patroon. De laatste stap is het identificeren van bronsystemen gegevens
vereist en ontwikkel transformatieprocessen om te verwerven, schoon te maken
en formaat ik gegevens.
De sterke punten van Kimballs aanpak zijn onder meer het gebruik van modellen
dimensionaal om i weer te geven gegevens opgeslagen die het maken
gemakkelijk te begrijpen en leidt tot een efficiënt fysiek ontwerp. A
dimensionaal model dat beide ook gemakkelijk gebruikt
systemen van databank relationeel kan worden geperfectioneerd of systemen
databank multidimensionaal. Tot de tekortkomingen behoort gebrek
van enkele technieken om de planning of integratie ervan te vergemakkelijken
veel sterpatronen binnen één datawarehouse en
moeilijkheid bij het ontwerpen vanuit de extreem gedenormaliseerde structuur in a
dimensionaal model a gegevens in verouderde systemen.
McFaddens (1996) Benadering van gegevens
Magazijnontwerp
McFadden (1996) stelt een aanpak in vijf stappen voor
teken een datawarehouse (zie figuur 5).
Zijn aanpak is gebaseerd op een synthese van ideeën uit de literatuur
en is gericht op het ontwerp van slechts één datawarehouse. De eerste
stap omvat een analyse van de vereisten. Hoewel de bijzonderheden
technieken zijn niet voorgeschreven, de aantekeningen van McFadden identificeren de
entiteit gegevens specificaties en hun kenmerken, en verwijst naar Watson-lezers
en Frolick (1993) voor het vastleggen van vereisten.
In de tweede stap wordt een entiteitsrelatiemodel getekend
datawarehouse en vervolgens gevalideerd door bedrijfsleiders. De derde
stap omvat het bepalen van de mapping van het oude systeem
en externe bronnen van datawarehouse. De vierde stap houdt in
processen bij de ontwikkeling, implementatie en synchronisatie van gegevens in
datawarehouse. In de laatste stap wordt het systeem opgeleverd
ontwikkeld met bijzondere nadruk op een gebruikersinterface.
McFadden wijst erop dat het tekenproces over het algemeen is
iteratief.
De sterke punten van McFaddens aanpak wijzen op participatie
door bedrijfsleiders bij het bepalen van vereisten en ook
het belang van hulpbronnen gegevens, hun schoonmaak en inzameling. Haar
tekortkomingen betreffen het ontbreken van een proces voor het verdelen van a
geweldig project van datawarehouse in veel geïntegreerde stadia, en daar
moeite met het begrijpen van de entiteits- en relatiemodellen die zijn gebruikt bij het ontwerpen van
datawarehouse.

    0/5 (0 beoordelingen)
    0/5 (0 beoordelingen)
    0/5 (0 beoordelingen)

    Lees meer bij Online Web Agency

    Schrijf u in om de nieuwste artikelen per e-mail te ontvangen.

    auteur avatar
    beheerder CEO
    👍Online Webbureau | Webbureau-expert in digitale marketing en SEO. Webbureau Online is een Webbureau. Voor Agenzia Web Online is succes in digitale transformatie gebaseerd op de fundamenten van Iron SEO versie 3. Specialiteiten: systeemintegratie, integratie van bedrijfsapplicaties, servicegerichte architectuur, cloud computing, datawarehouse, business intelligence, big data, portals, intranetten, webapplicaties Ontwerp en beheer van relationele en multidimensionale databases Ontwerpen van interfaces voor digitale media: bruikbaarheid en graphics. Online Web Agency biedt bedrijven de volgende diensten: -SEO op Google, Amazon, Bing, Yandex; -Webanalyse: Google Analytics, Google Tag Manager, Yandex Metrica; -Gebruikersconversies: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM op Google, Bing, Amazon-advertenties; -Socialemediamarketing (Facebook, Linkedin, Youtube, Instagram).
    Mijn Agile-privacy
    Deze site maakt gebruik van technische en profileringscookies. Door op accepteren te klikken, autoriseert u alle profileringscookies. Door op weigeren of de X te klikken, worden alle profileringscookies afgewezen. Door op aanpassen te klikken, kunt u selecteren welke profileringscookies u wilt activeren.
    Deze site voldoet aan de Wet Bescherming Persoonsgegevens (LPD), de Zwitserse federale wet van 25 september 2020, en de AVG, EU-verordening 2016/679, met betrekking tot de bescherming van persoonlijke gegevens en het vrije verkeer van dergelijke gegevens.