fbpx

Hurtownia danych i ERP | CENTRALNE ARCHIWUM DANYCH: HISTORIA I EWOLUCJE

ARCHIWUM DATA CENTRALNY: HISTORIA I EWOLUCJE


Dwa dominujące tematy technologii korporacyjnej w latach 90. to
stany ja hurtownia danych i ERP. Przez długi czas tych dwóch potężnych
prądy były częścią korporacyjnego IT, ale nigdy nie miały
skrzyżowania. To było prawie tak, jakby były materią i antymaterią. Ale
rozwój obu zjawisk nieuchronnie doprowadził do jednego
ich skrzyżowanie. Dziś firmy borykają się z problemem
co zrobić z ERP e hurtownia danych. Ten artykuł zilustruje
jakie są problemy i jak rozwiązują je firmy.
NA POCZĄTKU…
Na początku było hurtownia danych. Hurtownia danych urodził się dla
licznik systemu aplikacji przetwarzania transakcji.
W pierwszych dniach zapamiętywanie dać tak miało być
tylko kontrapunkt dla przetwarzania wniosków
transakcje. Ale obecnie są znacznie bardziej wyrafinowane wizje
niż co hurtownia danych. W dzisiejszym świecie
hurtownia danych jest umieszczony w strukturze, która może być
zwana Firmową Fabryką Informacji.
KORPORACYJNA FABRYKA INFORMACJI
(CIF)
Korporacyjna fabryka informacji zawiera elementy architektoniczne
standard: poziom transformacji i integracji kodu
która integruje ja dać podczas gdy ja dać przemieszczają się ze środowiska
środowiskowe zastosowanie hurtownia danych firmy; a
hurtownia danych firmy, w której ja dać
szczegółowe i zintegrowane historie. ten hurtownia danych spółki pełni funkcję
fundament, na którym można zbudować wszystkie inne części
środowiska hurtownia danych; operacyjne magazyny danych (ODS).
ODS to struktura hybrydowa, która zawiera pewne aspekty danych
magazyn i inne aspekty środowiska OLTP; hurtownie danych, w których i
różne działy mogą mieć własne wersje danych
hala magazynowa; a hurtownia danych eksploracji, w której ja
„Myśliciele” firmy mogą zadawać pytania
72 godziny bez szkodliwego wpływu na hurtownia danych; i wspomnienie
w pobliżu linii, w której dać stary i dać szczegóły zbiorcze mogą być
przechowywane tanio.
GDZIE ERP ŁĄCZY SIĘ Z
FABRYKA INFORMACJI KORPORACYJNYCH
ERP łączy się z Korporacyjną Fabryką Informacji w dwóch miejscach.
Najpierw jako aplikacja podstawowa (linia bazowa), która zapewnia
dać wniosku do hurtownia danych, W tym przypadku ja dać,
generowany jako produkt uboczny procesu transakcyjnego,
są zintegrowane i ładowane do hurtownia danych firmy. ten
drugi punkt połączenia między ERP i CIF a ODS. Rzeczywiście, wielu
środowiskach ERP jest używany jako klasyczny ODS.
Jeśli ERP jest używana jako aplikacja podstawowa, to jest
ten sam ERP może być również używany w CIF jako ODS. W
jeśli jednak ERP ma być używany w obu rolach, to tam
musi to być wyraźne rozróżnienie między tymi dwoma podmiotami. Innymi słowy,
gdy ERP odgrywa rolę aplikacji podstawowej, a ODS, plik
dwie jednostki architektoniczne muszą być różne. Jeśli jeden
wdrażanie ERP próbuje odgrywać obie role
w tym samym czasie nieuchronnie pojawią się problemy w
projekt i wykonanie tej konstrukcji.
ODDZIELNE SZWO I PODSTAWOWE ZASTOSOWANIA
Istnieje wiele przyczyn, które prowadzą do rozszczepienia komponentów
architektoniczny. Być może najbardziej wymowne pytanie, aby oddzielić
różne składniki architektury to każdy składnik
architektury ma swój własny pogląd. Potrzebna jest aplikacja podstawowa
w innym celu niż ODS. Spróbuj się pokryć
podstawowy pogląd aplikacji na świat ODS lub odwrotnie
to nie jest właściwy sposób pracy.
W związku z tym pierwszym problemem ERP w CIF jest problem
sprawdź, czy istnieje rozróżnienie między aplikacjami bazowymi a
SZWO.
MODELE DANYCH W FIRMIE
FABRYKA INFORMACJI
Aby osiągnąć spójność między różnymi komponentami
architektury CIF, musi istnieć model dać.
modele dać służyć jako łącznik między różnymi komponentami
architektura, taka jak aplikacje podstawowe i ODS. THE
modele dać stać się „intelektualną mapą drogową”, aby mieć
właściwe znaczenie przez różne elementy architektoniczne CIF.
Idąc ramię w ramię z tym pojęciem, idea jest taka, że ​​powinno być
być wspaniałym i wyjątkowym modelem dać. Oczywiście musi
być wzorem dać dla każdego ze składników, a ponadto tam
musi to być rozsądna ścieżka łącząca różne modele.
Każdy element architektury - ODS, aplikacje bazowe,
hurtownia danych firma i tak dalej.. - potrzebuje własnej
model dać. Musi więc istnieć dokładna definicja
jak te modele dać komunikują się ze sobą.
PRZESUŃ I DATA Z DATY ERP
MAGAZYN
Jeśli pochodzenie dać jest aplikacją bazową i/lub SZWO, gdy
Wkładki ERP i dać w hurtownia danych, takie wstawienie musi
występują na najniższym poziomie „ziarnistości”. Podsumowanie lub
po prostu agregować i dać jak wychodzą
z podstawowego zastosowania ERP lub ODS w ERP nie jest
właściwa rzecz do zrobienia. TEN dać szczegóły są potrzebne w terminie
magazyn stanowiący podstawę procesu DSS. Taki dać
zostaną one przekształcone na wiele sposobów dzięki bazom danych i eksploracjom
del hurtownia danych.
Przemieszczenie dać z bazowego środowiska aplikacji
ERP do środowiska of hurtownia danych firmy odbywa się w
dość zrelaksowany. Ta zmiana następuje potem
około 24 godziny od aktualizacji lub utworzenia w ERP. Fakt
mieć „leniwy” ruch bogów dać w hurtownia danych
firmy pozwala na dać pochodzących z ERP do "uregulowania".
Gdy dać są zdeponowane w aplikacji bazowej,
wtedy możesz bezpiecznie się ruszać i dać ERP
w firmie. Kolejny cel osiągalny dzięki ruchowi
„Leniwi” bogowie dać jest wyraźne rozgraniczenie między procesami operacyjnymi a
DSS. Z „szybkim” ruchem dać linia podziału
między DSS a operacją pozostaje niejasny.
Il movemento dei dać od ODS ERP do hurtownia danych
firmy odbywa się zazwyczaj okresowo
co tydzień lub co miesiąc. W tym przypadku ruch
dać opiera się na potrzebie „oczyszczenia” starego dać historycy.
Oczywiście ODS zawiera i dać które są znacznie nowsze
w stosunku do dać historycy znaleźli się w hurtownia danych.
Przemieszczenie dać w hurtownia danych to prawie nigdy się nie kończy
„Hurt” (na zasadach hurtowych). Skopiuj tabelę
ze środowiska ERP do hurtownia danych to nie ma sensu. Jedno podejście
znacznie bardziej realistyczne jest przemieszczenie wybranych jednostek dać.
Tylko dać które zmieniły się od ostatniej aktualizacji daty
hurtownie to te, które powinny zostać przeniesione w danych
hala magazynowa. Jeden sposób, aby wiedzieć, które z nich dać zostały zmodyfikowane
od ostatniej aktualizacji jest spojrzenie na sygnatury czasowe dać
znalezione w środowisku ERP. Projektant wybiera wszystkie zmiany
które miały miejsce od ostatniej aktualizacji. Inne podejście
jest wykorzystanie technik akwizycji zmian dać. Z
Techniki te są analizowane na taśmach dziennika i dziennika w celu
określić, które z nich dać musi zostać przeniesiony ze środowiska ERP do
Że z hurtownia danych. Te techniki są najlepsze w
ile dzienników i taśm dziennika można odczytać z plików ERP
bez dalszych skutków dla innych zasobów ERP.
INNE POWIKŁANIA
Jednym z problemów z ERP w CIF jest to, co dzieje się z innymi
źródła aplikacji lub ai dać ODS, które muszą przyczyniać się do:
hurtownia danych ale nie są częścią środowiska ERP. Biorąc pod uwagę
zamknięty charakter ERP, szczególnie SAP, próba integracji
klucze z zewnętrznych źródeł dać z dać które pochodzą z ERP do
czas się ruszyć ja dać w hurtownia danych, to wielkie wyzwanie.
A ile dokładnie jest prawdopodobieństw, że ja dać aplikacji lub
ODS poza środowiskiem ERP zostaną zintegrowane z danymi
magazyn? Szanse są w rzeczywistości bardzo wysokie.
ODKRYCIE DATA HISTORYKI Z ERP
Kolejny problem z dać ERP to wynikowy
z potrzeby posiadania dać historyczny w obrębie hurtownia danych.
Zwykle hurtownia danych on potrzebuje dać historycy. ORAZ
zazwyczaj technologia ERP ich nie przechowuje dać
historyczne, przynajmniej nie do momentu, w którym jest potrzebne w dniu
hala magazynowa. Gdy duża ilość dać historycy zaczynają
zostać dodane do środowiska ERP, takie środowisko musi być
oczyszczone. Załóżmy na przykład, że hurtownia danych musieć
być naładowanym pięcioma latami dać historyczne, podczas gdy ERP posiada
maksymalnie sześć miesięcy z nich dać. Dopóki firma jest zadowolona z
zbierać różne dać historyczny w miarę upływu czasu,
wtedy nie ma problemów z wykorzystaniem ERP jako źródła dla
hurtownia danych. Ale kiedy hurtownia danych muszę iść
cofnij się w czasie i weź bogów dać historycy, którzy nie byli
wcześniej zebrane i zapisane przez ERP, a następnie środowisko ERP
staje się nieefektywne.
ERP I METADANE
Kolejna uwaga dotycząca ERP i hurtownia danych to jest to
na istniejących metadanych w środowisku ERP. A także metadane
przechodzą ze środowiska ERP do hurtownia danych,
metadane należy przenosić w ten sam sposób. Ponadto i
metadane należy przekształcić pod względem formatu i struktury
wymagane przez infrastrukturę hurtownia danych. Jest duży
różnica między metadanymi operacyjnymi a metadanymi DSS. Metadane
operacyjne są głównie dla dewelopera i dla
programista. Metadane DSS są przeznaczone głównie dla użytkownika
finał. Istniejące metadane w aplikacjach ERP lub ODS
muszą się nawrócić, a to nawrócenie nie zawsze jest łatwe
i bezpośrednio.
POZYSKIWANIE DANYCH ERP
Jeśli ERP jest używany jako dostawca dać dla hurtownia danych ci
musi to być solidny interfejs, który się porusza i dać ze środowiska
ERP do środowiska hurtownia danych. Interfejs musi:
▪ być łatwy w użyciu
▪ zezwól na dostęp do dać ERP
▪ przyjmij znaczenie dać które mają zostać przeniesione
w hurtownia danych
▪ znać ograniczenia ERP, które mogą się pojawić w
czas, kiedy logujesz się do dać ERP:
▪ referencyjna integralność
▪ relacje hierarchiczne
▪ niejawne relacje logiczne
▪ konwencja aplikacji
▪ wszystkie struktury dać obsługiwane przez ERP i tak dalej...
▪ być skutecznym w dostępie dać, dostarczać:
▪ bezpośredni ruch dać
▪ akwizycja zmiany dać
▪ wspierać terminowy dostęp do dać
▪ zrozumieć format dać, i tak dalej…
INTERFEJS Z SAP
Interfejs może być dwojakiego rodzaju, własny lub komercyjny.
Niektóre z głównych interfejsów komercyjnych obejmują:
▪ SAS
▪ Rozwiązania Prims
▪ D2k i tak dalej ...
RÓŻNE TECHNOLOGIE ERP
Traktowanie środowiska ERP jako pojedynczej technologii to metoda
duży błąd. Istnieje wiele technologii ERP, każda z własną
silne strony. Najbardziej znanymi dostawcami na rynku są:
▪ SAP
▪ Oracle Finanse
▪ PeopleSoft
JD Edwardsa
▪ Baany
SAP
SAP to największe i najbardziej kompletne oprogramowanie ERP. Aplikacje
SAP obejmuje wiele typów aplikacji w wielu obszarach. SAP ma
reputacja:
▪ bardzo duże
▪ bardzo trudne i kosztowne w realizacji
▪ potrzebuje wielu ludzi i konsultantów
realizowane
▪ potrzebuje wyspecjalizowanych osób do realizacji
▪ zajmuje dużo czasu do wdrożenia
Ponadto SAP ma reputację tego, że sam się zapamiętuje dać bardzo
ostrożnie, utrudniając dostęp do nich
osoba spoza obszaru SAP. Siłą SAP ma być
zdolny do przechwytywania i przechowywania dużej ilości dać.
Firma SAP ogłosiła niedawno zamiar rozszerzenia
jego zastosowania hurtownia danych. Jest wiele zalet i wad
w korzystaniu z SAP jako dostawcy hurtownia danych.
Jedną z zalet jest to, że SAP jest już zainstalowany i że większość
konsultanci znają już SAP.
Wady posiadania SAP jako dostawcy hurtownia danych
wielu: SAP nie ma doświadczenia w świecie hurtownia danych
Jeśli SAP jest dostawcą hurtownia danych, trzeba "wyjąć"
i dać z SAP al hurtownia danych. Dane historia firmy SAP w zakresie
zamknięty system, jest mało prawdopodobne, aby można było łatwo dostać się do niego z SAP
to (???). Istnieje wiele starszych środowisk, które obsługują SAP,
takie jak IMS, VSAM, ADABAS, ORACLE, DB2 i tak dalej.
SAP kładzie nacisk na podejście „nie wynalezione tutaj”. SAP nie chce
współpracować z innymi dostawcami w celu używania lub tworzenia hurtownia danych.
SAP nalega na samodzielne generowanie całego swojego oprogramowania.
Chociaż SAP to duża i potężna firma, fakt
próba przepisania technologii ELT, OLAP, administracja
system, a nawet kod podstawowy dbm to jest po prostu szalone.
Zamiast przyjmować postawę opartą na współpracy z dostawcami
di hurtownia danych SAP od dawna stosuje podejście, które:
oni „wiedzą więcej”. Taka postawa powstrzymuje ten sukces
SAP może mieć w obszarze hurtownia danych.
Odmowa SAP zezwalania dostawcom zewnętrznym na dostęp
szybko i z wdziękiem dla nich dać. Sama istota używania
un hurtownia danych jest łatwy dostęp do dać. Cała historia SAP to:
oparte na utrudnieniu dostępu dać.
Brak doświadczenia SAP w radzeniu sobie z dużymi ilościami dać;
w dziedzinie hurtownia danych są tomy dać nigdy nie widziałem od
SAP i do obsługi tych dużych ilości dać musisz go mieć
odpowiednia technologia. SAP najwyraźniej nie jest tego świadomy
bariera technologiczna, która istnieje, aby wejść do pola danych
magazyn.
Kultura korporacyjna SAP: SAP stworzył biznes
w uzyskaniu i dać z systemu. Ale żeby to zrobić, musisz mieć
inna mentalność. Tradycyjnie firmy zajmujące się oprogramowaniem
nie radzą sobie dobrze z wprowadzaniem danych do środowiska
pobieranie danych w drugą stronę. Jeśli SAP może to zrobić
Switch będzie pierwszą firmą, która to zrobi.
Krótko mówiąc, wątpliwe jest, czy firma powinna dokonać wyboru
SAP jako dostawca hurtownia danych. Istnieje bardzo poważne ryzyko
z jednej strony i bardzo niewiele nagród z drugiej. Ale jest inny
powód, który zniechęca do wyboru SAP jako dostawcy dat
magazyn. Ponieważ każda firma powinna mieć tę samą datę
magazyn wszystkich innych firm? ten hurtownia danych jest sercem
przewaga konkurencyjna. Jeśli każda firma przyjęła to samo
hurtownia danych byłoby to trudne, nawet jeśli nie niemożliwe,
osiągnąć przewagę konkurencyjną. Wydaje się, że SAP uważa, że ​​plik
hurtownia danych może być postrzegany jako plik cookie i to jest
kolejny znak ich „zdobądź dane
w".
Żaden inny dostawca ERP nie jest tak dominujący jak SAP.
Niewątpliwie będą firmy, które podążą ścieżką SAP
dla nich hurtownia danych ale przypuszczalnie te daty
Magazyny SAP będą duże, drogie i bardzo wymagające
czas na ich stworzenie.
Środowiska te obejmują takie działania, jak „przetwarzanie informacji przez kasjerów”,
procesy rezerwacji linii lotniczych, procesy reklamacyjne
ubezpieczenie i tak dalej. Bardziej wydajny był system transakcyjny,
bardziej oczywista była potrzeba rozdzielenia procesu operacyjnego i
DSS (system wspomagania decyzji). Jednak w przypadku systemów zasobów
ludzkie i osobiste, nigdy nie masz do czynienia z dużymi ilościami
transakcje. I oczywiście, gdy zatrudniona jest osoba
lub opuść firmę to jest zapis transakcji.
Ale w stosunku do innych systemów, systemów zasobów ludzkich i
osobiste po prostu nie mają wielu transakcji. Dlatego w
systemy zasobów ludzkich i osobistych, nie jest do końca oczywiste, że istnieją
potrzebuje DataWarehouse. Pod wieloma względami te systemy
reprezentują połączenie systemów DSS.
Ale jest jeszcze jeden czynnik, który należy wziąć pod uwagę, jeśli trzeba to zrobić
zrobić z hurtownią danych i PeopleSoft. W wielu środowiskach ja dać
zasobów ludzkich i osobistych jest drugorzędna w stosunku do firmy
główna firma. Większość firm działa
produkcja, sprzedaż, świadczenie usług i tak dalej. THE
systemy zasobów ludzkich i osobistych są zwykle drugorzędne (lub
wsparcie) do podstawowej linii biznesowej firmy. Dlatego tak jest
niejednoznaczne i niewygodne a hurtownia danych oddzielne dla
wsparcie dla zasobów ludzkich i osobistych.
Pod tym względem PeopleSoft bardzo różni się od SAP. Dzięki SAP tak jest
obowiązkowe, że istnieje hurtownia danych. Z PeopleSoft tak nie jest
wtedy tak jasne. Hurtownia danych jest opcjonalna w PeopleSoft.
Najlepsze, co można powiedzieć o dać PeopleSoft polega na tym, że dane
magazyn może służyć do przechowywania i dać związane z
stare zasoby ludzkie i osobiste. Drugi powód
z którego firma chciałaby skorzystać a hurtownia danych a
ze szkodą dla środowiska PeopleSoft jest umożliwienie dostępu i
bezpłatny dostęp do narzędzi analitycznych, ai dać przez PeopleSoft. Jednak
Oprócz tych powodów mogą zaistnieć przypadki, w których lepiej tego nie robić
mieć hurtownię danych dla dać PeopleSoft.
W podsumowaniu
Istnieje wiele wskazówek dotyczących konstrukcji daty
magazyn wewnątrz oprogramowania ERP.
Oto niektóre z nich:
▪ Warto mieć hurtownia danych to wygląda jak każdy
jeszcze w branży?
▪ Jak elastyczny jest system ERP hurtownia danych oprogramowanie?
▪ System ERP hurtownia danych oprogramowanie może obsłużyć ilość
dać który znajduje się w „hurtownia danych arena"?
▪ Jakie są osiągnięcia dostawcy ERP
stawianie czoła łatwym i niedrogim pod względem czasu ai dać? (Co
to doświadczenie dostawców ERP w dostawach niedrogich, on
czas, łatwy dostęp do danych?)
▪ Jakie jest rozumienie architektury DSS i
„Korporacyjna fabryka informacji” dostawcy ERP?
▪ Dostawcy systemów ERP rozumieją, jak uzyskać dać all'interno
środowisko, ale także rozumiesz, jak je wyeksportować?
▪ Jak otwarty jest sprzedawca dotychczasowych instrumentów ERP
magazynowanie?
Przy określaniu należy wziąć pod uwagę wszystkie te względy
gdzie umieścić hurtownia danych który będzie gospodarzem ja dać ERP i inne
dać. Ogólnie, chyba że istnieje ku temu ważny powód
aby zrobić inaczej, zaleca się budowanie hurtownia danych na zewnątrz
ze środowiska dostawcy ERP.
ROZDZIAŁ 1
Omówienie organizacji BI
Kluczowe punkty:
Repozytoria informacji działają w odwrotny sposób
do architektury Business Intelligence (BI):
Kultura korporacyjna i IT mogą ograniczać sukces w
budowanie organizacji BI.
Technologia nie jest już czynnikiem ograniczającym dla organizacji BI. Plik
Problem dla architektów i planistów projektów nie polega na tym, że
technologia istnieje, ale jeśli mogą skutecznie wdrożyć
dostępna technologia.
Dla wielu firm m.in hurtownia danych to niewiele więcej niż depozyt
dystrybucja pasywna i dać dla użytkowników, którzy tego potrzebują. TEN dać
są pobierane z systemów źródłowych i umieszczane w strukturach docelowych
di hurtownia danych. dać można je również czyścić z całością
szczęście. Jednak żadna dodatkowa wartość nie jest dodana
Zebrane przez dać podczas tego procesu.
Zasadniczo pasywny DW w najlepszym przypadku zapewnia
tylko ja dać czyste i operacyjne dla stowarzyszeń użytkowników. Tam
tworzenie informacji i zrozumienie analityczne zależą
wyłącznie przez użytkowników. Sędzia, jeśli DW (Hurtownia danych) albo
sukces jest subiektywny. Jeśli ocenimy sukces na podstawie
umiejętność zbierania, integrowania i efektywnego sprzątania i dać
korporacyjnych na podstawie przewidywalnej podstawy, to tak, DW jest sukcesem.
Z drugiej strony, jeśli spojrzymy na kolekcję, konsolidację i to
wykorzystanie informacji w całej organizacji
DW jest porażką. DW zapewnia niewielką lub żadną wartość
Informacja. W rezultacie użytkownicy są zmuszeni do wykonania,
tworząc w ten sposób silosy informacyjne. W tym rozdziale przedstawiono
kompletna wizja podsumowująca architekturę BI (Business
Inteligencja) firm. Zacznijmy od opisu BI i
następnie przejdziemy do dyskusji na temat projektowania i
rozwój informacji, w przeciwieństwie do zwykłego dostarczania i dać
użytkownikom. Następnie dyskusje koncentrują się na obliczaniu
wartość Twoich wysiłków BI. Kończymy, definiując, w jaki sposób IBM
spełnia wymagania architektury BI w Twojej organizacji.
Opis architektury
organizacja BI
Potężne systemy informacyjne zorientowane na transakcje są teraz
na porządku dziennym w każdym dużym przedsiębiorstwie, na jakim poziomie
efektywnie plac zabaw dla firm na całym świecie.
Jednak utrzymanie konkurencyjności wymaga teraz systemów analitycznych
zorientowane na to może zrewolucjonizować możliwości firmy poprzez ponowne odkrycie i
wykorzystując informacje, które już posiadają. Te systemy
analityka czerpie ze zrozumienia z bogactwa dać
dostępny. BI może poprawić wydajność wszystkich informacji
firmy. Firmy mogą poprawić relacje z klientami i
dostawców, zwiększają zyski z produktów i usług, generują
nowe i najlepsze oferty, kontrola ryzyka i wiele innych
zarobki drastycznie ograniczyły wydatki. Z Twoim BI
firma wreszcie zaczyna wykorzystywać informacje o klientach
jako atut konkurencyjny dzięki aplikacjom, które mają cele
rynek.
Właściwy biznes oznacza uzyskanie ostatecznych odpowiedzi
kluczowe pytania, takie jak:
▪ Który z naszych klienci sprawiają, że zarabiamy więcej, albo tam
czy wysyłają ze stratą?
▪ Gdzie mieszkają nasi najlepsi klienci w stosunku do sklep/
magazyn, który często odwiedzają?
▪ Które z naszych produktów i usług mogą być sprzedawane najczęściej
skutecznie i komu?
▪ Które produkty można najskuteczniej sprzedawać i komu?
▪ Która kampania sprzedażowa odniosła największy sukces i dlaczego?
▪ Które kanały sprzedaży są najbardziej efektywne dla jakich produktów?
▪ Jak możemy poprawić relacje z najlepszymi klienci?
Większość firm ma dać szorstka odpowiedź
te pytania.
Systemy operacyjne generują duże ilości produktu, np
klient i dać market z punktów sprzedaży, rezerwacji,
z obsługi klienta i systemów wsparcia technicznego. Wyzwanie jest
wyodrębnij i wykorzystaj te informacje.
Wiele firm korzysta tylko z niewielkich ułamków własnych dać
do analiz strategicznych.
I dać pozostałe, często połączone z i dać wynikające ze źródeł zewnętrznych, takich jak i
Jedną z nich są „raporty rządowe” i inne zakupione informacje
kopalnia złota tylko czeka na odkrycie, np dać musieć
po prostu udoskonal je w swoim kontekście informacyjnym
organizacja.
Wiedzę tę można zastosować na różne sposoby, wariacje
od zaprojektowania ogólnej strategii korporacyjnej do
osobista komunikacja z dostawcami za pośrednictwem call center,
fakturowanie, Internet i inne punkty. Dzisiejsze środowisko biznesowe tak narzuca
że DW i powiązane rozwiązania BI ewoluują dalej
wykonanie tradycyjnych konstrukcji dać który ja dać znormalizowane do
na poziomie atomowym i „farmy gwiazd / kostek”.
Aby zachować konkurencyjność, potrzebne jest połączenie
tradycyjna i zaawansowana technologia w celu wspierania
rozległy krajobraz analityczny.
Wreszcie, ogólne otoczenie musi poprawiać wiedzę
firmy jako całości, upewniając się, że podjęte działania
w wyniku przeprowadzonych analiz są przydatne, aby każdy mógł
zasiłek.
Na przykład, powiedzmy, że oceniasz swoją klienci w kategoriach
wysokie lub niskie ryzyko.
Jeśli te informacje są generowane przez model wyodrębniania lub
innymi środkami, musi zostać umieszczony w DW i udostępniony
każdemu za pomocą dowolnych środków dostępu, takich jak i
statyczne raporty, arkusze kalkulacyjne, tabele lub przetwarzanie analityczne w
linia (OLAP).
Jednak obecnie wiele tego typu informacji
pozostają w silosach dać osób lub działów, które generują,
analiza. Organizacja jako całość ma niewielką lub żadną widoczność
do zrozumienia. Wystarczy zmieszać tego typu treści
informacji w Twojej firmie DW możesz wyeliminować silosy
informacji i podnieś swoje środowisko DW.
Istnieją dwie główne przeszkody w rozwoju organizacji
BI.
Po pierwsze, mamy problem samej organizacji
odpowiednich przepisów.
Chociaż nie możemy pomóc w zmianach zasad
organizacji, pomożemy Ci zrozumieć składniki
organizacja BI, jej architektura i sposób, w jaki
Technologia IBM ułatwia jego rozwój.
Drugą barierą do pokonania jest brak technologii
zintegrowane i znajomość metody, która przypomina całą przestrzeń
BI, a nie tylko niewielki składnik.
IBM reaguje na zmiany technologiczne
integracji. Twoim obowiązkiem jest dostarczenie projektu
samoświadomy. Ta architektura musi być rozwijana za pomocą
technologia wybrana do integracji bez ograniczeń lub przynajmniej z
technologia zgodna z otwartymi standardami. Również twój
kierownictwo firmy musi zapewnić, że przedsiębiorstwo Bi jest
przeprowadzane zgodnie z harmonogramem i nie pozwalać na to
rozwój silosów informacyjnych wynikających z egoizmu
programy lub cele.
Nie oznacza to, że środowisko BI nie jest wrażliwe
reagować na różne potrzeby i wymagania różnych użytkowników; zamiast tego oznacza
że realizacja tych indywidualnych potrzeb i wymagań jest
zrobione z korzyścią dla całej organizacji BI.
Opis architektury organizacji BI można
można znaleźć na stronie 9 na rysunku 1.1 Architektura demonstruje
bogata mieszanka technologii i technik.
Z tradycyjnego punktu widzenia architektura obejmuje następujące elementy
magazynu
Warstwa atomowa.
To jest podstawa, serce całego DW, a tym samym całego
raportowanie strategiczne.
I dać przechowywane tutaj zachowają historyczną integralność, raporty z
dać i zawierać pochodną metrykę, a także być czystym,
zintegrowane i przechowywane przy użyciu szablonów wyodrębniania.
Wszystkie późniejsze ich wykorzystanie dać i powiązane informacje to
wywodzące się z tej struktury. To doskonałe źródło
ekstrakcja dać oraz dla raportów z ustrukturyzowanymi zapytaniami SQL
Depozyt operacyjny w wysokości dać lub baza raportów z
dać(Operacyjny magazyn danych (ODS) lub raportowanie
baza danych.)
To jest struktura dać specjalnie zaprojektowany dla
raportowanie techniczne.
I dać przechowywane i przenoszone przez te struktury mogą wreszcie
propagować w magazynie przez strefę organizacji (staging
obszar), gdzie można by go wykorzystać do raportowania strategicznego.
Miejsce postoju.
Pierwszy przystanek dla większości dać przeznaczone dla środowiska
magazyn to strefa organizacji.
Tutaj jestem dać są integrowane, czyszczone i przekształcane w dać przydatne, że
zapełni strukturę magazynu
Targi randkowe.
Ta część architektury reprezentuje strukturę dać usata
specjalnie dla OLAP. Obecność datamartów, jeśli i dać
przechowywane w schemacie gwiazdy, które nakładają się dać
wielowymiarowe w środowisku relacyjnym lub w szafach na dokumenty
di dać zastrzeżone używane przez określoną technologię OLAP, taką jak
Serwer DB2 OLAP, to nie ma znaczenia.
Jedynym ograniczeniem jest to, że architektura ułatwia korzystanie z dać
wielowymiarowy.
Architektura obejmuje również krytyczne technologie i techniki Bi
które wyróżnia się jako:
Analiza przestrzenna
Przestrzeń jest nieoczekiwanym zasobem informacji dla analityka i
kluczowe znaczenie ma całkowite rozwiązanie problemu. Przestrzeń może
reprezentują informacje o ludziach mieszkających w pewnym
lokalizacja, a także informacje o tym, gdzie się ona znajduje
fizycznie w porównaniu z resztą świata.
Aby przeprowadzić tę analizę, musisz zacząć od zawiązania swojej
informacje o współrzędnych szerokości i długości geograficznej. To jest to
określane jako „geokodowanie” i musi być częścią ekstrakcji,
transformacja i proces ładowania (ETL) na poziomie
Twojego magazynu.
Eksploracja danych.
Ekstrakcja dać pozwala naszym firmom rozwijać się
Liczba klienci, przewidywać trendy sprzedaży i zezwalać
zarządzanie relacjami z i klienci (CRM), wśród innych inicjatyw tzw
BI.
Ekstrakcja dać musi być zatem zintegrowany ze strukturami
dać DWHouse i wspierane procesami magazynowymi dla
ustalić zarówno efektywne i wydajne wykorzystanie technologii, jak i
powiązane techniki.
Jak wskazano w architekturze BI, poziom atomowy
Dwhouse, podobnie jak datamarty, jest doskonałym źródłem informacji dać
do ekstrakcji. Te same struktury też muszą być
odbiorców wyników wydobycia, aby ustalić dostępność dla
najszersza publiczność (najszersza publiczność).
Agenci.
Istnieje różnych agentów do zbadania klienta w każdym punkcie, np
systemy operacyjne firmy i ten sam dw. Ci agenci mogą
być zaawansowanymi sieciami neuronowymi przeszkolonymi, aby się o nich uczyć
trendy w każdym punkcie, takie jak przyszły popyt na produkt oparty
o promocjach sprzedaży, silnikach opartych na regułach, na które należy reagować
un data zestaw okoliczności, a nawet prostych agentów, które
zgłaszają wyjątki „kadrze kierowniczej”. Te procesy mają
generalnie występuje w czasie rzeczywistym i dlatego musi
być ściśle powiązane z ruchem tego samego dać.
Wszystkie te struktury dać, technologie i techniki gwarantują
że nie spędzisz nocy na tworzeniu organizacji
twój BI.
Ta aktywność będzie rozwijana stopniowo, dla małych
punktów.
Każdy krok jest niezależnym wysiłkiem projektowym i jest raportowany
jako iteracja w Twojej inicjatywie DW lub BI. Iteracje
może obejmować wdrażanie nowych technologii, np
zacznij od nowych technik, dodając nowe struktury dać ,
ładowanie ja dać dodatkowe, lub z rozszerzeniem analizy
Twoje środowisko. Ten akapit jest szerzej omawiany
szczegółowo w rozdziale 3.
Oprócz tradycyjnych struktur Dw i narzędzi Bi są jeszcze inne
funkcje Twojej organizacji BI, za które jesteś winien
projekt, taki jak:
Punkty kontaktu z klientem (kontakt z klientem
zwrotnica).
Jak w każdej nowoczesnej organizacji, istnieje wiele
punkty kontaktu z klientem, które wskazują, jak mieć doświadczenie
pozytywne dla ciebie klienci. Istnieją tradycyjne kanały, takie jak i
handlowcy, operatorzy central, direct mail, multimedia i drukowanie
reklamy, a także najbardziej aktualne kanały, takie jak e-mail i internet, i dać
należy nabyć produkty z jakimś punktem kontaktowym,
transportowane, oczyszczane, przekształcane, a następnie zasiedlane w strukturach dać z
BI.
Podstawy dać stowarzyszenia operacyjne i użytkowników (Operacyjne
bazy danych i społeczności użytkowników).
Na końcu punktów kontaktowych klienci znajdziesz podstawy dać
zastosowanie społeczności firmowych i użytkowników. . TEN dać istniejący
dać tradycyjne, które muszą zostać zjednoczone i połączone z merge dać że
płyną z punktów kontaktowych, aby spełnić konieczne
Informacja.
Analitycy. (Analitycy)
Głównym beneficjentem środowiska BI jest analityk. To on jest tym, który
korzyści z obecnego wydobycia dać operacyjne, zintegrowane z
różne źródła dać , wzbogacony o funkcje takie jak analiza
geograficzne (geokodowanie) i prezentowane w technologiach BI, które
pozwalają na wyodrębnianie, OLAP, zaawansowane raportowanie i analizę SQL
geograficzny. Podstawowy interfejs analityka do środowiska
raportowanie to portal BI.
Jednak nie tylko analityk korzysta z architektury
BI.
Kierownictwo, duże stowarzyszenia użytkowników, a nawet partnerzy, dostawcy i i
klienci powinni odnosić korzyści z BI w przedsiębiorstwie.
Pętla zwrotna.
Architektura BI to środowisko uczenia się. Zasada
Cechą charakterystyczną rozwoju jest umożliwienie trwałych struktur dać
do aktualizacji za pomocą używanej technologii BI i poprzez działania
intrapese użytkownika. Przykładem jest ocena
klient (punktacja klienta).
Jeśli dział sprzedaży tworzy model wyszukiwania
oceny klienta w zakresie korzystania z nowej usługi, a następnie
Dział sprzedaży nie powinien być jedyną grupą beneficjentów
usługi.
Zamiast tego model wyszukiwania powinien być wykonany jako część
naturalny przepływ danych w firmie i oceny klienta
powinien stać się integralną częścią środowiska informacyjnego
magazyn, widoczny dla wszystkich użytkowników. Pakiet IBM Bi-bi-centric
w tym DB2 UDB, DB2 OLAP Server zawiera większość
część ważnych komponentów technologii, określonych na rysunku
1.1.
Używamy architektury, tak jak jest to przedstawione w tej książkowej postaci
daj nam poziom ciągłości i pokaż, jak każdy produkt
IBM pasuje do ogólnego schematu BI.
Dostarczanie treści informacyjnych (Providing
Treść informacji)
Projektowanie, rozwijanie i wdrażanie środowiska BI to
żmudna operacja. Projekt musi obejmować tak wiele
obecne i przyszłe wymagania biznesowe. Projekt architektury
musi być kompletna i zawierać wszystkie znalezione wnioski
na etapie projektowania. Egzekucja musi pozostać
zaangażowany w jeden cel: rozwój architektury BI
jak formalnie przedstawiono na rysunku i na podstawie wymagań
biznes.
Szczególnie trudno jest argumentować, że dyscyplina zapewni
względny sukces.
Jest to proste, ponieważ nie tworzysz całego środowiska BI
nagle, ale odbywa się to małymi krokami w czasie.
Jednak identyfikacja komponentów BI w twojej architekturze jest
ważne z dwóch powodów: będziesz kierować wszystkimi późniejszymi decyzjami
techniki architektoniczne.
Będziesz mógł świadomie zaprojektować konkretne zastosowanie technologii
chociaż możesz nie uzyskać przedstawiciela, który potrzebuje
technologii przez kilka miesięcy.
Zrozumienie wymagań biznesowych w wystarczającym stopniu wpłynie na typ
produktów, które zdobędziesz dla swojej architektury.
Projekt i rozwój Twojej architektury zapewniają
że jest twój magazyn
nie przypadkowe, a raczej „przemyślane”,
starannie skonstruowana reklama działać sztuki jako mozaiki
technologia mieszana.
Zaprojektuj treść informacji
Wszelkie wstępne planowanie musi się skupić i zidentyfikować
główne składniki BI, które będą potrzebne środowisku
ogólnie w teraźniejszości i przyszłości.
Znajomość wymagań biznesowych jest ważna.
Jeszcze zanim rozpocznie się wszystkie konwencjonalne planowanie, plik
planista projektu często może zidentyfikować jeden lub dwa
komponent od razu.
Bilans komponentów, które mogą być potrzebne do
Twojej architektury nie da się jednak łatwo znaleźć.
W fazie projektowania główna część architektury
wiąże sesję tworzenia aplikacji (JAD) z wyszukiwaniem
do identyfikacji wymagań biznesowych.
Czasami te wymagania można zlecić na zewnątrz
zapytania i raportowanie.
Na przykład użytkownicy deklarują, że jeśli chcą zautomatyzować
obecnie raport trzeba generować ręcznie poprzez integrację
dwa aktualne wskaźniki i dodanie obliczeń pochodzących z
kombinacja dać.
Chociaż to wymaganie jest proste, definiuje pewne
funkcjonalność funkcji, którą należy uwzględnić, kiedy
kup narzędzia do raportowania dla swojej organizacji.
Projektant musi również dążyć do dodatkowych wymagań dotyczących
uzyskać pełny obraz. Użytkownicy chcą subskrybować
ten raport?
Podzbiory raportu są generowane i wysyłane pocztą elektroniczną do różnych
użytkowników? Chcesz zobaczyć ten raport na portalu firmowym?
Wszystkie te wymagania są częścią prostej potrzeby
zastąpić raport ręczny zgodnie z wymaganiami użytkowników. Korzyść
tego typu wymagania mają wszyscy użytkownicy i projektanci
zrozumienie pojęcia raportów.
Są jednak inne rodzaje biznesów, które musimy zaplanować.
Gdy wymagania biznesowe są określone w postaci
Strategiczne pytania biznesowe - to łatwe dla doświadczonego projektanta
rozpoznać miarę / fakt i wymagania dotyczące wymiarów.
Rysunek 1.2 ilustruje pomiary i wymiarowe komponenty a
Problem biznesowy.
Jeśli użytkownicy JAD nie wiedzą, jak zadeklarować swoje wymagania
w postaci problemu biznesowego, często dostarcza projektant
przykłady, aby pominąć-rozpocząć sesję zbierania
wymagania.
Ekspert projektant może pomóc użytkownikom zrozumieć nie tylko
handel strategiczny, ale także jak go wyszkolić.
Podejście do zbierania wymagań zostało omówione w rozdziale 3; dla
teraz chcemy tylko wskazać na potrzebę projektowania dla każdego
rodzaje wymagań BI
Strategiczny problem biznesowy to nie tylko wymóg
Biznes, ale też wskazówka projektowa. Jeśli musisz odpowiedzieć
do wielowymiarowego pytania, musisz zapamiętać,
prześlij ja dać wymiary, a jeśli potrzebujesz przechowywać i
dać wielowymiarowy, musisz zdecydować, jakiego rodzaju technologii lub
technikę, którą zamierzasz zastosować.
Czy implementujesz zarezerwowany schemat gwiazdy sześcianu, czy jedno i drugie?
Jak widać, nawet prosty problem biznesowy
może mieć znaczący wpływ na projekt. jednak
tego typu wymagania biznesowe są zwyczajne i przynajmniej oczywiście
przez doświadczonych projektantów i planistów projektów.
Odbyła się wystarczająca debata na temat technologii i wsparcia
OLAP i szeroka gama rozwiązań. Do teraz
wspomnieliśmy o konieczności połączenia prostego raportowania z i
wymiarowe wymagania biznesowe i jak te wymagania
wpływać na techniczne decyzje architektoniczne.
Ale jakie są wymagania, których nie można łatwo zrozumieć
przez użytkowników czy zespół DW? Nigdy nie będziesz potrzebować analizy
przestrzenne (analiza przestrzenna)?
Modele górnicze dać będą niezbędną częścią twojego
przyszłość? Kto wie?
Należy zauważyć, że tego typu technologii to niewiele
znane ogółowi użytkowników i członkom zespołu
Dw, po części może się to zdarzyć, ponieważ zazwyczaj
są obsługiwane przez niektórych wewnętrznych lub zewnętrznych ekspertów technicznych. To jest
skrajny przypadek problemów, jakie generują tego typu technologie. Samego siebie
użytkownicy nie mogą opisywać wymagań biznesowych ani ich oprawiać
aby zapewnić projektantom wytyczne, mogą
pozostają niezauważone lub, co gorsza, po prostu zignorowane.
Staje się bardziej problematyczne, gdy projektant i deweloper zawodzą
mogą rozpoznać zastosowanie jednego z tych zaawansowanych, ale
krytyczne technologie.
Jak często słyszeliśmy od projektantów, „no cóż, dlaczego
Czy nie odkładamy tego na bok, dopóki nie dostaniemy tej drugiej rzeczy?
„Czy są naprawdę zainteresowani priorytetami, czy po prostu unikają i
wymagania, których nie rozumieją? To najprawdopodobniej ostatnia hipoteza.
Załóżmy, że Twój zespół sprzedaży zgłosił zapotrzebowanie
biznesu, jak pokazano na rysunku 1.3, jak widać, plik
wymaganie jest sformułowane w formie problemu biznesowego. Tam
różnica między tym problemem a typowym problemem wymiarowym wynosi
odległość. W takim przypadku grupa sprzedażowa chce wiedzieć,
miesięcznie, całkowita sprzedaż z produktów, magazynów i
klienci którzy mieszkają w promieniu 5 mil od magazynu, w którym się znajdują
kupują.
Niestety projektanci lub architekci po prostu mogą
zignoruj ​​komponent przestrzenny, mówiąc: „mamy klienta, plik
produkt i ja dać depozytu. Utrzymujemy dystans do
kolejna iteracja.
"Zła odpowiedź. Ten rodzaj problemu biznesowego dotyczy
całkowicie BI. Reprezentuje głębsze zrozumienie
naszej działalności i solidnej przestrzeni analitycznej dla naszych analityków.
BI wykracza poza proste zapytania lub standardowe raportowanie, lub
nawet OLAP. Nie oznacza to, że te technologie nie
są ważne dla Twojego BI, ale same nie reprezentują
środowisko BI.
Projekt uwzględniający kontekst informacyjny
(Projektowanie treści informacyjnych)
Teraz, gdy zidentyfikowaliśmy wymagania biznesowe, które je wyróżniają
Na rysunku należy uwzględnić różne kluczowe komponenty
ogólna architektura. Niektóre składniki BI są częścią
naszych początkowych wysiłków, podczas gdy niektóre nie zostaną wdrożone
kilka miesięcy.
Jednak wszystkie znane wymagania są odzwierciedlone w projekcie, dzięki czemu
kiedy musimy wdrożyć określoną technologię, jesteśmy
przygotuj się, aby to zrobić. Coś w projekcie będzie odzwierciedlać sposób myślenia
Tradycyjny.
Na przykład Rysunek 1.1 na początku rozdziału przedstawia datę
mart, który utrzymuje dać wymiarowy.
Ten zestaw dać służy do obsługi późniejszych zastosowań
dać wymiar wynikający z problemów biznesowych, które
zidentyfikowaliśmy. Ponieważ są to dodatkowe dokumenty
generowane, takie jak rozwój projektu design dać, my
zaczniemy sformalizować jak ja dać rozprzestrzeniają się w środowisku.
Ustaliliśmy potrzebę reprezentowania dać tak
wymiarowe, dzieląc je (według konkretnych potrzeb
ustalone) na targach.
Następne pytanie, na które należy odpowiedzieć, brzmi: jak zostaną zbudowane
te bazy danych?
Czy budujesz gwiazdy, aby podtrzymywały kostki, czy tylko kostki, czy tylko gwiazdy?
(lub prawe kostki lub prawe gwiazdy). Wygeneruj architekturę danych
marty zależne, które wymagają warstwy atomowej dla wszystkich dać
nabyty? Pozwól na pozyskanie niezależnych hurtowni danych mar dać
bezpośrednio z systemów operacyjnych?
Jaką technologię kostki spróbujesz ujednolicić?
Masz ogromne ilości bogów dać wymagane do analizy wymiarowej
Lub potrzebujesz swoich kostek krajowych sprzedawców na jednym
co tydzień czy w obu przypadkach? Zbuduj potężny przedmiot
jak DB2 OLAP Server for Finance lub Cognos Cognos
PowerPlay dla Twojej organizacji sprzedaży czy jedno i drugie?
To są wielkie decyzje architektoniczne
wpłynie na Twoje środowisko BI od teraz. Tak,
zidentyfikowałeś potrzebę korzystania z OLAP. A teraz, jak to zrobisz
rodzaj techniki i technologii?
Jak najbardziej zaawansowane technologie wpływają na Twoje
rysunki? Zakładamy, że zauważyłeś potrzebę
przestrzeń w Twojej organizacji. Teraz musisz wywołać
edycje rysunków architektonicznych aczkolwiek nieplanowane
do wykonywania elementów kosmicznych przez kilka miesięcy. Architekt musi
projektować dziś w oparciu o to, co jest potrzebne. Przewiduj potrzebę
analizy przestrzenne, które generuje, przechowuje, przeprowadza i dostarcza
dostęp do dać przestrzeń. To z kolei powinno służyć jako
ograniczenie dotyczące rodzaju technologii i specyfikacji
platformę oprogramowania, którą możesz obecnie rozważyć. Dla
na przykład system administracyjny Baza danych relacyjny
(RDBMS), które wykonujesz dla swojej warstwy atomowej, musi mieć
dostępne solidne rozszerzenie przestrzenne. Zapewniłoby to
maksymalna wydajność podczas korzystania z geometrii i obiektów
przestrzeni w aplikacjach analitycznych. Jeśli twój RDBMS nie
poradzi sobie z ja dać (przestrzenno-centryczne) wewnętrznie, więc będziesz musiał
ustanowić Baza danych (przestrzenno-centryczny) zewnętrzny. To komplikuje
zarządzanie wydaniami i obniżanie ogólnej wydajności,
nie wspominając o dodatkowych problemach stworzonych dla Ciebie
DBA, ponieważ prawdopodobnie mają trochę zrozumienia
podstaw dać przestrzeń. Z drugiej strony, jeśli twój
RDMBS obsługuje wszystkie komponenty przestrzenne i powiązane
optymalizator jest świadomy specjalnych potrzeb (np.
indeksowanie) obiektów przestrzennych, którymi mogą się zajmować administratorzy baz danych
szybko zarządzaj wydaniami i możesz podnieść
wydajność.
Musisz także dostosować obszar przemieszczania i warstwę
środowisko atomowe, aby uwzględnić czyszczenie adresów (a
kluczowy element analizy przestrzennej), a także następujące
oszczędność obiektów kosmicznych. Kolejność wydań
projektowanie jest kontynuowane teraz, gdy wprowadziliśmy pojęcie czyszczenia
adres. Po pierwsze, ta aplikacja będzie określać typ domeny
oprogramowanie potrzebne do pracy nad ETL.
Potrzebujesz produktów takich jak Trillium, aby zapewnić Ci adres
clean lub dostawca ETL, którego wybrałeś
funkcjonalność?
Na razie ważne jest, aby docenić poziom projektu, jakim jesteś
musi zostać zakończona, zanim zaczniesz tworzyć swoje
środowisko (magazyn). Powyższe przykłady powinny
pokazać mnogość decyzji projektowych, które należy podjąć
identyfikacja każdego konkretnego wymagania biznesowego. Jeśli gotowe
poprawnie, te decyzje projektowe promują
współzależność między fizycznymi strukturami twojego środowiska,
dobór stosowanej technologii i przebiegu propagacji
Treść informacji. Bez tej konwencjonalnej architektury
BI, Twoja organizacja będzie podlegać mieszaninie
chaotyczne istniejących technologii, w najlepszym razie zjednoczone w pewien sposób
nie są dokładne, aby zapewnić widoczną stabilność.
Utrzymuj zawartość informacyjną
Wnoszenie wartości informacji do Twojej organizacji jest
bardzo trudna operacja. Bez wystarczającego zrozumienia
i doświadczenie, czy właściwe planowanie i rysowanie, nawet
lepsze zespoły poniosłyby porażkę. Z drugiej strony, jeśli masz duży
intuicja i szczegółowy projekt, ale bez dyscypliny
po prostu zmarnowałeś pieniądze i czas
ponieważ twój wysiłek jest skazany na niepowodzenie. Wiadomość powinna
wyjaśnij: jeśli brakuje jednego lub więcej z nich
umiejętności, rozumienie / doświadczenie lub planowanie / rysowanie o
dyscyplina wdrażania, doprowadzi to do kalectwa lub
zniszczyć konstrukcję organizacji BI.
Czy Twój zespół jest wystarczająco przygotowany? Jest ktoś na twoim
Zespół BI, który rozumie rozległy dostępny obszar analityczny
w środowiskach BI, w niezbędnych technikach i technologiach
wpłynąć na ten krajobraz? Jest ktoś w Twoim zespole
który potrafi rozpoznać różnicę aplikacji między zaawansowanymi
raportowanie statyczne i OLAP, czyli różnice między ROLAP i OLAP? Jeden z
członkowie Twojego zespołu wyraźnie rozpoznają drogę
wyciąg i jak może to wpłynąć na magazyn lub w jaki sposób
czy magazyn może wspierać wydajność wydobycia? Członek
zespołu rozumie wartość dać przestrzeń lub technologia
oparty na agentach? Czy masz kogoś, kto ceni wyjątkową aplikację
narzędzi ETL a technologia brokerska
wiadomość? Jeśli go nie masz, zdobądź. BI to znacznie więcej
dużej znormalizowanej warstwy atomowej OLAP schematów a
gwiazda i ODS.
Miej zrozumienie i doświadczenie w rozpoznawaniu wymagań
BI i ich rozwiązań jest niezbędna do Twojej zdolności
poprawnie sformalizować potrzeby użytkowników i projekt
i realizować swoje rozwiązania. Jeśli Twoja społeczność użytkowników ma
trudność w opisaniu wymagań, to praca zespołu
magazyn zapewnia ten wgląd. Ale jeśli zespół
magazyn
nie rozpoznaje konkretnego zastosowania BI - na przykład podanego
wydobycie - to nie jest najlepsza rzecz, jaką robią środowiska BI
często ogranicza się do bycia depozytem pasywnym. Jednak zignoruj ​​je
technologie nie umniejszają ich znaczenia i efektu, jaki wywierają
na temat pojawienia się twoich możliwości Business Intelligence
organizację, a także strukturę informacji, którą projektujesz
awansować.
Projekt musi zawierać pojęcie projektu, red
obie wymagają kompetentnej osoby. Ponadto projekt
wymaga zespołowej filozofii i obserwacji
standardy. Na przykład, jeśli Twoja firma utworzyła taką
standardową platformę lub zidentyfikował określony RDBMS, który Ty
chcą ujednolicić całą platformę, to się zbliża
wszyscy w zespole przestrzegają tych standardów. Ogólnie jeden
zespół ujawnia potrzebę normalizacji (do użytkownika
communites), ale sam zespół nie chce dołączyć do
standardy ustalone również w innych obszarach firmy, a może nawet w
podobne firmy. Nie tylko jest to hiporrytyczne, ale zapewnia, że ​​firma tego nie robi
jest w stanie wykorzystać istniejące zasoby i inwestycje. To nie znaczy
że nie ma sytuacji, które gwarantują platformę lub jedną
niestandardowa technologia; jednak wysiłki magazynu
powinni zazdrośnie chronić standardy przedsiębiorstwa do
że wymagania biznesowe nie nakazują inaczej.
Trzeci kluczowy składnik potrzebny do zbudowania BI
organizacja to dyscyplina.
Zależy to w całości, w równym stopniu od jednostek, jak i od środowiska.
Planiści projektów, sponsorzy, architekci i użytkownicy muszą docenić
dyscyplina niezbędna do budowania struktury informacyjnej firmy.
Projektanci muszą tak pokierować pracami projektowymi, aby
zakończyć inne niezbędne wysiłki w społeczeństwie.
Załóżmy na przykład, że Twoja firma tworzy plik
Aplikacja ERP zawierająca komponent magazynowy.
Stąd odpowiedzialność projektantów ERP za współpracę z
zespół środowiska magazynowego, aby również nie konkurować
powielić już rozpoczętą pracę.
Dyscyplina to także temat, którym trzeba się zająć
przez całą organizację i jest zwykle tworzona i powierzana firmie
Poziom wykonawczy.
Czy menedżerowie są skłonni stosować się do zaprojektowanego podejścia? ZA
podejście, które obiecuje tworzenie treści informacyjnych, które są zgodne z
koniec przyniesie wartość wszystkim obszarom przedsiębiorstwa, ale być może
czy zagraża jednostkom lub programom departamentów? Zapamiętaj powiedzenie
„Myślenie o wszystkim jest ważniejsze niż myślenie o jednej rzeczy”.
To powiedzenie odnosi się do organizacji BI.
Niestety wiele magazynów skupia swoje wysiłki
próbując zaadresować i wnieść wartość do określonego działu lub do
konkretni użytkownicy, z niewielkim uwzględnieniem organizacji w
generał. Załóżmy, że wykonawczy prosi o pomoc z
areszt. Zespół odpowiada na to 90-dniową pracą
obejmuje nie tylko spełnienie wymagań zgłoszeniowych określonych w
wykonawczy, ale zapewnia, że ​​wszystkie dać baza jest mieszana w poziomie
atomic przed wprowadzeniem do technologii kostki
wniosek.
Ten dodatek inżynieryjny zapewnia, że ​​firma
Werehouse zyska na tym dać niezbędne dla kierownika.
Jednak szef rozmawiał o tym z zewnętrznymi firmami konsultingowymi
zaproponowali podobną aplikację z dostawą w mniej niż 4
tygodni.
Zakładając, że wewnętrzny zespół zwierząt domowych jest kompetentny, plik
dyrektor ma wybór. Kto może wspierać dyscyplinę
potrzebna jest dodatkowa inżynieria, aby kultywować dobro
informacyjny lub mogą zdecydować się na prowadzenie własnego
rozwiązanie szybko. Ten ostatni wydaje się być naprawdę wybrany
zbyt często i służy tylko do tworzenia kontenerów informacyjnych
które przynoszą korzyści tylko nielicznym lub pojedynczym osobom.
Cele krótko- i długoterminowe
Architekci i planiści projektów muszą je sformalizować
długoterminowy widok ogólnej architektury i planów
rozwinąć się w organizację BI. To połączenie
zarobki krótkoterminowe i planowanie długoterminowe
reprezentują dwa oblicza przedsięwzięć BI. Zysk w krótkim okresie
wygaśnięcie to aspekt BI, który jest powiązany z iteracjami
Twój magazyn.
Na tym skupiają się planiści, architekci i sponsorzy
spełniać określone wymagania handlowe. To jest na tym poziomie, gdzie
buduje się struktury fizyczne, kupuje technologię i
techniki są wdrażane. W żadnym wypadku nie są do tego stworzeni
specyficzne wymagania określone przez poszczególne społeczności użytkowników.
Wszystko po to, aby sprostać określonym, zdefiniowanym wymaganiom
z określonej społeczności.
Drugim aspektem jest jednak planowanie dalekosiężne
BI. Tak właśnie zapewniały plany i projekty
zbudował dowolną strukturę fizyczną, wybrane technologie i
techniki wykonane z myślą o firmie. I
planowanie długoterminowe zapewniające spójność
konieczne do zapewnienia, że ​​korzyści biznesowe będą czerpać ze wszystkich
znalezione zyski krótkoterminowe.
Uzasadnij swój wysiłek BI
Un hurtownia danych sam w sobie nie ma żadnej wrodzonej wartości. W innych
słów, nie ma żadnej wartości wśród technologii
techniki magazynowe i wdrożeniowe.
Wartość każdego wysiłku magazynu znajduje się w działaniach
wykonywane w wyniku środowiska i zawartości magazynu
pouczające rosły z biegiem czasu. To krytyczny punkt do zrozumienia
zanim spróbujesz oszacować wartość jakiejkolwiek inicjatywy
gdzie dom.
Architekci i projektanci zbyt często próbują nadać im wartość
fizyczne i techniczne elementy magazynu, gdy w rzeczywistości jest to wartość
oparty na procesach biznesowych, na które pozytywny wpływ mają
magazyn i dobrze zdobyte informacje.
Oto wyzwanie związane z założeniem BI: Jak uzasadniasz inwestycję?
Jeśli sam dom nie ma wartości wewnętrznej, projektanci
Projekt musi zbadać, zdefiniować i sformalizować korzyści
osiągnięte przez osoby, dla których magazyn będzie używany
ulepszyć określone procesy biznesowe lub wartość
chronione informacje lub jedno i drugie.
Aby skomplikować sprawy, każdy proces handlowy
wpływ pracy magazynu może przynieść korzyści
„Znaczne” lub „łagodne”. Jedną z nich są znaczne zalety
namacalny miernik do pomiaru zwrotu z inwestycji (ROI) - ad
na przykład, odwróć ekwipunek na dodatkowy czas w ciągu okresu
konkretny lub za niższy koszt transportu na przesyłkę. To więcej
Trudno jest określić drobne korzyści, takie jak lepszy dostęp do
informacji pod względem wartości materialnej.
Połącz swój projekt, aby dowiedzieć się o
Żądania biznesowe
Zbyt często projektanci próbują łączyć wartość
magazynu z amorficznymi celami firmy. Stwierdzając to
„Wartość magazynu zależy od naszych możliwości
zaspokajać strategiczne życzenia ”w przyjemny sposób otwieramy
przemówienie. Ale sam nie wystarczy, aby ustalić, czy
inwestowanie w zapasy ma sens. Lepiej połączyć przedstawicieli
magazyn ze specyficznymi i znanymi zapytaniami handlowymi.
Zmierz ROI
Obliczanie ROI w konfiguracji magazynu może być
szczególnie trudne. Jest to szczególnie trudne w przypadku przewagi
zasadą określonego powtórzenia jest coś niematerialnego lub
łatwe do zmierzenia. Jedno z badań wykazało, że użytkownicy postrzegają
dwie główne korzyści płynące z inicjatyw BI:
▪ Stwórz umiejętność podejmowania decyzji
▪ Utwórz dostęp do informacji
Te profity są łagodne (lub łagodne). Łatwo to zobaczyć
jak możemy obliczyć ROI na podstawie twardego potencjalnego klienta (lub
większe), jak obniżenie kosztów transportu, ale jak
czy mierzymy zdolność do podejmowania lepszych decyzji?
To zdecydowanie wyzwanie dla projektantów projektów, kiedy
próbują skłonić firmę do zainwestowania w konkretną
wysiłek magazynowy. Zwiększenie sprzedaży lub zmniejszenie kosztów
nie są już głównymi motywami, które kierują środowiskiem BI.
Zamiast tego szukasz dostępu do zapytań biznesowych
lepiej do informacji, aby mógł to zrobić konkretny dział
podejmować szybsze decyzje. To są strategiczne czynniki napędzające
co jest równie ważne dla firmy, ale tak jest
bardziej niejednoznaczne i trudniejsze do scharakteryzowania za pomocą namacalnej metryki.
W takim przypadku obliczanie zwrotu z inwestycji może być mylące, jeśli nie nieistotne.
Projektanci muszą być w stanie wykazać wartość
namacalne dla kadry kierowniczej przy podejmowaniu decyzji o tym, czy w nie inwestować
zachodzi określone powtórzenie. Nie zaproponujemy jednak nowego
metody obliczania zwrotu z inwestycji, ani nie przedstawimy żadnych za ani argumentów
przeciwko temu.
Dostępnych jest wiele artykułów i książek omawiających podstawy programu
obliczyć ROI. Istnieją specjalne propozycje wartości, takie jak wartość
na inwestycje (TY), oferowane przez grupy takie jak Gartner, że możesz
do badań. Zamiast tego skupimy się na podstawowych aspektach każdego
Zwrot z inwestycji lub inne propozycje wartości, które należy wziąć pod uwagę.
Stosowanie zwrotu z inwestycji
Oprócz sporu o korzyści „twarde” i korzyści „lekkie”
związane z działaniami BI należy wziąć pod uwagę inne kwestie
kiedy zastosujemy zwrot z inwestycji. Na przykład:
Przypisuj zbyt wiele oszczędności wysiłkom DW, które nadejdą
jednak
Powiedzmy, że Twoja firma przeszła od architektury
mainframe do rozproszonego środowiska UNIX. Więc każdy
oszczędności, które mogą (ale nie muszą) zostać osiągnięte dzięki temu wysiłkowi
nie należy przypisywać wyłącznie, jeśli wszystkim (?), wyłącznie
magazyn.
Nie uwzględnianie wszystkiego kosztuje. I jest wiele rzeczy z
wziąć pod uwagę. Rozważ następującą listę:
▪ Koszt uruchomienia, w tym wykonalność.
▪ Koszt dedykowanego sprzętu wraz z pamięcią masową e
Komunikacja
▪ Koszt oprogramowania, w tym zarządzanie dać i rozszerzenia
klient / serwer, oprogramowanie ETL, technologie DSS,
wizualizacja, programowanie i aplikacje przepływu
oprogramowanie do pracy i śledzenia.
▪ Koszt projektu konstrukcji dać, z realizacją, oraz
optymalizacja
▪ Koszt rozwoju oprogramowania bezpośrednio związany z nakładem pracy
BI
▪ Koszt utrzymania domu, w tym optymalizacja
wydajność, w tym kontrola wersji oprogramowania e
operacje pomocy
Zastosuj zwrot z inwestycji „Big-Bang”.
Budowa magazynu jako jeden i gigantyczny wysiłek
jest skazany na niepowodzenie, więc oblicza również zwrot z inwestycji dla inicjatywy
dużego przedsiębiorstwa Oferta jest zaskakująca, a że projektanci
nadal podejmować marne próby oszacowania wartości całości
wysiłek.
Ponieważ projektanci starają się podać wartość pieniężną
z inicjatywy biznesowej, jeśli jest to powszechnie znane i akceptowane
Czy trudno jest oszacować konkretne powtórzenia? Jak to jest możliwe? Nie jest
możliwe z kilkoma wyjątkami. Nie rób tego.
Teraz, gdy ustaliliśmy, czego nie robić, kiedy obliczamy
Zwrot z inwestycji, oto kilka punktów, które pomogą nam w zdefiniowaniu
niezawodny proces szacowania wartości Twoich wysiłków BI.
Uzyskanie zgody na zwrot z inwestycji. Niezależnie od twojego
wybór techniki oszacowania wartości twoich wysiłków BI musi
być uzgodnione przez wszystkie strony, w tym planistów projektu,
sponsorzy i kadra kierownicza.
Zmniejsz zwrot z inwestycji do możliwych do zidentyfikowania części. Niezbędny krok w kierunku
rozsądnym obliczeniem zwrotu z inwestycji jest skupienie się na jednym obliczeniu
konkretny projekt. Pozwala to oszacować wartość
w oparciu o specyficzne wymagania biznesowe
Określ koszty. Jak wspomniano, musi być wiele kosztów
uważane. Ponadto koszty muszą obejmować nie tylko koszty towarzyszące
do pojedynczej iteracji, ale także do związanych z nią kosztów
do zapewnienia zgodności ze standardami firmy.
Zdefiniuj korzyści. Jasne powiązanie zwrotu z inwestycji z wymaganiami
komercyjne, powinniśmy być w stanie zidentyfikować
korzyści, które doprowadzą do spełnienia wymagań.
Zmniejsz koszty i korzyści w przyszłych zarobkach. To jest droga
najlepszy sposób na oparcie wyceny na wartości bieżącej netto
(NPV) w przeciwieństwie do prób przewidywania przyszłej wartości w
przyszłe zarobki.
Ogranicz do minimum czas podziału ROI. JEST'
dobrze udokumentowany przez długi czas, był używany w twoim
ROI
Użyj więcej niż jednej formuły zwrotu z inwestycji. Istnieje wiele metod tworzenia plików
Prognoza zwrotu z inwestycji i należy zaplanować, czy użyć jednego z nich, czy
plus, w tym wartość bieżąca netto, wewnętrzna prędkość zwrotu
(IRR) i odzyskiwanie.
Zdefiniuj powtarzalny proces. Ma to kluczowe znaczenie dla obliczeń
wszelkie wartości długoterminowe. ZA
pojedynczy powtarzalny proces dla wszystkich sekwencji projektu a
podążać.
Wymienione problemy są najczęściej definiowanymi przez ekspertów
środowiska domowego. Naleganie ze strony kierownictwa
uzyskanie zwrotu z inwestycji w „Wielki Wybuch” jest bardzo mylące. Jeśli zaczniesz wszystkie
obliczenia zwrotu z inwestycji, redukując je do możliwych do zidentyfikowania i namacalnych części
dobra szansa na oszacowanie dokładnej oceny zwrotu z inwestycji.
Pytania o korzyści z zwrotu z inwestycji
Niezależnie od korzyści, miękkich lub twardych, możesz użyć
kilka podstawowych pytań, aby określić ich wartość. Do
przykład używając prostego systemu skali, od 1 do 10, ty
możesz wykryć wpływ dowolnego wysiłku, korzystając z poniższych
pytania:
▪ Jak oceniasz zrozumienie dać podążając za tym
projekt Twojej firmy?
▪ Jak oceniasz usprawnienia procesu w wyniku
ten projekt?
▪ Jak zmierzyłbyś teraz wpływ nowych spostrzeżeń i wniosków
udostępnione przez tę iterację
▪ Jaki był wpływ nowych środowisk komputerowych?
występowanie w wyniku tego, czego się nauczyliśmy?
Jeśli odpowiedzi na te pytania jest niewiele, jest to możliwe
firma nie jest warta poczynionej inwestycji. Pytania z wysokim
Punktacja wskazuje na znaczny wzrost wartości i powinien
służą jako wskazówki do dalszych badań.
Na przykład wysoki wynik za usprawnienia procesów
powinno to skłonić projektantów do zbadania, jak przebiegają procesy
został ulepszony. Może się okazać, że niektóre lub wszystkie zyski zostały osiągnięte
są namacalne, a zatem łatwo można uzyskać wartość pieniężną
stosowany.
Maksymalne wykorzystanie pierwszej iteracji
magazyn
Największym rezultatem twojego wysiłku biznesowego jest często
kilka pierwszych iteracji. Te pierwsze wysiłki tradycyjnie
ustalenie najbardziej przydatnych treści informacyjnych dla opinii publicznej e
ustanawia pomoc dla fundacji technologicznej dla kolejnych
Aplikacje BI.
Zwykle każda kolejna podciąg dać projektu
magazyny wnoszą do przedsiębiorstwa coraz mniej dodatkowej wartości
generał. Jest to szczególnie prawdziwe, jeśli iteracja nie
dodaje nowe tematy lub nie odpowiada potrzebom nowego
społeczność użytkowników.
Ta cecha przechowywania dotyczy również baterii
wzrost z dać historycy. Ponieważ kolejne wysiłki wymagają więcej
dać i jak więcej dać z czasem wlewają się do magazynu, najwięcej
dać staje się mniej istotny dla stosowanej analizy. Te dać
często nazywany dać zasnąć, a ich utrzymanie zawsze jest drogie, ponieważ
prawie nigdy nie są używane.
Co to oznacza dla sponsorów projektów? Zasadniczo, ja
pierwsi sponsorzy dzielą się więcej niż kosztami inwestycji.
Jest to pierwotne, ponieważ są bodźcem do znalezienia warstwy
duże środowisko technologiczne i zasoby magazynowe,
w tym organiczne.
Ale te pierwsze kroki przynoszą najwyższą wartość, a co za tym idzie projektantów
często muszą uzasadniać inwestycję.
Projekty wykonane po Twojej inicjatywie BI mogą wiązać się z kosztami
gorsze (w porównaniu z pierwszym) i bezpośrednie, ale mają mniejszą wartość
do firmy.
Właściciele organizacji muszą zacząć się zastanawiać
wyrzuć nagromadzenie dać i mniej odpowiednie technologie.
Eksploracja danych: Wydobycie Dać
Liczne elementy architektoniczne wymagają odmian
technologie i techniki eksploracji danych -
na przykład różni „agenci” zajmujący się badaniem interesujących miejsc
klienci, systemy operacyjne firmy i dla tego samego dw. Te
agenci mogą być przeszkolonymi zaawansowanymi sieciami neuronowymi
trendy puli, takie jak przyszły popyt na produkty na podstawie
wyprzedaż promocji; silniki oparte na regułach dla platformy
reagować na całość data okoliczności, na przykład diagnoza
zalecenia lekarskie i lecznicze; a nawet prostych agentów
z rolą zgłaszania wyjątków do wyższej kadry kierowniczej (top
kierownictwo). Generalnie te procesy ekstrakcji dać si
weryfikuj w czasie rzeczywistym; dlatego muszą być zjednoczeni
całkowicie z ruchem dać Stessi.
Przetwarzanie analityczne online
Analityka online
Możliwość krojenia, siekania, toczenia, drążenia
i przeprowadź analizę
co, jeśli, mieści się w zakresie celu zestawu
Technologia IBM. Na przykład funkcje przetwarzania analitycznego
online (OLAP) istnieją dla DB2, które przenoszą analizę wymiarową do
silnik baza danych podobnie.
Funkcje dodają narzędzia wymiarowe do SQL, podczas gdy
Skorzystaj ze wszystkich zalet bycia naturalną częścią DB2. Inne
przykładem integracji OLAP jest narzędzie do ekstrakcji, DB2
Analizator serwera OLAP. Ta technologia pozwala na użycie kostek
Serwer DB2 OLAP działa szybko i automatycznie
analizowane w celu identyfikacji i raportowania wartości dać niezwykłe lub nieoczekiwane
w całej kostce do analityka handlowego. I wreszcie funkcje
DW Center zapewnia architektom środki do kontrolowania, między innymi
inne rzeczy, profil kostki serwera DB2 OLAP jako część
charakter procesów ETL.
Analiza przestrzenna Analiza przestrzenna
Przestrzeń reprezentuje połowę kotwic analitycznych (przewodzenie)
potrzebne do panoramy
szeroki analityczny (drugą połowę reprezentuje czas). Poziom atomowy
(poziom atomowy) magazynu, przedstawionego na rysunku 1.1,
obejmuje podstawy czasu i przestrzeni. Nagrania
analizy kotwicy czasowej dla informacji o czasie i adresie
analiza przestrzeni kotwicy. Znaczniki czasu (znaczniki czasu)
przeprowadzają analizę w czasie, a informacje o adresie prowadzą
analiza przestrzenna. Diagram przedstawia geokodowanie - proces
konwertowanie adresów na punkty na mapie lub punkty w przestrzeni
tak, że takie pojęcia jak odległość i wewnętrzny / zewnętrzny mogą być
wykorzystywane w analizie - prowadzonej na poziomie atomowym i analizie przestrzennej
który jest udostępniany analitykowi. IBM dostarcza rozszerzenia
przestrzeń kosmiczna, opracowana we współpracy z Environmental System Research Institute (ESRI),
al baza danych DB2, tak aby obiekty przestrzenne mogły być
przechowywane jako normalna część pliku baza danych relacyjny. DB2
Spatial Extenders, zapewniają również wszystkie rozszerzenia SQL dla
skorzystaj z analizy przestrzennej. Na przykład rozszerzenia SQL z
pytanie o
odległość między adresami lub czy punkt znajduje się wewnątrz czy na zewnątrz obszaru
wielokątne, są standardem analitycznym w Spatial
Wypełniacz. Więcej informacji znajdziesz w rozdziale 16.
Baza danych-Resident Tools Tools Baza danych-
Resident
DB2 oferuje wiele pomocniczych funkcji SQL rezydentnych dla BI
w akcji analitycznej. Obejmują one:
▪ Funkcje rekurencyjne do przeprowadzania analizy, takie jak „znajdź
wszystkie możliwe trasy lotu z San Francisco a I Love New York".
▪ Funkcje analityczne dla rangowania, funkcje kumulacyjne, kostka
i pakiety zbiorcze ułatwiające wykonywanie normalnie wykonywanych zadań
Tylko dzięki technologii OLAP są teraz naturalną częścią
silnik baza danych
▪ Możliwość tworzenia tabel zawierających wyniki
Sprzedawcy baza danych liderzy łączą więcej możliwości BI
w baza danych samo.
Główni dostawcy Baza danych mieszają więcej
Funkcjonalność BI w baza danych samo.
Zapewnia to najlepszą wydajność i więcej opcji wykonywania dla
Rozwiązania BI.
Omówiono cechy i funkcje DB2 V8
szczegółowo w następujących rozdziałach:
Podstawy architektury technicznej i zarządzania danymi
(Rozdział 5)
▪ Podstawy DB2 BI (rozdział 6)
▪ Tabele zmaterializowanych zapytań DB2 (zmaterializowane zapytanie
Tabele) (Rozdział 7)
▪ Funkcje DB2 OLAP (rozdział 13)
▪ Rozszerzony BI DB2
Cechy i funkcje) (rozdział 15)
Uproszczony system dostarczania danych
System dostaw dać uproszczony
Architektura przedstawiona na rysunku 1.1 obejmuje kilka
Struktury dać fizyczny. Jednym z nich jest magazyn dać operacyjny.
Ogólnie ODS jest zorientowany tematycznie,
zintegrowane i aktualne. Czy stworzyłbyś ODS do obsługi, ad
na przykład biuro sprzedaży. Sprzedaż ODS zostałaby zintegrowana dać
pochodzący z wielu różnych systemów, ale zachowałby tylko reklamę
na przykład dzisiejsze transakcje. ODS można aktualizować
nawet wiele razy dziennie. W tym samym czasie procesy
pchnij ja dać zintegrowane z innymi aplikacjami. Ta struktura jest
specjalnie zaprojektowany do integracji dać prąd i dynamiczny e
byłby prawdopodobnym kandydatem do poddania się analizie w czasie rzeczywistym,
jak świadczyć usługi agentom klienci informacje o sprzedaży
prądy klienta poprzez wydobycie informacji o trendach sprzedaży
z samego magazynu. Inną strukturą pokazaną na rysunku 1.1 jest
formalny status dla dw. Nie tylko jest to miejsce dla
wykonanie niezbędnej integracji, jakości daćI
transformacji dać zapasów w drodze, ale jest też
niezawodne i tymczasowe miejsce do przechowywania storage dać odpowiedziałem, że
może być używany w analityce w czasie rzeczywistym. Jeśli zdecydujesz się
korzystać z ODS lub miejsca postoju, jeden
najlepszych narzędzi do wypełniania tych struktur dać za pomocą
różnych źródeł operacyjnych jest heterogenicznym rozproszonym zapytaniem DB2.
Tę możliwość zapewnia opcjonalna opcja DB2
o nazwie DB2 Relational Connect (tylko zapytania) i za pośrednictwem DB2
DataJoiner (osobny produkt dostarczający aplikację,
wstawianie, aktualizacja i możliwość anulowania a
Heterogeniczne rozproszone RDBMS).
Ta technologia pozwala architektom na: dać wiązać dać di
produkcja z procesami analitycznymi. Nie tylko technologia może
wirtualnie dostosowują się do dowolnych żądań replikacji, które .
mogą pojawić się z analityką w czasie rzeczywistym, ale to
mogą również łączyć się z szeroką gamą baz dać więcej
popularne m.in. DB2, Oracle, Sybase, SQL Server,
Informix i inne. DB2 DataJoiner może być używany do wypełniania
struktura dać formalne jako ODS lub nawet stół
stałe reprezentowane w magazynie przeznaczonym do renowacji
szybkie natychmiastowe aktualizacje lub na sprzedaż. Oczywiście,
te same struktury dać można wypełnić za pomocą
kolejna ważna technologia przeznaczona do replikacji dać, IBM
Relacja DataPropagator. (DataPropagator to osobny produkt
dla systemów centralnych. DB2 UNIX, Linux, Windows i OS/2 obejmują
usługi replikacji firmy dać w standardzie).
Inna metoda poruszania dać działa wokół
do przedsiębiorstwa jest integratorem aplikacji korporacyjnych w przeciwnym razie
znany jako broker wiadomości
unikalna technologia pozwala na niezrównaną kontrolę do centrum
(kierowanie) i ruszaj dać wokół firmy. IBM ma brokera
szerzej używanej wiadomości, MQSeries lub odmiany
produktu, który zawiera wymagania e-commerce, IBM
WebSphere MQ.
Więcej informacji na temat wykorzystania MQ do obsługi
magazyn i środowisko BI, odwiedź strona internetowa z książki. Na razie tak
wystarczy powiedzieć, że ta technologia jest doskonałym nośnikiem dla
przechwytywanie i przekształcanie (za pomocą MQSeries Integrator) dać
operatorów docelowych rekrutowanych do rozwiązań BI. Tam
Technologia MQ została zintegrowana i umieszczona w UDB V8, co:
oznacza to, że można teraz zarządzać kolejkami wiadomości
jakby były tabelami DB2. Koncepcja spawania
wiadomości w kolejce i wszechświata baza danych głowy relacji relation
w kierunku potężnego środowiska dostarczania dać.
Zerowa latencja Zerowa latencja
Ostatecznym celem strategicznym IBM jest analiza z zerową latencją (zerolatency).
Zgodnie z definicją
Gartner, system BI musi być w stanie wydedukować, przyswoić
i dostarczać informacje dla analityków na żądanie. Wyzwanie,
oczywiście chodzi o to, jak mieszać dać bieżące i w czasie rzeczywistym
z niezbędnymi informacjami historycznymi, takimi jak i dać powiązany model / z
trend lub wyodrębnione zrozumienie, jako nakreślenie
klient
Takie informacje obejmują na przykład identyfikację klienci ad
wysokie lub niskie ryzyko lub które produkty są klienci dużo kupią
pewnie, jeśli mają już w wozach trochę sera
zakupy.
Uzyskanie zerowego opóźnienia w rzeczywistości zależy od dwóch
podstawowe mechanizmy:
▪ Całkowite połączenie dać które są analizowane za pomocą
ugruntowane techniki i narzędzia opracowane przez BI
▪ System dostarczania dać skuteczne, aby zapewnić, że
analiza w czasie rzeczywistym jest naprawdę dostępna
Te warunki wstępne o zerowym opóźnieniu nie różnią się od tych dwóch
cele wyznaczone przez IBM i opisane powyżej.
Bliskie sprzężenie dać jest częścią
bezproblemowa integracja przygotowana przez IBM. I stworzyć system
Dostawa dać wydajny jest całkowicie zależny od
dostępna technologia, która upraszcza proces dostawy
dać. W związku z tym dwa z trzech celów IBM są krytyczne
zrealizować trzeci. IBM świadomie rozwija swój własny
technologia zapewniająca, że ​​zero opóźnień jest rzeczywistością dla
wysiłki magazynowe.
Podsumowanie / Synteza
Organizacja BI zapewnia mapę drogową dla
stwórz swoje środowisko
iteracyjnie. Musi być dostosowany do potrzeb
Twój biznes, zarówno obecny, jak i przyszły. Bez wizji architektonicznej
szeroki, powtórzeń akcji jest niewiele więcej niż
losowe wdrożenia magazynu centralnego, które niewiele robią za
stworzyć duże, informacyjne przedsiębiorstwo.
Pierwszą przeszkodą dla kierowników projektów jest to, jak uzasadnić
inwestycje niezbędne do rozwoju organizacji BI.
Chociaż obliczanie ROI pozostało głównym argumentem dla
osiągnięć magazynowych, coraz trudniej jest
przewidzieć dokładnie. Doprowadziło to do innych metod
ustalenie, czy otrzymujesz wartość swoich pieniędzy. ten
na przykład wartość inwestycji2 (TY) jest nabywana
jako rozwiązanie.
Wisi nad architektami dać i na planistach projektu
celowo generować i dostarczać informacje stowarzyszeniom
użytkowników, a nie tylko świadczyć usługi dać. Tam jest
ogromna różnica między nimi. Informacja jest czymś, co sprawia, że ​​człowiek
różnica w podejmowaniu decyzji i skuteczności; stosunkowo, ja
dać są budulcem do pozyskiwania tych informacji.
Chociaż krytyczny wobec źródła dać odpowiadać na prośby
komercyjne, środowisko BI powinno pełnić większą rolę
w tworzeniu treści informacyjnych. Musimy wziąć
dodatkowe środki do czyszczenia, integracji, transformacji lub
w przeciwnym razie stworzyć treść informacyjną, zgodnie z którą
użytkownicy mogą podejmować działania, dlatego musimy upewnić się, że
działania i te decyzje, tam gdzie jest to uzasadnione, są odzwierciedlane
w środowisku BI. Jeśli przeniesiemy magazyn do obsługi tylko na dać,
zapewnia się, że stowarzyszenia użytkowników będą tworzyć treści
informacje potrzebne do podjęcia działań. Gwarantuje to, że ich
społeczność będzie mogła podejmować lepsze decyzje, ale firma
cierpi z powodu braku wiedzy, z której korzystali.
Dane że architekci i projektanci inicjują projekty
specyficzne dla środowiska BI, pozostają odpowiedzialne przed przedsiębiorstwem
ogólnie mówiąc. Prosty przykład tej dwukierunkowej funkcji
twarze iteracji BI znajdują się w źródle dać, Wszystko
dać otrzymane dla konkretnych żądań handlowych muszą być
zaludnionych w pierwszej warstwie atomowej. Gwarantuje to rozwój
korporacyjnych zasobów informacyjnych, a także zarządzać, adresować
specyficzne żądania użytkownika zdefiniowane w iteracji.

W hatisa Dane W arehouse?
Hurtownia danych jest sercem architektury systemów informatycznych
od 1990 roku i wspiera procesy informacyjne oferując solidne
zintegrowana platforma dać historycy wzięty za podstawę później
ćwiczenie. TEN hurtownia danych oferują łatwość integracji z
świat systemów aplikacji, które nie są ze sobą kompatybilne. Data
magazyn ewoluował, aby stać się trendem. Hurtownia danych
organizuje i przechowuje i dać niezbędne do procesów informacyjnych e
analityczne w oparciu o długą historyczną perspektywę czasową. Wszystkie
wiąże się to ze znacznym i stałym zaangażowaniem w budowę e
w utrzymaniu hurtownia danych.
Więc co to jest? hurtownia danych? hurtownia danych to jest:
▪ zorientowany na tematy
▪ zintegrowany system
▪ czas wariantu
▪ nieulotny (nie anuluje)
kolekcja dać wykorzystywane do wspierania decyzji zarządczych w
wdrożenie procesu.
I dać włożona w hurtownia danych powstają w większości
przypadki ze środowisk operacyjnych. ten hurtownia danych jest wykonany przez a
jednostka magazynowa, fizycznie oddzielona od reszty
system, który zawiera dać wcześniej przekształcony przez
aplikacje operujące na informacjach pochodzących z otoczenia
operacyjny.
Dosłowna definicja a hurtownia danych zasługuje na dogłębne spojrzenie
wyjaśnienie, ponieważ istnieją ważne motywacje i znaczenia
fundusz opisujący charakterystykę magazynu.
ORIENTACJA NA PRZEDMIOT
TEMATYCZNY
Pierwsza cecha hurtownia danych jest to, że jest zorientowany na ai
głównych graczy w firmie. Ocenianie prób przez i
dać jest to w przeciwieństwie do bardziej klasycznej metody, która zapewnia
orientacja aplikacji na procesy i funkcje,
metoda w większości podzielana przez większość
starsze systemy kierunkowe.
Świat obsługi jest zaprojektowany wokół aplikacji i funkcji
takie jak pożyczki, oszczędności, karty bankowe i powiernictwo dla instytucji
budżetowy. Świat dw jest zorganizowany wokół tematów
takich jak klient, sprzedawca, produkt i firma.
Dopasowanie wokół tematów wpływa na projekt i
w sprawie realizacji dać znalezione w dw. Co więcej,
główny argument wpływa na najważniejszą część
kluczowa struktura.
Na świat aplikacji ma wpływ zarówno projekt daty
bazy i projektu procesu. Świat
dw koncentruje się wyłącznie na modelowaniu dać i na
rysunek baza danych. Projekt procesu (w jego formie)
classic) nie jest częścią środowiska dw.
Różnice między wyborem procesu/funkcji a zastosowaniem
wybór tematyczny ujawnia się również jako różnice w treści
z dać na poziomie szczegółowym. TEN dać del dw nie zawierają i dać że
nie będą używane w procesie DSS podczas aplikacji
operacyjne zorientowane na dać zawierać ja dać zaspokoić
natychmiast wymagania funkcjonalne / przetwarzania, które mogą lub
minus posiadanie jakiegokolwiek użytku dla analityka DSS.
Kolejny ważny sposób, w jaki aplikacje zorientowane na operacje
ai dać różnią dać dw znajduje się w raportach dać. dać
operacyjne utrzymywanie ciągłej relacji między dwoma lub więcej tabelami
na podstawie aktywnej reguły biznesowej. TEN dać przez dw
obejmują one spektrum czasu, a stosunki znalezione w dw są
dużo. Wiele zasad handlu (i odpowiednio wiele
raporty z dać ) są reprezentowane w magazynie dać między dwoma
wiele tabel.
(Aby uzyskać szczegółowe wyjaśnienie, w jaki sposób relacje między dać
zarządzany w DW, odnosimy się do tematu technicznego na ten temat
pytanie.)
Z żadnej innej perspektywy niż różnica
fundamentalne między wyborem funkcjonalności/procesu a aplikacją
wybór tematu, jest większa różnica między systemami
operacyjne i dać i DW.
INTEGRACJA INTEGRACJA
Najważniejszym aspektem środowiska dw jest to, że i dać znaleziony
w dw można je łatwo zintegrować. ZAWSZE. BEZ
WYJĄTKI. Istotą środowiska dw jest to, że i dać
zawarte w granicach magazynu są zintegrowane.
Integracja objawia się na wiele różnych sposobów – w konwencjach
zidentyfikowane jako spójne, w zakresie zmiennych zgodnych, w
skodyfikowanych struktur składających się z fizycznych atrybutów dać
spójne i tak dalej.
Przez lata robili to projektanci różnych aplikacji
podejmowanie wielu decyzji o tym, jak aplikacja powinna
być rozwijane. Indywidualne decyzje dotyczące stylu i projektu
aplikacje projektantów ujawniają się na setki sposobów: in
różnice w kodowaniu, kluczowej strukturze, cechach fizycznych,
konwencje identyfikacji i tak dalej. Zbiorowa zdolność wielu
projektanci aplikacji do tworzenia niespójnych aplikacji
to jest legendarne. Rysunek 3 przedstawia niektóre z większej liczby różnic
ważne w sposobie projektowania aplikacji.
Kodowanie: Kodowanie:
Projektanci aplikacji wybrali kodowanie w terenie -
seks - na kilka sposobów. Projektant reprezentuje seks jako
„m” i „f”. Inny projektant przedstawia seks jako „1”
i „0”. Inny projektant przedstawia seks jako „x” e
„T”. Inny projektant przedstawia seks jako „męski” e
"Płeć żeńska". To naprawdę nie ma znaczenia, jak seks pojawia się w DW. Im"
a „F” są chyba tak dobre jak całość
reprezentacja.
Liczy się to, że z jakiegokolwiek źródła pochodzi pole płci,
to pole dociera do DW w spójnym stanie zintegrowanym. Z
konsekwencja, gdy pole jest ładowane do DW z
zgłoszenie, w którym zostało przedstawione w formacie
„M” i „F”, i dać należy przekonwertować na format DW.
Pomiar atrybutów: pomiar
Atrybuty:
Projektanci aplikacji postanowili zmierzyć potok w
na różne sposoby w kursie
Kilka lat. Projektant przechowuje i dać rurociągu w
cm. Inny projektant aplikacji przechowuje i dać
rurociągu w calach. Inny projektant z
sklepy z aplikacjami dać rurociągu w milionach stóp sześciennych
na sekundę. A inny projektant przechowuje informacje o
rurociąg w metrach. Niezależnie od źródła, kiedy
informacje o rurociągu docierają do DW, którym muszą być
mierzone w ten sam sposób.
Zgodnie ze wskazaniami na rysunku 3, kwestie integracji
wpływają na prawie każdy aspekt projektu – cechy
fizyczne z dać, dylemat posiadania więcej niż jednego źródła daćThe
kwestia niezgodnych zidentyfikowanych próbek, formatów dać
niespójne i tak dalej.
Niezależnie od argumentu dotyczącego projektu, wynik jest taki sam -
i dać musi być przechowywany w DW w pojedynczym e
globalnie akceptowalny sposób, nawet gdy systemy operacyjne
sklep funduszy inaczej ja dać.
Kiedy analityk DSS patrzy na DW, cel analityka
powinno być wykorzystywaniem dać którzy są w magazynie,
zamiast zastanawiać się nad wiarygodnością lub spójnością
dać.
ZMIANA CZASU
wszystko dać w DW są one dokładne w pewnym momencie.
Ta podstawowa cecha dać w DW bardzo różni się od dać
znaleźć w środowisku operacyjnym. TEN dać środowiska operacyjnego są
tak dokładne, jak w momencie dostępu. Innymi słowy,
w środowisku operacyjnym, gdy uzyskuje się dostęp do dysku dać, Ale również
poczekaj, aż odda dokładne wartości jak w momencie dostępu.
Dlaczego ja dać w DW są tak dokładne, jak w pewnym momencie w
czas (tzn. nie „teraz”), i dać znalezione w DW
są to „zmienność czasowa”.
Zmienność czasu dać DW jest określane na wiele sposobów.
Najprostszym sposobem jest to, że ja dać DW reprezentują dać na
długi horyzont czasowy - od pięciu do dziesięciu lat. Horyzont
czas reprezentowany dla środowiska operacyjnego jest znacznie krótszy
▪ od dzisiejszych aktualnych wartości od nawet sześćdziesięciu dziewięćdziesięciu
Aplikacje, które muszą działać i muszą być
dostępne do przetwarzania transakcji muszą nosić
minimalna kwota dać jeśli przyznają się do jakiegokolwiek stopnia
elastyczność. Tak więc aplikacje operacyjne mają horyzont
krótki czas, jako temat projektowy
aplikacje audio.
Drugi sposób, w jaki „zmienność czasowa” pojawia się w DW, to
kluczowa struktura. Każda kluczowa struktura w DW zawiera:
pośrednio lub bezpośrednio, element czasu, taki jak
dzień, tydzień, miesiąc itp. Element czasu jest prawie zawsze
na dole połączonego klucza znajdującego się w DW. W tych
W niektórych przypadkach element czasu będzie istniał niejawnie, w zależności od przypadku
gdzie cały plik jest powielany na koniec miesiąca lub kwartału.
Trzecim sposobem wyświetlania wariancji czasu jest to, że i dać del
DW, po prostu poprawnie zarejestrowany, nie może być
zaktualizowany. TEN dać DW są, z praktycznego punktu widzenia, długie
seria migawek (migawka). Oczywiście, jeśli migawki są
zostały zrobione nieprawidłowo, wtedy zrzuty mogą być
zmodyfikowany. Ale zakładając, że migawki są gotowe
poprawnie, nie są one zmieniane zaraz po ich zakończeniu. W niektórych
przypadki mogą być nieetyczne lub nawet nieprawidłowe, że migawki w in
DW są zmodyfikowane. TEN dać działanie, będąc precyzyjnym jak w
po uzyskaniu dostępu można je aktualizować tak, jak się prezentuje
potrzeba.
NIELOTNY
Czwartą ważną cechą DW jest to, że jest nieulotna.
Wprowadzane są aktualizacje, wstawienia, anulowania i zmiany
regularnie dla środowisk operacyjnych „od zapisu po zapisie”. Ale
podstawowa manipulacja dać potrzebnych w DW jest znacznie więcej
prosty. Istnieją tylko dwa rodzaje operacji, które występują w
DW - początkowe ładowanie dać i dostęp do dać. Tam nie ma
wszelkie aktualizacje dać (w ogólnym sensie
aktualizacja) w DW jako normalna operacja przetwarzania.
Istnieje kilka bardzo silnych konsekwencji tej różnicy
podstawa pomiędzy przetwarzaniem operacyjnym a przetwarzaniem DW. Na poziomie
projekt, konieczność zachowania ostrożności przy aktualizacji
anomalia nie jest czynnikiem w DW, ponieważ aktualizacja dać nie jest
przeprowadzone. Oznacza to, że na fizycznym poziomie projektowania
można wykorzystać swobody w celu optymalizacji dostępu do dać,
w szczególności w zajmowaniu się tematami normalizacji i
denormalizacja fizyczna. Kolejna konsekwencja prostoty
działalności DW jest w technologii bazowej wykorzystywanej do
uruchomić środowisko DW. Konieczność obsługi aktualizacji
rekord po rekordzie online (jak to często bywa w przypadku
przetwarzanie operacyjne) technologia jest wymagana
bardzo złożone fundamenty pod pozorną prostotą.
Technologia obsługująca tworzenie kopii zapasowych i odzyskiwanie, transakcje
i integralność dać a wykrywanie i usuwanie stanu impasu to
dość skomplikowane i nie jest konieczne do przetwarzania DW.
Cechy DW, orientacja projektowa,
integracja dać w DW, zmienność czasu i prostota
zarządzanie dać, to wszystko prowadzi do środowiska, które jest bardzo, bardzo
różni się od klasycznego środowiska operacyjnego. Źródło prawie wszystkich
dać DW to środowisko operacyjne. Kuszące jest myślenie
że istnieje ogromna redundancja dać między tymi dwoma środowiskami.
W rzeczywistości pierwsze wrażenie, jakie wiele osób odnosi, to:
duża redundancja dać między środowiskiem operacyjnym a
DW. Taka interpretacja jest powierzchowna i dowodzi jednej…
brak zrozumienia, co dzieje się w DW.
W rzeczywistości istnieje minimalna redundancja dać między środowiskiem operacyjnym
i dać DW. Rozważmy następujące kwestie:
▪ ja dać są filtrowane data które przekazujesz ze środowiska operacyjnego
do środowiska DW. Dużo dać nigdy nie mdleją
ze środowiska operacyjnego. Z wyjątkiem tego, że ja dać które są potrzebne do
Przetwarzanie DSS znajduje swój kierunek w środowisku
▪ horyzont czasowy dać bardzo różni się od otoczenia
do drugiego. TEN dać w środowisku operacyjnym są bardzo świeże. TEN dać
w DW są znacznie starsze. Tylko z perspektywy
w horyzoncie czasowym nakłada się bardzo mało
między środowiskiem operacyjnym a DW.
▪ DW zawiera dać podsumowanie, które nigdy nie zostało znalezione
w otoczeniu
▪ ja dać przechodzą fundamentalną transformację, ponieważ
gdy przechodzą do rysunku 3, pokazuje, że większość
część dać są znacząco zmodyfikowane pod warunkiem
do wybrania i przeniesienia do DW. Innymi słowy,
bardzo dać jest fizycznie zmodyfikowany e
radykalnie jak to jest przeniesione do DW. Z punktu widzenia
integracja to nie to samo dać kto mieszka?
w środowisku operacyjnym.
W świetle tych czynników redundancja dać między dwoma środowiskami jest
rzadkie zdarzenie, prowadzące do redundancji mniejszej niż 1% między nimi
środowiska.
STRUKTURA MAGAZYNU
DW mają odrębną strukturę. Istnieją różne poziomy podsumowania i di
szczegóły, które wyznaczają DW.
Różne składniki DW to:
▪ Metadane
Dać aktualnych informacji
Dać starych detali
Dać lekko podsumowane
Dać bardzo podsumowane
Zdecydowanie główny problem dotyczy i dać szczegółowości
prądy. Jest to główny problem, ponieważ:
▪ ja dać aktualne dane odzwierciedlają najnowsze wydarzenia,
które zawsze cieszą się dużym zainteresowaniem i
▪ ja dać bieżących szczegółów jest obszernych, ponieważ jest
przechowywane na najniższym poziomie ziarnistości e
▪ ja dać aktualne dane są prawie zawsze przechowywane na
pamięć dyskowa, która jest szybko dostępna, ale droga e
kompleks od
I dać starsze szczegóły są dać które są przechowywane na
jakieś wspomnienie nt massa. Ma dostęp sporadycznie i jest
przechowywane na poziomie szczegółowości zgodnym z dać szczegółowy
prądy. Chociaż nie jest obowiązkowe, aby przechowywać na
pamięć alternatywna, ze względu na dużą objętość dać zjednoczony z
sporadyczny dostęp do dać, nośnik pamięci dla dać di
starsze szczegóły zwykle nie są przechowywane na dysku.
I dać podsumowane lekko są dać które są destylowane od dołu
poziom szczegółowości znaleziony na obecnym poziomie szczegółowości. Ten
Poziom DW jest prawie zawsze przechowywany w pamięci dyskowej. TEN
problemy projektowe, które są przedstawiane architektowi dać
w budowie tego poziomu DW są:
▪ Którą jednostką czasu jest podsumowanie wykonane powyżej
▪ Jaka treść, atrybuty będą w niewielkim stopniu podsumowywać
zadowolony z dać
Następny poziom dać znalezione w DW jest to z dać bardzo
streszczony. TEN dać bardzo podsumowane są kompaktowe i łatwe
dostępny. TEN dać bardzo podsumowane są czasami znalezione
w środowisku DW oraz w innych przypadkach i dać bardzo podsumowane są
znalezione poza bezpośrednimi murami technologii obsługującej DW.
(w każdym razie ja dać bardzo podsumowane są częścią DW
niezależnie od tego, gdzie ja dać są fizycznie zakwaterowane).
Ostatnim elementem DW są metadane. Pod wieloma względami
metadane są w innym wymiarze niż inne dać
DW, ponieważ metadane nie zawierają żadnych data bezpośrednio
pobrane ze środowiska operacyjnego. Metadane odgrywają szczególną rolę e
bardzo ważne w DW. Metadane wykorzystywane są jako:
▪ katalog, który pomoże analitykowi DSS zlokalizować
treść DW,
▪ przewodnik po mapowaniu dać jak ja dać były
przekształcone ze środowiska operacyjnego do środowiska DW,
▪ przewodnik po algorytmach używanych do podsumowania między dać di
aktualny szczegół ei dać nieco podsumowane, ja dać bardzo
streszczenia,
Metadane odgrywają znacznie ważniejszą rolę w środowisku DW
w porównaniu do tego, co kiedykolwiek mieli w środowisku operacyjnym
STARE SZCZEGÓŁY MAGAZYNOWE ŚREDNI
Taśma magnetyczna może być używana do przechowywania tego typu
dać. W rzeczywistości istnieje wiele różnych narzędzi do zapamiętywania, które
należy wziąć pod uwagę zachowanie starych dać di
Szczegół.
W zależności od objętości dać, częstotliwość dostępu, koszt
narzędzi i rodzaju dostępu, jest to całkowicie prawdopodobne
że inne narzędzia będą wymagały starego poziomu szczegółowości
w DW.
PRZEPŁYW DANYCH
Istnieje normalny i przewidywalny przepływ bogów dać w DW.
I dać wprowadź DW ze środowiska operacyjnego. (UWAGA: są
kilka bardzo interesujących wyjątków od tej reguły. Jednak prawie
wszystko dać wprowadzić DW ze środowiska operacyjnego). Dane że dać
wejść do DW ze środowiska operacyjnego, jest przekształcone tak, jak było
opisane powyżej. Pod warunkiem wpisania DW, i dać wejdz do
aktualny poziom szczegółowości, jak pokazano. Znajduje się tam i jest używany
do momentu wystąpienia jednego z trzech zdarzeń:
▪ jest oczyszczony,
▪ jest podsumowany i/lub
▪ jest
Przestarzały proces wewnątrz ruchu DW i dać aktualnych informacji
a dać starych detali, według wieku dać. Proces
podsumowanie wykorzystuje szczegóły dać obliczyć ja dać
nieznacznie podsumowane i bardzo podsumowane poziomy dać. Tam są
pewne wyjątki od pokazanego przepływu (omówione później).
Jednak zazwyczaj dla zdecydowanej większości dać znaleziony
w DW, przepływ dać jest jak na zdjęciu.
KORZYSTANIE Z MAGAZYNU DANYCH
Nic dziwnego, że różne poziomy dać w DW nie
otrzymują różne poziomy użytkowania. Z reguły im wyższy poziom
podsumowanie, plus i dać są one wykorzystywane.
Wiele zastosowań występuje w dać bardzo podsumowane, podczas gdy stare
dać szczegóły prawie nigdy nie są używane. Jest dobry powód w
przenieść organizację do paradygmatu wykorzystania zasobów. Więcej ma
podsumowanie dać, tym szybciej i efektywniej dotrzesz do dać. Jeśli
un sklep stwierdza, że ​​wykonuje wiele procesów na poziomie szczegółowości DW,
następnie odpowiednio duża ilość zasobów maszynowych
jest konsumowany. Ściganie leży w najlepszym interesie wszystkich
jak najszybciej na wysokim poziomie podsumowania.
W przypadku wielu sklepów analityk DSS w przedśrodowiskowym DW używał
dać na poziomie szczegółowości. Pod wieloma względami przybycie a dać szczegółowy
wygląda jak koc bezpieczeństwa, nawet jeśli są dostępne
inne poziomy podsumowania. Jedno z działań architekta dać è
odzwyczaić użytkownika DSS od ciągłego korzystania z dać na plusie
niski poziom szczegółowości. Dostępne są dwa powody
przez architekta dać:
▪ instalując system obciążeń zwrotnych, w którym użytkownik końcowy płaci
zużyte zasoby e
▪ które wskazują, że bardzo dobry czas odpowiedzi może być
uzyskane, gdy zachowanie z i dać jest na wysokim poziomie
podsumowania, natomiast zły czas odpowiedzi wynika z
zachowanie dać na niskim poziomie
INNE UWAGI
Istnieje kilka innych kwestii związanych z budową i zarządzaniem
DW
Pierwsza uwaga dotyczy indeksów. TEN dać na najwyższych poziomach
podsumowanie może być dowolnie indeksowane, natomiast i dać
na niższych poziomach szczegółowości są tak nieporęczne, że mogą być
indeksowane oszczędnie. Z tego samego znaku i dać na wysokich poziomach
detal można stosunkowo łatwo odnowić,
podczas gdy głośność dać na niższych poziomach jest tak duży, że i dać nie
można je łatwo odnowić. W związku z tym model
z dać i formalna praca wykonana przez projekt określiła
fundament pod DW stosowany prawie wyłącznie do poziomu
szczegóły aktualne. Innymi słowy, działania modelarskie
dać prawie w każdym przypadku nie mają one zastosowania do poziomów podsumowania.
Inną kwestią strukturalną jest to, że podział
dać przez DW.
Partycjonowanie można wykonać na dwóch poziomach - na poziomie dbm oraz
poziom aplikacji. W podziale na poziomie dbmThe dbm è
informowany o podziałach i odpowiednio je sprawdza. W przypadku
podział na poziomie aplikacji, tylko programista jest
poinformowany o podziałach i odpowiedzialności za nie
administracja jest mu pozostawiona
Poniżej poziomu dbm, dużo pracy odbywa się automatycznie. Jest
duża nieelastyczność związana z automatycznym administrowaniem
podziały. W przypadku podziału na poziomie aplikacji dać del
hurtownia danych, dużo pracy jest na programatorze, ale
efektem końcowym jest elastyczność w administrowaniu dać w terminie
magazyn
INNE ANOMALIE
Podczas gdy składniki hurtownia danych pracuj zgodnie z opisem
dla prawie wszystkich dać, istnieje kilka przydatnych wyjątków, które muszą
być dyskutowane. Wyjątkiem jest ten z dać streszczenia publiczne
(publiczne dane podsumowujące). To są dać podsumowania, które zostały
obliczona poza hurtownia danych ale są używane przez społeczeństwo. TEN dać
podsumowania publiczne są przechowywane i zarządzane w hurtownia danych,
chociaż, jak wspomniano powyżej, są one zorientowane. TEN
księgowi pracują nad produkcją takiego kwartalnika dać jako
dochód, wydatki kwartalne, zysk kwartalny i tak dalej. Praca
wykonywane przez księgowych jest zewnętrzne w stosunku do hurtownia danych. Jednakże, ja dać
używany „wewnętrznie” w firmie – od marketing, sprzedaż itp.
Inną anomalią, która nie będzie omawiana, jest anomalia dać zewnętrzny.
Kolejny świetny rodzaj dać które można znaleźć na randce
Magazyn to stałe dane szczegółowe. Te powodują
trzeba przechowywać na stałe i dać na jednym poziomie
szczegółowe ze względów etycznych lub prawnych. Jeśli firma wystawia i
pracowników powiązanych z substancjami niebezpiecznymi istnieje potrzeba dać
szczegółowe i trwałe. Jeśli firma wytwarza produkt, który:
chodzi o bezpieczeństwo publiczne, jakie są części samolotu
potrzeba dać stałe szczegóły, a także czy firma
zawiera niebezpieczne umowy.
Firma nie może sobie pozwolić na przeoczenie szczegółów dlaczego
w ciągu najbliższych kilku lat, w przypadku procesu sądowego, wycofanie, a
sporna wada konstrukcyjna itp. ekspozycja firmy
to mogłoby być świetne. W związku z tym istnieje unikalny rodzaj dać
znane jako stałe dane szczegółowe.
PODSUMOWANIE
Un hurtownia danych jest zorientowanym, zintegrowanym, wariantowym obiektem
czas, zbiór dać nieulotne na wsparcie potrzeb
decyzja administracji. Każda z istotnych funkcji
un hurtownia danych ma swoje konsekwencje. Plus są cztery
poziomy dać del hurtownia danych:
▪ Stary detal
▪ Aktualne szczegóły
Dać lekko podsumowane
Dać bardzo podsumowane
Metadane są również ważną częścią hurtownia danych.
ABSTRAKCYJNY
Pojęcie przechowywania dać niedawno otrzymany
dużo uwagi i stało się trendem lat 90. To wszystko
ze względu na zdolność a hurtownia danych przezwyciężyć
ograniczenia systemów wspomagających administrację, takich jak i
systemy wspomagania decyzji (DSS) i systemy informacyjne,
wykonawczy (EIS).
Chociaż koncepcja hurtownia danych wygląda obiecująco,
wdrożyć ja hurtownia danych może to być problematyczne z powodu
procesy magazynowania na dużą skalę. Mimo
złożoność projektów magazynowych dać, wielu dostawców
i konsultantów, którzy przechowują dać twierdzą, że
przechowywanie dać przedstawiać żadnego problemu.
Jednak na początku tego projektu badawczego prawie żaden
przeprowadzono niezależne, rygorystyczne i systematyczne badania. Z
W związku z tym trudno powiedzieć, co tak naprawdę się dzieje
w przemyśle, kiedy budują hurtownia danych.
W tym badaniu zbadano praktykę magazynowania dać
współczesnych, które mają na celu rozwinięcie bogatszego zrozumienia
australijskiej praktyki. Przegląd literatury dostarczył
kontekst i podstawa badań empirycznych.
Istnieje wiele wyników tych badań. Pierwszy
miejsce, badanie to ujawniło działania, które miały miejsce
w trakcie rozwoju hurtownia danych. W wielu dziedzinach, tj dać Zebrane
potwierdził praktykę opisywaną w literaturze. Drugi
witrynę, kwestie i problemy, na które może mieć wpływ
rozwój hurtownia danych zostały zidentyfikowane w tym badaniu.
Wreszcie korzyści uzyskane od australijskich organizacji związanych z
sposób użycia hurtownia danych zostały ujawnione.
Rozdział 1
Kontekst wyszukiwania
Koncepcja hurtowni danych zyskała powszechną akceptację
ekspozycji i stał się nowym trendem w
90 (McFadden 1996, TDWI 1996, Shah i Milstein 1997,
Shanks i inni. 1997, Eckerson 1998, Adelman i Oates 2000). To jest
widać po rosnącej liczbie artykułów na temat danych
magazynowanie w publikacjach branżowych (Little i Gibson 1999).
Wiele artykułów (patrz np. Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett i King 1996, Graham i in. 1996,
Sakaguchi i Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997, McCarthy 1997, O'Donnell 1997, Edwards 1998, TDWI
1999) przyniosły organizacjom znaczące korzyści
które wdrażają I hurtownia danych. Poparli swoją teorię
z anegdotycznymi dowodami udanych wdrożeń, wysoki zwrot
na temat wartości inwestycji (ROI), a także dostarcza wskazówek
odniesienie lub metodologie opracowywania hurtownia danych
(Shanks i in. 1997, Seddon i Benjamin 1998, Little i Gibson
1999). W skrajnym przypadku Graham i in. (1996) mają
odnotował średni zwrot z trzyletniej inwestycji na poziomie 401%.
Jednak większość współczesnej literatury pominęła ten problem
złożoności związanej z realizacją takich projektów. Projekty z
hurtownia danych są zwykle złożone i na dużą skalę oraz
dlatego implikują wysokie prawdopodobieństwo niepowodzenia, jeśli tak nie jest
dokładnie sprawdzone (Shah i Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs i Clymer 1998, Rao
1998). Wymagają ogromnych nakładów zarówno ludzkich, jak i zasobów ludzkich
finansowych oraz czasu i wysiłku, aby je zbudować (Hill 1998, Crofts 1998). The
typowy wymagany czas i środki finansowe wynoszą odpowiednio
około dwóch lat i dwóch lub trzech milionów dolarów (Braly 1995, Foley
1997b, Bort 1998, Humphries i in. 1999). Te czasy i środki
instrumenty finansowe są wymagane do kontrolowania i konsolidowania wielu aspektów
różni się od hurtowni danych (Cafasso 1995, Hill 1998). Na bok
względy dotyczące sprzętu i oprogramowania, inne funkcje, które się różnią
z wydobycia dać do procesów ładowania dać, Z
pojemność pamięci do zarządzania aktualizacjami i podawania meta dać
do szkolenia użytkowników, należy wziąć pod uwagę.
W momencie rozpoczęcia tego projektu badawczego było ich bardzo mało
badania naukowe prowadzone w zakresie hurtowni danych,
zwłaszcza w Australii. Widać to było po braku artykułów
publikowane na hurtowniach danych przez gazety lub inne pisma święte
ówczesnych naukowców. Wiele pism akademickich
dostępny opis doświadczeń z USA. brak
Badania akademickie w obszarze hurtowni danych sl spowodowały
wymagało rygorystycznych badań i studiów empirycznych (McFadden 1996,
Shanks i inni. 1997, Little i Gibson 1999). W szczególności studia
badania nad procesem wdrożeniowym hurtownia danych
należy zrobić, aby poszerzyć wiedzę
ogólnie o wykonaniu hurtownia danych e
posłuży jako podstawa do przyszłych badań (Shanks ed
inni. 1997, Little i Gibson 1999).
Dlatego celem tego badania jest zbadanie, czym tak naprawdę jest
dzieje się tak, gdy organizacje przechowują i wykorzystują dane
magazyn w Australii. W szczególności badanie to będzie obejmować
analiza całego procesu rozwojowego a hurtownia danych,
począwszy od inicjacji i projektowania poprzez projektowanie i
wdrożenie i późniejsze wykorzystanie w organizacjach
Australijski. Ponadto badanie przyczyni się również do bieżącej praktyki
identyfikowanie obszarów, w których praktyka może być kontynuowana
udoskonalone, a nieefektywność i ryzyko można zminimalizować lub
unikać. Ponadto posłuży jako podstawa do innych badań nt hurtownia danych in
Australii i wypełni lukę istniejącą obecnie w literaturze.
Pytania badawcze
Celem tego badania jest zbadanie zaangażowanych działań
w realizacji hurtownia danych i ich wykorzystanie przez
organizacje australijskie. W szczególności badane są elementy
w sprawie planowania projektu, rozwoju, al
działania, użytkowania i związanego z tym ryzyka. Stąd pytanie
tego badania jest:
„Jak wygląda obecna praktyka tzw hurtownia danych w Australii?"
Aby skutecznie odpowiedzieć na ten problem, a
liczba pomocniczych pytań badawczych. W szczególności trzy
pod-pytania zostały zidentyfikowane z literatury, to znaczy
przedstawione w rozdziale 2, aby poprowadzić ten projekt badawczy:
Jak są realizowane hurtownia danych przez organizacje
Australijski? Jakie są napotkane problemy?
Jakie są korzyści?
W odpowiedzi na te pytania posłużono się rysunkiem
badania eksploracyjne, które wykorzystują dochodzenie. Jak się uczę
rozpoznawczy, odpowiedzi na powyższe pytania nie są kompletne
(Shanks i in. 1993, Denscombe 1998). W tym przypadku tak jest
Aby poprawić odpowiedzi na nie, wymagana jest triangulacja
upraszanie. Śledztwo zapewni jednak solidne podstawy
przyszłe prace nad tymi pytaniami. Szczegółowy
omówienie zasadności metody badawczej i projektu
przedstawiono w rozdziale 3.
Struktura projektu badawczego
Ten projekt badawczy podzielony jest na dwie części: badanie kontekstowe
koncepcji hurtowni danych i badań empirycznych (zob
Rysunek 1.1), z których każdy jest omówiony poniżej.
Część I: Badanie kontekstowe
Pierwsza część badań polegała na przeglądzie tzw
Aktualna literatura dotycząca różnych rodzajów hurtowni danych, w tym m.in
systemy wspomagania decyzji (DSS), systemy informacyjne
kierownictwo (EIS), studia przypadków hurtownia danych i koncepcje daty
magazyn. Również wyniki forum nt hurtownia danych i
grupy spotkań dla ekspertów i profesjonalistów prowadzone przez grupę ds
Badania Monash DSS przyczyniły się do tej fazy badania
który miał na celu uzyskanie informacji o praktyce danych
magazynu oraz zidentyfikować ryzyka związane z ich przyjęciem.
Podczas tego okresu studiów kontekstualnych zrozumienie
obszaru problemowego została ustalona w celu dostarczenia wiedzy nt
podstawę do dalszych badań empirycznych. Jednak to
był procesem ciągłym w trakcie prowadzenia badania
badania.
Część II: Badania empiryczne
Zwłaszcza stosunkowo nowa koncepcja hurtowni danych
w Australii, stworzyła potrzebę przeprowadzenia śledztwa ws
uzyskać szeroki obraz doświadczenia związanego z użytkowaniem. Ten
część została wykonana, gdy domena problemowa została
została ustalona na podstawie obszernego przeglądu literatury. Koncepcja
formatu hurtowni danych podczas fazy badania kontekstowego
wykorzystano jako dane wejściowe do wstępnego kwestionariusza tego badania.
Następnie ankieta została sprawdzona. Jesteście ekspertami od randek
magazyn brał udział w teście. Celem testowania
Wstępny kwestionariusz miał na celu sprawdzenie kompletności i dokładności
kilka pytań. Na podstawie wyników testu, kwestionariusz jest
został zredagowany, a edytowana wersja została wysłana do
uczestników ankiety. Kwestionariusze zwrócone wtedy były
analizowane dla I dać w tabelach, diagramach i innych formatach. TO
wyniki analizy dot dać utwórz migawkę
praktyka hurtowni danych w Australii.
PRZEGLĄD HURTOWNI DANYCH
Koncepcja hurtowni danych ewoluowała wraz z ulepszeniami
technologii komputerowej.
Ma na celu przezwyciężenie problemów napotykanych przez grupy
wsparcie aplikacji, takie jak System Wspomagania Decyzji (DSS) e
System informacji wykonawczej (EIS).
W przeszłości największą przeszkodą dla tych aplikacji było
niezdolność tych aplikacji do zapewnienia Baza danych
niezbędne do analizy.
Wynika to głównie z charakteru pracy
przywództwo. Interesy kierownictwa firmy są różne
stale w zależności od leczonego obszaru. dlatego ja dać
podstawowa dla tych aplikacji musi być w stanie
zmieniać się szybko w zależności od leczonej części.
Oznacza to, że ja dać musi być dostępny w formularzu
adekwatne do wymaganych analiz. W rzeczywistości grupy wsparcia
aplikacje napotykały w przeszłości wiele trudności w zbieraniu wyd
integracja dać ze złożonych i różnorodnych źródeł.
Pozostała część tej sekcji zawiera przegląd koncepcji
hurtownie danych i jak hurtownia danych może przekroczyć
Problemy z grupą wsparcia aplikacji.
Termin "Hurtownia danychzostał wydany przez Williama Inmon w 1990 roku.
Jego często cytowana definicja widzi Hurtownia danych jak
kolekcja dać zorientowane na przedmiot, zintegrowane, nieulotne i zmienne
w miarę upływu czasu, w celu wsparcia decyzji zarządczych.
Korzystając z tej definicji, Inmon wskazuje, że i dać mieszkańców
w hurtownia danych musi posiadać następujące 4
cechy:
▪ Zorientowany na temat
▪ Zintegrowany
▪ Nielotny
▪ Zmienna w czasie
Przez podmiot zorientowany Inmon oznacza, że ​​ja dać w terminie
magazyn w największych dotychczas obszarach organizacyjnych
zdefiniowane w modelu dać. Na przykład wszystkie dać dotyczące i klienci
mieszczą się w obszarze tematycznym KLIENCI. Podobnie wszystkie
dać odnoszące się do produktów są zawarte w obszarze tematycznym
PRODUKTY.
Przez Integrated Inmon oznacza, że ​​i dać pochodzących z różnych
platformy, systemy i lokalizacje są łączone i przechowywane
jedyne miejsce. Konsekwentnie dać podobny musi zostać przekształcony
w spójnych formatach do dodawania i porównywania
łatwo.
Na przykład reprezentowana jest płeć męska i żeńska
literami M i F w jednym systemie, a 1 i 0 w innym. Dla
zintegrować je we właściwy sposób, jeden lub oba formaty muszą
przekształcić tak, aby oba formaty były takie same. W tym
przypadku możemy zmienić M na 1 i F na 0 lub odwrotnie. Orientuj się
temat i zintegrowany wskazują, że hurtownia danych jest przeznaczony dla
zapewnić funkcjonalną i przekrojową wizję dać daje część
spółka.
Przez nieulotne rozumie on, że ja dać w hurtownia danych pozostawać
spójne i aktualizowane dać to nie jest konieczne. Zamiast tego każdy
przebrać się dać dodawane są oryginały baza danych daty
magazyn. Oznacza to, że historyk tzw dać jest zawarty w
hurtownia danych.
Dla zmiennych z czasem Inmon wskazuje, że i dać w hurtownia danych
zawsze zawierają wskaźniki tempa ei dać normalmente
obejmować określony horyzont czasowy. na przykład
hurtownia danych może zawierać 5 lat historycznych wartości klienci dal
1993 do 1997. Dostępność historii i szeregów czasowych
z dać pozwala analizować trendy.
Un hurtownia danych może sam zbierać dać z systemów
OLTP;z początków dać poza organizacją i/lub przez inne oferty specjalne
projekty systemów przechwytywania dać.
I dać ekstrakty mogą przejść proces czyszczenia, w
ten przypadek I dać są przekształcane i integrowane przed byciem
przechowywane w baza danych del hurtownia danych. Potem ja dać
przebywający w obrębie baza danych del hurtownia danych są udostępniane
narzędzia dostępu i odzyskiwania dla użytkowników końcowych. Za pomocą
Dzięki tym narzędziom użytkownik końcowy może uzyskać dostęp do zintegrowanego widoku
organizacji o dać.
I dać przebywający w obrębie baza danych del hurtownia danych
przechowywane zarówno w formatach szczegółowych, jak i podsumowujących.
Poziom podsumowania może zależeć od charakteru dać. dać
szczegółowe mogą składać się z dać obecny i dać historycy
I dać rzeczywiste nie są uwzględnione w hurtownia danych dopóki ja dać
w hurtownia danych są ponownie aktualizowane.
Oprócz przechowywania ww dać siebie, A hurtownia danych może być
przechowywać inny rodzaj data o nazwie METADANE, które
opisz I dać mieszka w jego baza danych.
Istnieją dwa rodzaje metadanych: metadane programistyczne i według metadanych
ćwiczenie.
Metadane programistyczne służą do zarządzania i automatyzacji
procesy ekstrakcji, oczyszczania, mapowania i załadunku dać w
hurtownia danych.
Informacje zawarte w metadanych rozwojowych mogą zawierać
szczegóły dotyczące systemów operacyjnych, szczegóły elementów do wyodrębnienia,
model dać del hurtownia danych oraz regulamin firmy dot
konwersja dei dać.
Drugi rodzaj metadanych, znany jako metadane analityczne
umożliwia użytkownikowi końcowemu zapoznanie się z zawartością danych
magazyn, aby znaleźć dać dostępne i ich znaczenie w terminach
jasne i nietechniczne.
Dlatego metadane analizy działają jako pomost między danymi
aplikacje magazynowe i dla użytkowników końcowych. Te metadane mogą
zawierać model biznesowy, opisy dać korespondentów
do modelu biznesowego, predefiniowanych zapytań i raportów,
informacje dotyczące logowania użytkowników i indeksu.
Metadane analizy i rozwoju muszą być połączone w jedno
zintegrowane przechowywanie metadanych do prawidłowego działania.
Niestety wiele z istniejących narzędzi ma swoje własne
metadanych i obecnie nie istnieją żadne standardy, które by to umożliwiały
pozwalają narzędziom do hurtowni danych na ich integrację
metadane. Aby zaradzić tej sytuacji wielu handlowców
główne narzędzia do hurtowni danych utworzyły metadane
Council, która później przekształciła się w Koalicję Meta Data.
Celem tej koalicji jest zbudowanie zestawu metadanych
standard, który umożliwia różnym narzędziom do przechowywania danych
konwertować metadane
Ich wysiłki zaowocowały narodzinami Meta
Specyfikacja wymiany danych (MDIS), która umożliwi wymianę
informacji między archiwami firmy Microsoft a powiązanymi plikami MDIS.
Istnienie dać zarówno podsumowane/zindeksowane, jak i szczegółowe
użytkownikowi możliwość wykonania DRILL DROWN
(wiercenie) chodź dać indeksowane do szczegółowych i odwrotnie.
Istnienie dać szczegółowa historia pozwala na realizację
analiza trendów w czasie. Ponadto metadane analizy mogą
być używany jako katalog del baza danych del hurtownia danych dla
pomóc użytkownikom końcowym zlokalizować i dać niezbędny.
W porównaniu do systemów OLTP, z ich możliwością obsługi
Analiza dać i sprawozdawczości, tzw hurtownia danych jest postrzegany jako system
bardziej odpowiedni dla procesów informacyjnych, takich jak przeprowadzanie i
odpowiadać na zapytania i tworzyć raporty. Następna sekcja
szczegółowo podkreśli różnice między tymi dwoma systemami.
MAGAZYN DANYCH PRZECIWKO SYSTEMOM OLTP
Wiele systemów informatycznych w organizacjach
mają one na celu wspieranie codziennych operacji. Te
systemy znane jako SYSTEMY OLTP, przechwytują transakcje
codziennie aktualizowane na bieżąco.
I dać w ramach tych systemów są często zmieniane, dodawane lub
usunięte. Na przykład adres klienta prawie się nie zmienia
przemieszcza się z miejsca na miejsce. W tym przypadku nowy adres
zostanie zarejestrowany poprzez zmianę pola adresowego baza danych.
Głównym celem tych systemów jest obniżenie kosztów
transakcji i jednocześnie skrócić czas przetwarzania.
Przykłady systemów OLTP obejmują krytyczne akcje, takie jak zapisy
księgowość zamówień, listy płac, faktury, produkcja, usługi ai klienci.
W przeciwieństwie do systemów OLTP, które zostały utworzone przez proces
oparte na transakcjach i zdarzeniach, tj hurtownia danych zostały stworzone
zapewnienie wsparcia procesowego w oparciu o analizę dać oraz
procesy decyzyjne.
Zwykle osiąga się to poprzez integrację i dać z różnych systemów
OLTP i zewnętrzne w jednym „kontenerze”. dać,jak ustalono
w poprzedniej sekcji.
Model procesu hurtowni danych Monash
Model procesu dla hurtownia danych Monash został opracowany przez
naukowców z Monash DSS Research Group, opiera się na
literatury nt hurtownia danych, na temat doświadczenia w obsłudze allo
rozwój obszarów systemów, na rozmowach z dostawcami
aplikacje do użytku na hurtownia danychna grupie ekspertów
w użyciu hurtownia danych.
Fazy ​​to: inicjacja, planowanie, rozwój, operacje i
Wyjaśnienia. Diagram wyjaśnia iteracyjny charakter o
ewolucyjny rozwój a hurtownia danych proces za pomocą
dwukierunkowe strzałki umieszczone między różnymi fazami. W tym
Kontekst „iteracyjny” i „ewolucyjny” oznacza to w każdym przypadku
etapem procesu mogą być działania wdrożeniowe
zawsze propaguj wstecz do poprzedniego etapu. To jest
ze względu na charakter projektu a hurtownia danych w którym
dodatkowe żądania są składane w dowolnym momencie
użytkownika końcowego. Na przykład w fazie rozwoju a
proces hurtownia danych, jeden jest wymagany przez użytkownika końcowego
nowy wymiar lub obszar tematyczny, który nie był częścią
oryginalny plan, należy go dodać do systemu. Ten
powoduje zmiany w projekcie. W rezultacie zespół ds
projekt musi zmienić wymagania tworzonych do tej pory dokumentów
w fazie projektowania. W wielu przypadkach obecny stan
projekt musi przejść całą drogę wstecz do etapu projektowania, gdzie
nowy wniosek musi zostać dodany i udokumentowany. Użytkownik
wersja ostateczna musi mieć możliwość zobaczenia określonej zmienionej dokumentacji, np
zmiany wprowadzone w fazie rozwoju. Na końcu
w tym cyklu rozwojowym projekt musi uzyskać świetne opinie
oba zespoły, zespół programistów i zespół użytkowników. TO
opinie są następnie ponownie wykorzystywane do ulepszenia przyszłego projektu.
Planowanie wydajności
DW są zwykle bardzo duże i rosną
bardzo szybko (Best 1995, Rudin 1997a) po
ilość dać historyczne, które zachowują od czasu ich trwania. Tam
wzrost może być również spowodowany przez dać dodatkowe wymagane przez
użytkowników w celu zwiększenia wartości dać że już mają. Z
w związku z tym wymagania dotyczące przechowywania dać możliwe
być znacząco wzmocnione (Eckerson 1997). Tak jest
niezbędne do zapewnienia, poprzez przeprowadzenie planowania
pojemność, aby system, który ma zostać zbudowany, mógł rosnąć wraz z
rosnące potrzeby (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
Planując skalowalność dw, należy znać tzw
oczekiwany wzrost wielkości magazynu, rodzaje pytań
które prawdopodobnie zostaną wykonane, oraz liczbę obsługiwanych użytkowników końcowych (Best
1995, Rudin 1997b, Foley 1997a). Twórz skalowalne aplikacje
wymaga połączenia technicznych i skalowalnych technologii serwerowych
skalowalnego projektu aplikacji (Best 1995, Rudin 1997b.
Oba są wymagane do budowania aplikacji
niezwykle skalowalny. Skalowalne technologie serwerowe mogą
sprawiają, że dodawanie pamięci masowej, pamięci i
CPU bez obniżania wydajności (Lang 1997, Telephony 1997).
Istnieją dwie podstawowe technologie skalowalnych serwerów: Compute
symetryczne multipleksowanie (SMP) i przetwarzanie masowe
równoległy (MPP)) (IDC 1997, Humphries i wsp. 1999). Serwer
SMP zwykle ma wiele procesorów współdzielących pamięć,
system magistrali i inne zasoby (IDC 1997, Humphries i in. 1999).
W celu zwiększenia można dodać dodatkowe procesory
jego potenza obliczeniowy. Inny sposób na zwiększenie
potenza obliczeniowa serwera SMP, polega na łączeniu wielu
maszyny SMP. Ta technika jest znana jako grupowanie (Humphries
i in. 1999). Z drugiej strony serwer MPP ma wiele procesorów
z własną pamięcią, systemem magistrali i innymi zasobami (IDC 1997,
Humphries i in. 1999). Każdy procesor nazywany jest węzłem. A
wzrost w potenza można uzyskać obliczeniową
dodawanie dodatkowych węzłów do serwerów MPP (Humphries et al.
1999).
Słabością serwerów SMP jest zbyt duża liczba operacji wejścia-wyjścia
(I/O) może przeciążyć system magistrali (IDC 1997). Ten
problem nie występuje na serwerach MPP, ponieważ każdy
procesor ma własny system magistrali. Jednak połączenia
między każdym węzłem są na ogół znacznie wolniejsze niż system magistrali
SMP. Ponadto serwery MPP mogą dodawać warstwę
dodatkową złożoność dla twórców aplikacji (IDC
1997). W ten sposób można wpłynąć na wybór między serwerami SMP i MPP
przez wiele czynników, w tym złożoność pytań, stosunek
cena/wydajność, wymagane moce przerobowe,
uniemożliwił aplikacje dw i wzrost rozmiaru baza danych
dw oraz w liczbie użytkowników końcowych.
Liczne skalowalne techniki projektowania aplikacji
można wykorzystać w planowaniu pojemności. Jeden
stosuje różne okresy sprawozdawcze, takie jak dni, tygodnie, miesiące i lata.
Mając różne okresy powiadomień, baza danych Można podzielić na
kawałki łatwo pogrupowane (Inmon i in. 1997). Inny
techniką jest użycie skonstruowanych tabel podsumowań
Podsumowując dać da dać szczegółowe. w ten sposób, ja dać podsumowań jest więcej
zwarty niż szczegółowy, co wymaga mniej miejsca w pamięci.
Więc dać szczegółów można zarchiwizować w jednostce
tańsze przechowywanie, co pozwala zaoszczędzić jeszcze więcej depozytu.
Chociaż korzystanie z tabel podsumowań może zaoszczędzić miejsce
pamięci, wymagają wiele wysiłku, aby były aktualne i aktualne
zgodnie z potrzebami komercyjnymi. Jednak ta technika jest
szeroko stosowane i często używane w połączeniu z techniką
poprzedni (Najlepszy 1995, Inmon 1996a, Chauduri i Dayal
1997).
Definiowanie Hurtownia danych Techniczny
Architektury Definicja technik
architektury dw
Pierwotni użytkownicy hurtowni danych byli głównie pomysłami
scentralizowana implementacja dw, w której wszystkie dać, włącznie z
i dać zewnętrzne, zostały zintegrowane w jedną,
repozytorium fizyczne (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Główną korzyścią tego podejścia są użytkownicy końcowi
mają dostęp do widoku skali przedsiębiorstwa
(widok całego przedsiębiorstwa) dei dać organizacyjny (Ovum 1998). Inny
zaletą jest to, że oferuje standaryzację dać przez
organizacji, co oznacza, że ​​istnieje tylko jedna wersja lub
definicja dla każdej terminologii używanej w repozytorium dw
(repozytorium) metadanych (Flanagan i Safdie 1997, Ovum 1998). The
Z drugiej strony wadą tego podejścia jest to, że jest drogie i trudne
do zbudowania (Flanagan i Safdie 1997, Ovum 1998, Inmon i in.
1998). Niedługo po architekturze pamięci masowej dać
scentralizowany stał się popularny, koncepcja ekstrakcji ewoluowała
najmniejszych podzbiorów dać wspierać potrzeby
specyficzne zastosowania (Varney 1996, IDC 1997, Berson i Smith
1997, paw 1998). Te małe systemy wywodzą się z większych
wielki hurtownia danych scentralizowane. Nazywają się data
zależne magazyny działowe lub zależne hurtownie danych.
Zależna architektura hurtowni danych jest znana jako
architekturę trójwarstwową, w której pierwsza warstwa składa się z danych
scentralizowany magazyn, drugi składa się z magazynów dać
departamentalny, a trzeci polega na dostępie do dać i z narzędzi
analiza (Demarest 1994, Inmon i in. 1997).
Bazy danych są zwykle budowane po hurtownia danych
scentralizowany został zbudowany w celu zaspokojenia potrzeb
określone jednostki (White 1995, Varney 1996).
Sklep hurtowni danych i dać bardzo istotne w odniesieniu do szczegółów
jedność (Inmon i in. 1997, Inmon i in. 1998, IA 1998).
Zaletą tej metody jest to, że nie będzie data nie
zintegrowane i że ja dać będą mniej zbędne w danych
marts od wszystkich dać pochodzić z depozytu dać zintegrowane.
Kolejną zaletą jest to, że będzie mniej powiązań między nimi
hurtownia danych i powiązane źródła dać ponieważ każda hurtownia danych ma tylko
źródło dać. Plus przy tej architekturze, użytkownicy
użytkownicy nadal mają dostęp do przeglądu dać
organizacje korporacyjne. Ta metoda jest znana jako
metoda top-down, w której hurtownie danych są budowane po danych
magazyn (paw 1998, Goff 1998).
Zwiększenie potrzeby wczesnego wyświetlania wyników, niektóre
organizacje zaczęły budować niezależne hurtownie danych
(Flanagan i Safdie 1997, Biały 2000). W tym przypadku hurtownie danych
biorą swoje dać prosto od podstaw dać OLTP, a nie od tego czasu
scentralizowane i zintegrowane przechowywanie, eliminując w ten sposób potrzebę
posiadać centralne repozytorium.
Każda hurtownia danych wymaga co najmniej jednego łącza do swoich źródeł
di dać. Jedna wada posiadania wielu linków dla każdej daty
mart polega na tym, że w porównaniu z poprzednimi dwiema architekturami, the
nadmiar dać znacznie wzrasta.
Każda hurtownia danych musi przechowywać wszystkie dać wymagane lokalnie dla
nie mają wpływu na systemy OLTP. To powoduje, że ja dać
są one przechowywane w różnych hurtowniach danych (Inmon i in. 1997).
Inną wadą tej architektury jest to, że prowadzi do
tworzenie złożonych połączeń między hurtowniami danych a ich bazami danych
źródła dać które są trudne do przeprowadzenia i opanowania (Inmon ed
inni. 1997).
Inną wadą jest to, że użytkownicy końcowi mogą nie zasilać
uzyskać dostęp do przeglądu informacji o firmie, ponieważ i dać
różnych baz danych nie są zintegrowane (Ovum 1998).
Jeszcze inną wadą jest to, że może ich być więcej niż jeden
definicje dla każdej terminologii używanej w generowanych przez nią bazach danych
niespójności dać w organizacji (Ovum 1998).
Pomimo wad omówionych powyżej, niezależne hurtownie danych
wciąż budzą zainteresowanie wielu organizacji (IDC 1997).
Jednym z czynników, który czyni je atrakcyjnymi, jest to, że szybciej się rozwijają
i wymagają mniej czasu i zasobów (Bresnahan 1996, Berson e
Smith 1997, jajo 1998). W związku z tym służą głównie
jako projekty testów, które można wykorzystać do identyfikacji
szybko korzyści i/lub niedoskonałości w projekcie (Parsaye
1995, Braly 1995, Newing 1996). W tym przypadku część z
wdrożenie w projekcie pilotażowym musi być niewielkie, ale ważne
dla organizacji (Newing 1996, Mansell-Lewis 1996).
Badając prototyp, użytkownicy końcowi i administracja mogą
zdecydować, czy kontynuować, czy przerwać projekt (Flanagan i Safdie
1997).
Jeśli decyzja ma być kontynuowana, hurtownie danych dla innych branż
powinny być budowane pojedynczo. Istnieją dwie opcje dot
użytkowników końcowych w oparciu o ich potrzeby w zakresie tworzenia danych
niezależne macierze: zintegrowane/sfederowane i niezintegrowane (Ovum
1998)
W pierwszej metodzie należy zbudować każdą nową hurtownię danych
w oparciu o aktualne hurtownie danych i model dać używany
przez firmę (Varney 1996, Berson i Smith 1997, Peacock 1998).
Konieczność korzystania z modelu dać firmy sprawia, że ​​jest to konieczne
upewnij się, że istnieje tylko jedna definicja dla każdej terminologii
wykorzystywane przez hurtownie danych, ma to również na celu zapewnienie, że dane
różne markety można łączyć, aby uzyskać przegląd
informacje korporacyjne (Bresnahan 1996). Ta metoda jest
nazywany oddolnym i jest najlepszy, gdy istnieje ograniczenie
czasu i środków finansowych (Flanagan i Safdie 1997, Ovum 1998,
paw 1998, Goff 1998). W drugiej metodzie hurtownie danych
zbudowany może zaspokoić tylko potrzeby określonej jednostki.
Wariantem federacyjnej hurtowni danych jest hurtownia danych Rozpowszechniane
w którym baza danych oprogramowanie pośredniczące serwera centralnego służy do łączenia wielu
hurtownie danych w jednym repozytorium dać rozproszone (biały 1995). W
ta sprawa, tj dać firmy są rozproszone w kilku bazach danych.
Żądania użytkowników końcowych są przekazywane do baza danych
oprogramowanie pośredniczące serwera centralnego, które wyodrębnia wszystkie dać żądane przez dane
marts i przesyłaj wyniki z powrotem do aplikacji użytkowników końcowych. Ten
dostarcza informacji biznesowych użytkownikom końcowym. Jednakże,
problemy z bazami danych wciąż nie zostały wyeliminowane
niezależny. Istnieje inna architektura, której można użyć
Zadzwoń do hurtownia danych wirtualny (biały 1995). Jednak to
architektura opisana na rysunku 2.9 nie jest architekturą
przechowywania dać rzeczywisty, ponieważ nie przesuwa ładunku
z systemów OLTP do hurtownia danych (Demarest 1994).
Właściwie prośby o dać przez użytkowników końcowych pominęli ai
Systemy OLTP, które zwracają wyniki po przetworzeniu wiadomości e-mail
żądania użytkowników. Chociaż ta architektura pozwala użytkownikom
final do generowania raportów i formułowania wniosków, nie może zapewnić
dać historia i przegląd informacji o firmie od i dać
ponieważ różne systemy OLTP nie są zintegrowane. Więc to
architektura nie może sprostać analizie dać złożone np
przykładowe prognozy.
Wybór aplikacji dostępowej i
odzyskanie dać
Celem budowy A hurtownia danych jest przekazać
informacji dla użytkowników końcowych (Inmon i in. 1997, Poe 1996,
McFadden 1996, Shanks i wsp. 1997, Hammergren 1998); jeden lub
wiele aplikacji dostępu i odzyskiwania dać musi być zapewnione. Do
obecnie istnieje wiele różnych tych aplikacji, wśród których użytkownik może
wybrać (Hammergren 1998, Humphries i in. 1999). The
wybrane aplikacje decydują o powodzeniu wysiłku
przechowywania dać w organizacji, ponieważ
aplikacje są najbardziej widoczną częścią hurtownia danych do użytkownika
końcowy (Inmon i in. 1997, Poe 1996). Aby odnieść sukces na randce
magazyn, musi być w stanie wspierać działania związane z analizą danych dać
użytkownika końcowego (Poe 1996, Seddon i Benjamin 1998, Eckerson
1999). Tak więc „poziom” tego, czego chce użytkownik końcowy, musi być
zidentyfikowane (Poe 1996, Mattison 1996, Inmon i in. 1997,
Humphries i wsp. 1999).
Ogólnie użytkowników końcowych można podzielić na trzy grupy
kategorie: użytkownicy wykonawczy, analitycy biznesowi i użytkownicy zaawansowani (Poe
1996, Humphries i wsp. 1999). Użytkownicy wykonawczy muszą
łatwy dostęp do predefiniowanych zestawów raportów (Humphries red
inni 1999). Raporty te można łatwo uzyskać za pomocą
nawigacja po menu (Poe 1996). Ponadto raporty powinny
prezentować informacje za pomocą reprezentacji graficznej
takie jak tabele i szablony, aby szybko dostarczyć
informacji (Humphries i in. 1999). Analitycy biznesowi, którzy tego nie robią
mogą mieć możliwości techniczne do budowania relacji
zero samodzielnie, muszą mieć możliwość zmiany raportów bieżących dla
zaspokajać ich specyficzne potrzeby (Poe 1996, Humphries i in
1999). Z drugiej strony użytkownicy zaawansowani to użytkownicy końcowi, którzy
mieć możliwość generowania i pisania żądań i raportów z
zero (Poe 1996, Humphries i in. 1999). Oni są tymi, którzy
opracowywać raporty dla innych typów użytkowników (Poe 1996, Humphries
i wsp. 1999).
Po określeniu wymagań użytkownika końcowego należy to zrobić
wybór aplikacji dostępu i odzyskiwania dać wśród wszystkich
te dostępne (Poe 1996, Inmon i in. 1997).
Dostęp do dać i narzędzia wyszukiwania mogą być
podzielone na 4 typy: narzędzie OLAP, narzędzie EIS/DSS, narzędzie do zapytań i
narzędzia do raportowania i eksploracji danych.
Narzędzia OLAP umożliwiają użytkownikom tworzenie zapytań ad hoc
te wykonane na baza danych del hurtownia danych. Do tego te produkty
umożliwić użytkownikom drążenie w dół dać ogólne do tych
szczegółowe.
Narzędzia EIS/DSS zapewniają raportowanie wykonawcze, takie jak analiza „co by było, gdyby”.
oraz dostęp do raportów uporządkowanych według menu. Raporty muszą być
predefiniowane i połączone z menu dla łatwiejszej nawigacji.
Narzędzia do tworzenia zapytań i raportowania umożliwiają użytkownikom tworzenie raportów
predefiniowany i konkretny.
Narzędzia eksploracji danych służą do identyfikowania relacji, które
może rzucić nowe światło na operacje zapomniane w dać del
hurtownia danych.
Oprócz optymalizacji wymagań każdego typu użytkownika, tj
wybrane narzędzia muszą być intuicyjne, wydajne i łatwe w obsłudze.
Muszą być również kompatybilne z innymi częściami architektury, np
możliwość pracy z istniejącymi systemami. Sugeruje się również
wybierz narzędzia do dostępu i wyszukiwania danych wraz z cenami i wydajnością
rozsądny. Inne kryteria, które należy wziąć pod uwagę, obejmują zaangażowanie
dostawcą narzędzia we wspieraniu ich produktu i związanych z nim zmian
będzie miał w przyszłych wydaniach. Aby zapewnić zaangażowanie użytkowników
przy korzystaniu z hurtowni danych w skład zespołu programistycznego wchodzą m.in
użytkowników w procesie doboru narzędzi. W tym przypadku
należy przeprowadzić praktyczną ocenę użytkownika.
Aby poprawić wartość hurtowni danych, zespół programistów może
zapewniają również dostęp internetowy do swoich hurtowni danych. A
hurtownia danych z obsługą sieci umożliwia użytkownikom dostęp do dać
z odległych miejsc lub podczas podróży. Również informacje mogą
być świadczone po niższych kosztach poprzez zmniejszanie kosztów
di szkolenia.
2.4.3 Hurtownia danych Faza operacyjna
Ta faza składa się z trzech działań: określenie strategii randkowych
odświeżanie, kontrola działań hurtowni danych i zarządzanie nimi
bezpieczeństwo hurtowni danych.
Definicja strategii odświeżania danych
Po wstępnym załadowaniu, tj dać w baza danych hurtowni danych
musi być okresowo odświeżany, aby móc grać i
zmiany wprowadzone dn dać oryginały. Więc musimy zdecydować
kiedy odświeżać, jak często należy
odświeżyć i jak odświeżyć dać. Sugeruje się wykonanie tzw
odświeżenie ww dać kiedy system może zostać przełączony w tryb offline. Tam
częstotliwość odświeżania jest określana przez zespół programistów
na wymagania użytkownika. Istnieją dwa podejścia do odświeżania
hurtownia danych: pełne odświeżanie i ciągłe ładowanie
zmiany.
Pierwsze podejście, pełne odświeżenie, wymaga przeładowania
wszystko dać od zera. Oznacza to, że wszystkie dać wymagana musi
zostać wyodrębnione, oczyszczone, przekształcone i zintegrowane z każdym odświeżeniem. Ten
należy w miarę możliwości unikać takiego podejścia, ponieważ
zajmuje dużo czasu i środków.
Alternatywnym podejściem jest ciągłe ładowanie i
zmiany. To dodaje I dać które zostały zmienione
od ostatniego cyklu odświeżania hurtowni danych. Identyfikacja
nowe lub zmienione rekordy znacznie zmniejszają ilość
dać które muszą być propagowane do hurtowni danych w każdym z nich
aktualizacja, ponieważ tylko te dać zostanie dodany do baza danych
hurtowni danych.
Istnieje co najmniej 5 podejść, które można wykorzystać do wycofania się
i dać nowe lub zmodyfikowane. Aby uzyskać skuteczną strategię
odświeżenie ww dać przydatne może być połączenie tych podejść
pobiera wszystkie zmiany w systemie.
Pierwsze podejście, które wykorzystuje sygnatury czasowe, zakłada, że ​​nadejdzie
przypisany wszystkim dać zmodyfikował i zaktualizował znacznik czasu w pewien sposób
aby móc łatwo zidentyfikować wszystkie dać zmodyfikowane i nowe.
To podejście nie było jednak powszechnie stosowane w większości
częścią dzisiejszych systemów operacyjnych.
Drugie podejście polega na użyciu pliku delta wygenerowanego przez
aplikacja zawierająca tylko zmiany wprowadzone w pliku dać.
Korzystanie z tego pliku również wzmacnia cykl aktualizacji.
Jednak nawet ta metoda nie była stosowana w wielu
Aplikacje.
Trzecie podejście polega na przeskanowaniu pliku dziennika, który
zasadniczo zawiera informacje podobne do pliku delta. Jedyny
różnica polega na tym, że dla procesu odzyskiwania tworzony jest plik dziennika, np
może to być trudne do zrozumienia.
Czwartym podejściem jest modyfikacja kodu aplikacji.
Jednak większość kodu aplikacji jest stara i
kruchy; dlatego należy unikać tej techniki.
Ostatnim podejściem jest porównanie i dać źródła z plikiem
główni bogowie dać.
Monitorowanie działań hurtowni danych
Gdy hurtownia danych zostanie udostępniona użytkownikom, tak jest
muszą być monitorowane w czasie. W tym przypadku administrator
hurtowni danych może wykorzystywać jedno lub więcej narzędzi zarządzania, np
kontrola w celu monitorowania wykorzystania hurtowni danych. W szczególności
mogą być gromadzone informacje o ludziach i pogodzie
którym uzyskują dostęp do hurtowni danych. Pospiesz się dać zebrane mogą być tworzone
profil wykonywanej pracy, który może być wykorzystany jako dane wejściowe
w implementacji obciążenia zwrotnego użytkownika. Obciążenie zwrotne
umożliwia informowanie użytkowników o kosztach przetwarzania
hurtownia danych.
Można również użyć kontroli hurtowni danych
identyfikować rodzaje zapytań, ich rozmiar, liczbę zapytań przypadających na
dzień, czasy reakcji na zapytanie, sektory, do których dotarły oraz ilość
di dać obrobiony. Innym celem sprawdzania
hurtownia danych to identyfikacja i dać które nie są używane. Te dać
można je usunąć z hurtowni danych, aby skrócić czas
odpowiedzi na wykonanie zapytania i kontrolować wzrost
dać które znajdują się w Baza danych hurtowni danych.
Zarządzanie bezpieczeństwem hurtowni danych
Hurtownia danych zawiera dać zintegrowane, krytyczne, wrażliwe
można łatwo dojechać. Z tego powodu powinien
być chronione przed nieautoryzowanymi użytkownikami. Droga do
wdrożenie zabezpieczeń polega na użyciu funkcji del DBMS
przypisać różne uprawnienia różnym typom użytkowników. W tym
sposób, dla każdego typu użytkownika musi być utrzymywany profil
dostęp. Innym sposobem zabezpieczenia hurtowni danych jest jej zaszyfrowanie
tak jak jest napisane Baza danych hurtowni danych. Dostęp do
dać a narzędzia do odzyskiwania muszą odszyfrować dać przed złożeniem I
wyniki użytkownikom.
2.4.4 Hurtownia danych Faza wdrażania
Jest to ostatni etap cyklu wdrożenia hurtowni danych. The
działania, które należy przeprowadzić w tej fazie, obejmują szkolenie
użytkownikom do korzystania z hurtowni danych i tworzenia recenzji
hurtowni danych.
Trening użytkownika
Najpierw należy przeprowadzić szkolenie użytkowników
dostępu do dać hurtowni danych i wykorzystania narzędzi
wyszukiwanie. Generalnie sesje powinny zaczynać się od
wprowadzenie do koncepcji przechowywania daćal
zawartość hurtowni danych, ai meta dać i podstawowe funkcje
narzędzi. Następnie bardziej zaawansowani użytkownicy mogą również studiować
fizyczne tabele i funkcje dostępu do danych użytkownika oraz narzędzia
wyszukiwanie.
Istnieje wiele podejść do szkolenia użytkowników. Jeden z
zapewnia to wybór wielu użytkowników lub analityków wybranych przez a
zestaw użytkowników, opierając się na ich przywództwie i umiejętnościach
Komunikacja. Są szkoleni w charakterze osobistym na
wszystko, co muszą wiedzieć, aby zapoznać się z
system. Po zakończeniu szkolenia wracają do pracy, np
zaczynają uczyć innych użytkowników obsługi systemu. Na
na podstawie tego, czego się nauczyli, inni użytkownicy mogą rozpocząć reklamę
eksplorować hurtownię danych.
Innym podejściem jest przeszkolenie wielu użytkowników w tym samym zakresie
czas, jakbyś prowadził kurs w klasie. Ta metoda
jest odpowiedni, gdy istnieje wielu użytkowników, których należy przeszkolić
w tym samym czasie. Jeszcze inną metodą jest trenowanie
każdego użytkownika indywidualnie, jeden po drugim. Ta metoda jest
odpowiednie, gdy jest niewielu użytkowników.
Celem szkolenia użytkowników jest ich zapoznanie
z dostępem do dać oraz narzędzia do wyszukiwania, jak również zawartość pliku
hurtownia danych. Jednak niektórzy użytkownicy mogą być przytłoczeni
od ilości informacji przekazywanych podczas sesji
szkolenie. Należy więc wykonać szereg czynności
aktualizacje sesji bieżącej pomocy i reagowania
na konkretne pytania. W niektórych przypadkach grupa
użytkowników do świadczenia tego rodzaju wsparcia.
Zbieranie opinii
Po wdrożeniu hurtowni danych użytkownicy mogą
użyj ja dać przebywających w hurtowni danych w różnych celach.
Najczęściej analitycy lub użytkownicy używają i dać w
hurtownia danych dla:
1 Zidentyfikuj trendy firmy
2 Przeanalizuj profile zakupowe klienci
3 Podział I klienci i
4 Zapewnij najlepsze usługi dla klienci – dostosować usługi
5 Formułuj strategie marketing
6 Przygotuj konkurencyjne oferty na analizy kosztów i pomoc
kontrola
7 Wspieraj podejmowanie strategicznych decyzji
8 Zidentyfikuj pojawiające się możliwości
9 Popraw jakość bieżących procesów biznesowych
10 Sprawdź zysk
Idąc za kierunkiem rozwoju hurtowni danych, mogli
przeprowadzić serię przeglądów systemu w celu uzyskania informacji zwrotnej
zarówno od zespołu programistów, jak i od społeczności użytkowników
użytkownicy końcowi.
Otrzymane wyniki mogą być brane pod uwagę dla tzw
kolejny cykl rozwojowy.
Ponieważ hurtownia danych ma podejście przyrostowe,
ważne jest, aby uczyć się na sukcesach i błędach poprzednich
rozwój wydarzeń.
2.5 Podsumowanie
W tym rozdziale omówiono podejścia obecne w
literatura. W części 1 omówiono koncepcję
hurtownia danych i jej rola w naukach decyzyjnych. w
w sekcji 2 opisano główne różnice między nimi
hurtownie danych i systemy OLTP. W części 3 omówiliśmy
wykorzystano model hurtowni danych według Monash
w sekcji 4, aby opisać czynności związane z procesem
opracowanie hurtowni danych, na których tezy te nie były oparte
rygorystyczne badania. To, co dzieje się w rzeczywistości, może być
bardzo różni się od tego, co podaje literatura, jednak te
wyniki mogą być wykorzystane do stworzenia podstawowego bagażu, który
podkreślasz koncepcję hurtowni danych dla tych badań.
Rozdział 3
Metody badawcze i projektowe
Ten rozdział dotyczy metod badawczych i projektowych dla
to badanie. Pierwsza część przedstawia ogólny widok metod
dodatkowo dostępne wyszukiwarki do wyszukiwania informacji
omówiono kryteria wyboru najlepszej dla nich metody
konkretne badanie. W części 2 omówiono następnie dwie metody
wybrane zgodnie z właśnie określonymi kryteriami; z nich zostanie wybrany red
przyjęli jeden z powodów określonych w sekcji 3, jeżeli są
wyjaśniono również przyczyny wykluczenia drugiego kryterium. Tam
w części 4 przedstawiono projekt badawczy, a w części 5 le
wnioski.
3.1 Badania systemów informatycznych
Badania nad systemami informatycznymi nie są po prostu ograniczone
do sfery technologicznej, ale musi być również rozszerzony na włączenie
cele behawioralne i organizacyjne.
Zawdzięczamy to tezom różnych dyscyplin począwszy od
nauki społeczne do nauk przyrodniczych; prowadzi to do potrzeby a
pewne spektrum metod badawczych z udziałem metod ilościowych
i jakościowe do wykorzystania w systemach informacyjnych.
Wszystkie dostępne metody badawcze są ważne, a właściwie kilka
badacze tacy jak Jenkins (1985), Nunamaker i in. (1991) i Galliers
(1992) twierdzą, że nie ma uniwersalnej specyficznej metody
prowadzenie badań w różnych dziedzinach systemów informatycznych; Rzeczywiście
metoda może być odpowiednia dla konkretnego badania, ale nie
dla innych. Prowadzi to do konieczności wybrania metody, która
jest odpowiedni dla naszego konkretnego projektu badawczego: dla tego
wybór Benbasat i in. (1987) stwierdzają, że należy je rozważyć
charakter i cel badań.
3.1.1 Charakter badań
Różne metody mogą być oparte na charakterze badań
podzielić na trzy tradycje powszechnie znane w nauce
informacji: badania pozytywistyczne, interpretacyjne i krytyczne.
3.1.1.1 Badania pozytywistyczne
Badania pozytywistyczne są również znane jako badania naukowe lub
empiryczny. Ma na celu: „wyjaśnić i przewidzieć, co wydarzy się w
świata społecznego, przyglądając się prawidłowościom i związkom przyczynowo-skutkowym
wśród elementów, które ją tworzą” (Shanks i in. 1993).
Badania pozytywistyczne charakteryzują się także powtarzalnością,
uproszczenia i obalenia. Ponadto badania pozytywistyczne przyznają
istnienie związków a priori między badanymi zjawiskami.
Według Galliersa (1992) taksonomia jest metodą badawczą
mieści się w paradygmacie pozytywistycznym, który jednak nie ogranicza się do tego,
w rzeczywistości istnieją eksperymenty laboratoryjne, eksperymenty polowe,
studia przypadków, dowodzenie twierdzeń, przewidywania i symulacje.
Za pomocą tych metod naukowcy przyznają, że zjawiska
badane mogą być obserwowane obiektywnie i rygorystycznie.
3.1.1.2 Badania interpretacyjne
Badania interpretacyjne, które często nazywane są fenomenologią lub
antypozytywizm jest opisany przez Neumana (1994) jako „analiza
systematykę społecznego znaczenia działania poprzez bezpośrednie i
szczegółowa obserwacja ludzi w sytuacjach naturalnych w porządku
dojść do zrozumienia i interpretacji tego, jak
ludzie tworzą i utrzymują swój społeczny świat. Studia
teorie interpretacyjne odrzucają założenie, że obserwowane zjawiska
można obiektywnie zaobserwować. Rzeczywiście są oparte
na subiektywnych interpretacjach. Co więcej, badacze interpretacyjni tego nie robią
narzucają a priori znaczenia badanym zjawiskom.
Metoda ta obejmuje badania subiektywne/argumentacyjne, działania
badania, badania opisowe/interpretacyjne, przyszłe badania i gry
rola. Oprócz tych badań i studiów przypadku mogą być
objęte tym podejściem, ponieważ dotyczą badań nad
osób lub organizacji w złożonych sytuacjach
realnego świata.
3.1.1.3 Badania krytyczne
Badania krytyczne to najmniej znane podejście w naukach ścisłych
społeczne, ale ostatnio zwrócił na siebie uwagę badaczy
w dziedzinie systemów informatycznych. Filozoficzne założenie, że
rzeczywistość społeczna jest historycznie wytwarzana i reprodukowana przez ludzi,
a także systemy społeczne z ich działaniami i interakcjami. Ich
zdolność jest jednak uzależniona od wielu czynników
społeczna, kulturalna i polityczna.
Podobnie jak badania interpretacyjne, badania krytyczne twierdzą, że
Badania pozytywistyczne nie mają nic wspólnego z kontekstem społecznym i ignorują go
jego wpływ na działania człowieka.
Z drugiej strony badania krytyczne krytykują badania interpretacyjne
jest zbyt subiektywny i dlaczego nie pomaga
ludziom poprawić swoje życie. Największa różnica między
badania krytyczne i dwa pozostałe podejścia to jego wymiar wartościujący.
Natomiast obiektywizm tradycji pozytywistycznej i interpretacyjnej jest za
przewidzieć lub wyjaśnić status quo lub rzeczywistość społeczną, badania krytyczne
ma na celu krytyczną ocenę i transformację rzeczywistości społecznej
studio.
Krytyczni badacze zwykle sprzeciwiają się status quo, aby to zrobić
usunąć różnice społeczne i poprawić warunki socjalne. Tam
krytyczne badania mają zobowiązanie do poglądu na proces
interesujących nas zjawisk i dlatego jest zwykle podłużny.
Przykładami metod badawczych są długoterminowe badania historyczne i
studia etnograficzne. Jednak krytyczne badania nie były
szeroko stosowane w badaniach systemów informatycznych
3.1.2 Cel badań
Wraz z charakterem wyszukiwania można wykorzystać jego cel
kierować badacza w wyborze określonej metody
badania. Cel projektu badawczego jest ze sobą ściśle powiązany
do pozycji wyszukiwania w odniesieniu do cyklu wyszukiwania, który składa się z
trzy fazy: budowanie teorii, testowanie teorii i udoskonalanie teorii
teoria. Tak więc, w oparciu o pęd w stosunku do cyklu wyszukiwania, a
projekt badawczy może mieć charakter wyjaśniający, opisowy, di
eksploracyjne lub predykcyjne.
3.1.2.1 Badania eksploracyjne
Badania eksploracyjne mają na celu zbadanie tematu
zupełnie nowe i formułować pytania i hipotezy badawcze
przyszły. Ten typ wyszukiwania jest używany w konstrukcji
teorię, aby uzyskać wstępne odniesienia w nowej dziedzinie.
Zazwyczaj stosuje się jakościowe metody badawcze, takie jak studia przypadków
studiów czy studiów fenomenologicznych.
Jednak możliwe jest również zastosowanie technik ilościowych, takich jak
badania eksploracyjne lub eksperymenty.
3.1.3.3 Wyszukiwanie opisowe
Badania opisowe mają na celu w dużej mierze analizowanie i opisywanie
wyszczególnić konkretną sytuację lub praktykę organizacyjną. Ten
jest odpowiedni do konstruowania teorii i może być również używany do
potwierdzać lub kwestionować hipotezy. Wyszukiwanie opisowe zwykle
obejmuje wykorzystanie pomiarów i próbek. Najbardziej odpowiednie metody badawcze
obejmują dochodzenia i analizy tła.
3.1.2.3 Badania wyjaśniające
Badania wyjaśniające próbują wyjaśnić, dlaczego coś się dzieje.
Jest zbudowany na faktach, które zostały już zbadane i stara się je znaleźć
przyczyny tych faktów.
Tak więc badania wyjaśniające są zwykle budowane na badaniach
rozpoznawczy lub opisowy i jest pomocniczy w celu testowania i udoskonalania
teorie. Badania wyjaśniające zwykle wykorzystują studia przypadków
lub metod badawczych opartych na ankietach.
3.1.2.4 Badania prewencyjne
Badania prewencyjne mają na celu przewidywanie zdarzeń i zachowań
pod obserwacją, które są badane (Marshall i Rossman
1995). Przewidywanie jest standardowym naukowym testem prawdy.
Ten rodzaj badań zazwyczaj wykorzystuje ankiety lub analizę danych
dać historycy. (Jin 1989)
Powyższa dyskusja pokazuje, że jest ich kilka
możliwych metod badawczych, które można zastosować w badaniu
konkretny. Jednak musi istnieć konkretna metoda, która jest bardziej odpowiednia
inne dla określonego rodzaju projektu badawczego. (Galerie
1987, Yin 1989, De Vaus 1991). Każdy badacz ma zatem
trzeba dokładnie ocenić mocne i słabe strony
różnych metod, aby dojść do przyjęcia najbardziej odpowiedniej metody badawczej, np
zgodny z projektem badawczym. (Jenkins 1985, Pervan i Klass
1992, Bonomia 1985, Yin 1989, Himilton i Ives 1992).
3.2. Możliwe metody wyszukiwania
Celem tego projektu było zbadanie doświadczenia w
Australijskie organizacje z i dać przechowywany z jednym
rozwój hurtownia danych. Dane który obecnie jest jeden
brak badań w obszarze hurtowni danych w Australii,
ten projekt badawczy jest jeszcze w teoretycznej fazie cyklu
badawczy i ma cel eksploracyjny. Eksploracja doświadczenia w
Australijskie organizacje wdrażające hurtownie danych
wymaga interpretacji rzeczywistego społeczeństwa. W związku z tym
wynika filozoficzne założenie leżące u podstaw projektu badawczego
tradycyjna interpretacja.
Po dokładnym zbadaniu dostępnych metod zostały one zidentyfikowane
dwie możliwe metody badawcze: ankiety i studia przypadków
(studia przypadków), które można wykorzystać do badań
eksploracyjny (Shanks i in. 1993). Galliers (1992) twierdzi, że
przydatności tych dwóch metod do tego konkretnego badania w
zmieniono jego taksonomię, stwierdzając, że nadają się do budowy
teoretyczny. W poniższych dwóch podsekcjach omówiono każdą metodę w
Szczegół.
3.2.1 Metoda badań ankietowych
Metoda badań sondażowych wywodzi się ze starożytnej metody tzw
spis ludności. Spis polega na zbieraniu informacji z
całą populację. Ta metoda jest droga i niepraktyczna
zwłaszcza jeśli populacja jest duża. Więc w porównaniu do
spisu ludności, badanie zwykle koncentruje się na
zebrać informacje dla niewielkiej liczby lub próbki
przedstawiciele ludności (Fowler 1988, Neuman 1994). A
próbka odzwierciedla populację, z której została pobrana, z różnymi różnicami
poziomy dokładności, zgodnie ze strukturą próbki,
wielkości i zastosowanej metody selekcji (Fowler 1988, Babbie
1982, Neumana 1994).
Metodę ankiety definiuje się jako „migawki praktyk,
sytuacji lub poglądów w określonym momencie, podjętych za pomocą
kwestionariusze lub wywiady, z których można wyciągnąć wnioski
wykonane” (Galliers 1992: 153) [migawkowe zdjęcia praktyk,
sytuacji lub poglądów w określonym momencie, podjętych przy użyciu
kwestionariusze lub wywiady, z których można wyciągnąć wnioski]. The
ankiety zajmują się zbieraniem informacji na temat pewnych aspektów
badania przez pewną liczbę uczestników
pytania (Fowler 1988). Nawet te kwestionariusze i wywiady, które
obejmują bezpośrednie wywiady telefoniczne i wywiady ustrukturyzowane,
są techniki zbierania dać najczęściej używany w
dochodzenia (Blalock 1970, Nachmias i Nachmias 1976, Fowler
1988), można wykorzystać obserwacje i analizy (Gable
1994). Ze wszystkich tych metod zbierania bogów dać, sposób użycia
Ankieta jest najpopularniejszą techniką, ponieważ zapewnia, że ​​m.in dać
zebrane są ustrukturyzowane i sformatowane, co ułatwia ich
klasyfikacja informacji (Hwang 1987, de Vaus 1991).
Analizując I dać, strategia dochodzeniowa często wykorzystuje tzw
technik ilościowych, takich jak analiza statystyczna, ale może być
stosowane są również techniki jakościowe (Galliers 1992, Pervan
i Klass 1992, Gable 1994). Normalnie, ja dać zebrane są
używany do analizy rozkładów i wzorców skojarzeń
(Fowler 1988).
Chociaż ankiety są ogólnie odpowiednie do wyszukiwania
radzenie sobie z pytaniem „co?” (co) lub z tego
wywodzące się, takie jak „ile” (ile) i „quant'è” (ile), oni
można zadać za pomocą pytania „dlaczego” (Sonquist i
Dunkelberg 1977, Yin 1989). Według Sonquista i Dunkelberga
(1977), kwerenda badawcza wskazuje na trudne hipotezy, program di
oceny, opisania populacji i opracowania modeli
ludzkie zachowanie. Można również skorzystać z ankiet
studiować pewną opinię o populacji, warunkach,
opinie, cechy, oczekiwania, a nawet przeszłe zachowania
lub obecny (Neuman 1994).
Badania pozwalają badaczowi odkryć zależności między
populacji, a wyniki są zwykle bardziej ogólne niż dla
inne metody (Sonquist i Dunkelberg 1977, Gable 1994). The
ankiety pozwalają naukowcom objąć obszar geograficzny
szerszy i dotrzeć do dużej liczby abonentów (Blalock 1970,
Sonquist i Dunkelberg 1977, Hwang i Lin 1987, Gable 1994,
Neumanna 1994). Wreszcie, ankiety mogą dostarczyć informacji
które nie są dostępne gdzie indziej lub w formie wymaganej do analiz
(Fowler 1988).
Istnieją jednak pewne ograniczenia dotyczące przeprowadzania ankiety. Jeden
Wadą jest to, że badacz nie może uzyskać wielu informacji
o badanym obiekcie. Wynika to z faktu, że
dochodzenia prowadzone są tylko w określonym momencie, a zatem
istnieje ograniczona liczba zmiennych i osób, które badacz może
badania (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Inną wadą jest to, czym może być prowadzenie ankiety
bardzo kosztowne pod względem czasu i zasobów, zwłaszcza jeśli
obejmuje wywiady twarzą w twarz (Fowler 1988).
3.2.2. Metoda badania zapytania
Metoda badań dociekających polega na dogłębnym zbadaniu
konkretna sytuacja w jej rzeczywistym kontekście w a
przez określony czas, bez jakiejkolwiek interwencji ze strony
badacz (Shanks i C. 1993, Eisenhardt 1989, Jenkins 1985).
Najczęściej ta metoda jest używana do opisu relacji między
zmienne, które są badane w konkretnej sytuacji
(Galliers 1992). Dochodzenia mogą dotyczyć pojedynczych przypadków lub
wielokrotności, w zależności od analizowanego zjawiska (Franz i Robey 1987,
Eisenhardta 1989, Yin 1989).
Metodę badania dociekającego określa się jako „zapytanie
badanie empiryczne, które bada współczesne zjawisko w obrębie
jego rzeczywisty kontekst, korzystając z wielu źródeł pochodzących z jednego o
wiele jednostek, takich jak ludzie, grupy lub organizacje” (Yin 1989).
Nie ma wyraźnego oddzielenia zjawiska od jego kontekstu, np
nie ma kontroli ani eksperymentalnej manipulacji zmiennymi (Yin
1989, Benbasat i wsp. 1987).
Istnieje wiele technik zbierania bogów dać że mogą
być zastosowane w metodzie dochodzeniowej, które obejmują
bezpośrednie obserwacje, przeglądy archiwaliów, ankiety,
przegląd dokumentacji i ustrukturyzowane wywiady. Mający
różnorodne techniki zbioru dać, śledztwa
pozwalają naukowcom zajmować się zarówno dać jakościowe to
ilości w tym samym czasie (Bonoma 1985, Eisenhardt 1989, Yin
1989, Gable 1994). Podobnie jak w przypadku metody sondażowej, a
badacz dochodzeniowy działa jako obserwator lub badacz, a nie
jako aktywny uczestnik organizacji studiów.
Benbasat i wsp. (1987) twierdzą, że metoda dociekań jest
szczególnie nadaje się do konstrukcji teorii badań, która
zaczyna się od pytania badawczego i kontynuuje szkolenie
teorii w procesie kolekcjonowania dać, istota
nadaje się również na scenę
konstrukcji teorii sugerują to Franz i Robey (1987).
metodę zapytania można również zastosować do kompleksu
etap teorii. W niniejszej sprawie, na podstawie zebranego materiału dowodowego, A
dana teoria lub hipoteza zostaje zweryfikowana lub obalona. Poza tym śledztwo
nadaje się również do badań dotyczących pytań „jak” lub „jak”.
„ponieważ” (Yin 1989).
W porównaniu z innymi metodami ankiety pozwalają badaczowi na to
uchwycić istotne informacje bardziej szczegółowo (Galliers
1992, Shanks i wsp. 1993). Ponadto badania pozwalają na
badaczowi zrozumienie natury i złożoności badanych procesów
(Benbasat i wsp. 1987).
Istnieją cztery główne wady związane z tą metodą
dochodzenie. Pierwszym z nich jest brak kontrolowanych potrąceń. Tam
Subiektywność badacza może wpływać na ustalenia i wnioski
badania (Yin 1989). Drugą wadą jest brak
obserwacja kontrolowana. W odróżnieniu od metod eksperymentalnych, tzw
badacz dociekający nie może kontrolować badanych zjawisk
gdy są badane w ich naturalnym kontekście (Gable 1994). The
trzecią wadą jest brak powtarzalności. Wynika to z faktu
że jest mało prawdopodobne, aby badacz zaobserwował te same zdarzenia, np
nie może zweryfikować wyników konkretnego badania (Lee 1989).
Wreszcie, w wyniku braku powtarzalności, jest to trudne
uogólnić wyniki uzyskane z jednego lub więcej badań (Galliers
1992, Shanks i wsp. 1993). Wszystkie te problemy jednak nie
są nie do pokonania i w rzeczywistości mogą być zminimalizowane przez
badacz stosujący odpowiednie działania (Lee 1989).
3.3. Uzasadnij metodologię badań
przyjęty
Spośród dwóch możliwych metod badawczych dla tego badania, metoda
ankietę uważa się za najbardziej odpowiednią. To dociekanie jest
zostały odrzucone po starannym rozważeniu powiązanych
zalety i słabości. Wygoda lub nieodpowiedniość każdego z nich
metoda tego badania zostanie omówiona później.
3.3.1. Niewłaściwa metoda badawcza
zapytania
Metoda dociekania wymaga dogłębnego zbadania a
szczególną sytuację w jednej lub kilku organizacjach dla a
okres czasu (Eisenhardt 1989). W takim przypadku okres może
przekraczać ramy czasowe podane dla tego badania. Inny
Powodem, dla którego nie należy stosować metody badawczej, jest to, że wyniki
mogą cierpieć z powodu braku dyscypliny (Yin 1989). Subiektywność
badacza może wpływać na wyniki i wnioski. Inny
powodem jest to, że ta metoda jest bardziej odpowiednia do wyszukiwania pytań
typu „jak” lub „dlaczego” (Yin 1989), natomiast pytanie badawcze
dla tego badania jest typu „co”. Nie mniej ważny
Co ważne, trudno jest uogólniać wyniki na podstawie tylko jednego o
kilka zapytań (Galliers 1992, Shanks i in. 1993). na podstawie
z tego powodu metoda badania dociekań nie jest
została wybrana jako nie nadająca się do tego badania.
3.3.2. Wygoda metody wyszukiwania
badanie
Kiedy przeprowadzono te badania, praktyka hurtowni danych
nie została powszechnie przyjęta przez
organizacje australijskie. Nie było więc zbyt wielu informacji
w sprawie ich realizacji w ramach
organizacje australijskie. Dostępne informacje pochodziły z
od organizacji, które wdrożyły lub wykorzystały dane
magazyn. W tym przypadku metoda badań ankietowych jest jak najbardziej wskazana
odpowiednie, ponieważ pozwala uzyskać informacje, które nie są
dostępne gdzie indziej lub w formie wymaganej do analizy (Fowler 1988).
Ponadto metoda badań ankietowych umożliwia badaczowi
uzyskać dobry wgląd w praktyki, sytuacje lub
widziane w danym czasie (Galliers 1992, Denscombe 1998).
Poproszono o przegląd w celu zwiększenia
znajomość australijskiego doświadczenia w hurtowniach danych.
Ponownie Sonquist i Dunkelberg (1977) stwierdzają, że wyniki
Badania ankietowe są bardziej ogólne niż inne metody.
3.4. Projekt badań ankietowych
Badanie praktyki hurtowni danych przeprowadzono w 1999 roku.

Populacja docelowa składała się z organizacji
byli zainteresowani badaniami nad hurtowniami danych
prawdopodobnie już poinformowany o i dać jaki sklep i
dlatego może dostarczyć przydatnych informacji dla tego badania. Tam
Populacja docelowa została zidentyfikowana za pomocą wstępnego badania
wszyscy australijscy członkowie „The Data Warehousing Institute” (Tdwiaap).
W tej sekcji omówiono projekt fazy badawczej
empiryczne tego badania.
3.4.1. Technika zbierania dać
Spośród trzech technik powszechnie stosowanych w badaniach śledczych
(tj. kwestionariusz przesłany pocztą, wywiad telefoniczny i wywiad
osobiste) (Nachmias 1976, Fowler 1988, de Vaus 1991), dla
w tym badaniu przyjęto kwestionariusz pocztą. Pierwszy
Powodem przyjęcia tego ostatniego jest to, że może on osiągnąć a
rozproszona geograficznie populacja (Blalock 1970, Nachmias e
Nachmias 1976, Hwang i Lin 1987, de Vaus 1991, Gable 1994).
Po drugie, ankieta pocztowa jest odpowiednia dla uczestników
dobrze wykształcony (Fowler 1988). Kwestionariusz pocztą w tym celu
badanie skierowane było do sponsorów projektów hurtowni danych,
dyrektorzy projektów i/lub kierownicy. Po trzecie, kwestionariusze dot
mail są odpowiednie, gdy masz bezpieczną listę
adresy (Salant i Dilman 1994). TDWI, w tym przypadku jeden
zaufane stowarzyszenie hurtowni danych dostarczyło listę mailingową
swoich australijskich członków. Kolejny plus ankiety
kwestionariusze lub wywiady drogą pocztową lub telefoniczną
osobisty polega na tym, że pozwala rejestrującym na udzielanie większej liczby odpowiedzi
dokładność, zwłaszcza gdy respondenci muszą się skonsultować
notować lub omawiać pytania z innymi osobami (Fowler
1988).
Potencjalnym mankamentem może być czas potrzebny na
przeprowadzać ankiety pocztą. Normalnie kwestionariusz dalej
poczta odbywa się w następującej kolejności: wysyłaj listy, czekaj na
odpowiedzi i wysłać potwierdzenie (Fowler 1988, Bainbridge 1989).
Zatem całkowity czas może być dłuższy niż czas wymagany
wywiady osobiste lub wywiady telefoniczne. Jednakże
całkowity czas może być znany z góry (Fowler 1988,
Denscombe 1998). Czas poświęcony na przeprowadzanie wywiadów
osobisty nie może być znany z góry, ponieważ różni się od
jeden wywiad do drugiego (Fowler 1988). Wywiady telefoniczne
może być szybsze niż kwestionariusze pocztowe i e-maile
osobistych wywiadów, ale mogą mieć wysoki wskaźnik chybienia
odpowiedź ze względu na niedostępność niektórych osób (Fowler 1988).
Ponadto wywiady telefoniczne są na ogół ograniczone do list
stosunkowo krótkich pytań (Bainbridge 1989).
Inną słabością kwestionariusza pocztowego jest wysoki wskaźnik
brak odpowiedzi (Fowler 1988, Bainbridge 1989, Neuman
1994). Podjęto jednak środki zaradcze, zrzeszając się
to badanie z zaufaną instytucją danych
magazynowanie (tj. TDWI) (Bainbridge 1989, Neuman 1994),
który wysyła dwa listy przypominające do tych, którzy nie odpowiedzieli
(Fowler 1988, Neuman 1994) i zawiera również list
dodatek wyjaśniający cel badania (Neuman 1994).
3.4.2. Jednostka analizy
Celem tego badania jest uzyskanie informacji nt
wdrożenie hurtowni danych i jej wykorzystanie
w organizacjach australijskich. Populacja docelowa
składa się ze wszystkich australijskich organizacji, które mają
wdrożyły lub wdrażają, tj hurtownia danych, w
poszczególne organizacje są wymienione poniżej. Kwestionariusz
został wysłany do organizacji zainteresowanych adopcją
di hurtownia danych. Ta metoda gwarantuje, że informacje
zbiory pochodzą z najbardziej odpowiednich zasobów każdej organizacji
uczestnik.
3.4.3. Próbka ankiety
Uzyskano „listę mailingową” uczestników badania
rozszerzenie TDW. Z tej listy 3000 australijskich organizacji
zostały wybrane jako podstawa pobierania próbek. A
pismo uzupełniające wyjaśniające projekt i cel badania,
wraz z kartą odpowiedzi i opłaconą kopertą na
zwrot wypełnionego kwestionariusza przesłano do próby.
Spośród 3000 organizacji 198 zgodziło się na udział
badanie. Spodziewano się tak małej liczby odpowiedzi data il
duża liczba australijskich organizacji, które wtedy mieli
przyjęli lub przyjęli strategię dotyczącą randek
magazynowania w swoich organizacjach. Tak więc
Populacja docelowa dla tego badania składa się tylko z 198 osób
organizacje.
3.4.4. Treść kwestionariusza
Struktura kwestionariusza została oparta na modelu daty
magazynowanie Monash (omówione wcześniej w części 2.3). The
Treść kwestionariusza została oparta na analizie
literatura przedstawiona w rozdziale 2. Kopia kwestionariusza
wysłane do uczestników ankiety można znaleźć
w dodatku B. Kwestionariusz składa się z sześciu części, które
śledzić fazy leczonego modelu. Kolejne sześć akapitów
krótko streścić zawartość każdego rozdziału.
Sekcja A: Podstawowe informacje o organizacji
Ta sekcja zawiera pytania związane z profilem użytkownika
organizacje uczestniczące. Poza tym niektóre pytania są
dotyczące stanu projektu hurtowni danych
uczestnik. Informacje poufne, takie jak imię i nazwisko
organizacji nie zostały ujawnione w analizie ankiety.
Sekcja B: Start
Pytania w tej sekcji dotyczą rozpoczynania pracy
magazyn danych. Padły pytania za ile
dotyczy inicjatorów projektów, sponsorów, umiejętności i wiedzy
żądania, cele rozwoju hurtowni danych oraz
oczekiwania użytkowników końcowych.
Sekcja C: Projektowanie
Ta sekcja zawiera pytania związane z działalnością firmy
planowanie hurtownia danych. Konkretnie chodzi o pytania
podać zakres wykonania, czas trwania projektu, koszt
projektu oraz analizę kosztów i korzyści.
Sekcja D: Rozwój
W dziale rozwojowym znajdują się pytania związane z działalnością firmy
rozwój hurtownia danych: zbiór wymagań użytkownika
ostateczna, źródła dać, logiczny model dać, prototypy, tzw
planowanie wydajności, architektury techniczne i wybór
narzędzia do tworzenia hurtowni danych.
Sekcja E: Działanie
Kwestie operacyjne związane z operacją wyd
do rozciągliwości hurtownia danych, jak się rozwija
kolejny etap rozwoju. Tam jakość danych, strategie
odświeżenie ww dać, ziarnistość daćskalowalność danych
magazynu i problemy z bezpieczeństwem hurtownia danych byli pomiędzy
rodzaje zadawanych pytań.
Sekcja F: Rozwój
Ta sekcja zawiera pytania związane z wykorzystaniem danych
magazynu przez użytkowników końcowych. Badacz był zainteresowany
w celu i użyteczności hurtownia danych, przegląd i strategie
przyjętego szkolenia i strategii kontroli danych
magazyn przyjęty.
3.4.5. Odsetek odpowiedzi
Chociaż ankiety pocztowe są krytykowane za to, że mają wskaźnik
niski odzew, podjęto działania w celu zwiększenia
stopa zwrotu (jak omówiono wcześniej w cz
3.4.1). Termin „wskaźnik odpowiedzi” odnosi się do procentu
osób w określonej próbie ankiety, które odpowiedziały na
kwestionariusz (Denscombe 1998). Wykorzystano następujące
wzór do obliczenia wskaźnika odpowiedzi dla tego badania:
Liczba osób, które odpowiedziały
Wskaźnik odpowiedzi =
——————————————————————————– X 100
Łączna liczba wysłanych kwestionariuszy
3.4.6. Pilot testowy
Zanim kwestionariusz zostanie wysłany do próby, pytania są
zostały zbadane poprzez przeprowadzenie testów pilotażowych, zgodnie z sugestią Lucka
i Rubin (1987), Jackson (1988) i de Vaus (1991). Cel
Testy pilotażowe mają na celu ujawnienie wszystkich niezręcznych, niejednoznacznych i wyrażeń
pytania trudne do interpretacji, aby wyjaśnić wszelkie
definicji i użytych terminów oraz określić przybliżony czas
wymagane do wypełnienia kwestionariusza (Warwick i Lininger 1975,
Jackson 1988, Salant i Dilman 1994). Próby pilotażowe były
poprzez wybór podmiotów o podobnych cechach
przedmiotów końcowych, zgodnie z sugestią Davisa e Cosenza (1993). W
w tym badaniu było sześciu specjalistów ds. hurtowni danych
wybranych jako tematy pilotażowe. Po każdym teście pilotażowym są
dokonano niezbędnych poprawek. Z przeprowadzonych testów pilotażowych, tj
uczestnicy pomogli przekształcić i zresetować
ostateczna wersja kwestionariusza.
3.4.7. Metody analizy Dać
I dać dane ankietowe zebrane z kwestionariuszy zamkniętych są
zostały przeanalizowane przy użyciu pakietu oprogramowania statystycznego
zwany SPSS. Wiele odpowiedzi zostało przeanalizowanych
za pomocą statystyki opisowej. Szereg kwestionariuszy
wróciły niekompletne. Te były leczone starszym
uwagę, aby upewnić się, że i dać zaginionych nie było
konsekwencje błędów we wprowadzaniu danych, ale dlaczego nie pytania
były odpowiednie dla rozgrywającego lub rozgrywający zdecydował, że nie
odpowiedzieć na jedno lub więcej szczegółowych pytań. Te odpowiedzi
brakujące zostały zignorowane podczas analizowania pliku dać i oni byli
kodowane jako „-9”, aby zapewnić ich wykluczenie z procesu
ćwiczenie.
W przygotowaniu kwestionariusza zastosowano pytania zamknięte
wstępnie zakodowane przez przypisanie numeru do każdej opcji. Numer
następnie wykorzystano go do przygotowania m.in dać podczas analizy
(Denscombe 1998, Sapsford i Jupp 1996). Na przykład były
sześć opcji wymienionych w pytaniu 1 sekcji B: porada
dyrekcja, dyrektor generalny, dział IT, jednostka
biznes, konsultanci i nie tylko. w pliku dać SPSS, tak jest
wygenerowano zmienną wskazującą „inicjatora projektu”,
z sześcioma znacznikami wartości: „1” dla „planszy”, „2”
dla „dyrektora wyższego szczebla” i tak dalej. Zastosowanie skali Likertina
w niektórych pytaniach zamkniętych ma również pozwolenie
identyfikacja, która nie wymaga żadnego wysiłku, biorąc pod uwagę użycie wartości
odpowiednie numery wprowadzone w SPSS. W przypadku pytań z
niewyczerpujące odpowiedzi, które nie wykluczały się wzajemnie,
każda opcja była traktowana jako pojedyncza zmienna z dwoma
etykiety wartości: „1” dla „zaznaczone” i „2” dla „nieoznaczone”.
Pytania otwarte potraktowano inaczej niż pytania
Zamknięte. Odpowiedzi na te pytania nie zostały opublikowane w
SPSS. Zamiast tego zostały przeanalizowane ręcznie. Korzystanie z tego
typ pytania pozwala na uzyskanie informacji o pomysłach
swobodnie wyrażone i osobiste doświadczenia rejestrujących
(Bainbridge 1989, Denscombe 1998). Tam, gdzie było to możliwe, zostało to zrobione
kategoryzacja odpowiedzi.
Do analizy daćstosowane są metody prostej analizy statystycznej,
takie jak częstość odpowiedzi, średnia, odchylenie standardowe
średnia i mediana (Argyrous 1996, Denscombe 1998).
Test Gamma był skuteczny w uzyskiwaniu pomiarów ilościowych
skojarzeń między dać liczby porządkowe (Norusis 1983, Argyrous 1996).
Testy te były odpowiednie, ponieważ zastosowane skale porządkowe nie były
miały wiele kategorii i można je było przedstawić w tabeli
(Norusis 1983).
3.5 Sommarii
W tym rozdziale omówiono metodologię badań i
projekty przyjęte do tego badania.
Wybór najbardziej odpowiedniej metody wyszukiwania dla a
bierze pod uwagę konkretne badanie
rozważ szereg zasad, w tym charakter i typ
badań, a także zalety i wady każdego z możliwych
metoda (Jenkins 1985, Benbasat i in. 1097, Galliers i Land 1987,
Yin 1989, Hamilton i Ives 1992, Galliers 1992, Neuman 1994). Pogląd
brak istniejącej wiedzy i teorii na ten temat
przyjęcia hurtowni danych w Australii, to badanie przeprowadzone przez
badania wymagają umiejętnej interpretacyjnej metody badawczej
eksploracyjne, mające na celu zbadanie doświadczeń organizacji
Australijski. Twoja metoda wyszukiwania została wybrana dla
zebrać informacje dotyczące przyjęcia koncepcji daty
magazynowanie przez organizacje australijskie. A
Jako technikę zbierania wybrano ankietę pocztową dać.
uzasadnienie metody badawczej i techniki zbierania dać
wybór zostanie podany w tym rozdziale. Poza tym było
przedstawił dyskusję na temat jednostki analizy, próbki
zastosowane, wskaźniki odpowiedzi, treść kwestionariusza,
test wstępny kwestionariusza i metoda analizy dać.

Projektowanie Hurtownia danych:
Łączenie relacji encji i modelowania wymiarowego
ABSTRACT
sklep dać dla wielu jest to ważny aktualny problem
organizacje. Kluczowy problem w rozwoju
przechowywania dać to jego projekt.
Projekt musi obsługiwać wykrywanie pojęć w danych
magazynu do starszego systemu i innych źródeł dać a także jeden
łatwe zrozumienie i wydajna implementacja danych
magazyn.
Dużo literatury magazynowej dać Zalecana
wykorzystanie modelowania relacji między jednostkami lub modelowania wymiarowego
reprezentują projekt hurtownia danych.
W tym czasopiśmie pokazujemy, jak jedno i drugie
reprezentacje można łączyć w podejściu do
rysunek hurtownia danych. Stosowane podejście jest systematyczne
zbadane w studium przypadku i zidentyfikowane w wielu
ważne implikacje dla profesjonalistów.
MAGAZYN DANYCH
Un hurtownia danych jest zwykle definiowana jako „zorientowana na temat,
zintegrowane, zmienne w czasie i nieulotne gromadzenie danych pomocniczych
decyzji kierownictwa” (Inmon i Hackathorn, 1994).
Zorientowany tematycznie i zintegrowany wskazuje, że hurtownia danych è
zaprojektowany, aby przekraczać granice funkcjonalne starszych systemów dla
oferują zintegrowaną perspektywę dać.
Wariant czasowy dotyczy historycznego lub szeregowego charakteru wideo dać in
un hurtownia danych, co umożliwia analizę trendów.
Nieulotny wskazuje, że hurtownia danych nie jest to ciągłe
zaktualizowany jako A baza danych firmy OLTP. Raczej jest aktualizowany
okresowo, z dać ze źródeł wewnętrznych i zewnętrznych. The
hurtownia danych jest specjalnie zaprojektowany do badań
a nie dla integralności i wydajności aktualizacji
operacje.
Idea przechowywania I dać to nie jest nowe, to był jeden z celów
zarządzanie dać od lat sześćdziesiątych (Il Martin, 1982).
I hurtownia danych oferują infrastrukturę dać dla zarządzania
systemy wsparcia. Systemy wspomagania zarządzania obejmują decyzje
systemy wsparcia (DSS) i systemy informacji wykonawczej (EIS).
DSS to komputerowy system informacyjny
zaprojektowany w celu poprawy procesu, a co za tym idzie chwytu
ludzka decyzja. EIS jest zazwyczaj systemem dostarczania
dać co umożliwia kierownictwu biznesowemu łatwy dostęp do widoku
z dać.
Ogólna architektura a hurtownia danych podkreśla rolę
hurtownia danych we wsparciu zarządzania. Oprócz oferowania
infrastruktura dać ds. EIS i DSS, al hurtownia danych è possibile
uzyskać do niego bezpośredni dostęp za pomocą zapytań. TO dać zawarte w dacie
magazynu opierają się na analizie wymagań informacyjnych
zarządzania i są pozyskiwane z trzech źródeł: wewnętrznych systemów odziedziczonych,
systemy przechwytywania danych specjalnego przeznaczenia i zewnętrzne źródła danych. TO
dać w wewnętrznych starszych systemach są często redundantne,
słabe, niskiej jakości i przechowywane w wielu formatach
więc muszą zostać uzgodnione i oczyszczone, zanim będzie można je załadować do
hurtownia danych (Inmon, 1992; McFadden, 1996). TO dać od
z systemów pamięci masowej dać ad hoc i ze źródeł dać
zewnętrzne są często używane do rozszerzania (aktualizacji, zastępowania) i
dać ze starszych systemów.
Istnieje wiele przekonujących powodów, dla których warto rozwijać a hurtownia danych,
które obejmują lepsze podejmowanie decyzji dzięki użyciu
skuteczne więcej informacji (Ives 1995), wsparcie dla skupienia
na cały biznes (Graham 1996) oraz obniżenie kosztów
prowizja od dać dla EIS i DSS (Graham 1996, McFadden
1996).
Niedawne badanie empiryczne wykazało średnio zwrot
inwestycje dla I hurtownia danych o 401% po trzech latach (Graham,
1996). Jednak inne badania empiryczne nt hurtownia danych mieć
stwierdzono istotne problemy, w tym trudności w pomiarze ed
przydzielać korzyści, brak jasnego celu, niedocenianie go
zakres i złożoność procesu przechowywania i daćw
zwłaszcza w odniesieniu do źródeł i czystości dać.
sklep dać można uznać za rozwiązanie
do problemu zarządzania dać między organizacjami. Tam
manipulacja dać jako zasób społeczny pozostaje jednym z nich
kluczowe problemy w zarządzaniu systemami informatycznymi na całym świecie
świecie przez wiele lat (Brancheau i in. 1996, Galliers i in. 1994,
Niedermana i in. 1990, Pervan 1993).
Popularne podejście do zarządzania aktywami dać to było w latach osiemdziesiątych
opracowanie modelu dać społeczny. Model dać społeczne to było
zaprojektowane tak, aby oferować stabilną podstawę do rozwoju nowych systemów
aplikacje i baza danych oraz odbudowę i integrację dziedzictwa
systemy (Brancheau i in.
1989, Goodhue i in. 1988:1992, Kim i Everest 1994).
Z takim podejściem wiąże się jednak wiele problemów, m.in
w szczególności złożoność i koszt każdego zadania oraz długi czas
muszą mieć namacalne rezultaty (Beynon-Davies 1994, Earl
1993, Goodhue i in. 1992, Periasamy 1994, Shanks 1997).
Il hurtownia danych jest to oddzielna baza danych, która współistnieje z dziedzictwem
baz danych zamiast ich zastępowania. Dlatego pozwala
kierować kierownictwem dać i uniknąć kosztownej odbudowy
starszych systemów.
ISTNIEJĄCE PODEJŚCIA DO PROJEKTOWANIA DANYCH
MAGAZYN
Proces budowania i doskonalenia a hurtownia danych
należy rozumieć raczej jako proces ewolucyjny niż
tradycyjny cykl rozwoju systemów (Desio, 1995, Shanks,
O'Donnell i Arnott 1997a). Istnieje wiele procesów zaangażowanych w
projekt hurtownia danych takie jak inicjalizacja, planowanie;
informacje uzyskane z wymagań stawianych kierownictwu firmy;
źródła, przemiany, oczyszczanie dać i synchronizuj ze starszej wersji
systemów i innych źródeł dać; systemy dostarczania w trakcie opracowywania;
monitorowanie hurtownia danych; i bezsensowność procesu
ewolucyjne i konstrukcja a hurtownia danych (Shins, O'Donnell
i Arnott 1997b). W tym czasopiśmie skupiamy się na tym, jak
narysuj I dać przechowywane w kontekście tych innych procesów.
Istnieje wiele proponowanych podejść do architektury danych
magazyn w literaturze (Inmon 1994, Ives 1995, Kimball 1994
McFaddena 1996). Każda z tych metodologii ma krótki opis
przegląd wraz z analizą ich mocnych i słabych stron.
Podejście Inmona (1994) do Hurtownia danych
Wnętrze
Inmon (1994) zaproponował cztery iteracyjne kroki projektowania danych
magazyn (patrz rysunek 2). Pierwszym krokiem jest zaprojektowanie szablonu
dać społeczne, aby zrozumieć, jak ja dać można zintegrować
w obszarach funkcjonalnych organizacji
podział I dać przechowywać w obszarach. Model dać jest przeznaczony
przechować dać związanych z podejmowaniem decyzji, m.in dać
historyczne i włączone dać odliczane i sumowane. Drugim krokiem jest
zidentyfikować obszary tematyczne do wdrożenia. Te są oparte
na priorytetach określonych przez konkretną organizację. Trzeci
krok polega na narysowaniu a baza danych dla obszaru tematycznego, pozy
szczególną uwagę na uwzględnienie odpowiednich poziomów szczegółowości.
Inmon zaleca stosowanie modelu encji i relacji. Czwarty
etapem jest identyfikacja systemów źródłowych dać wymagane i rozwijane
procesy transformacji w celu przechwytywania, czyszczenia i formatowania i dać.
Siłą podejścia Inmona jest model dać społeczny
stanowi podstawę integracji dać w ramach organizacji
oraz planowanie podpór dla iteracyjnego opracowywania danych
magazyn. Jego wadami są trudność i koszt rysowania
model dać społeczne, trudność w zrozumieniu modeli encji, np
relacje stosowane w obu modelach, tj dać społeczne i że dać
przechowywane według obszaru tematycznego i stosowność dać del
rysunek hurtownia danych do realizacji baza danych
relacyjny, ale nie dla baza danych wielowymiarowy.
Ives' (1995) Podejście do Hurtownia danych
Wnętrze
Ives (1995) proponuje czteroetapowe podejście do projektowania
systemu informacyjnego, który uzna za odpowiedni do zaprojektowania daty
magazyn (patrz rysunek 3). Podejście jest bardzo oparte na
Inżynieria informacyjna dla rozwoju systemów informatycznych
(Marcin 1990). Pierwszym krokiem jest określenie celów, czynników
historie sukcesu i kluczowe wskaźniki wydajności. TO
kluczowe procesy biznesowe i niezbędne informacje
modelowane, aby doprowadzić nas do modelu dać społeczny. Drugi krok
obejmuje rozwój architektury, która definiuje dać
przechowywane według obszaru, baza danych di hurtownia danych, części
technologii, które są wymagane, zestaw wsparcia organizacyjnego
wymagane do wdrożenia i obsługi hurtownia danych. Trzeci
krok obejmuje wybór wymaganych pakietów oprogramowania i narzędzi.
Czwarty krok to szczegółowy projekt i budowa
hurtownia danych. Ives zauważa ten sklep dać on jest więzią
proces iteracyjny.
Siłą podejścia Ives jest wykorzystanie specyfikacji technicznych dla
określić wymagania informacyjne, wykorzystanie ustrukturyzowanego
proces wspierający integrację hurtownia danych,
odpowiedni dobór sprzętu i oprogramowania oraz korzystanie z wielu
techniki reprezentacji dot hurtownia danych. Jego wady
są nieodłącznie związane ze złożonością. Inne obejmują trudności w
rozwijać wiele poziomów baza danych all'interno del hurtownia danych in
rozsądny czas i koszt.
Podejście Kimballa (1994). Hurtownia danych
Wnętrze
Kimball (1994) zaproponował pięć iteracyjnych kroków projektowania danych
magazyn (patrz rysunek 4). Jego podejście jest szczególne
poświęcony na rysunku tylko jednego hurtownia danych i korzystanie z szablonów
wymiarowe w stosunku do modeli encji i relacji. Kimball
przeanalizować te modele wymiarowe, ponieważ jest to łatwiejsze do zrozumienia dla i
dyrektorów biznesowych, jest bardziej wydajny w kontaktach
kompleksowe konsultacje i projektowanie baza danych fizyczna jest czymś więcej
wydajne (Kimball 1994). Kimball przyznaje, że opracowanie
hurtownia danych jest iteracyjny i tyle hurtownia danych oddzielna puszka
zintegrować poprzez podział na tabele wymiarów
wspólny.
Pierwszym krokiem jest określenie konkretnego obszaru tematycznego
udoskonalony. Kroki drugi i trzeci dotyczą kształtowania
wymiarowy. W drugim kroku miary identyfikują rzeczy
zainteresowanie danym obszarem i pogrupowane w tabelę faktów.
Na przykład w obszarze tematycznym sprzedaży miary zainteresowania
mogą obejmować ilość sprzedanych przedmiotów i dolara
jako waluta sprzedaży. Trzeci krok polega na identyfikacji
wymiary, które są sposobami, w jakie można pogrupować i
fakty. W obszarze tematycznym sprzedaży odpowiednie wymiary
może obejmować przedmiot, lokalizację i okres. Tam
tabela faktów ma wieloczęściowy klucz, który można połączyć z każdym z nich
tabel wymiarów i zwykle zawiera bardzo dużą liczbę
duży na faktach. Natomiast tabele wymiarów zawierają
opisowe informacje o rozmiarze i innych atrybutach, które
może służyć do grupowania faktów. Tabela faktów e
wymiary związane z propozycją tworzą tzw
wzór gwiazdy ze względu na swój kształt. Czwarty krok obejmuje
budowa a baza danych wielowymiarowy, aby go udoskonalić
wzór gwiazdy. Ostatnim krokiem jest identyfikacja systemów źródłowych dać
wymagane i rozwijać procesy transformacji w celu pozyskania, oczyszczenia
i sformatuj I dać.
Mocne strony podejścia Kimball obejmują wykorzystanie szablonów
wymiarowy do reprezentowania i dać przechowywane, które sprawiają, że to
łatwy do zrozumienia i prowadzi do wydajnego projektu fizycznego. A
model wymiarowy, który również chętnie używa obu
systemy baza danych relacyjne mogą być udoskonalone lub systemy
baza danych wielowymiarowy. Do jego wad należy brak
niektórych technik ułatwiających planowanie lub integrację
wiele schematów gwiazd w jednym hurtownia danych i
trudność projektowania ze skrajnie zdenormalizowanej struktury w a
model wymiarowy a dać w starszych systemach.
Podejście McFaddena (1996) do danych
Projektowanie magazynu
McFadden (1996) proponuje pięcioetapowe podejście do
narysować hurtownia danych (patrz rysunek 5).
Jego podejście opiera się na syntezie idei z literatury
i koncentruje się na rysowaniu solówki hurtownia danych, Pierwszy
etap obejmuje analizę wymagań. Choćby konkrety
techniki nie są przepisane, notatki McFaddena identyfikują
jednostka dać specyfikacje i ich atrybuty oraz odnoszą się do czytników Watson
i Frolick (1993) za uchwycenie wymagań.
W drugim kroku rysowany jest model relacji encji
hurtownia danych a następnie zweryfikowane przez kierownictwo firmy. Trzeci
krok obejmuje określenie mapowania ze starszego systemu
i zewnętrznych źródeł hurtownia danych. Czwarty krok obejmuje
procesy w rozwoju, wdrażaniu i synchronizacji dać w
hurtownia danych. Ostatnim etapem jest dostawa systemu
opracowany z naciskiem na interfejs użytkownika.
McFadden zwraca uwagę, że proces rysowania jest ogólnie
wielokrotny.
Mocne strony podejścia McFaddena wskazują na partycypację
przez dyrektorów biznesowych przy określaniu wymagań, a także
znaczenie zasobów daćich czyszczenie i zbieranie. Jej
załamania odnoszą się do braku procesu podziału a
duży projekt pt hurtownia danych w wielu zintegrowanych etapach i tam
trudności w zrozumieniu encji i modeli relacji stosowanych w projektowaniu
hurtownia danych.

    0/5 (0 Recenzji)
    0/5 (0 Recenzji)
    0/5 (0 Recenzji)

    Więcej informacji można znaleźć w Agencji Internetowej Online

    Zapisz się, aby otrzymywać najnowsze artykuły e-mailem.

    awatar autora
    Admin CEO
    👍Agencja internetowa | Ekspert agencji internetowych w zakresie marketingu cyfrowego i SEO. Agencja internetowa Online jest agencją internetową. Dla Agenzia Web Online sukces w transformacji cyfrowej opiera się na fundamentach Iron SEO w wersji 3. Specjalizacje: Integracja Systemów, Integracja Aplikacji Korporacyjnych, Architektura Zorientowana na Usługi, Cloud Computing, Hurtownia Danych, Business Intelligence, Big Data, portale, intranety, Aplikacja Webowa Projektowanie i zarządzanie relacyjnymi i wielowymiarowymi bazami danych. Projektowanie interfejsów dla mediów cyfrowych: użyteczność i grafika. Agencja Internetowa oferuje firmom następujące usługi: -SEO w Google, Amazon, Bing, Yandex; -Analiza internetowa: Google Analytics, Menedżer tagów Google, Yandex Metrica; -Konwersje użytkowników: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM w Google, Bing, Amazon Ads; -Marketing w mediach społecznościowych (Facebook, Linkedin, Youtube, Instagram).
    Moja zwinna prywatność
    Ta strona korzysta z technicznych i profilujących plików cookie. Klikając przycisk Akceptuj, wyrażasz zgodę na wszystkie pliki cookie profilujące. Kliknięcie przycisku odrzucania lub znaku X powoduje odrzucenie wszystkich profilujących plików cookie. Klikając opcję dostosuj, można wybrać, które pliki cookie profilujące mają zostać aktywowane.
    Niniejsza strona jest zgodna z ustawą o ochronie danych (LPD), szwajcarską ustawą federalną z dnia 25 września 2020 r. oraz RODO, rozporządzeniem UE 2016/679, dotyczącym ochrony danych osobowych i swobodnego przepływu takich danych.