https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

Hurtownia danych i planowanie zasobów przedsiębiorstwa | DWH i ERP

ARCHIWUM DATA CENTRALNE: HISTORIA ED EWOLUCJA

Dwa dominujące tematy technologii korporacyjnej w latach 90. to: hurtownia danych i ERP. Przez długi czas te dwa potężne strumienie były częścią korporacyjnej infrastruktury informatycznej i nigdy się nie krzyżowały. To było prawie tak, jakby były materią i antymaterią. Ale rozwój obu zjawisk nieuchronnie doprowadził do ich skrzyżowania. Dziś firmy stają przed problemem, co zrobić z ERP i hurtownia danych. W tym artykule wyjaśnimy, jakie są problemy i jak są one rozwiązywane przez firmy.

NA POCZĄTKU…

Na początku było hurtownia danych. Hurtownia danych narodził się, aby przeciwdziałać systemowi aplikacji do przetwarzania transakcji. We wczesnych dniach zapamiętywania dać miał być tylko kontrapunktem dla aplikacji przetwarzających transakcje. Ale obecnie istnieją znacznie bardziej wyrafinowane wizje tego, czym jest a hurtownia danych. W dzisiejszym świecie hurtownia danych jest wstawiony w strukturę, którą można nazwać Korporacyjną Fabryką Informacji.

KORPORACYJNA FABRYKA INFORMACJI (CIF)

Korporacyjna fabryka informacji ma standardowe komponenty architektury: warstwę integracji i transformacji kodu, która integruje i dać podczas gdy ja dać przechodzą ze środowiska aplikacji do środowiska programu hurtownia danych firmy; a hurtownia danych firmy, w której ja dać szczegółowe i zintegrowane historie. ten hurtownia danych przedsiębiorstwa służy jako fundament, na którym można zbudować wszystkie inne części środowiska hurtownia danych; operacyjny magazyn danych (ODS). ODS jest strukturą hybrydową, która zawiera pewne aspekty hurtownia danych oraz inne aspekty środowiska OLTP; hurtownie danych, w których różne działy mogą mieć własne wersje danych hurtownia danych; za hurtownia danych eksploracji, gdzie myśliciele firmy mogą przesyłać swoje 72-godzinne zapytania bez szkodliwego wpływu na hurtownia danych; i pamięć bliskiej linii, w której dać stary i dać dane zbiorcze można tanio przechowywać.

GDZIE ERP ŁĄCZY SIĘ Z FABRYKA INFORMACJI KORPORACYJNYCH

ERP łączy się z Firmową Fabryką Informacji w dwóch miejscach. Przede wszystkim jako aplikacja bazowa, która zapewnia i dać wniosku do hurtownia danych, W tym przypadku ja dać, generowane jako produkt uboczny procesu transakcyjnego, są integrowane i ładowane do hurtownia danych firmy. Drugim ogniwem łączącym ERP i CIF jest ODS. Rzeczywiście, w wielu środowiskach ERP jest używany jako klasyczny ODS.

W przypadku, gdy ERP jest używany jako aplikacja podstawowa, ten sam ERP może być również używany w CIF jako ODS. W każdym razie, jeśli ERP ma być używany w obu rolach, musi istnieć wyraźne rozróżnienie między tymi dwoma podmiotami. Innymi słowy, gdy ERP pełni rolę aplikacji bazowej i ODS, należy rozróżnić te dwie jednostki architektoniczne. Jeśli pojedyncza implementacja ERP próbuje pełnić obie role jednocześnie, nieuchronnie pojawią się problemy w projektowaniu i wdrażaniu tej struktury.

ODDZIELNE SZWO I PODSTAWOWE ZASTOSOWANIA

Istnieje wiele powodów prowadzących do podziału elementów architektonicznych. Być może najbardziej wymownym punktem w oddzielaniu różnych komponentów architektury jest to, że każdy komponent architektury ma swój własny pogląd. Podstawowa aplikacja służy innym celom niż ODS. Spróbuj nakładać się

podstawowy widok aplikacji na świat ODS lub odwrotnie nie jest uczciwym sposobem pracy.

W związku z tym pierwszym problemem ERP w CIF jest sprawdzenie, czy istnieje rozróżnienie między aplikacjami podstawowymi a ODS.

MODELE DANYCH W FIRMIE FABRYKA INFORMACJI

Aby osiągnąć spójność między różnymi komponentami architektury CIF, musi istnieć model dać. Modele dać służą jako łącznik między różnymi komponentami architektury, takimi jak podstawowe aplikacje i ODS. Modele dać stają się „intelektualną mapą drogową”, aby uzyskać właściwe znaczenie z różnych komponentów architektonicznych CIF.

Idąc ręka w rękę z tym pojęciem, idea jest taka, że powinien istnieć jeden duży i pojedynczy wzór dać. Oczywiście musi być wzór dać dla każdego z komponentów, a ponadto musi istnieć sensowna ścieżka łącząca różne modele. Każdy komponent architektury – ODS, aplikacje bazowe, hurtownia danych firmy itd. – potrzebuje własnego modelu dać. A więc musi istnieć precyzyjna definicja tego, w jaki sposób te modele dać komunikują się ze sobą.

PRZESUŃ I DATA Z DATY ERP MAGAZYN

Jeśli pochodzenie dać jest aplikacją bazową i/lub ODS, gdy ERP wstawia i dać w hurtownia danych, to wstawienie musi odbywać się na najniższym poziomie „ziarnistości”. Po prostu podsumuj lub zagreguj i dać gdy wychodzą z podstawowej aplikacji ERP lub ERP ODS, nie jest właściwą rzeczą. TO dać potrzebne są szczegóły w j hurtownia danych tworząc podstawę procesu DSS. Taki dać zostaną one przekształcone na wiele sposobów przez hurtownie danych i eksplorację hurtownia danych.

Przemieszczenie dać z podstawowego środowiska aplikacji ERP do hurtownia danych firmy odbywa się w dość zrelaksowany sposób. To przeniesienie ma miejsce około 24 godzin po aktualizacji lub utworzeniu w ERP. Fakt posiadania „leniwego” ruchu dać w hurtownia danych firmy pozwala na dać przychodzące z ERP do „rozliczenia”. Gdy dać są przechowywane w podstawowej aplikacji, możesz bezpiecznie przenieść dać ERP w przedsiębiorstwie. Kolejny cel, który można osiągnąć dzięki „leniwemu” ruchowi dać jest wyraźna granica między procesami operacyjnymi a DSS. Z „szybkim” ruchem dać granica między DSS a operacyjnym pozostaje niewyraźna.

Il movemento dei dać od ODS ERP do hurtownia danych firmy odbywa się okresowo, zwykle co tydzień lub co miesiąc. W tym przypadku ruch dać opiera się na potrzebie „oczyszczenia” starego dać historycy. Oczywiście ODS zawiera m.in dać które są znacznie nowsze niż dać historycy znaleźli się w hurtownia danych.

Przemieszczenie dać w hurtownia danych prawie nigdy nie odbywa się to „hurtowo” (w sposób hurtowy). Skopiuj tabelę ze środowiska ERP do hurtownia danych to nie ma sensu. O wiele bardziej realistycznym podejściem jest przeniesienie wybranych jednostek z dać, Tylko ja dać które uległy zmianie od ostatniej aktualizacji programu hurtownia danych to te, które należy przenieść do hurtownia danych. Jeden sposób, aby wiedzieć, które z nich dać uległy zmianie od czasu ostatniej aktualizacji, aby spojrzeć na sygnatury czasowe dać znaleźć w środowisku ERP. Projektant wybiera wszystkie zmiany, które nastąpiły od ostatniej aktualizacji. Innym podejściem jest użycie technik przechwytywania zmian dać. Za pomocą tych technik dzienniki i taśmy dziennika są analizowane w celu określenia, które z nich dać musi zostać przeniesiony ze środowiska ERP do tego z hurtownia danych. Te techniki są najlepsze, ponieważ dzienniki i taśmy dziennika można odczytywać z plików ERP bez dalszego wpływu na inne zasoby ERP.

INNE POWIKŁANIA

Jednym z problemów ERP w CIF jest to, co dzieje się z innymi źródłami aplikacji lub ai dać ODS, które muszą przyczyniać się do: hurtownia danych ale nie są częścią środowiska ERP. Biorąc pod uwagę zamknięty charakter ERP, zwłaszcza SAP, próbuje się integrować klucze z zewnętrznych źródeł dać z dać które pochodzą z ERP w momencie przenoszenia i dać w hurtownia danych, to duże wyzwanie. I jakie dokładnie są prawdopodobieństwa, że ja dać aplikacji lub ODS poza środowiskiem ERP zostaną zintegrowane z systemem hurtownia danych? Szanse są naprawdę bardzo duże.

ODKRYCIE DATA HISTORYKI Z ERP

Kolejny problem z dać ERP wynika z potrzeby posiadania dać historyczny w obrębie hurtownia danych. Zwykle hurtownia danych on potrzebuje dać historycy. A technologia ERP zwykle ich nie przechowuje dać historyczne, przynajmniej nie w takim zakresie, w jakim jest to konieczne w hurtownia danych. Kiedy duża ilość dać logi zaczynają się sumować w środowisku ERP, to środowisko wymaga oczyszczenia. Załóżmy na przykład, że a hurtownia danych powinien być załadowany pięcioma latami dać historyczne, podczas gdy ERP przechowuje maksymalnie sześć miesięcy dać. Tak długo, jak firma jest usatysfakcjonowana, aby zebrać pewną liczbę dać historycznych w miarę upływu czasu, nie ma problemu z wykorzystaniem ERP jako źródła dla hurtownia danych. Ale kiedy hurtownia danych musi cofnąć się w czasie i zabrać bogów dać rekordów, które wcześniej nie były gromadzone i zapisywane przez ERP, środowisko ERP staje się nieefektywne.

ERP I METADANE

Kolejna uwaga dotycząca ERP i hurtownia danych to ta na istniejących metadanych w środowisku ERP. Tak jak metadane przenoszą się ze środowiska ERP do hurtownia danych, metadane muszą zostać przeniesione w ten sam sposób. Ponadto metadane muszą zostać przekształcone do formatu i struktury wymaganej przez infrastrukturę hurtownia danych. Istnieje duża różnica między metadanymi operacyjnymi a metadanymi DSS. Metadane operacyjne są przeznaczone głównie dla programisty i dla

programista. Metadane DSS są przeznaczone przede wszystkim dla użytkownika końcowego. Istniejące metadane w aplikacjach ERP lub ODS wymagają konwersji, a ta konwersja nie zawsze jest łatwa i prosta.

POZYSKIWANIE DANYCH ERP

Jeśli ERP jest używany jako dostawca dać dla hurtownia danych musi istnieć solidny interfejs, który porusza i dać ze środowiska ERP do środowiska hurtownia danych. Interfejs musi:

▪ być łatwy w użyciu
▪ zezwolić na dostęp do dać ERP
▪ podchwycić znaczenie dać do których są przenoszone hurtownia danych
▪ znać ograniczenia ERP, które mogą wystąpić podczas uzyskiwania dostępu do dać ERP:
▪ integralność referencyjna
▪ relacje hierarchiczne
▪ niejawne relacje logiczne
▪ konwencja aplikacji
▪ wszystkie struktury dać obsługiwane przez ERP i tak dalej...
▪ być skutecznym w dostępie dać, dostarczać:
▪ bezpośredni ruch dać
▪ nabycie zmiany dać
▪ wspierać terminowy dostęp do dać
▪ zrozumieć format pliku dać, i tak dalej… INTERFEJS Z SAP Interfejs może być dwojakiego rodzaju, domowy lub komercyjny. Niektóre z głównych interfejsów komercyjnych obejmują:

▪ SAS
▪ Najlepsze rozwiązania
▪ D2k i tak dalej… RÓŻNE TECHNOLOGIE ERP Traktowanie środowiska ERP jako pojedynczej technologii to duży błąd. Istnieje wiele technologii ERP, z których każda ma swoje mocne strony. Najbardziej znani sprzedawcy na rynku to:

▪ SAP
▪ Finanse Oracle
▪ PeopleSoft
JD Edwardsa
▪ Baany SAP SAP to największe i najbardziej wszechstronne oprogramowanie ERP. Aplikacje SAP obejmują wiele typów aplikacji w wielu obszarach. SAP ma reputację:

▪ bardzo duże
▪ bardzo trudny i kosztowny w realizacji
▪ wymaga wielu ludzi i konsultantów do wdrożenia
▪ potrzebuje wyspecjalizowanych osób do wdrożenia
▪ wymaga dużo czasu na wdrożenie Również SAP ma reputację zapamiętywania dać ściśle, utrudniając dostęp do nich osobom spoza obszaru SAP. Siłą SAP jest to, że jest w stanie przechwytywać i przechowywać dużą ilość danych dać. Firma SAP ogłosiła niedawno zamiar rozszerzenia swoich aplikacji o hurtownia danych. Korzystanie z SAP jako dostawcy ma wiele zalet i wad hurtownia danych. Zaletą jest to, że SAP jest już zainstalowany i większość konsultantów jest już zaznajomiona z SAP.
Wady posiadania SAP jako dostawcy hurtownia danych jest wiele: SAP nie ma doświadczenia w świecie hurtownia danych Jeśli SAP jest dostawcą hurtownia danych, należy „wyjąć” tj dać z SAP al hurtownia danych. Dane historia SAP w zakresie zamkniętego systemu, jest mało prawdopodobne, aby było łatwo uzyskać w nim i od SAP (???). Istnieje wiele starszych środowisk wspierających SAP, takich jak IMS, VSAM, ADABAS, ORACLE, DB2 i tak dalej. SAP nalega na podejście „nie wynalezione tutaj”. SAP nie chce współpracować z innymi dostawcami w celu używania lub tworzenia hurtownia danych. SAP nalega na samodzielne generowanie całego swojego oprogramowania.

Chociaż SAP jest dużą i potężną firmą, fakt próby przepisania technologii ELT, OLAP, administracji systemem, a nawet bazy kodu dbm to po prostu szalone. Zamiast przyjmować postawę współpracy z dostawcami hurtownia danych Firma SAP od dawna stosuje podejście, które „zna najlepiej”. Taka postawa powstrzymuje sukces, jaki SAP mógłby odnieść w tej dziedzinie hurtownia danych.
Odmowa firmy SAP umożliwienia zewnętrznym dostawcom szybkiego i płynnego dostępu do ich produktów dać. Sama istota korzystania z hurtownia danych jest łatwy dostęp do dać. Cała historia SAP opiera się na utrudnianiu dostępu dać.
Brak doświadczenia SAP w radzeniu sobie z dużymi ilościami dać; w dziedzinie hurtownia danych są tomy dać nigdy nie widziałem z SAP i do obsługi tych dużych ilości dać musisz mieć odpowiednią technologię. SAP najwyraźniej nie zdaje sobie sprawy z istnienia tej bariery technologicznej, którą należy pokonać hurtownia danych.
Kultura korporacyjna SAP: Firma SAP zbudowała biznes polegający na uzyskaniu i dać z systemu. Ale żeby to zrobić, musisz mieć inną mentalność. Tradycyjnie firmy programistyczne, które były dobre w wprowadzaniu danych do środowiska, nie radziły sobie z przesyłaniem danych w drugą stronę. Jeśli SAPowi uda się dokonać tego typu zmiany, będzie to pierwsza firma, która tego dokona.

Krótko mówiąc, wątpliwe jest, czy firma powinna wybrać SAP jako dostawcę hurtownia danych. Z jednej strony istnieje bardzo poważne ryzyko, a z drugiej bardzo niewiele korzyści. Ale jest jeszcze jeden powód, który zniechęca do wyboru SAP jako dostawcy hurtownia danych. Bo każda firma powinna mieć to samo hurtownia danych wszystkich innych firm? The hurtownia danych jest sercem przewagi konkurencyjnej. Gdyby każda firma przyjęła to samo hurtownia danych osiągnięcie przewagi konkurencyjnej byłoby trudne, choć nie niemożliwe. SAP wydaje się myśleć, że a hurtownia danych mogą być postrzegane jako plik cookie i jest to kolejny znak ich mentalności polegającej na „pobieraniu danych w” aplikacjach.

Żaden inny dostawca ERP nie jest tak dominujący jak SAP. Niewątpliwie znajdą się firmy, które pójdą drogą SAP dla swoich hurtownia danych ale chyba te hurtownia danych SAP będą duże, drogie i czasochłonne w tworzeniu.

Te środowiska obejmują takie działania, jak obsługa kasjera bankowego, procesy rezerwacji linii lotniczych, procesy reklamacji ubezpieczeniowych i tak dalej. Im lepiej wykonywany był system transakcyjny, tym bardziej oczywista była potrzeba rozdzielenia procesu operacyjnego od DSS (System Wspomagania Decyzji). Jednak dzięki systemom kadrowym i kadrowym nigdy nie masz do czynienia z dużymi wolumenami transakcji. I oczywiście, kiedy osoba zostaje zatrudniona lub odchodzi z firmy, jest to zapis transakcji. Jednak w porównaniu z innymi systemami, systemy kadrowe i kadrowe po prostu nie obsługują wielu transakcji. Dlatego w systemach HR i kadrowych nie do końca jest oczywiste, że istnieje zapotrzebowanie na Hurtownię Danych. Pod wieloma względami systemy te są połączeniem systemów DSS.

Ale jest jeszcze jeden czynnik, który należy wziąć pod uwagę w przypadku hurtowni danych i oprogramowania PeopleSoft. W wielu kręgach, tj dać HR i zasoby osobowe są drugorzędne w stosunku do podstawowej działalności firmy. Większość firm zajmuje się produkcją, sprzedażą, świadczeniem usług i tak dalej. Systemy HR i kadrowe są zwykle drugorzędne (lub wspomagające) w stosunku do głównej linii biznesowej firmy. Dlatego jest to niejednoznaczne i niewygodne hurtownia danych osobne dla obsługi HR i zasobów osobistych.

Pod tym względem PeopleSoft bardzo różni się od SAP. W przypadku SAP obowiązkowe jest, aby istniał hurtownia danych. W przypadku PeopleSoft nie jest to takie oczywiste. Hurtownia danych jest opcjonalna w przypadku PeopleSoft.

Najlepsze, co można powiedzieć o dać PeopleSoft polega na tym, że hurtownia danych może służyć do archiwizacji i dać związane ze starymi zasobami ludzkimi i osobowymi. Drugi powód, dla którego firma chciałaby użyć hurtownia danych a

Wadą środowiska PeopleSoft jest umożliwienie dostępu i swobodny dostęp do narzędzi analitycznych, tj dać przez PeopleSoft. Ale poza tymi powodami mogą zaistnieć przypadki, w których lepiej nie mieć hurtowni danych dać PeopleSoft.

W podsumowaniu

Istnieje wiele pomysłów związanych z budową tzw hurtownia danych wewnątrz oprogramowania ERP.
Oto niektóre z nich:

▪ Sensowne jest posiadanie hurtownia danych kto wygląda jak każdy inny w branży?
▪ Jak elastyczny jest system ERP hurtownia danych oprogramowanie?
▪ ERP hurtownia danych oprogramowanie może obsłużyć ilość dać który znajduje się w „hurtownia danych arena"?
▪ Jakie rejestrowanie śledzenia wykonuje dostawca ERP w obliczu łatwej i niedrogiej, czasochłonnej sztucznej inteligencji dać? (jakie są osiągnięcia dostawców ERP w zakresie dostarczania niedrogich, terminowych i łatwo dostępnych danych?)
▪ Jak dostawca ERP rozumie architekturę DSS i korporacyjną fabrykę informacji?
▪ Dostawcy ERP rozumieją, jak je uzyskać dać w środowisku, ale także zrozumieć, jak je eksportować?
▪ Jak otwarty jest dostawca ERP na narzędzia do hurtowni danych?
Wszystkie te rozważania należy wziąć pod uwagę przy określaniu, gdzie umieścić hurtownia danych który będzie gospodarzem ja dać ERP i inne dać. Ogólnie rzecz biorąc, o ile nie ma ważnego powodu, aby postąpić inaczej, zaleca się budowanie hurtownia danych poza środowiskiem dostawcy ERP. ROZDZIAŁ 1 Przegląd kluczowych punktów organizacji BI:
Repozytoria informacji działają w odwrotny sposób niż architektura Business Intelligence (BI):
Kultura korporacyjna i IT mogą ograniczać powodzenie budowania organizacji BI.

Technologia nie jest już czynnikiem ograniczającym dla organizacji BI. Problemem dla architektów i planistów projektów nie jest to, czy technologia istnieje, ale to, czy potrafią skutecznie wdrożyć dostępną technologię.

Dla wielu firm m.in hurtownia danych to niewiele więcej niż pasywny depozyt, który dystrybuuje i dać dla użytkowników, którzy tego potrzebują. TEN dać są wyodrębniane z systemów źródłowych i wypełniane w strukturach docelowych przez hurtownia danych. dać można je również wyczyścić przy odrobinie szczęścia. Jednak żadna dodatkowa wartość nie jest dodawana ani gromadzona przez dać podczas tego procesu.

Zasadniczo pasywne dw w najlepszym razie zapewnia tylko i dać czyste i operacyjne dla stowarzyszeń użytkowników. Tworzenie informacji i zrozumienie analityczne są całkowicie zależne od użytkowników. Oceniając, czy DW (Hurtownia danych) czy sukces jest subiektywny. Jeśli oceniamy sukces na podstawie zdolności do skutecznego gromadzenia, integrowania i oczyszczania i dać korporacyjne na przewidywalnych zasadach, to tak, DW jest sukcesem. Z drugiej strony, jeśli spojrzymy na gromadzenie, konsolidację i wykorzystywanie informacji przez organizację jako całość, to DW jest porażką. DW zapewnia niewielką lub żadną wartość informacyjną. W rezultacie użytkownicy są zmuszani do robienia czegoś, tworząc w ten sposób silosy informacyjne. W tym rozdziale przedstawiono kompleksową wizję podsumowującą architekturę BI (Business Intelligence) przedsiębiorstwa. Zaczniemy od opisu BI, a następnie przejdziemy do dyskusji na temat projektowania i rozwoju informacji, a nie samego dostarczania dać do użytkowników. Dyskusje koncentrują się następnie na obliczeniu wartości twoich wysiłków BI. Na zakończenie określamy, w jaki sposób IBM odpowiada na wymagania architektury BI Twojej organizacji.

Opis architektury organizacja BI

Potężne, zorientowane na transakcje systemy informatyczne są obecnie na porządku dziennym w każdym dużym przedsiębiorstwie, skutecznie wyrównując szanse dla korporacji na całym świecie.

Jednak utrzymanie konkurencyjności wymaga teraz systemów analitycznych, które mogą zrewolucjonizować zdolność firmy do ponownego odkrywania i wykorzystywania informacji, które już posiada. Te systemy analityczne wywodzą się ze zrozumienia bogactwa dać dostępny. BI może poprawić wydajność wszystkich informacji w całym przedsiębiorstwie. Firmy mogą poprawiać relacje klient-dostawca, poprawiać rentowność produktów i usług, generować nowe i lepsze oferty, kontrolować ryzyko, a wśród wielu innych korzyści drastycznie obniżać wydatki. Dzięki BI Twoja firma wreszcie zaczyna wykorzystywać informacje o klientach jako atut konkurencyjny dzięki aplikacjom, które mają cele rynkowe.

Posiadanie odpowiednich środków biznesowych oznacza posiadanie ostatecznych odpowiedzi na kluczowe pytania, takie jak:

▪ Który z naszych klienci Czy sprawiają, że zarabiamy więcej, czy też powodują, że tracimy pieniądze?
▪ Gdzie mieszkają nasi najlepsi klienci w stosunku do sklep/ magazyn, w którym często bywają?
▪ Które z naszych produktów i usług można sprzedać najskuteczniej i komu?
▪ Jakie produkty można sprzedawać najefektywniej i komu?
▪ Która kampania sprzedażowa jest bardziej skuteczna i dlaczego?
▪ Które kanały sprzedaży są najbardziej efektywne dla jakich produktów?
▪ Jak możemy poprawić relacje z najlepszymi klienci? Większość firm ma dać ciężko odpowiedzieć na te pytania.
Systemy operacyjne generują duże ilości produktów, klientów i kosztów dać z punktów sprzedaży, rezerwacji, obsługi klienta i systemów wsparcia technicznego. Wyzwaniem jest wydobycie i wykorzystanie tych informacji. Wiele firm czerpie zyski tylko z małych ułamków swoich dać do analiz strategicznych.
I dać pozostałe, często połączone z i dać czerpanie ze źródeł zewnętrznych, takich jak raporty rządowe i inne kupione informacje, to kopalnia złota, która tylko czeka na odkrycie dać wystarczy je dopracować w kontekście informacyjnym Twojej organizacji.

Wiedzę tę można zastosować na kilka sposobów, począwszy od projektowania ogólnej strategii firmy po osobistą komunikację z dostawcami, poprzez call center, fakturowanie, Internet i inne punkty. Dzisiejsze środowisko biznesowe wymaga, aby DW i powiązane rozwiązania BI ewoluowały poza prowadzenie tradycyjnych struktur biznesowych. dać który ja dać znormalizowane na poziomie atomowym i „farmy gwiazd/kostek”.

Aby zachować konkurencyjność, konieczne jest połączenie tradycyjnych i zaawansowanych technologii w celu wspierania szerokiego środowiska analitycznego.
Wreszcie, ogólne otoczenie musi poprawiać wiedzę o firmie jako całości, upewniając się, że działania podjęte w wyniku przeprowadzonych analiz są przydatne, aby wszyscy na tym skorzystali.

Na przykład, powiedzmy, że oceniasz swoją klienci w kategoriach wysokiego lub niskiego ryzyka.
Niezależnie od tego, czy informacje te są generowane przez model eksploracji, czy w inny sposób, muszą zostać umieszczone w DW i udostępnione każdemu za pomocą dowolnego narzędzia dostępu, takiego jak raporty statyczne, arkusze kalkulacyjne, tabele lub przetwarzanie analityczne online (OLAP).

Jednak obecnie wiele tego typu informacji pozostaje w silosach dać osób lub działów generujących analizę. Organizacja jako całość ma niewielką lub żadną widoczność do zrozumienia. Tylko poprzez włączenie tego typu treści informacyjnych do DW przedsiębiorstwa można wyeliminować silosy informacyjne i podnieść poziom środowiska DW.
Istnieją dwie główne przeszkody w rozwoju organizacji BI.
Po pierwsze, mamy problem samej organizacji i jej dyscypliny.
Chociaż nie możemy pomóc w zmianach polityki organizacyjnej, możemy pomóc w zrozumieniu składników BI organizacji, jej architektury oraz sposobu, w jaki technologia IBM ułatwia jej rozwój.
Drugą barierą do pokonania jest brak zintegrowanej technologii i znajomości metody, która obejmuje całą przestrzeń BI, a nie tylko mały komponent.

IBM reaguje na zmiany w technologii integracji. Twoim obowiązkiem jest zapewnienie świadomego projektu. Ta architektura musi być rozwijana przy użyciu technologii wybranej do nieograniczonej integracji lub przynajmniej technologii zgodnej z otwartymi standardami. Ponadto kierownictwo Twojej firmy musi zapewnić, że przedsięwzięcie Bi jest realizowane zgodnie z harmonogramem, a nie pozwala na rozwój silosów informacyjnych, które wynikają z samolubnych programów lub celów.
Nie oznacza to, że środowisko BI nie jest wrażliwe na reagowanie na różne potrzeby i wymagania różnych użytkowników; zamiast tego oznacza to, że realizacja tych indywidualnych potrzeb i wymagań odbywa się z korzyścią dla całej organizacji BI.
Opis architektury organizacji BI można znaleźć na stronie 9 na rysunku 1.1. XNUMX. Architektura przedstawia bogatą mieszankę technologii i technik.
W tradycyjnym ujęciu architektura obejmuje następujące komponenty magazynowe

Warstwa atomowa.

To jest fundament, serce całego Dw, a więc i raportowania strategicznego.
I dać przechowywane tutaj zachowają historyczną integralność, raporty z dać i obejmują metryki pochodne, a także są czyszczone, integrowane i przechowywane przy użyciu modeli eksploracji.
Wszystkie późniejsze ich wykorzystanie dać i powiązane informacje pochodzą z tej struktury. To doskonałe źródło do wydobywania dać oraz dla raportów z ustrukturyzowanymi zapytaniami SQL

Depozyt operacyjny w wysokości dać lub baza raportów z dać(Operacyjny magazyn danych (ODS) lub raportowanie baza danych.)

To jest struktura dać specjalnie zaprojektowany do raportowania technicznego.

I dać przechowywane i zgłaszane powyżej tych struktur mogą ostatecznie rozprzestrzenić się do magazynu przez strefę postojową, gdzie mogłyby zostać wykorzystane do sygnalizacji strategicznej.

Miejsce postoju.

Pierwszy przystanek dla większości dać przeznaczona dla środowiska magazynowego to strefa organizacyjna.
Tutaj jestem dać są integrowane, czyszczone i przekształcane w dać zysków, które wypełnią strukturę magazynu

Targi randkowe.

Ta część architektury reprezentuje strukturę dać używany specjalnie dla OLAP. Obecność datamartów, jeśli i dać są one przechowywane w schematach gwiaździstych, na które się nakładają dać wielowymiarowe w środowisku relacyjnym lub w plikach dać własnościowe używane przez określoną technologię OLAP, taką jak DB2 OLAP Server, nie mają znaczenia.

Jedynym ograniczeniem jest to, że architektura ułatwia korzystanie z dać wielowymiarowy.
Architektura obejmuje również krytyczne technologie i techniki Bi, które wyróżniają się jako:

Analiza przestrzenna

Przestrzeń jest gratką informacyjną dla analityka i ma kluczowe znaczenie dla pełnego rozwiązania. Przestrzeń może reprezentować informacje o ludziach mieszkających w określonej lokalizacji, a także informacje o fizycznym położeniu tej lokalizacji w stosunku do reszty świata.

Aby przeprowadzić tę analizę, należy rozpocząć od powiązania informacji ze współrzędnymi szerokości i długości geograficznej. Nazywa się to „geokodowaniem” i musi być częścią procesu wyodrębniania, przekształcania i ładowania (ETL) na poziomie atomowym magazynu.

Eksploracja danych.

Ekstrakcja dać pozwala naszym firmom na zwiększenie liczby klienci, aby przewidywać trendy sprzedaży i umożliwiać zarządzanie relacjami z i klienci (CRM), wśród innych inicjatyw BI.

Ekstrakcja dać musi być zatem zintegrowany ze strukturami dać magazynu i wspierane przez procesy magazynowe w celu zapewnienia zarówno efektywnego, jak i efektywnego wykorzystania technologii i związanych z nią technik.

Jak wskazano w architekturze BI, Dwhouse na poziomie atomowym, podobnie jak datamarty, jest doskonałym źródłem dać do ekstrakcji. Te same właściwości muszą być również odbiorcami wyników ekstrakcji, aby zapewnić dostępność dla jak najszerszego grona odbiorców.

Agenci.

Istnieją różni „agenci”, którzy badają klienta pod kątem dowolnego punktu, takiego jak systemy operacyjne firmy i same dw. Tymi agentami mogą być zaawansowane sieci neuronowe wyszkolone do poznawania trendów w każdym punkcie, takich jak przyszłe zapotrzebowanie na produkty w oparciu o promocje sprzedaży, oparte na regułach silniki do reagowania na data zbieg okoliczności, a nawet zwykli agenci zgłaszający wyjątki kierownictwu najwyższego szczebla. Procesy te na ogół zachodzą w czasie rzeczywistym i dlatego muszą być ściśle powiązane z ruchem procesów dać. Wszystkie te struktury dać, technologie i techniki sprawią, że nie spędzisz nocy na tworzeniu organizacji swojego BI.

Ta aktywność będzie rozwijana stopniowo, dla małych punktów.
Każdy krok jest niezależnym wysiłkiem projektowym i jest określany jako iteracja w Twoim BI dw lub inicjatywie. Iteracje mogą obejmować wdrażanie nowych technologii, rozpoczynanie od nowych technik, dodawanie nowych ram dać , ładowanie I dać dodatkowe lub z rozszerzeniem analizy Twojego środowiska. Ten akapit jest omówiony bardziej szczegółowo w rozdziale 3.

Oprócz tradycyjnych ram DW i narzędzi BI istnieją inne aspekty organizacji BI, które należy zaprojektować, takie jak:

Punkty kontaktu z klientem (kontakt z klientem zwrotnica).

Jak w każdej nowoczesnej organizacji, istnieje wiele punktów kontaktu z klientem, które wskazują, jak zapewnić sobie pozytywne doświadczenia klienci. Istnieją tradycyjne kanały, takie jak sprzedawcy, operatorzy central telefonicznych, poczta bezpośrednia, reklamy multimedialne i drukowane, a także bardziej aktualne kanały, takie jak poczta elektroniczna i Internet, dać produkty z pewnym punktem styku muszą być pozyskiwane, transportowane, czyszczone, przetwarzane, a następnie zaludniane w obiektach dać BI.

Podstawy dać stowarzyszenia operacyjne i użytkowników (Operacyjne

bazy danych i społeczności użytkowników).
Na końcu punktów kontaktowych klienci znajdziesz podstawy dać zastosowanie społeczności firmowych i użytkowników. . TEN dać istniejące są dać tradycyjne, które muszą zostać zjednoczone i połączone z merge dać płynących z punktów styku w celu spełnienia niezbędnych informacji.

Analitycy. (Analitycy)

Głównym beneficjentem środowiska BI jest analityk. To on korzysta z obecnego wydobycia dać operacyjny, zintegrowany z różnymi źródłami dać , wzbogacony o funkcje takie jak analiza geograficzna (geokodowanie) i prezentowany w technologiach BI umożliwiających kopanie, OLAP, zaawansowane raportowanie SQL i analizę geograficzną. Podstawowym interfejsem analityka do środowiska raportowania jest portal BI.

Analityk nie jest jednak jedyną osobą, która korzysta z architektury BI.
Kierownictwo, duże stowarzyszenia użytkowników, a nawet partnerzy, dostawcy i i klienci powinni odnosić korzyści z BI w przedsiębiorstwie.

Pętla zwrotna.

Architektura BI to środowisko uczenia się. Charakterystyczną zasadą rozwoju jest dopuszczanie trwałych struktur dać być aktualizowane przez zastosowaną technologię BI i podjęte działania użytkownika. Przykładem jest scoring klienta.

Jeśli dział sprzedaży stosuje model eksploracji ocen klientów, takich jak korzystanie z nowej usługi, dział sprzedaży nie powinien być jedyną grupą odnoszącą korzyści z usługi.

Zamiast tego eksploracja modeli powinna być wykonywana jako naturalna część przepływu danych w przedsiębiorstwie, a oceny klientów powinny stać się integralną częścią kontekstu informacji hurtowni, widoczną dla wszystkich użytkowników. Bi-bI-centric IBM Suite zawierający DB2 UDB, DB2 OLAP Server zawiera najważniejsze komponenty technologiczne, zdefiniowane na rysunku 1.1.

Używamy architektury przedstawionej na tym rysunku z książki, aby zapewnić nam poziom ciągłości i zademonstrować, w jaki sposób każdy z produktów IBM pasuje do ogólnego schematu BI.

Dostarczanie treści informacyjnych (Providing Treść informacji)

Projektowanie, rozwijanie i wdrażanie środowiska BI to trudne zadanie. Projekt musi uwzględniać zarówno obecne, jak i przyszłe wymagania biznesowe. Rysunek architektury musi być kompleksowy, aby zawierał wszystkie wnioski wyciągnięte na etapie projektowania. Wykonanie musi być ukierunkowane na jeden cel: rozwój architektury BI formalnie przedstawionej w projekcie i opartej na wymaganiach biznesowych.

Szczególnie trudno jest twierdzić, że dyscyplina zapewni względny sukces.
Jest to proste, ponieważ środowiska BI nie tworzy się od razu, ale małymi krokami w czasie.

Jednak identyfikacja komponentów BI Twojej architektury jest ważna z dwóch powodów: Będziesz kierować wszystkimi późniejszymi decyzjami dotyczącymi architektury technicznej.
Będziesz w stanie świadomie zaplanować konkretne wykorzystanie technologii, nawet jeśli przez kilka miesięcy nie będziesz potrzebować tej technologii ponownie.

Dostateczne zrozumienie wymagań biznesowych wpłynie na rodzaj produktów, które nabędziesz dla swojej architektury.
Projektowanie i rozwój Twojej architektury zapewnia, że Twój magazyn jest

nie przypadek, a przemyślana, starannie skonstruowana reklama działać sztuki jako mozaiki technologii mieszanej.

Zaprojektuj treść informacji

Cały początkowy projekt musi koncentrować się i identyfikować główne komponenty BI, które będą potrzebne całemu środowisku teraz iw przyszłości.
Znajomość wymagań biznesowych jest ważna.

Nawet przed rozpoczęciem jakiegokolwiek formalnego planowania planista projektu może często od razu zidentyfikować jeden lub dwa komponenty.
Równowagi komponentów, które mogą być wymagane dla twojej architektury, nie można jednak łatwo znaleźć. W fazie projektowania główna część architektury wiąże sesję tworzenia aplikacji (JAD) z badaniem mającym na celu identyfikację wymagań biznesowych.

Czasami te wymagania można powierzyć narzędziom do tworzenia zapytań i raportowania.
Na przykład użytkownicy twierdzą, że jeśli chcą zautomatyzować raport bieżący, muszą wygenerować go ręcznie, integrując dwa raporty bieżące i dodając obliczenia pochodzące z połączenia dać.
Chociaż to wymaganie jest proste, definiuje pewną funkcjonalność funkcji, którą należy uwzględnić przy zakupie narzędzi do raportowania dla swojej organizacji.

Projektant musi również spełnić dodatkowe wymagania, aby uzyskać pełny obraz. Czy użytkownicy chcą subskrybować ten raport?
Czy podzestawy raportów są generowane i wysyłane e-mailem do różnych użytkowników? Chcesz zobaczyć ten raport w portalu firmowym? Wszystkie te wymagania są częścią prostej potrzeby zastąpienia ręcznego raportu zgodnie z wymaganiami użytkowników. Zaletą tego typu wymagań jest to, że wszyscy, użytkownicy i projektanci, są zaznajomieni z koncepcją raportów.

Istnieją jednak inne rodzaje firm, które musimy planować. Kiedy wymagania biznesowe są określone w formie strategicznych pytań biznesowych, doświadczony planista może łatwo rozpoznać wymagania wymiarowe i miary/fakty.

Jeśli użytkownicy JAD nie wiedzą, jak sformułować swoje wymagania w formie problemu biznesowego, projektant często podaje przykłady, aby pominąć rozpoczęcie sesji zbierania wymagań.
Doświadczony planista może pomóc użytkownikom zrozumieć nie tylko strategiczny biznes, ale także, jak go kształtować.
Podejście do zbierania wymagań zostało omówione w rozdziale 3; na razie chcemy tylko zwrócić uwagę na potrzebę projektowania pod kątem wszelkiego rodzaju wymagań BI.

Strategiczny problem biznesowy to nie tylko wymóg biznesowy, ale także wskazówka projektowa. Jeśli musisz odpowiedzieć na pytanie wielowymiarowe, musisz nauczyć się na pamięć, przedstawić dać wymiary, a jeśli potrzebujesz przechowywać i dać wielowymiarowy, musisz zdecydować, jakiego rodzaju technologię lub technikę zamierzasz zastosować.

Czy wdrażasz zarezerwowany schemat gwiazdy kostki, czy oba? Jak widać, nawet prosta sprawa biznesowa może znacząco wpłynąć na projekt. Ale tego typu wymagania biznesowe są powszechne i oczywiście przynajmniej przez doświadczonych planistów i projektantów projektów.

Odbyło się wystarczająco dużo dyskusji na temat technologii i obsługi OLAP, a dostępna jest szeroka gama rozwiązań. Do tej pory poruszyliśmy potrzebę połączenia prostego raportowania z wielowymiarowymi wymaganiami biznesowymi oraz tego, jak te wymagania wpływają na decyzje dotyczące architektury technicznej.

Ale jakie są wymagania, które nie są łatwo zrozumiałe dla użytkowników lub zespołu Dw? Czy kiedykolwiek będziesz potrzebować analizy przestrzennej (analiza przestrzenna)?
Modele górnicze dać Czy będą niezbędną częścią twojej przyszłości? Kto wie?

Należy zauważyć, że tego typu technologie nie są dobrze znane ogółowi użytkowników i członkom zespołu DW, po części może to wynikać z tego, że są one zazwyczaj obsługiwane przez niektórych wewnętrznych lub zewnętrznych ekspertów technicznych. Jest to skrajny przypadek problemów, jakie generują tego typu technologie. Jeśli użytkownicy nie potrafią opisać wymagań biznesowych lub sformułować ich w celu dostarczenia wskazówek projektantom, mogą pozostać niezauważeni lub, co gorsza, po prostu zignorowani.

Bardziej problematyczne staje się, gdy projektant i programista nie mogą rozpoznać zastosowania jednej z tych zaawansowanych, ale krytycznych technologii.
Jak często słyszeliśmy, jak Projektanci mówili: „Cóż, dlaczego nie odłożymy tego, dopóki nie zdobędziemy tej innej rzeczy? „Czy naprawdę interesują ich priorytety, czy po prostu unikają wymagań, których nie rozumieją? Najprawdopodobniej jest to drugie założenie. Załóżmy, że Twój zespół sprzedaży przekazał wymaganie biznesowe, jak pokazano na rysunku 1.3. Jak widać, wymaganie jest sformułowane w formie problemu biznesowego. Różnica między tym problemem a typowym problemem wymiarowym polega na odległości. W tym przypadku zespół sprzedaży chce znać co miesiąc całkowitą sprzedaż z produktów, magazynów i klienci którzy mieszkają w promieniu 5 mil od magazynu, w którym robią zakupy.

Niestety, projektanci lub architekci mogą po prostu zignorować komponent przestrzenny, mówiąc: „Mamy klienta, produkt i dać depozytu. Wstrzymajmy się z dystansem do kolejnej iteracji.

"Zła odpowiedź. Ten typ problemu biznesowego dotyczy BI. Stanowi głębsze zrozumienie naszej działalności i solidną przestrzeń analityczną dla naszych analityków. BI wykracza poza proste zapytania lub standardowe raporty, a nawet OLAP. Nie oznacza to, że te technologie nie są ważne dla twojego BI, ale same w sobie nie reprezentują środowiska BI.

Projekt uwzględniający kontekst informacyjny (Projektowanie treści informacyjnych)

Teraz, gdy zidentyfikowaliśmy wymagania biznesowe, które wyróżniają różne podstawowe komponenty, należy je uwzględnić w ogólnym rysunku architektonicznym. Niektóre komponenty BI są częścią naszych początkowych wysiłków, a niektóre zostaną wdrożone dopiero za kilka miesięcy.

Jednak wszystkie znane wymagania znajdują swoje odzwierciedlenie w projekcie, dzięki czemu w przypadku konieczności wdrożenia określonej technologii jesteśmy do tego przygotowani. Coś w projekcie będzie odzwierciedlać tradycyjne myślenie.

Ten zestaw dać służy do obsługi późniejszych zastosowań dać wymiar napędzany problemami biznesowymi, które zidentyfikowaliśmy. W miarę generowania dodatkowych dokumentów, takich jak opracowanie projektu dać, zaczniemy od sformalizowania jako i dać rozprzestrzeniają się w środowisku. Stwierdziliśmy potrzebę reprezentowania i dać wymiarowo, dzieląc je (według konkretnych potrzeb) na hurtownie danych.

Następne pytanie, na które należy odpowiedzieć, brzmi: w jaki sposób zostaną zbudowane te hurtownie danych?
Czy budujesz gwiazdy, aby wspierać kostki, czy tylko kostki, czy tylko gwiazdy? (lub prawe kostki lub prawe gwiazdy). Wygeneruj architekturę dla zależnych hurtowni danych, które wymagają dla wszystkich warstwy atomowej dać nabyty? Pozwól na pozyskanie niezależnych hurtowni danych mar dać bezpośrednio z systemów operacyjnych?

Jaką technologię kostki spróbujesz ujednolicić?

Masz ogromne ilości bogów dać wymagane do analizy wymiarowej, czy potrzebujesz cotygodniowych kostek krajowych sił sprzedaży, czy też jedno i drugie? Czy budujesz potężny obiekt, taki jak DB2 OLAP Server dla finansów lub kostki Cognos PowerPlay dla swojej organizacji sprzedaży lub jedno i drugie? Są to ważne decyzje dotyczące projektu architektonicznego, które będą miały wpływ na rozwój Twojego środowiska BI. Tak, zidentyfikowałeś potrzebę OLAP. Jak teraz zamierzasz przeprowadzić tego rodzaju technikę i technologię?

Jak niektóre z bardziej zaawansowanych technologii wpływają na twoje projekty? Załóżmy, że zidentyfikowałeś potrzebę przestrzenną w swojej organizacji. Teraz trzeba przypomnieć sobie edycje rysunków architektonicznych, nawet jeśli nie planuje się wykonywania elementów przestrzennych przez kilka miesięcy. Architekt musi dziś projektować w oparciu o to, co jest potrzebne. Przewiduj potrzebę analizy przestrzennej, która generuje, przechowuje, utrzymuje i zapewnia dostęp dać przestrzenny. To z kolei powinno służyć jako ograniczenie dotyczące rodzaju technologii oprogramowania i specyfikacji platformy, które możesz obecnie rozważyć. Na przykład system administracyjny Baza danych relacyjny (RDBMS), który utrzymujesz dla swojej warstwy atomowej, musi mieć dostępny solidny zasięg przestrzenny. Zapewniłoby to maksymalną wydajność podczas korzystania z obiektów geometrycznych i przestrzennych w aplikacjach analitycznych. Jeśli twój RDBMS nie może obsłużyć pliku dać (przestrzenno-centryczny) wewnętrznie, więc będziesz musiał ustalić Baza danych (przestrzenno-centryczny) zewnętrzny. To komplikuje zarządzanie problemami i pogarsza ogólną wydajność, nie wspominając o dodatkowych problemach tworzonych przez administratorów baz danych, ponieważ prawdopodobnie mają oni minimalne zrozumienie podstaw dać przestrzenne również. Z drugiej strony, jeśli Twój silnik RDMBS obsługuje wszystkie komponenty przestrzenne, a jego optymalizator jest świadomy specjalnych potrzeb (np.

Ponadto należy dostosować obszar przemieszczania i warstwę środowiska atomowego, aby uwzględnić czyszczenie adresu (a

kluczowym elementem analizy przestrzennej), a także późniejsze zapisywanie obiektów przestrzennych. Sukcesja wydań projektowych trwa teraz, gdy wprowadziliśmy pojęcie czystości adresu. Po pierwsze, ta aplikacja będzie dyktować rodzaj oprogramowania potrzebnego do działań związanych z ETL.

Czy potrzebujesz produktów takich jak Trillium, aby zapewnić czysty adres lub wybranego przez Ciebie dostawcę ETL, który zapewni tę funkcjonalność?
Na razie ważne jest, abyś docenił poziom projektowania, który należy ukończyć, zanim zaczniesz konserwować swój magazyn. Powyższe przykłady powinny zademonstrować mnogość decyzji projektowych, które muszą nastąpić po zidentyfikowaniu konkretnego wymagania biznesowego. Prawidłowo podjęte decyzje projektowe promują współzależność między fizycznymi strukturami środowiska, wyborem używanej technologii i przepływem propagacji treści informacyjnych. Bez tej konwencjonalnej architektury BI Twoja organizacja będzie podlegać chaotycznej mieszance istniejących technologii, w najlepszym razie luźno powiązanych ze sobą, aby zapewnić pozorną stabilność.

Utrzymuj zawartość informacyjną

Wniesienie wartości informacji do Twojej organizacji to bardzo trudne zadanie. Bez wystarczającego zrozumienia i doświadczenia lub odpowiedniej inżynierii i projektu nawet najlepsze zespoły poniosłyby porażkę. Z drugiej strony, jeśli masz świetną intuicję i szczegółowy projekt, ale nie masz dyscypliny do wykonania, po prostu zmarnowałeś pieniądze i czas, ponieważ twój wysiłek jest skazany na niepowodzenie. Przesłanie powinno być jasne: jeśli brakuje Ci jednej lub więcej z tych umiejętności, zrozumienia/doświadczenia lub dyscypliny planowania/projektowania lub wdrażania, doprowadzi to do paraliżu lub zniszczenia budynku organizacji BI.

Czy Twój zespół jest wystarczająco przygotowany? Czy ktokolwiek w Twoim zespole BI rozumie rozległy krajobraz analityczny dostępny w środowiskach BI oraz techniki i technologie potrzebne do utrzymania tego krajobrazu? Czy jest ktoś w twoim zespole, kto potrafi dostrzec różnicę w stosowaniu zaawansowanych

raportowanie statyczne i OLAP, czyli różnice między ROLAP a OLAP? Czy jeden z członków Twojego zespołu wyraźnie rozpoznaje sposób wydobycia i jego wpływ na magazyn lub sposób, w jaki magazyn może wspierać wydajność wydobycia? Członek zespołu rozumie wartość dać technologia kosmiczna czy agentowa? Czy masz kogoś, kto docenia unikalną aplikację narzędziową technologii ETL vs Message Broker? Jeśli go nie masz, zdobądź go. BI jest znacznie większy niż znormalizowana warstwa atomowa, OLAP, schematy gwiazd i ODS.

Zrozumienie i doświadczenie w rozpoznawaniu wymagań BI i ich rozwiązań jest niezbędne do prawidłowego sformalizowania potrzeb użytkowników oraz zaprojektowania i wdrożenia ich rozwiązań. Jeśli społeczność użytkowników ma trudności z opisaniem wymagań, zadaniem zespołu magazynu jest zapewnienie zrozumienia. Ale jeśli zespół magazynu

nie rozpoznaje konkretnego zastosowania BI – na przykład eksploracji danych – to nie jest najlepiej, gdy środowiska BI są często ograniczone do bycia pasywnymi repozytoriami. Jednak ignorowanie tych technologii nie umniejsza ich znaczenia i wpływu, jaki wywierają na pojawienie się możliwości analizy biznesowej Twojej organizacji, a także zasobu informacyjnego, który planujesz wypromować.

Projekt musi zawierać pojęcie rysunku, a oba wymagają kompetentnej osoby. Ponadto planowanie wymaga zespołowej filozofii magazynu i zgodności ze standardami. Na przykład, jeśli Twoja firma ustanowiła standard platformy lub zidentyfikowała konkretny RDBMS, który chce ustandaryzować na całej platformie, konieczne jest, aby wszyscy w zespole przestrzegali tych standardów. Ogólnie rzecz biorąc, zespół wyraża potrzebę standaryzacji (do społeczności użytkowników), ale sam zespół nie chce przestrzegać standardów ustanowionych w innych obszarach firmy, a może nawet w podobnych firmach. Jest to nie tylko hipokryzja, ale pokazuje, że firma nie jest w stanie wykorzystać istniejących zasobów i inwestycji. Nie oznacza to, że nie istnieją sytuacje, które uzasadniają niestandaryzowaną platformę lub technologię; jednak wysiłki magazynu

powinni zazdrośnie strzec standardów przedsiębiorstwa, dopóki wymagania biznesowe nie nakazują inaczej.

Trzecim kluczowym elementem potrzebnym do zbudowania organizacji BI jest dyscyplina.
Zależy to w sumie, w równym stopniu od jednostek, jak i od środowiska. Planiści projektów, sponsorzy, architekci i użytkownicy muszą docenić dyscyplinę wymaganą do budowania zasobów informacyjnych firmy. Projektanci muszą ukierunkować swoje wysiłki projektowe na uzupełnienie innych wysiłków potrzebnych w społeczeństwie.

Załóżmy na przykład, że Twoja firma buduje aplikację ERP zawierającą komponent magazynowy.
Dlatego zadaniem projektantów ERP jest taka współpraca z zespołem środowiska magazynowego, aby nie konkurować i nie powielać już rozpoczętej pracy.

Dyscyplina jest również tematem, którym musi zająć się cała organizacja i jest zwykle ustanawiana i nakazywana na szczeblu kierowniczym.
Czy kierownictwo jest skłonne stosować się do zaprojektowanego podejścia? Podejście, które obiecuje tworzenie treści informacyjnych, które ostatecznie dostarczą wartości wszystkim obszarom przedsiębiorstwa, ale być może narazi na szwank indywidualne lub działowe plany? Pamiętaj o powiedzeniu „Myślenie o wszystkim jest ważniejsze niż myślenie o jednej rzeczy”. To powiedzenie odnosi się do organizacji BI.

Niestety, wiele hurtowni koncentruje swoje wysiłki na próbach ukierunkowania i dostarczania wartości do określonego działu lub określonych użytkowników, nie zwracając uwagi na całą organizację. Załóżmy, że kierownik prosi o pomoc zespół magazynu. Zespół odpowiada 90-dniowym wysiłkiem, który obejmuje nie tylko spełnienie wymagań dotyczących powiadomień określonych przez kierownictwo, ale także zapewnienie, że wszystkie dać zasady są mieszane do poziomu atomowego przed wprowadzeniem do proponowanej technologii kostki.
Ten dodatek inżynieryjny gwarantuje, że przedsiębiorstwo magazynowe odniesie korzyści z dać niezbędne dla kierownika.
Jednak dyrektor rozmawiał z zewnętrznymi firmami konsultingowymi, które zaproponowały podobną aplikację z dostawą w mniej niż 4 tygodnie.

Zakładając, że wewnętrzny zespół magazynu jest kompetentny, kierownik ma wybór. Kto może wesprzeć dodatkową dziedzinę inżynierii potrzebną do rozbudowy zasobów informacyjnych przedsiębiorstwa lub może zdecydować się na szybkie zbudowanie własnego rozwiązania. To drugie wydaje się być wybierane zbyt często i służy jedynie do tworzenia pojemników informacji, z których korzystają nieliczni lub poszczególni.

Cele krótko- i długoterminowe

Architekci i planiści projektów muszą sformalizować długoterminową wizję ogólnej architektury i plany rozwoju organizacji BI. Ta kombinacja krótkoterminowego zysku i długoterminowego planowania to dwie strony wysiłków BI. Przychody krótkookresowe to aspekt BI powiązany z iteracjami Twojego magazynu.

To tutaj planiści, architekci i sponsorzy koncentrują się na spełnieniu określonych wymagań biznesowych. Na tym poziomie buduje się struktury fizyczne, kupuje technologię i wdraża techniki. W żadnym wypadku nie są one tworzone w celu spełnienia określonych wymagań określonych przez określone społeczności użytkowników. Wszystko odbywa się w celu zaspokojenia konkretnych wymagań określonych przez konkretną społeczność.
Dalekosiężne planowanie to jednak drugi aspekt BI. To tam plany i projekty zapewniały, że każda fizyczna konstrukcja została zbudowana, wybrane technologie i wykonane techniki wykonane z myślą o przedsięwzięciu. To długoterminowe planowanie zapewnia spójność niezbędną do zapewnienia, że trwałe zyski wynikają z wszelkich znalezionych korzyści krótkoterminowych.

Uzasadnij swój wysiłek BI

Un hurtownia danych samo w sobie nie ma żadnej wartości. Innymi słowy, nie ma nieodłącznej wartości między technologiami magazynowymi a technikami wdrażania.

Wartość każdego wysiłku magazynowego tkwi w działaniach podejmowanych w wyniku środowiska magazynowego i treści informacyjnych kultywowanych w czasie. Jest to krytyczny punkt, który należy zrozumieć, zanim podejmie się próbę oszacowania wartości jakiejkolwiek inicjatywy „gdzieś w domu”.

Zbyt często architekci i planiści próbują nadać wartość fizycznym i technicznym komponentom magazynu, podczas gdy w rzeczywistości wartość ta jest zakorzeniona w procesach biznesowych, na które magazyn i dobrze zebrane informacje pozytywnie wpływają.

Oto wyzwanie dla założenia BI: Jak uzasadnić inwestycję? Jeśli sam magazyn nie ma wartości wewnętrznej, planiści projektu muszą zbadać, zdefiniować i sformalizować korzyści dla tych osób, które będą korzystać z magazynu w celu usprawnienia określonych procesów biznesowych lub wartości chronionych informacji, lub obu.

Aby skomplikować sprawę, każdy proces biznesowy, na który mają wpływ prace magazynowe, może przynieść „znaczące” lub „łagodne” korzyści. Znaczące korzyści zapewniają namacalną miarę pomiaru zwrotu z inwestycji (ROI) — na przykład obrót zapasami o dodatkowy czas w określonym okresie lub niższy koszt transportu na przesyłkę. Trudniej jest zdefiniować subtelne korzyści, takie jak lepszy dostęp do informacji, w kategoriach wymiernej wartości.

Połącz swój projekt, aby dowiedzieć się o Żądania biznesowe

Zbyt często planiści projektów próbują powiązać wartość magazynu z amorficznymi celami przedsiębiorstwa. Deklarując, że „wartość magazynu opiera się na naszej zdolności do zaspokojenia strategicznych próśb” w przyjemny sposób otwieramy dyskusję. Jednak samo to nie wystarczy, aby stwierdzić, czy inwestowanie w magazyn ma sens. Najlepiej jest łączyć przedstawicieli magazynu z konkretnymi zapytaniami biznesowymi i notatkami.

Zmierz ROI

Obliczanie zwrotu z inwestycji w warunkach magazynowych może być szczególnie trudne. Jest to szczególnie trudne, jeśli prowadzi

danego powtórzenia jest czymś nienamacalnym lub łatwym do zmierzenia. Jedno z badań wykazało, że użytkownicy dostrzegają dwie główne korzyści płynące z inicjatyw BI:

▪ Stwórz umiejętność podejmowania decyzji
▪ Stwórz dostęp do informacji
Świadczenia te są świadczeniami miękkimi (lub łagodnymi). Łatwo jest zobaczyć, w jaki sposób możemy obliczyć zwrot z inwestycji w oparciu o twardą (lub większą) korzyść, taką jak obniżony koszt transportu, ale jak zmierzyć zdolność do podejmowania lepszych decyzji?
Jest to zdecydowanie wyzwanie dla planistów projektów, gdy próbują skłonić firmę do zainwestowania w konkretny magazyn. Rosnąca sprzedaż lub spadające koszty nie są już głównymi tematami napędzającymi środowisko BI.
Zamiast tego szukasz wniosków biznesowych o lepszy dostęp do informacji, aby określony dział mógł szybciej podejmować decyzje. Są to czynniki strategiczne, które są równie ważne dla przedsiębiorstwa, ale są bardziej niejednoznaczne i trudniejsze do scharakteryzowania za pomocą namacalnych wskaźników. W takim przypadku obliczenie zwrotu z inwestycji może być mylące, jeśli nie nieistotne.
Projektanci muszą być w stanie wykazać namacalną wartość dla kadry kierowniczej, aby zdecydować, czy inwestycja w konkretną iterację jest tego warta. Nie zaproponujemy jednak nowej metody obliczania ROI ani nie przedstawimy żadnych argumentów za lub przeciw.
Dostępnych jest wiele artykułów i książek omawiających podstawy obliczania ROI. Istnieją specjalne propozycje wartości, takie jak wartość inwestycji (VOI), oferowane przez grupy takie jak Gartner, które można zbadać. Zamiast tego skupimy się na podstawowych aspektach wszelkich zwrotów z inwestycji lub innych propozycji wartości, które należy wziąć pod uwagę. Stosowanie zwrotu z inwestycji Oprócz sporu o „twarde” kontra „miękkie” korzyści związane z BI, istnieją inne kwestie, które należy wziąć pod uwagę przy stosowaniu zwrotu z inwestycji. Na przykład:

Przypisywanie zbyt wielu oszczędności wysiłkom DW, które i tak by nadeszły
Załóżmy, że Twoja firma przeszła z architektury mainframe do rozproszonego środowiska UNIX. Tak więc wszelkie oszczędności, które mogą (lub nie mogą) zostać osiągnięte dzięki temu wysiłkowi, nie powinny być przypisywane wyłącznie, jeśli w ogóle (?), Magazynowi.

Nieuwzględnianie wszystkiego jest drogie. Jest wiele rzeczy, które należy wziąć pod uwagę. Rozważ następującą listę:

▪ Koszt uruchomienia, w tym wykonalność.
▪ Koszt dedykowanego sprzętu wraz z powiązaną pamięcią masową i komunikacją
▪ Koszt oprogramowania, w tym zarządzanie dać i rozszerzenia klient/serwer, oprogramowanie ETL, technologie DSS, narzędzia do wizualizacji, aplikacje do planowania i przepływu pracy oraz oprogramowanie do monitorowania, .
▪ Koszt projektu konstrukcji dać, z tworzeniem i optymalizacją
▪ Koszt tworzenia oprogramowania bezpośrednio związany z pracami BI
▪ Koszt wsparcia domowego, w tym optymalizacja wydajności, w tym kontrola wersji oprogramowania i operacje pomocy Zastosuj zwrot z inwestycji „Big-Bang”. Budowa magazynu jako jednorazowy, gigantyczny wysiłek jest z góry skazana na niepowodzenie, tak samo kalkuluje się zwrot z inwestycji dla inicjatywy dużego przedsiębiorstwa. Oferta jest zaskakująca, a planiści wciąż podejmują mizerne próby oszacowania wartości całego nakładu. Dlaczego planiści próbują nadać inicjatywie biznesowej wartość pieniężną, skoro powszechnie wiadomo i akceptuje się, że oszacowanie konkretnych iteracji jest trudne? Jak to jest możliwe? Nie jest to możliwe z małymi wyjątkami. Nie rób tego. Teraz, gdy ustaliliśmy, czego nie należy robić podczas obliczania ROI, oto kilka punktów, które pomogą Ci ustanowić niezawodny proces szacowania wartości Twoich wysiłków BI.

Uzyskanie zgody ROI. Bez względu na wybraną technikę szacowania wartości wysiłków BI, musi ona zostać uzgodniona przez wszystkie strony, w tym planistów projektów, sponsorów i kadrę kierowniczą korporacji.

Podziel ROI na możliwe do zidentyfikowania części. Niezbędnym krokiem w kierunku rozsądnego obliczenia zwrotu z inwestycji jest skoncentrowanie tych obliczeń na konkretnym projekcie. Pozwala to następnie oszacować wartość na podstawie określonych wymagań biznesowych, które zostały spełnione

Zdefiniuj koszty. Jak wspomniano, należy wziąć pod uwagę wiele kosztów. Dodatkowo koszty muszą obejmować nie tylko te związane z pojedynczą iteracją, ale także koszty związane z zapewnieniem zgodności ze standardami przedsiębiorstwa.

Zdefiniuj korzyści. Poprzez wyraźne powiązanie zwrotu z inwestycji z określonymi wymaganiami biznesowymi, powinniśmy być w stanie zidentyfikować korzyści, które doprowadzą do spełnienia wymagań.

Zmniejsz koszty i korzyści w nieuchronnych zyskach. Jest to najlepszy sposób na oparcie wyceny na wartości bieżącej netto (NPV), w przeciwieństwie do prób przewidywania przyszłej wartości w przyszłych zarobkach.

Skróć czas do podziału zwrotu z inwestycji do minimum. Jest to dobrze udokumentowane w dłuższej perspektywie czasu, w którym zostało użyte w ROI.

Użyj więcej niż jednej formuły ROI. Istnieje wiele metod przewidywania zwrotu z inwestycji i należy zaplanować użycie jednej lub więcej z nich, w tym wartości bieżącej netto, wewnętrznej stopy zwrotu (IRR) i zwrotu z inwestycji.

Zdefiniuj powtarzalny proces. Ma to kluczowe znaczenie dla obliczenia wartości długoterminowej. Pojedynczy powtarzalny proces powinien być udokumentowany dla wszystkich kolejnych podsekwencji projektu.

Wymienione problemy to najczęstsze problemy definiowane przez ekspertów ds. środowiska hali magazynowej. Naleganie kierownictwa na osiągnięcie „wielkiego wybuchu” zwrotu z inwestycji jest bardzo mylące. Jeśli zaczniesz wszystkie obliczenia zwrotu z inwestycji od rozbicia ich na możliwe do zidentyfikowania, namacalne części, masz duże szanse na oszacowanie dokładnego oszacowania zwrotu z inwestycji.

Pytania o korzyści z zwrotu z inwestycji

Jakiekolwiek są twoje korzyści, miękkie czy twarde, możesz użyć kilku podstawowych pytań, aby określić ich wartość. Na przykład używając prostego systemu skali, od 1 do 10, możesz zmierzyć wpływ każdego wysiłku za pomocą następujących pytań:

Jak oceniasz zrozumienie dać śledzisz ten projekt swojej firmy?
Jak oceniasz usprawnienia procesów w wyniku tego projektu?
Jak zmierzyłbyś wpływ nowych spostrzeżeń i wniosków udostępnionych teraz w ramach tej iteracji
Jaki był wpływ nowych i lepszych środowisk komputerowych w wyniku tego, czego się nauczyliśmy? Jeśli odpowiedzi na te pytania jest niewiele, możliwe, że przedsięwzięcie nie jest warte poczynionej inwestycji. Pytania z wysokimi punktami wskazują na znaczny wzrost wartości i powinny służyć jako wskazówki do dalszych badań. Na przykład wysoka ocena za ulepszenia procesów powinna skłonić projektantów do zbadania, w jaki sposób procesy zostały ulepszone. Może się okazać, że niektóre lub wszystkie osiągnięte zyski są namacalne i dlatego można łatwo zastosować wartość pieniężną. Maksymalne wykorzystanie pierwszej iteracji magazyn Największy zysk z wysiłku przedsiębiorstwa jest często w pierwszych kilku iteracjach. Te wczesne wysiłki tradycyjnie ustanawiają najbardziej użyteczną treść informacyjną dla ogółu społeczeństwa i pomagają stworzyć podstawę technologiczną dla kolejnych aplikacji BI. Zwykle każdy kolejny podsekwencja dać projektów magazynowych przynosi coraz mniejszą wartość dodaną dla całego przedsiębiorstwa. Jest to szczególnie prawdziwe, jeśli iteracja nie dodaje nowych tematów ani nie spełnia potrzeb nowej społeczności użytkowników.

Ta funkcja przechowywania dotyczy również rosnących stosów dać historycy. Ponieważ kolejne wysiłki wymagają więcej dać i jak więcej dać z czasem wlewają się do magazynu, najwięcej dać staje się mniej istotny dla stosowanej analizy. Te dać często się nazywają dać uśpione i utrzymywanie ich jest zawsze drogie, ponieważ prawie nigdy nie są używane.

Co to oznacza dla sponsorów projektów? Zasadniczo pierwsi sponsorzy dzielą się czymś więcej niż tylko kosztami inwestycji. Jest to pierwszorzędne, ponieważ są one impulsem do powstania szerokiej warstwy otoczenia technologicznego i zasobowego magazynu, w tym organicznego.

Ale te pierwsze kroki mają największą wartość i dlatego projektanci często muszą uzasadniać inwestycję.
Projekty wykonane po Twojej inicjatywie BI mogą mieć niższe (w porównaniu z pierwszym) i bezpośrednie koszty, ale wnoszą mniejszą wartość dla przedsiębiorstwa.

A właściciele organizacji muszą zacząć rozważać rzucenie nagromadzenia dać i mniej odpowiednie technologie.

Eksploracja danych: Wydobycie Dać

Wiele komponentów architektury wymaga różnych technologii i technik eksploracji danych —
na przykład różni „agenci” zajmujący się badaniem interesujących miejsc klienci, systemy operacyjne firmy i dla tego samego dw. Tymi agentami mogą być zaawansowane sieci neuronowe wytrenowane na podstawie trendów, takich jak przyszły popyt na produkty w oparciu o promocje sprzedaży; oparte na regułach silniki do reagowania na zestaw data okoliczności, na przykład diagnoza medyczna i zalecenia dotyczące leczenia; lub nawet zwykli agenci, których rolą jest zgłaszanie wyjątków kierownictwu najwyższego szczebla. Ogólnie te procesy ekstrakcji dać si

weryfikować w czasie rzeczywistym; dlatego muszą być całkowicie zjednoczeni z ruchem dać Stessi.

Przetwarzanie analityczne online

Analityka online

Możliwość krojenia, krojenia w kostkę, toczenia, drążenia i przeprowadzania analiz
co-jeśli, mieści się w zakresie pakietu technologii IBM. Na przykład dla DB2 istnieją funkcje przetwarzania analitycznego online (OLAP), które wprowadzają analizę wymiarową do silnika programu baza danych podobnie.

Funkcje dodają wielowymiarową użyteczność do SQL, jednocześnie czerpiąc wszystkie korzyści z bycia naturalną częścią DB2. Innym przykładem integracji OLAP jest narzędzie wyodrębniające DB2 OLAP Analyzer Server. Ta technologia umożliwia szybkie i automatyczne skanowanie kostek DB2 OLAP Server w celu zlokalizowania i raportowania wartości dać niezwykłe lub nieoczekiwane dla dowolnej kostki dla analityka handlowego. I wreszcie, funkcje DW Center zapewniają architektom środki do sprawdzania między innymi profilu serwera kostek DB2 OLAP jako naturalnej części procesów ETL.

Analiza przestrzenna Analiza przestrzenna

Przestrzeń reprezentuje połowę kotwic analitycznych (przewodników) niezbędnych do wykonania panoramy
szerokie analityczne (czas reprezentuje drugą połowę). Poziom atomowy magazynu, przedstawiony na rysunku 1.1, obejmuje podstawy zarówno czasu, jak i przestrzeni. Analizy zakotwiczenia znaczników czasu według czasu i analizy zakotwiczenia informacji adresowych według przestrzeni. Znaczniki czasu przeprowadzają analizę według czasu, a informacje adresowe przeprowadzają analizę według przestrzeni. Diagram przedstawia geokodowanie — proces przekształcania adresów w punkty na mapie lub punkty w przestrzeni, tak aby w analizie można było wykorzystać pojęcia takie jak odległość i wnętrze/zewnętrze — przeprowadzane na poziomie atomowym i udostępniane analitykowi analizy przestrzenne. IBM dostarcza rozszerzenia przestrzenne, opracowane we współpracy z Environmental System Research Institute (ESRI), al baza danych DB2, dzięki czemu obiekty przestrzenne mogą być utrzymywane jako normalna część baza danych relacyjny. DB2

Przedłużacze przestrzenne zapewniają również wszystkie rozszerzenia SQL, aby skorzystać z analizy przestrzennej. Na przykład rozszerzenia SQL do zapytania
odległości między adresami lub tego, czy punkt znajduje się wewnątrz, czy na zewnątrz zdefiniowanego obszaru wielokątnego, są standardem analitycznym w rozszerzeniu przestrzennym. Więcej informacji znajduje się w rozdziale 16.

Baza danych-Resident Tools Tools Baza danych-Rezydent

DB2 ma wiele funkcji rezydentnych SQL BI, które pomagają w działaniu analizowania. Obejmują one:

Funkcje rekurencji do przeprowadzania analiz, takie jak „znajdź wszystkie możliwe tory lotu z San Francisco a I Love New York".
Funkcje analityczne służące do tworzenia rankingów, funkcji kumulatywnych, kostkowych i zbiorczych, ułatwiające zadania, które normalnie występują tylko w technologii OLAP, są teraz naturalną częścią silnika baza danych
Możliwość tworzenia tabel zawierających wyniki
Sprzedawcy baza danych liderzy łączą więcej funkcji BI w baza danych samo.
Główni dostawcy Baza danych mieszają więcej funkcji BI w baza danych samo.
Zapewnia to lepszą wydajność i więcej opcji wykonania dla rozwiązań BI.
Cechy i funkcje DB2 V8 zostały szczegółowo omówione w następujących rozdziałach:
Podstawy architektury technicznej i zarządzania danymi (rozdział 5)

Podstawy DB2 BI (rozdział 6)
Zmaterializowane tabele zapytań DB2 (rozdział 7)
Funkcje DB2 OLAP (rozdział 13)
Cechy i funkcje rozszerzonej analizy biznesowej DB2 (rozdział 15) Uproszczony system dostarczania danych System dostaw dać uproszczony

Architektura przedstawiona na rysunku 1.1 obejmuje liczne struktury dać fizyczny. Jednym z nich jest magazyn dać operacyjny. Ogólnie ODS jest zorientowany obiektowo, zintegrowany i aktualny. Zbudowałbyś ODS do obsługi np. biura sprzedaży. Uzupełnieniem byłaby sprzedaż ODS dać z wielu różnych systemów, ale przechowuje np. tylko dzisiejsze transakcje. ODS można również aktualizować wiele razy dziennie. Jednocześnie procesy popychają i dać zintegrowane z innymi aplikacjami. Ta struktura jest specjalnie zaprojektowana do integracji dać aktualny i dynamiczny i byłby prawdopodobnie kandydatem do wspierania analiz w czasie rzeczywistym, takich jak udostępnianie agentów usług klienci aktualne informacje o sprzedaży klienta poprzez wyodrębnienie informacji o trendach sprzedaży z samego magazynu. Inna struktura pokazana na rysunku 1.1 jest stanem formalnym dw. Jest to nie tylko miejsce do wykonania niezbędnej integracji, jakości dać, oraz przekształcenia dać magazynu przychodzącego, ale jest również niezawodnym i tymczasowym miejscem składowania dać powtórzeń, które można wykorzystać w analizie w czasie rzeczywistym. Jeśli zdecydujesz się użyć ODS lub miejsca postoju, jedno z najlepszych narzędzi do wypełnienia tych struktur dać korzystanie z różnych źródeł operacyjnych to heterogeniczne rozproszone zapytanie DB2. Ta funkcja jest zapewniana przez opcjonalną funkcję DB2 o nazwie DB2 Relational Connect (tylko zapytania) oraz przez DB2 DataJoiner (oddzielny produkt, który udostępnia możliwości zapytań, wstawiania, aktualizacji i usuwania w heterogenicznych rozproszonych systemach RDBMS).

Ta technologia pozwala architektom na: dać wiązać dać produkcji z procesami analitycznymi. Technologia może nie tylko dostosować się do praktycznie każdego zapotrzebowania na replikację, które może pojawić się w przypadku analiz w czasie rzeczywistym, ale może również łączyć się z szeroką gamą dać najpopularniejsze, w tym DB2, Oracle, Sybase, SQL Server, Informix i inne. Programu DB2 DataJoiner można użyć do wypełnienia struktury dać formalne, takie jak ODS, a nawet stały stół reprezentowany w magazynie przeznaczony do szybkiego odzyskiwania natychmiastowych aktualizacji lub na sprzedaż. Oczywiście same te struktury dać można wypełnić za pomocą

kolejna ważna technologia przeznaczona do replikacji dać, Relacyjny IBM DataPropagator. (DataPropagator to oddzielny produkt dla systemów centralnych. DB2 UNIX, Linux, Windows i OS/2 obejmują usługi replikacji dać w standardzie).
Inna metoda poruszania dać wokół przedsiębiorstwa działa integrator aplikacji korporacyjnych zwany inaczej brokerem wiadomości.Ta unikalna technologia umożliwia niezrównaną kontrolę nad celowaniem i przenoszeniem dać wokół firmy. IBM ma najczęściej używany broker komunikatów, MQSeries, lub odmianę produktu, która zawiera wymagania dotyczące e-commerce, IBM WebSphere MQ.
Więcej dyskusji na temat wykorzystania rozwiązania MQ do obsługi magazynu i środowiska BI można znaleźć na stronie strona internetowa z książki. Na razie wystarczy powiedzieć, że technologia ta jest doskonałym środkiem do przechwytywania i przekształcania (przy użyciu Integratora MQSeries) dać ukierunkowani agenci rekrutowani do rozwiązań BI. Technologia MQ została zintegrowana i spakowana w UDB V8, co oznacza, że kolejkami komunikatów można teraz zarządzać tak, jakby były tabelami DB2. Koncepcja komunikatów kolejki spawania i wszechświat baza danych relacyjne kieruje się w stronę potężnego środowiska dostarczania dać.

Zerowa latencja Zerowa latencja

Nadrzędnym celem strategicznym IBM jest analiza bez opóźnień. Zgodnie z definicją wg
Gartner, system BI musi być w stanie wyciągać wnioski, przetwarzać i udostępniać informacje analitykom na żądanie. Wyzwaniem jest oczywiście sposób mieszania dać bieżące i aktualne wraz z niezbędnymi informacjami historycznymi, takimi jak m.in dać powiązanego trendu/wzorca lub wyodrębnionych spostrzeżeń, takich jak profilowanie klientów.

Takie informacje obejmują na przykład identyfikację klienci wysokiego lub niskiego ryzyka lub które produkty klienci najprawdopodobniej kupią, jeśli mają już ser w koszyku.

Uzyskanie zerowego opóźnienia zależy w rzeczywistości od dwóch podstawowych mechanizmów:

Całkowite zjednoczenie dać które są analizowane za pomocą ustalonych technik i narzędzi stworzonych przez BI
System dostarczania dać wydajne, aby zapewnić rzeczywistą dostępność analiz w czasie rzeczywistym Te wymagania wstępne dotyczące zerowych opóźnień nie różnią się od dwóch celów określonych przez IBM i opisanych powyżej. Ścisłe połączenie dać jest częścią programu bezproblemowej integracji IBM. I stworzyć system dostarczania dać efektywność jest całkowicie uzależniona od dostępnej technologii, która upraszcza proces dostawy dać. W rezultacie dwa z trzech celów IBM są kluczowe dla osiągnięcia trzeciego. IBM świadomie rozwija swoją technologię, aby zapewnić zerowe opóźnienia w działaniach magazynowych. Podsumowanie / Synteza Twoja organizacja BI zapewnia plan budowy środowiska
iteracyjnie. Musi być dostosowany do potrzeb Twojej firmy, zarówno obecnych, jak i przyszłych. Bez szerokiej wizji architektonicznej iteracje magazynu są niewiele więcej niż przypadkowymi implementacjami magazynu centralnego, które w niewielkim stopniu przyczyniają się do stworzenia dużego, informacyjnego przedsiębiorstwa. Pierwszą przeszkodą dla liderów projektów jest uzasadnienie inwestycji potrzebnych do rozwoju organizacji BI. Chociaż obliczenia ROI pozostają podstawą osiągnięć w zakresie inwentaryzacji, coraz trudniej jest dokładnie je przewidzieć. Doprowadziło to do innych metod określania, czy otrzymujesz pieniądze. Na przykład wartość inwestycji2 (VOI) jest nabywana jako rozwiązanie. To spoczywa na architektach dać oraz planiści projektów celowo generują i dostarczają informacje stowarzyszeniom użytkowników, a nie tylko świadczą usługi dać. Istnieje ogromna różnica między nimi. Informacja to coś, co ma wpływ na podejmowanie decyzji i skuteczność; stosunkowo, tj dać są budulcem do pozyskiwania tych informacji.

Chociaż krytyczny wobec źródła dać aby sprostać wymaganiom biznesowym, środowisko BI powinno odgrywać większą rolę w tworzeniu treści informacyjnych. Musimy podjąć dodatkowe kroki, aby oczyścić, zintegrować, przekształcić lub w inny sposób stworzyć treść informacyjną, na podstawie której użytkownicy mogą działać, a następnie musimy zapewnić, że te działania i decyzje, tam gdzie jest to uzasadnione, zostaną odzwierciedlone w środowisku BI. Jeśli zdegradujemy magazyn do obsługi tylko na dać, możesz mieć pewność, że stowarzyszenia użytkowników utworzą zawartość informacyjną potrzebną do podjęcia działań. To gwarantuje, że ich społeczność będzie w stanie podejmować lepsze decyzje, ale przedsiębiorstwo cierpi z powodu braku wiedzy, którą wykorzystali. Dane że architekci i planiści projektów inicjują konkretne projekty w środowisku BI, pozostają odpowiedzialni przed przedsiębiorstwem jako całością. Prosty przykład tej dwustronnej cechy iteracji BI można znaleźć w źródle dać, Wszystko dać otrzymane w związku z określonymi zamówieniami komercyjnymi muszą być wypełnione w pierwszej warstwie atomowej. Zapewnia to rozwój zasobów informacyjnych przedsiębiorstwa, a także zarządzanie, adresowanie konkretnych żądań użytkowników zdefiniowanych w iteracji.

Czym jest hurtownia danych?

Hurtownia danych jest sercem architektury systemów informatycznych od 1990 roku i wspiera procesy informacyjne, oferując solidną zintegrowaną platformę dać historii jako podstawy do późniejszych analiz. TO hurtownia danych oferują łatwość integracji w świecie niekompatybilnych systemów aplikacji. Hurtownia danych ewoluował, by stać się modą. Hurtownia danych organizuje i przechowuje i dać niezbędne dla procesów informacyjnych i analitycznych na podstawie długiej historycznej perspektywy czasowej. Wszystko to wiąże się ze znacznym i stałym wysiłkiem w budowie i utrzymaniu hurtownia danych.

Więc co to jest? hurtownia danych? hurtownia danych to jest:

▪ zorientowany tematycznie
▪ zintegrowany system
▪ zmienność czasu
▪ nieulotny (nie anuluje)

kolekcja dać wykorzystywane do wspomagania decyzji zarządczych w realizacji procesów.
I dać włożona w hurtownia danych wywodzą się one w większości przypadków ze środowisk operacyjnych. The hurtownia danych składa się z jednostki pamięci, fizycznie oddzielonej od reszty systemu, który zawiera dać wcześniej przekształcone przez aplikacje działające na informacjach pochodzących ze środowiska operacyjnego.

Dosłowna definicja a hurtownia danych zasługuje na dokładne wyjaśnienie, ponieważ istnieją ważne motywacje i ukryte znaczenia, które opisują cechy magazynu.

ORIENTACJA NA PRZEDMIOT TEMATYCZNY

Pierwsza cecha hurtownia danych polega na tym, że jest zorientowany na główne tematy firmy. Przewodnik po procesach przez dać kontrastuje to z bardziej klasyczną metodą, która zapewnia orientację aplikacji na procesy i funkcje, metodą powszechnie stosowaną przez większość mniej aktualnych systemów zarządzania.

Świat operacyjny jest zaprojektowany wokół aplikacji i funkcji, takich jak pożyczki, oszczędności, karty bankowe i fundusze powiernicze dla instytucji finansowych. Świat dw jest zorganizowany wokół głównych tematów, takich jak klient, sprzedawca, produkt i działalność. Wyrównanie wokół tematów wpływa na projektowanie i wdrażanie dać znalezione w dw. Co najważniejsze, główny temat wpływa na najważniejszą część struktury klucza.

Na świat aplikacji ma wpływ zarówno projekt bazy danych, jak i projekt procesu. Świat dw koncentruje się wyłącznie na modelowaniu wideo dać oraz w sprawie projektu baza danych. Projektowanie procesów (w klasycznej postaci) nie jest częścią środowiska dw.

Różnice między wyborem zastosowania procesu/funkcji a wyborem przedmiotu ujawniają się również jako różnice w treści dać na poziomie szczegółowym. TEN dać del dw nie zawierają i dać które nie będą używane do przetwarzania DSS podczas aplikacji

operacyjne zorientowane na dać zawierać ja dać w celu natychmiastowego zaspokojenia wymagań funkcjonalnych/przetwarzania, które mogą, ale nie muszą, mieć żadnego zastosowania dla analityka DSS.
Innym ważnym sposobem, dla którego aplikacje zorientowane na działanie dać różnią dać dw znajduje się w raportach dać. dać agenci utrzymują ciągłą relację między dwiema lub więcej tabelami w oparciu o aktywną regułę biznesową. TO dać dw obejmuje całe spektrum czasu, a raportów znalezionych w dw jest wiele. Wiele zasad handlu (i odpowiednio wiele raportów o dać ) są reprezentowane w magazynie dać między dwoma lub więcej stołami.

(Aby uzyskać szczegółowe wyjaśnienie, w jaki sposób relacje między dać są zarządzane w DW, zapoznaj się z tematem technicznym w tej sprawie.)
Z żadnej innej perspektywy niż podstawowa różnica między wyborem aplikacji funkcjonalnej/procesowej a wyborem przedmiotu, czy istnieje zasadnicza różnica między systemami operacyjnymi a dać i DW.

INTEGRACJA INTEGRACJA

Najważniejszym aspektem środowiska dw jest to, że i dać znalezione w dw można łatwo zintegrować. ZAWSZE. BEZ WYJĄTKÓW. Istotą środowiska dw jest to, że i dać zawarte w granicach magazynu są zintegrowane.

Integracja przejawia się na wiele różnych sposobów – w spójnie zidentyfikowanych konwencjach, w spójnym pomiarze zmiennych, w spójnych zakodowanych strukturach, w fizycznych atrybutach dać spójne i tak dalej.

Na przestrzeni lat projektanci różnych aplikacji podjęli wiele decyzji dotyczących tego, jak aplikacja powinna być rozwijana. Styl i zindywidualizowane decyzje projektowe aplikacji projektantów ujawniają się na sto sposobów: w różnicach w kodowaniu, strukturze klucza, cechach fizycznych, konwencjach identyfikacji i tak dalej. Zbiorowa zdolność wielu projektantów aplikacji do tworzenia niespójnych aplikacji jest legendarna. Rysunek 3 przedstawia niektóre z najważniejszych różnic w sposobie projektowania aplikacji.

Kodowanie: Kodowanie:

Projektanci aplikacji wybrali kodowanie pól – płeć – na kilka sposobów. Projektant przedstawia płeć jako „m” i „f”. Inny projektant przedstawia płeć jako „1” i „0”. Inny projektant przedstawia płeć jako „x” i „y”. Inny projektant przedstawia płeć jako „męską” i „kobiecą”. To naprawdę nie ma znaczenia, jak seks dostaje się do DW. „M” i „F” są prawdopodobnie tak dobre, jak każda reprezentacja.

Liczy się to, że niezależnie od źródła, z którego pochodzi pole płci, dociera ono do DW w spójnym, zintegrowanym stanie. W konsekwencji, gdy pole jest ładowane do DW z aplikacji, w której było reprezentowane na zewnątrz w formacie „M” i „F”, dać należy przekonwertować na format DW.

Pomiar atrybutów: pomiar Atrybuty:

Na przestrzeni lat projektanci aplikacji wybierali pomiar potoku na różne sposoby. Designerskie sklepy i dać rurociągu w centymetrach. Inny projektant aplikacji przechowuje plik dać rurociągu w calach. Inny projektant aplikacji przechowuje plik dać rurociągu w milionach stóp sześciennych na sekundę. A inny projektant przechowuje informacje o rurociągu w postaci jardów. Niezależnie od źródła, kiedy informacje o rurociągu docierają do DW, muszą być mierzone w ten sam sposób.

Jak pokazano na rysunku 3, problemy z integracją dotyczą prawie każdego aspektu projektu — fizycznych właściwości projektu dać, dylemat posiadania więcej niż jednego źródła dać, kwestia niespójnych zidentyfikowanych próbek, formatów dać niespójne i tak dalej.

Niezależnie od argumentu projektowego, wynik jest taki sam – tj dać muszą być przechowywane w DW w unikalny i globalnie akceptowalny sposób, nawet jeśli bazowe systemy operacyjne przechowują pliki i dać.

Kiedy analityk DSS patrzy na DW, powinien skupić się na wykorzystaniu dać którzy są w magazynie,

zamiast zastanawiać się nad wiarygodnością lub spójnością dać.

ZMIANA CZASU

wszystko dać w DW są dokładne do pewnego momentu w czasie. Ta podstawowa cecha dać w DW bardzo różni się od dać znaleźć w środowisku operacyjnym. TEN dać środowiska operacyjnego są tak dokładne, jak w momencie uzyskiwania dostępu. Innymi słowy, w środowisku operacyjnym, gdy uzyskuje się dostęp do jednostki daćoczekuje się, że będzie odzwierciedlać wartości tak dokładne, jak w momencie dostępu. Dlaczego ja dać w DW są dokładne w pewnym momencie (tj. nie „w tej chwili”), tj dać znalezione w DW to „zmienność czasu”.
Zmienność czasu dać DW jest określane na wiele sposobów.
Najprostszym sposobem jest to, że ja dać DW reprezentują dać w długim horyzoncie czasowym – od pięciu do dziesięciu lat. Przedstawiony horyzont czasowy dla środowiska operacyjnego jest znacznie krótszy od dzisiejszych aktualnych wartości nawet o sześćdziesiąt dziewięćdziesiąt
Aplikacje, które muszą dobrze działać i muszą być dostępne do przetwarzania transakcji, muszą przynosić minimalną kwotę dać jeśli pozwalają na jakikolwiek stopień elastyczności. Tak więc aplikacje operacyjne mają krótki horyzont czasowy, na przykład temat projektowania aplikacji audio.
Drugim sposobem, w jaki „zmienność czasu” pojawia się w DW, jest struktura klucza. Każda kluczowa struktura w DW zawiera, pośrednio lub jawnie, element czasu, taki jak dzień, tydzień, miesiąc itd. Element czasu prawie zawsze znajduje się na dole połączonego klucza znalezionego w DW. W takich przypadkach element czasu będzie istniał niejawnie, tak jak w przypadku duplikowania całego pliku na koniec miesiąca lub kwartału.
Trzecim sposobem wyświetlania wariancji czasu jest to, że i dać DW, właśnie poprawnie zarejestrowane, nie mogą być aktualizowane. TO dać DW są, ze względów praktycznych, długą serią migawek. Oczywiście, jeśli migawka została zrobiona nieprawidłowo, migawki można modyfikować. Ale zakładając, że migawki są zrobione poprawnie, nie są one zmieniane, gdy tylko zostaną zrobione. W niektórych

przypadkach modyfikacja migawek w DW może być nieetyczna lub nawet nieprawidłowa. TO dać operacyjne, tak dokładne, jak w momencie dostępu, mogą być aktualizowane w miarę potrzeb.

NIELOTNY

Czwartą ważną cechą DW jest to, że jest nieulotna.
Aktualizacje, wstawki, usunięcia i zmiany są dokonywane regularnie w środowiskach operacyjnych na zasadzie rekord po rekordzie. Ale podstawowa manipulacja dać potrzebne w DW jest znacznie łatwiejsze. Istnieją tylko dwa rodzaje operacji, które występują w DW – początkowe ładowanie dać i dostęp do dać. Nie ma aktualizacji dot dać (w ogólnym znaczeniu aktualizacji) w DW jako normalna operacja przetwarzania. Istnieje kilka bardzo poważnych konsekwencji tej podstawowej różnicy między przetwarzaniem operacyjnym a przetwarzaniem DW. Na poziomie projektowania konieczność zachowania ostrożności przy aktualizacji awaryjnej nie jest czynnikiem wpływającym na DW, ponieważ aktualizacja dać nie jest wykonywana. Oznacza to, że na fizycznym poziomie projektowania można zachować swobodę w celu optymalizacji dostępu dać, szczególnie w radzeniu sobie z tematami normalizacji i fizycznej denormalizacji. Inną konsekwencją prostoty działania DW jest podstawowa technologia używana do uruchamiania środowiska DW. Konieczność obsługi aktualizacji online rekord po rekordzie (jak to często ma miejsce w przypadku przetwarzania operacyjnego) wymaga, aby technologia miała bardzo złożone podstawy pod pozorną prostotą.
Technologia obsługująca tworzenie kopii zapasowych i odzyskiwanie danych, transakcje i integralność danych dać a wykrywanie i usuwanie zakleszczeń jest dość złożone i niepotrzebne do przetwarzania DW. Charakterystyka DW, orientacja projektowa, integracja dać w DW, zmienność czasu i łatwość zarządzania dać, wszystko to prowadzi do środowiska, które bardzo, bardzo różni się od klasycznego środowiska operacyjnego. Źródło prawie wszystkich dać DW to środowisko operacyjne. Kuszące jest myślenie, że istnieje masowa redundancja dać między tymi dwoma środowiskami.
Rzeczywiście, pierwsze wrażenie, jakie wielu ludzi ma, to wielka redundancja dać między środowiskiem operacyjnym a

rozszerzenie DW. Taka interpretacja jest powierzchowna i świadczy o niezrozumieniu tego, co dzieje się w DW.
W rzeczywistości istnieje minimalna redundancja dać między środowiskiem operacyjnym a i dać z DW. Rozważ następujące kwestie: I dać są filtrowane data aby przełączyć się ze środowiska operacyjnego do środowiska DW. Wiele dać nigdy nie wychodzą poza środowisko operacyjne. Tylko, że ja dać które są wymagane do przetwarzania DSS, znajdują swój kierunek w środowisku

▪ horyzont czasowy dać różni się bardzo w zależności od środowiska. TO dać w środowisku operacyjnym są bardzo świeże. TEN dać w DW są dużo starsi. Tylko z perspektywy horyzontu czasowego środowisko operacyjne i DW pokrywają się w bardzo niewielkim stopniu.

▪ DW zawiera dać podsumowania, które nigdy nie występują w środowisku

▪ I dać przechodzą fundamentalną transformację, gdy przechodzą do Ryc. 3 ilustruje, że większość z nich dać ulegają istotnym modyfikacjom pod warunkiem ich wybrania i przeniesienia do DW. Innymi słowy, większość dać jest fizycznie i radykalnie zmieniany, gdy jest przenoszony do DW. Z punktu widzenia integracji nie są tożsame dać przebywających w środowisku operacyjnym. Biorąc pod uwagę te czynniki, redundancja dać między dwoma środowiskami jest rzadkim zdarzeniem, prowadzącym do mniej niż 1% nadmiarowości między dwoma środowiskami. STRUKTURA MAGAZYNU DW mają odrębną strukturę. Istnieją różne poziomy podsumowań i szczegółów, które wyznaczają DW.
Różne składniki DW to:

Metadane
Dać aktualnych informacji
Dać starych detali
Dać lekko podsumowane
Dać bardzo podsumowane

Zdecydowanie główny problem dotyczy i dać aktualne szczegóły. Jest to główny problem, ponieważ:

I dać Bieżące szczegóły odzwierciedlają najnowsze wydarzenia, które zawsze cieszą się dużym zainteresowaniem i
i dać Bieżące dane szczegółowe są obszerne, ponieważ są przechowywane na najniższym poziomie szczegółowości i
i dać bieżących szczegółów jest prawie zawsze przechowywanych w pamięci dyskowej, do której dostęp jest szybki, ale kosztowny i złożony od I dać starsze szczegóły są dać które są przechowywane w jakiejś pamięci massa. Dostęp do niego jest sporadyczny i przechowywany na poziomie szczegółowości zgodnym z dać aktualne szczegóły. Chociaż przechowywanie na alternatywnym nośniku danych nie jest obowiązkowe, ze względu na dużą objętość dać połączone ze sporadycznym dostępem dać, nośnik pamięci dla dać starszych szczegółów zwykle nie jest przechowywana na dysku. TO dać podsumowane lekko są dać które są destylowane ze znalezionego niskiego poziomu szczegółowości do obecnego poziomu szczegółowości. Ten poziom DW jest prawie zawsze przechowywany w pamięci dysku. Problemy projektowe, które stawiają przed architektem dać w budowie tego poziomu DW są:

W jakiej jednostce czasu znajduje się powyższe podsumowanie
Jakie treści, atrybuty nieco podsumują zawartość dać Następny poziom dać znalezione w DW jest to z dać mocno podsumowane. TO dać wysoce podsumowane są zwarte i łatwo dostępne. TO dać wysoce podsumowane są czasami spotykane w środowisku DW i innych przypadkach, tj dać wysoce abstrakcyjne znajdują się poza bezpośrednimi murami technologii obsługującej DW. (w każdym razie tj dać wysoce podsumowane są częścią DW niezależnie od tego, gdzie i dać są fizycznie zakwaterowane). Ostatnim elementem DW jest komponent metadanych. Pod wieloma względami metadane znajdują się w innym wymiarze niż inne dać DW, ponieważ metadane nie zawierają żadnych data pobierane bezpośrednio ze środowiska operacyjnego. Metadane odgrywają szczególną i bardzo ważną rolę w DW. Metadane są używane jako:

katalog ułatwiający analitykowi DSS zlokalizowanie zawartości DW,
przewodnik po mapowaniu dać jak ja dać zostały przekształcone ze środowiska operacyjnego do środowiska DW,
przewodnik po algorytmach używanych do podsumowania między i dać aktualne dane ei dać nieco podsumowane, ja dać podsumowując, metadane odgrywają znacznie większą rolę w środowisku DW niż kiedykolwiek w środowisku operacyjnym STARE SZCZEGÓŁY MAGAZYNOWE ŚREDNI Taśma magnetyczna może być używana do przechowywania tego typu dać. Rzeczywiście istnieje wiele różnych nośników pamięci, które należy wziąć pod uwagę przy przechowywaniu starych dać szczegółów. W zależności od objętości dać, częstotliwość dostępu, koszt narzędzi i rodzaj dostępu, jest całkiem prawdopodobne, że inne narzędzia będą wymagały starego poziomu szczegółowości w DW. PRZEPŁYW DANYCH Istnieje normalny i przewidywalny przepływ bogów dać w DW.
I dać wchodzą do DW ze środowiska operacyjnego. (UWAGA: Istnieje kilka bardzo interesujących wyjątków od tej reguły. Jednak prawie wszystkie dać wprowadzić DW ze środowiska operacyjnego). Dane że dać wchodzą do DW ze środowiska operacyjnego, jest ono przekształcane w sposób opisany powyżej. Pod warunkiem, że wejdziesz do DW, tj dać wprowadź bieżący poziom szczegółowości, jak pokazano. Znajduje się tam i jest używany do momentu wystąpienia jednego z trzech zdarzeń:

jest oczyszczony,
jest podsumowany i/lub ▪jest Przestarzały proces wewnątrz DW porusza się i dać aktualne dane a dać starych detali, według wieku dać. Proces

podsumowanie wykorzystuje szczegóły dać obliczyć ja dać nieznacznie podsumowane i bardzo podsumowane poziomy dać. Istnieją pewne wyjątki od pokazanego przepływu (do omówienia później). Jednak zwykle dla zdecydowanej większości dać znalezione w DW, strumień dać jest jak na zdjęciu.

KORZYSTANIE Z MAGAZYNU DANYCH

Nic dziwnego, że różne poziomy dać w DW nie otrzymują różnych poziomów użytkowania. Z reguły im wyższy poziom podsumowania, tym bardziej i dać są one wykorzystywane.
Wiele zastosowań występuje w dać bardzo podsumowane, podczas gdy stare dać szczegółów prawie nigdy nie są używane. Istnieje dobry powód, aby przesunąć organizację na paradygmat wykorzystania zasobów. Więcej podsumował I dać, tym szybciej i efektywniej dotrzesz do dać. Jeśli sklep stwierdzi, że wykonuje dużo szczegółowego przetwarzania DW, a następnie zużywana jest odpowiednio duża ilość zasobów maszynowych. Jak najszybsze przetworzenie tak wysokiego poziomu podsumowania leży w najlepszym interesie wszystkich.

W przypadku wielu sklepów analityk DSS w przedśrodowiskowym DW używał dać na poziomie szczegółowości. Pod wieloma względami przybycie a dać szczegółowy wygląda jak koc bezpieczeństwa, nawet jeśli dostępne są inne poziomy podsumowania. Jednym z działań architekta dać jest odzwyczajenie użytkownika DSS od ciągłego używania dać na najniższym poziomie szczegółowości. Dla architekta dostępne są dwie motywacje dać:

zainstalowanie systemu chargeback, w którym użytkownik końcowy płaci za zużyte zasoby, np
które wskazują, że bardzo dobry czas odpowiedzi można uzyskać, gdy zachowanie z i dać jest na wysokim poziomie podsumowania, podczas gdy słaby czas reakcji wynika z zachowania dać na niskim poziomie INNE UWAGI Istnieje kilka innych kwestii związanych z budową i zarządzaniem DW.
Pierwsza uwaga dotyczy indeksów. TEN dać na wyższych poziomach podsumowania można je dowolnie indeksować, podczas gdy i dać

przy niższych poziomach szczegółowości są one tak obszerne, że można je oszczędnie indeksować. Z tego samego znaku, tj dać przy wysokim poziomie szczegółowości można stosunkowo łatwo zrestrukturyzować, podczas gdy objętość dać na niższych poziomach jest tak duży, że i dać nie można ich łatwo odnowić. W związku z tym model tzw dać a formalna praca wykonana przez projekt stanowi podstawę dla DW zastosowanego prawie wyłącznie do obecnego poziomu szczegółowości. Innymi słowy, działania modelarskie dać nie mają one zastosowania do poziomów podsumowania, w prawie każdym przypadku. Innym zagadnieniem strukturalnym jest podział dać przez DW.

Partycjonowanie można wykonać na dwóch poziomach - na poziomie dbm oraz na poziomie aplikacji. W dywizji na poziomie dbmThe dbm jest informowany o oddziałach i odpowiednio je kontroluje. W przypadku podziału na poziomie aplikacji tylko programista zna podziały i na nim spoczywa odpowiedzialność za administrowanie nimi

Poniżej poziomu dbm, duża część pracy jest wykonywana automatycznie. Samozarządzanie oddziałami wiąże się z dużą elastycznością. W przypadku wniosku na poziomie podziału, o którym mowa w ust dać del hurtownia danych, dużo pracy spada na programistę, ale efektem końcowym jest elastyczność w administrowaniu dać w hurtownia danych

INNE ANOMALIE

Podczas gdy składniki hurtownia danych działa zgodnie z opisem dla prawie wszystkich dać, istnieje kilka użytecznych wyjątków, które należy omówić. Wyjątkiem jest ten z dać publiczne podsumowania (publiczne dane podsumowujące). To są dać podsumowania, które zostały obliczone z hurtownia danych ale są używane przez społeczeństwo. TEN dać podsumowania publiczne są przechowywane i zarządzane w hurtownia danych, chociaż, jak wspomniano powyżej, są wymyślone. Nad takim kwartalnikiem pracują księgowi dać takie jak dochód, wydatki kwartalne, zysk kwartalny i tak dalej. Praca wykonywana przez księgowych jest zewnętrzna w stosunku do hurtownia danych. Jednakże, ja dać są używane „wewnętrznie” w firmie – od marketing, sprzedaż itp. Kolejną anomalią, o której nie będziemy omawiać, jest tzw dać zewnętrzny.

Kolejny świetny rodzaj dać który można znaleźć w hurtownia danych to stałe dane szczegółowe. Powodują one konieczność trwałego przechowywania dać na poziomie szczegółowym ze względów etycznych lub prawnych. Jeśli firma naraża swoich pracowników na działanie niebezpiecznych substancji, istnieje taka potrzeba dać szczegółowe i trwałe. Jeśli firma wytwarza produkt związany z bezpieczeństwem publicznym, na przykład części do samolotu, istnieje taka potrzeba dać stałych danych, jak również w przypadku zawierania przez firmę niebezpiecznych umów.

Firma nie może sobie pozwolić na przeoczenie szczegółów, ponieważ w ciągu najbliższych kilku lat w przypadku pozwu, wycofania, spornej wady konstrukcyjnej itp. ekspozycja firmy może być duża. W rezultacie istnieje unikalny rodzaj dać znane jako stałe dane szczegółowe.

PODSUMOWANIE

Un hurtownia danych jest zorientowanym obiektowo, zintegrowanym, napiętym wariantem, zbiorem dać nieulotne wspierające potrzeby decyzyjne administracji. Każda z istotnych funkcji A hurtownia danych ma swoje implikacje. Ponadto istnieją cztery poziomy dać del hurtownia danych:

Stare szczegóły
Bieżący szczegół
Dać lekko podsumowane
Dać wysoce podsumowane metadane są również ważną częścią hurtownia danych. ABSTRAKCYJNY Pojęcie przechowywania dać ostatnio zyskał wiele uwagi i stał się trendem lat 90. Wynika to ze zdolności hurtownia danych przezwyciężyć ograniczenia systemów wspomagających zarządzanie, takich jak systemy wspomagania decyzji (DSS) i systemy informacji wykonawczej (EIS). Chociaż koncepcja tzw hurtownia danych wygląda obiecująco, wdrożyć i hurtownia danych może być problematyczne ze względu na procesy magazynowania na dużą skalę. Pomimo złożoności projektów magazynowych firmy dać, wielu dostawców i konsultantów, którzy zajmują się magazynowaniem dać twierdzą, że przechowywanie dać przedstawiać żadnego problemu. Jednak na początku tego projektu badawczego nie przeprowadzono prawie żadnych niezależnych, rygorystycznych i systematycznych badań. W związku z tym trudno powiedzieć, co tak naprawdę dzieje się w branży, gdy są budowane hurtownia danych. W tym badaniu zbadano praktykę magazynowania dać współczesnych, którego celem jest pogłębienie zrozumienia australijskiej praktyki. Przegląd literatury dostarczył kontekstu i podstawy do badań empirycznych. Istnieje wiele wyników tych badań. Po pierwsze, badanie to ujawniło działania, które miały miejsce podczas rozwoju hurtownia danych. W wielu dziedzinach, tj dać zebranych potwierdziło praktykę opisywaną w literaturze. Po drugie, kwestie i problemy, które mogą mieć wpływ na rozwój hurtownia danych zostały zidentyfikowane w tym badaniu. Wreszcie korzyści uzyskiwane przez australijskie organizacje związane z wykorzystaniem hurtownia danych zostały ujawnione.

Rozdział 1

Kontekst wyszukiwania

Koncepcja hurtowni danych zyskała szerokie uznanie i stała się pojawiającym się trendem w latach 90. Świadczy o tym rosnąca liczba artykułów na temat hurtowni danych w publikacjach branżowych (Little i Gibson 1996). Wiele artykułów (zob. np. Fisher 1996, Hackathorn 1997, Morris 1997a, Bramblett i King 1998, Graham i in. 2000, Sakaguchi i Frolick 1999, Alvarez 1995, Brousell 1995, Clarke 1995, McCarthy 1996, O'Donnell 1996, Edwards 1996, TDWI 1997) donoszą o znaczących korzyściach dla organizacji, które je wdrażają hurtownia danych. Poparli swoją teorię anegdotycznymi dowodami udanych wdrożeń, wysokimi wartościami zwrotu z inwestycji (ROI), a także dostarczając wytyczne lub metodologie opracowywania hurtownia danych

(Shanks i in. 1997, Seddon i Benjamin 1998, Little i Gibson 1999). W skrajnym przypadku Graham i in. (1996) odnotowali średni zwrot z trzyletniej inwestycji na poziomie 401%.

Jednak większość aktualnej literatury pomija złożoność związaną z podejmowaniem takich projektów. Projekty z hurtownia danych są one zwykle złożone i na dużą skalę, a zatem niosą ze sobą wysokie prawdopodobieństwo niepowodzenia, jeśli nie są dokładnie kontrolowane (Shah i Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs i Clymer 1998, Rao 1998). Ich zbudowanie wymaga ogromnych nakładów zarówno ludzkich, jak i finansowych, czasu i wysiłku (Hill 1998, Crofts 1998). Typowy wymagany czas i środki finansowe to odpowiednio około dwóch lat i dwa do trzech milionów dolarów (Braly 1995, Foley 1997b, Bort 1998, Humphries i in. 1999). Ten czas i środki finansowe są potrzebne do kontrolowania i konsolidowania wielu różnych aspektów hurtowni danych (Cafasso 1995, Hill 1998). Oprócz rozważań dotyczących sprzętu i oprogramowania, inne funkcje, które różnią się od ekstrakcji dać do procesów ładowania dać, pojemność pamięci do zarządzania aktualizacjami i meta dać do szkolenia użytkowników, należy wziąć pod uwagę.

W momencie rozpoczęcia tego projektu badawczego przeprowadzono bardzo niewiele badań akademickich w dziedzinie hurtowni danych, zwłaszcza w Australii. Było to widoczne na podstawie niedostatku artykułów opublikowanych na temat hurtowni danych w czasopismach lub innych pismach akademickich tamtych czasów. Wiele dostępnych prac naukowych opisywało doświadczenia Stanów Zjednoczonych. Brak badań naukowych w obszarze hurtowni danych spowodował zapotrzebowanie na rygorystyczne badania i studia empiryczne (McFadden 1996, Shanks i in. 1997, Little i Gibson 1999). W szczególności badania naukowe dotyczące procesu wdrażania hurtownia danych należy zrobić, aby poszerzyć ogólną wiedzę na temat wdrażania hurtownia danych i posłuży jako podstawa do przyszłych badań (Shanks i in. 1997, Little i Gibson 1999).

Dlatego celem tego badania jest zbadanie, co faktycznie dzieje się, gdy organizacje wdrażają i używają i hurtownia danych w Australii. W szczególności badanie to będzie obejmować analizę całego procesu opracowywania hurtownia danych, począwszy od zainicjowania i zaprojektowania, poprzez zaprojektowanie i wdrożenie, a następnie wykorzystanie w organizacjach australijskich. Ponadto badanie przyczyni się również do obecnej praktyki, identyfikując obszary, w których praktykę można jeszcze udoskonalić, a nieefektywność i ryzyko można zminimalizować lub uniknąć. Ponadto posłuży jako podstawa do innych badań nt hurtownia danych w Australii i wypełni lukę istniejącą obecnie w literaturze.

Pytania badawcze

Celem tych badań jest zbadanie działań związanych z realizacją hurtownia danych i ich wykorzystania przez organizacje australijskie. W szczególności badane są elementy dotyczące planowania projektu, rozwoju, eksploatacji, użytkowania i związanego z tym ryzyka. Tak więc pytanie tego badania brzmi:

„Jak wygląda obecna praktyka tzw hurtownia danych w Australii?"

Aby skutecznie odpowiedzieć na to pytanie, należy zadać kilka pomocniczych pytań badawczych. W szczególności, z literatury, która jest przedstawiona w rozdziale 2, zidentyfikowano trzy pytania podrzędne, które mają kierować tym projektem badawczym: W jaki sposób hurtownia danych przez australijskie organizacje? Jakie są napotkane problemy?

Jakie są korzyści?
W odpowiedzi na te pytania zastosowano eksploracyjny projekt badawczy z wykorzystaniem ankiety. Jako badanie eksploracyjne, odpowiedzi na powyższe pytania nie są kompletne (Shanks i in. 1993, Denscombe 1998). W takim przypadku wymagana jest pewna triangulacja, aby poprawić odpowiedzi na te pytania. Jednak dochodzenie zapewni solidne podstawy do przyszłych prac nad zbadaniem tych kwestii. Szczegółowe omówienie zasadności i konstrukcji metody badawczej przedstawiono w rozdziale 3.

Struktura projektu badawczego

Ten projekt badawczy podzielony jest na dwie części: badanie kontekstualne koncepcji hurtowni danych oraz badania empiryczne (patrz rysunek 1.1), z których każda została omówiona poniżej.

Część I: Badanie kontekstowe

Pierwsza część badań polegała na przeglądzie aktualnej literatury dotyczącej różnych rodzajów hurtowni danych, w tym systemów wspomagania decyzji (DSS), systemów informacji wykonawczej (EIS), studiów przypadków hurtownia danych i koncepcje hurtownia danych. Również wyniki forum nt hurtownia danych oraz grupy spotkań ekspertów i praktyków, kierowane przez grupę badawczą Monash DSS, przyczyniły się do tej fazy badań, która miała na celu uzyskanie wglądu w praktykę hurtownia danych oraz zidentyfikować ryzyko związane z ich przyjęciem. Podczas tego okresu badań kontekstualnych ustalono zrozumienie obszaru problemowego, aby zapewnić bazę wiedzy dla późniejszych badań empirycznych. Był to jednak proces ciągły, ponieważ przeprowadzono badanie.

Część II: Badania empiryczne

Stosunkowo nowa koncepcja hurtowni danych, zwłaszcza w Australii, stworzyła potrzebę przeprowadzenia ankiety w celu uzyskania szerokiego obrazu doświadczeń związanych z użytkowaniem. Ta część została wykonana po ustaleniu dziedziny problemu poprzez obszerny przegląd literatury. Koncepcja hurtowni danych stworzona podczas fazy badania kontekstowego została wykorzystana jako dane wejściowe do wstępnego kwestionariusza tego badania. Następnie ankieta została sprawdzona. Czy jesteś ekspertem ds hurtownia danych brał udział w teście. Celem testowania kwestionariusza wstępnego było sprawdzenie kompletności i trafności pytań. Na podstawie wyników badań kwestionariusz został zmodyfikowany i zmodyfikowana wersja została wysłana do uczestników badania. Zwrócone kwestionariusze zostały następnie przeanalizowane pod kątem m.in dać w tabelach, diagramach i innych formatach. TO

wyniki analizy dot dać tworzą migawkę praktyki hurtowni danych w Australii.

PRZEGLĄD HURTOWNI DANYCH

Koncepcja hurtowni danych ewoluowała wraz z ulepszeniami technologii komputerowej.
Ma na celu przezwyciężenie problemów napotykanych przez grupy wsparcia aplikacji, takie jak System Wspomagania Decyzji (DSS) i System Informacji Wykonawczej (EIS).

W przeszłości największą przeszkodą w tych aplikacjach była ich niemożność zapewnienia Baza danych niezbędne do analizy.
Wynika to głównie z charakteru pracy kadry zarządzającej. Interesy kierownictwa firmy stale się zmieniają w zależności od obszaru, którym się zajmują. dlatego ja dać fundamentalne dla tych zastosowań muszą być zdolne do szybkiej zmiany w zależności od części, która ma być leczona.
Oznacza to, że ja dać muszą być dostępne w odpowiedniej formie dla wymaganych analiz. W rzeczywistości grupy wsparcia aplikacji miały w przeszłości bardzo duże trudności ze zbieraniem i integracją dać ze złożonych i różnorodnych źródeł.

W pozostałej części tej sekcji przedstawiono przegląd koncepcji hurtowni danych i omówiono, w jaki sposób hurtownia danych może przezwyciężyć problemy grup wsparcia aplikacji.
Termin "Hurtownia danychzostała spopularyzowana przez Williama Inmona w 1990 roku. Jego często cytowana definicja widzi Hurtownia danych jako zbiór dać zorientowane tematycznie, zintegrowane, trwałe i zmienne w czasie, wspierające decyzje zarządcze.

Korzystając z tej definicji, Inmon wskazuje, że i dać mieszkający w A hurtownia danych musi posiadać następujące 4 cechy:

▪ Zorientowany na temat
▪ Zintegrowany
▪ Nielotny
▪ Zmienna w czasie Przez zorientowany podmiotowo Inmon oznacza, że i dać w hurtownia danych w największych obszarach organizacyjnych, jakie były

zdefiniowane w modelu dać. Na przykład wszystkie dać dotyczące i klienci mieszczą się w obszarze tematycznym KLIENCI. Podobnie wszystkie dać dotyczące produktów są zawarte w obszarze tematycznym PRODUKTY.

Przez Integrated Inmon oznacza, że i dać z różnych platform, systemów i lokalizacji są łączone i przechowywane w jednym miejscu. Konsekwentnie dać podobne muszą zostać przekształcone w spójne formaty, aby można je było łatwo dodawać i porównywać.
Na przykład płeć męska i żeńska są reprezentowane przez litery M i F w jednym systemie, a przez 1 i 0 w innym. Aby je właściwie zintegrować, jeden lub oba formaty muszą zostać przekształcone, aby oba formaty były równe. W tym przypadku moglibyśmy zmienić M na 1 i F na 0 lub odwrotnie. Zorientowany tematycznie i zintegrowany wskazują, że hurtownia danych ma na celu zapewnienie funkcjonalnej i przekrojowej wizji dać od firmy.

Przez nieulotne rozumie on, że ja dać w hurtownia danych zachować spójność i aktualizować dać to nie jest konieczne. Zamiast tego każda zmiana w dać dodawane są oryginały baza danych del hurtownia danych. Oznacza to, że historyk tzw dać jest zawarty w hurtownia danych.

Dla zmiennych z czasem Inmon wskazuje, że i dać w hurtownia danych zawsze zawierają wskaźniki tempa ei dać zwykle przekraczają pewien horyzont czasowy. na przykład
hurtownia danych może zawierać 5 lat historycznych wartości klienci od 1993 do 1997. Dostępność historycznych i czasowych szeregów dać pozwala analizować trendy.

Un hurtownia danych może sam zbierać dać z systemów OLTP; z początków dać zewnętrznych w stosunku do organizacji i/lub z innych specjalnych projektów systemów odłowu dać.
I dać ekstrakty mogą przejść proces oczyszczania, w tym przypadku tj dać są przekształcane i integrowane przed zapisaniem w baza danych del hurtownia danych. Potem ja dać

przebywający w obrębie baza danych del hurtownia danych są udostępniane loginom i narzędziom odzyskiwania użytkowników końcowych. Za pomocą tych narzędzi użytkownik końcowy może uzyskać dostęp do zintegrowanego widoku organizacji dać.

I dać przebywający w obrębie baza danych del hurtownia danych są one przechowywane zarówno w formatach szczegółowych, jak i podsumowujących.
Poziom podsumowania może zależeć od charakteru dać. dać szczegółowe mogą składać się z dać obecny i dać historycy
I dać rzeczywiste nie są uwzględnione w hurtownia danych dopóki ja dać w hurtownia danych są ponownie aktualizowane.
Oprócz przechowywania ww dać siebie, A hurtownia danych może również przechowywać inny rodzaj data zwane METADANYMI opisującymi i dać mieszka w jego baza danych.
Istnieją dwa rodzaje metadanych: metadane programistyczne i metadane analityczne.
Metadane programistyczne służą do zarządzania i automatyzacji procesów wyodrębniania, czyszczenia, mapowania i przesyłania dać w hurtownia danych.
Informacje zawarte w metadanych rozwojowych mogą zawierać szczegóły systemów operacyjnych, szczegóły elementów do wyodrębnienia, model dać del hurtownia danych i reguły biznesowe dotyczące konwersji danych dać.

Drugi typ metadanych, znany jako metadane analityczne, umożliwia użytkownikowi końcowemu eksplorację zawartości hurtownia danych znaleźć dać dostępne i ich znaczenie wyrażone w jasny, nietechniczny sposób.

W ten sposób metadane analityczne działają jako pomost między hurtownia danych i aplikacji dla użytkowników końcowych. Te metadane mogą zawierać model biznesowy, opisy dać odpowiadające modelowi biznesowemu, predefiniowane zapytania i raporty, informacje o dostępie użytkownika oraz indeks.

Metadane analizy i rozwoju muszą zostać połączone w jedno zintegrowane metadane przechowawcze, aby działały prawidłowo.

Niestety wiele z istniejących narzędzi ma własne metadane i obecnie nie istnieją żadne standardy, które by to umożliwiały

pozwalają narzędziom do hurtowni danych zintegrować te metadane. Aby zaradzić tej sytuacji, wielu dostawców wiodących narzędzi do hurtowni danych utworzyło Radę Meta Data, która później przekształciła się w Koalicję Meta Data.

Celem tej koalicji jest zbudowanie standardowego zestawu metadanych, który umożliwi różnym narzędziom do hurtowni danych konwersję metadanych
Ich wysiłki zaowocowały narodzinami Meta Data Interchange Specification (MDIS), która umożliwi wymianę informacji między archiwami Microsoftu i powiązanymi plikami MDIS.

Istnienie dać zarówno podsumowane/indeksowane, jak i szczegółowe, daje użytkownikowi możliwość wykonania DRILL DROWN (wiercenie) z dać indeksowane do szczegółowych i odwrotnie. Istnienie dać szczegółowa historia pozwala na tworzenie analiz trendów w czasie. Ponadto metadane analizy mogą służyć jako katalog del baza danych del hurtownia danych aby pomóc użytkownikom końcowym zlokalizować i dać niezbędny.

W porównaniu do systemów OLTP, z ich zdolnością do wspierania analizy dać i sprawozdawczości, tzw hurtownia danych jest postrzegany jako bardziej odpowiedni system dla procesów informacyjnych, takich jak tworzenie zapytań i odpowiadanie na nie oraz tworzenie raportów. W następnej sekcji zostaną szczegółowo omówione różnice między tymi dwoma systemami.

MAGAZYN DANYCH PRZECIWKO SYSTEMOM OLTP

Wiele systemów informatycznych w organizacjach ma na celu wspieranie codziennych operacji. Systemy te, znane jako SYSTEMY OLTP, wychwytują codzienne transakcje, które są stale aktualizowane.

I dać w ramach tych systemów są one często modyfikowane, dodawane lub usuwane. Na przykład adres klienta zmienia się, gdy przemieszcza się on z miejsca na miejsce. W takim przypadku nowy adres zostanie zarejestrowany poprzez modyfikację pola adresu baza danych. Głównym celem tych systemów jest obniżenie kosztów transakcyjnych przy jednoczesnym skróceniu czasu przetwarzania. Przykłady systemów OLTP obejmują krytyczne działania, takie jak księgowanie zamówień, listy płac, faktury, produkcja, obsługa klienta klienci.

W przeciwieństwie do systemów OLTP, które zostały stworzone z myślą o procesach opartych na transakcjach i zdarzeniach, tj hurtownia danych zostały stworzone, aby zapewnić wsparcie procesów oparte na analizie dać oraz na procesach decyzyjnych.

Zwykle osiąga się to poprzez integrację i dać z różnych systemów OLTP i zewnętrznych w jednym „kontenerze”. dać, jak omówiono w poprzedniej sekcji.

Model procesu hurtowni danych Monash

Model procesu dla hurtownia danych Monash został opracowany przez naukowców z Monash DSS Research Group i opiera się na literaturze hurtownia danych, doświadczenie w dziedzinie systemów wspomagania rozwoju, rozmowy z dostawcami aplikacji do wykorzystania hurtownia danych, na grupie ekspertów w zakresie wykorzystania hurtownia danych.

Fazy to: inicjacja, planowanie, rozwój, operacje i wyjaśnienie. Diagram wyjaśnia iteracyjny lub ewolucyjny charakter rozwoju a hurtownia danych proces za pomocą dwukierunkowych strzałek umieszczonych pomiędzy różnymi fazami. W tym kontekście „iteracyjny” i „ewolucyjny” oznacza, że na każdym etapie procesu działania wdrożeniowe mogą zawsze cofnąć się do poprzedniego etapu. Wynika to ze specyfiki projektu hurtownia danych w którym w dowolnym momencie wystąpią dodatkowe żądania użytkownika końcowego. Na przykład w fazie rozwoju procesu hurtownia danychJeśli użytkownik końcowy zażąda nowego rozmiaru przedmiotu lub obszaru, który nie był częścią pierwotnego planu, musi zostać dodany do systemu. Powoduje to zmianę w projekcie. Powoduje to, że zespół projektowy musi zmienić wymagania tworzonych do tej pory dokumentów w fazie projektowej. W wielu przypadkach obecny stan projektu musi cofnąć się aż do fazy projektowania, w której należy dodać i udokumentować nowe wymagania. Użytkownik końcowy musi mieć możliwość wglądu w konkretną przejrzaną dokumentację i zmiany wprowadzone w fazie rozwoju. Pod koniec tego cyklu rozwoju projekt musi uzyskać dobre opinie zarówno od zespołu programistów, jak i użytkowników. Informacje zwrotne są następnie ponownie wykorzystywane do ulepszania przyszłych projektów.

Planowanie wydajności
dw są zwykle bardzo duże i rosną bardzo szybko (Best 1995, Rudin 1997a) ze względu na ilość dać historyczne, które zachowują od czasu ich trwania. Wzrost może być również spowodowany przez dać dodatki wymagane przez użytkowników w celu zwiększenia wartości dać że już mają. W związku z tym wymagania dotyczące przechowywania dla dać może zostać znacznie wzmocniony (Eckerson 1997). Dlatego konieczne jest zapewnienie, poprzez planowanie wydajności, aby budowany system mógł rosnąć wraz ze wzrostem potrzeb (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Planując skalowalność dw, należy znać oczekiwany wzrost wielkości magazynu, rodzaje pytań, które mogą być zadawane oraz liczbę obsługiwanych użytkowników końcowych (Best 1995, Rudin 1997b, Foley 1997a). Tworzenie skalowalnych aplikacji wymaga połączenia skalowalnych technologii serwerowych i technik projektowania skalowalnych aplikacji (Best 1995, Rudin 1997b. Oba są niezbędne do zbudowania wysoce skalowalnej aplikacji. Skalowalne technologie serwerowe mogą ułatwić i oszczędzić dodawanie pamięci masowej, pamięci i procesora bez pogarszająca się wydajność (Lang 1997, Telefonia 1997).

Istnieją dwie główne technologie skalowalnych serwerów: symetryczne przetwarzanie wielokrotne (SMP) i masowo równoległe przetwarzanie (MPP) (IDC 1997, Humphries i in. 1999). Serwer SMP zazwyczaj ma wiele procesorów współdzielących pamięć, magistrale systemowe i inne zasoby (IDC 1997, Humphries i in. 1999). Dodatkowe procesory można dodać, aby zwiększyć jego wydajność potenza obliczeniowy. Inny sposób na zwiększenie potenza obliczenia serwera SMP, polega na połączeniu wielu maszyn SMP. Ta technika jest znana jako grupowanie (Humphries i in. 1999). Z drugiej strony serwer MPP ma wiele procesorów, każdy z własną pamięcią, systemem magistrali i innymi zasobami (IDC 1997, Humphries i in. 1999). Każdy procesor nazywany jest węzłem. Wzrost w potenza można uzyskać obliczeniową

dodawanie dodatkowych węzłów do serwerów MPP (Humphries et al. 1999).

Słabością serwerów SMP jest to, że zbyt wiele operacji wejścia-wyjścia (I/O) może przeciążyć system magistrali (IDC 1997). Ten problem nie występuje w serwerach MPP, ponieważ każdy procesor ma własny system magistrali. Jednak połączenia między każdym węzłem są generalnie znacznie wolniejsze niż system magistrali SMP. Ponadto serwery MPP mogą dodatkowo skomplikować programistom aplikacji (IDC 1997). Tak więc na wybór między serwerami SMP i MPP może mieć wpływ wiele czynników, w tym złożoność aplikacji, stosunek ceny do wydajności, wymagana przepustowość, zapobieganie aplikacjom dw oraz wzrost rozmiaru baza danych dw oraz w liczbie użytkowników końcowych.

W planowaniu wydajności można zastosować szereg skalowalnych technik projektowania aplikacji. Wykorzystuje się różne okresy sprawozdawcze, takie jak dni, tygodnie, miesiące i lata. Mając różne okresy powiadomień, baza danych można podzielić na łatwo pogrupowane części (Inmon i in. 1997). Inną techniką jest użycie tabel podsumowujących, które są konstruowane przez podsumowanie dać da dać szczegółowe. w ten sposób, ja dać streszczenia są bardziej zwarte niż szczegółowe, co wymaga mniej miejsca w pamięci. więc dać szczegóły można zarchiwizować w tańszej jednostce pamięci masowej, co pozwala zaoszczędzić jeszcze więcej miejsca. Chociaż korzystanie z tabel podsumowań może zaoszczędzić miejsce w pamięci masowej, wymaga wiele wysiłku, aby były aktualne i zgodne z potrzebami biznesowymi. Jednak ta technika jest szeroko stosowana i często stosowana w połączeniu z poprzednią techniką (Best 1995, Inmon 1996a, Chauduri i Dayal
1997).

Definiowanie Hurtownia danych Architektury techniczne Definicja technik architektury dw

Pierwsi użytkownicy hurtowni danych wyobrażali sobie przede wszystkim scentralizowaną implementację hurtowni danych, w której wszystkie dać, w tym ja dać zewnętrzne, zostały zintegrowane w jedną,
repozytorium fizyczne (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Główną zaletą tego podejścia jest to, że użytkownicy końcowi mają dostęp do widoku całego przedsiębiorstwa dać organizacyjny (Ovum 1998). Kolejnym plusem jest to, że oferuje standaryzację dać w całej organizacji, co oznacza, że istnieje tylko jedna wersja lub definicja każdej terminologii używanej w metadanych repozytorium dw (Flanagan i Safdie 1997, Ovum 1998). Z drugiej strony wadą tego podejścia jest to, że jest drogie i trudne do skonstruowania (Flanagan i Safdie 1997, Ovum 1998, Inmon i in. 1998). Niedługo po architekturze pamięci masowej dać scentralizowane stało się popularne, ewoluowała koncepcja wydobywania najmniejszych podzbiorów bogów dać do obsługi potrzeb konkretnych aplikacji (Varney 1996, IDC 1997, Berson i Smith 1997, peacock 1998). Te małe systemy wywodzą się z większego hurtownia danych scentralizowane. Są nazwane hurtownia danych zbiorcze dane pracowników działów lub pracowników. Zależna architektura hurtowni danych jest znana jako architektura trójwarstwowa, w której pierwsza warstwa składa się z hurtownia danych scentralizowane, drugie składa się z depozytów dać departamentalny, a trzeci polega na dostępie do dać oraz za pomocą narzędzi analitycznych (Demarest 1994, Inmon i in. 1997).

Bazy danych są zwykle budowane po hurtownia danych scentralizowany został zbudowany na potrzeby konkretnych jednostek (White 1995, Varney 1996).
Sklep hurtowni danych i dać odnoszące się do poszczególnych jednostek (Inmon i in. 1997, Inmon i in. 1998, IA 1998).

Zaletą tej metody jest to, że nie będzie data niezintegrowane i że ja dać będą mniej zbędne w hurtowniach danych, ponieważ wszystkie dać pochodzić z depozytu dać zintegrowany. Kolejną zaletą jest to, że będzie mniej powiązań między poszczególnymi bazami danych a ich źródłami dać ponieważ każda hurtownia danych ma tylko jedno źródło dać. Ponadto dzięki tej architekturze użytkownicy końcowi nadal mają dostęp do plików dać

organizacje korporacyjne. Ta metoda jest znana jako metoda odgórna, w której hurtownie danych są budowane po hurtownia danych (paw 1998, Goff 1998).
Zwiększając potrzebę wczesnego pokazywania wyników, niektóre organizacje zaczęły budować niezależne hurtownie danych (Flanagan i Safdie 1997, White 2000). W tym przypadku hurtownie danych dostają swoje dać prosto od podstaw dać OLTP i inne niż OLTP ze scentralizowanego i zintegrowanego repozytorium, eliminując w ten sposób potrzebę posiadania centralnego repozytorium.

Każda hurtownia danych wymaga co najmniej jednego łącza do swoich źródeł dać. Wadą posiadania wielu linków do każdej hurtowni danych jest to, że w porównaniu z poprzednimi dwiema architekturami nadmiar dać znacznie wzrasta.

Każda hurtownia danych musi przechowywać wszystkie dać wymagane lokalnie, aby nie miały wpływu na systemy OLTP. To powoduje, że ja dać są one przechowywane w różnych hurtowniach danych (Inmon i in. 1997). Inną wadą tej architektury jest to, że prowadzi ona do tworzenia złożonych połączeń między hurtowniami danych a ich źródłami danych. dać które są trudne do wdrożenia i kontroli (Inmon et al. 1997).

Inną wadą jest to, że użytkownicy końcowi mogą nie mieć dostępu do przeglądu informacji o firmie, ponieważ: dać różnych baz danych nie są zintegrowane (Ovum 1998).
Jeszcze inną wadą jest to, że może istnieć więcej niż jedna definicja każdej terminologii używanej w hurtowniach danych, która generuje niespójności danych. dać w organizacji (Ovum 1998).
Pomimo omówionych powyżej wad samodzielne hurtownie danych nadal budzą zainteresowanie wielu organizacji (IDC 1997). Jednym z czynników, który czyni je atrakcyjnymi, jest to, że rozwijają się szybciej i wymagają mniej czasu i zasobów (Bresnahan 1996, Berson i Smith 1997, Ovum 1998). W związku z tym służą przede wszystkim jako projekty testowe, które można wykorzystać do szybkiej identyfikacji korzyści i/lub niedociągnięć w projekcie (Parsaye 1995, Braly 1995, Newing 1996). W takim przypadku część do wdrożenia w projekcie pilotażowym musi być niewielka, ale ważna dla organizacji (Newing 1996, Mansell-Lewis 1996).

Badając prototyp, użytkownicy końcowi i kierownictwo mogą zdecydować, czy kontynuować, czy przerwać projekt (Flanagan i Safdie 1997).
Jeśli decyzja ma być kontynuowana, hurtownie danych dla innych branż powinny być budowane pojedynczo. Istnieją dwie opcje dla użytkowników końcowych w zależności od ich potrzeb w zakresie konstruowania niezależnych macierzy danych: zintegrowane/sfederowane i niezintegrowane (Ovum 1998)

W pierwszej metodzie każda nowa hurtownia danych powinna być budowana w oparciu o obecne hurtownie danych i model dać używane przez firmę (Varney 1996, Berson i Smith 1997, Peacock 1998). Konieczność korzystania z modelu dać przedsiębiorstwa oznacza, że należy upewnić się, że istnieje tylko jedna definicja dla każdej terminologii używanej w hurtowniach danych, a także w celu zapewnienia, że różne hurtownie danych mogą być łączone w celu uzyskania przeglądu informacji przedsiębiorstwa (Bresnahan 1996). Metoda ta nazywana jest metodą oddolną i jest najlepiej stosowana, gdy istnieją ograniczenia finansowe i czasowe (Flanagan i Safdie 1997, Ovum 1998, peacock 1998, Goff 1998). W drugiej metodzie budowane hurtownie danych mogą zaspokoić tylko potrzeby konkretnej jednostki. Wariantem federacyjnej hurtowni danych jest hurtownia danych dystrybuowane, w którym baza danych Oprogramowanie pośredniczące serwera centralnego służy do łączenia wielu hurtowni danych w jedno repozytorium dać rozproszone (biały 1995). w tym przypadku dać firmy są rozproszone w kilku bazach danych. Żądania użytkowników końcowych są przekazywane do baza danych oprogramowanie pośredniczące serwera centralnego, które wyodrębnia wszystkie dać żądane przez hurtownie danych i przesyłają wyniki z powrotem do aplikacji użytkowników końcowych. Ta metoda zapewnia użytkownikom końcowym informacje biznesowe. Jednak problemy niezależnych hurtowni danych wciąż nie zostały wyeliminowane. Istnieje inna architektura, której można użyć, zwana hurtownia danych wirtualny (biały 1995). Jednak ta architektura, przedstawiona na rysunku 2.9, nie jest architekturą przechowywania danych dać real, ponieważ nie przenosi obciążenia z systemów OLTP do hurtownia danych (Demarest 1994).

Właściwie prośby o dać przez użytkowników końcowych są one przekazywane do systemów OLTP, które zwracają wyniki po przetworzeniu żądań użytkowników. Chociaż ta architektura umożliwia użytkownikom końcowym generowanie raportów i wysyłanie żądań, nie może zapewnić i

dać historia i przegląd informacji o firmie od i dać ponieważ różne systemy OLTP nie są zintegrowane. Dlatego ta architektura nie może spełnić analizy dać takie jak prognozy.

Wybór aplikacji dostępowych i odzyskiwania danych dać

Celem budowy A hurtownia danych ma na celu przekazanie informacji użytkownikom końcowym (Inmon i in. 1997, Poe 1996, McFadden 1996, Shanks i in. 1997, Hammergren 1998); jedną lub więcej aplikacji dostępu i odzyskiwania dać musi być zapewnione. Do chwili obecnej użytkownik ma do wyboru szeroką gamę takich aplikacji (Hammergren 1998, Humphries i in. 1999). Wybrane aplikacje decydują o powodzeniu prac magazynowych dać w organizacji, ponieważ aplikacje są najbardziej widoczną częścią hurtownia danych do użytkownika końcowego (Inmon i in. 1997, Poe 1996). Aby odnieść sukces A hurtownia danych, musi być w stanie wspierać działania związane z analizą danych dać użytkownika końcowego (Poe 1996, Seddon i Benjamin 1998, Eckerson 1999). Dlatego należy określić „poziom” tego, czego chce użytkownik końcowy (Poe 1996, Mattison 1996, Inmon i in. 1997, Humphries i in. 1999).

Ogólnie użytkowników końcowych można podzielić na trzy kategorie: użytkownicy wykonawczy, analitycy biznesowi i użytkownicy zaawansowani (Poe 1996, Humphries i in. 1999). Użytkownicy wykonawczy potrzebują łatwego dostępu do predefiniowanych zestawów raportów (Humphries i in. 1999). Dostęp do tych raportów można łatwo uzyskać za pomocą nawigacji w menu (Poe 1996). Ponadto raporty powinny przedstawiać informacje za pomocą reprezentacji graficznej, takiej jak tabele i szablony, aby szybko przekazywać informacje (Humphries i in. 1999). Analitycy biznesowi, którzy mogą nie mieć technicznych możliwości samodzielnego tworzenia raportów od podstaw, muszą mieć możliwość modyfikowania bieżących raportów, aby spełniały ich specyficzne potrzeby (Poe 1996, Humphries i in. 1999). Z drugiej strony użytkownicy zaawansowani to typ użytkownika końcowego, który ma możliwość generowania i pisania żądań i raportów od podstaw (Poe 1996, Humphries i in. 1999). Oni są tymi, którzy

budują relacje dla innych typów użytkowników (Poe 1996, Humphries i in. 1999).

Po określeniu wymagań użytkownika końcowego należy dokonać wyboru aplikacji dostępu i odzyskiwania dać spośród wszystkich dostępnych (Poe 1996, Inmon i in. 1997).
Dostęp do dać i narzędzia wyszukiwania można podzielić na 4 typy: narzędzie OLAP, narzędzie EIS/DSS, narzędzie do zapytań i raportowania oraz narzędzie do eksploracji danych.

Narzędzia OLAP umożliwiają użytkownikom tworzenie zapytań ad hoc, jak również tych tworzonych w sieci baza danych del hurtownia danych. Ponadto produkty te umożliwiają użytkownikom drążenie w dół dać ogólnych do szczegółowych.

Narzędzia EIS/DSS zapewniają raportowanie wykonawcze, takie jak analiza „co by było, gdyby” oraz dostęp do raportów opartych na menu. Raporty powinny być wstępnie zdefiniowane i połączone z menu w celu ułatwienia nawigacji.
Narzędzia do tworzenia zapytań i raportowania umożliwiają użytkownikom tworzenie predefiniowanych i określonych raportów.

Narzędzia eksploracji danych służą do identyfikowania relacji, które mogą rzucić nowe światło na zapomniane operacje dać hurtowni danych.

Oprócz optymalizacji wymagań każdego typu użytkownika wybrane narzędzia muszą być intuicyjne, wydajne i łatwe w użyciu. Muszą być również kompatybilne z innymi częściami architektury i zdolne do pracy z istniejącymi systemami. Sugeruje się również wybór narzędzi do dostępu i wyszukiwania danych w rozsądnej cenie i wydajności. Inne kryteria, które należy wziąć pod uwagę, obejmują zobowiązanie dostawcy narzędzi do wspierania ich produktu oraz udoskonalenia, które będą wprowadzane w przyszłych wersjach. Aby zapewnić zaangażowanie użytkownika w korzystanie z hurtowni danych, zespół programistów włącza użytkowników w proces wyboru narzędzia. W takim przypadku należy przeprowadzić praktyczną ocenę użytkownika.

Aby zwiększyć wartość hurtowni danych, zespół programistów może również zapewnić dostęp internetowy do swoich hurtowni danych. Hurtownia danych z obsługą sieci umożliwia użytkownikom dostęp do dać z odległych miejsc lub podczas podróży. Również informacje mogą

być świadczone po niższych kosztach dzięki obniżeniu kosztów szkolenia.

2.4.3 Hurtownia danych Faza operacyjna

Faza ta składa się z trzech czynności: zdefiniowania strategii odświeżania danych, kontroli działań hurtowni danych oraz zarządzania bezpieczeństwem hurtowni danych.

Definicja strategii odświeżania danych

Po wstępnym załadowaniu, tj dać w baza danych hurtownia danych musi być okresowo odświeżana w celu odtworzenia zmian dokonanych na dać oryginały. Musisz więc zdecydować, kiedy odświeżyć, jak często odświeżanie powinno być zaplanowane i jak odświeżyć dać. Sugeruje się odświeżenie dać kiedy system może zostać przełączony w tryb offline. Częstotliwość odświeżania jest określana przez zespół programistów na podstawie wymagań użytkownika. Istnieją dwa podejścia do odświeżania hurtowni danych: pełne odświeżanie i ciągłe przesyłanie zmian.

Pierwsze podejście, pełne odświeżenie, wymaga ponownego załadowania wszystkich dać od zera. Oznacza to, że wszystkie dać wymagane muszą zostać wyodrębnione, oczyszczone, przekształcone i włączone do każdego odświeżenia. W miarę możliwości należy unikać tego podejścia, ponieważ jest ono czasochłonne i pochłania zasoby.

Alternatywnym podejściem jest ciągłe przesyłanie zmian. To dodaje I dać które uległy zmianie od ostatniego cyklu odświeżania hurtowni danych. Identyfikacja nowych lub zmienionych rekordów znacznie zmniejsza ich ilość dać które muszą być propagowane do hurtowni danych w każdej aktualizacji jako tylko te dać zostanie dodany do baza danych hurtowni danych.

Istnieje co najmniej 5 podejść, które można wykorzystać do wycofania, tj dać nowe lub zmodyfikowane. Aby osiągnąć skuteczną strategię odświeżania wideo dać przydatne może być połączenie tych podejść, które pobierają wszystkie zmiany w systemie.

Pierwsze podejście, które wykorzystuje znaczniki czasu, zakłada, że każdy jest przypisany dać edytował i aktualizował znacznik czasu, dzięki czemu można łatwo zidentyfikować wszystkie dać zmodyfikowane i nowe. Jednak to podejście nie było obecnie powszechnie stosowane w większości systemów operacyjnych.
Drugie podejście polega na użyciu pliku delta wygenerowanego przez aplikację, który zawiera tylko zmiany wprowadzone w pliku dać. Korzystanie z tego pliku również wzmacnia cykl aktualizacji. Jednak nawet ta metoda nie była stosowana w wielu zastosowaniach.
Trzecie podejście polega na przeskanowaniu pliku dziennika, który zasadniczo zawiera informacje podobne do pliku delta. Jedyna różnica polega na tym, że dla procesu odzyskiwania tworzony jest plik dziennika, co może być trudne do zrozumienia.
Czwartym podejściem jest modyfikacja kodu aplikacji. Jednak większość kodu aplikacji jest stara i łamliwa; dlatego należy unikać tej techniki.
Ostatnim podejściem jest porównanie i dać source z głównym plikiem dei dać.

Monitorowanie działań hurtowni danych

Po udostępnieniu hurtowni danych użytkownikom należy ją monitorować w czasie. W takim przypadku administrator hurtowni danych może zastosować jedno lub więcej narzędzi do zarządzania i kontroli w celu monitorowania wykorzystania hurtowni danych. W szczególności zbierane mogą być informacje o osobach oraz czasie, w jakim uzyskują dostęp do hurtowni danych. Pospiesz się dać zebrane, można utworzyć profil wykonanej pracy, który może być wykorzystany jako dane wejściowe do wdrożenia obciążenia zwrotnego użytkownika. Chargeback pozwala na informowanie użytkowników o koszcie przetwarzania hurtowni danych.

Ponadto audyt hurtowni danych może być również wykorzystany do identyfikacji typów zapytań, ich wielkości, liczby zapytań dziennie, czasów reakcji na zapytania, sektorów, do których docierają oraz ilości dać obrobiony. Innym celem przeprowadzania audytu hurtowni danych jest identyfikacja dać które nie są używane. Te dać można je usunąć z hurtowni danych, aby skrócić czas

odpowiedzi na wykonanie zapytania i kontrolować wzrost dać które znajdują się w Baza danych hurtowni danych.

Zarządzanie bezpieczeństwem hurtowni danych

Hurtownia danych zawiera dać zintegrowane, krytyczne, wrażliwe, do których można łatwo dotrzeć. Z tego powodu należy go chronić przed nieautoryzowanymi użytkownikami. Jednym ze sposobów implementacji zabezpieczeń jest użycie funkcji del DBMS przydzielać różne uprawnienia różnym typom użytkowników. W ten sposób należy zachować profil dostępu dla każdego typu użytkownika. Innym sposobem zabezpieczenia hurtowni danych jest jej zaszyfrowanie zgodnie z instrukcją Baza danych hurtowni danych. Dostęp do dać a narzędzia do odzyskiwania muszą odszyfrować dać przed prezentacją wyników użytkownikom.

2.4.4 Hurtownia danych Faza wdrażania

Jest to ostatni etap cyklu wdrożenia hurtowni danych. Czynności do wykonania w tej fazie obejmują przeszkolenie użytkowników w zakresie korzystania z hurtowni danych oraz przeprowadzanie przeglądów hurtowni danych.

Trening użytkownika

Przed uzyskaniem dostępu należy przeprowadzić szkolenie użytkowników dać hurtowni danych i wykorzystania narzędzi wyszukiwania. Ogólnie rzecz biorąc, sesje powinny rozpocząć się od wprowadzenia do koncepcji przechowywania dać, zawartość hurtowni danych, meta dać oraz podstawowe cechy narzędzi. Następnie bardziej zaawansowani użytkownicy mogą również badać fizyczne tabele i funkcje użytkowników narzędzi dostępu do danych i ich wyszukiwania.

Istnieje wiele podejść do szkolenia użytkowników. Jeden z nich obejmuje wybór wielu użytkowników lub analityków wybranych z puli użytkowników, w oparciu o ich umiejętności przywódcze i komunikacyjne. Są oni osobiście przeszkoleni w zakresie wszystkiego, co jest im potrzebne do zapoznania się z systemem. Po szkoleniu wracają do pracy i zaczynają uczyć innych użytkowników obsługi systemu. Na

Na podstawie tego, czego się nauczyli, inni użytkownicy mogą rozpocząć eksplorację hurtowni danych.
Innym podejściem jest szkolenie wielu użytkowników w tym samym czasie, tak jakbyś szkolił się w klasie. Ta metoda jest odpowiednia, gdy jest wielu użytkowników, którzy muszą być szkoleni w tym samym czasie. Jeszcze inną metodą jest szkolenie każdego użytkownika indywidualnie, jeden po drugim. Ta metoda jest odpowiednia, gdy jest niewielu użytkowników.

Celem szkolenia użytkowników jest zapoznanie się z dostępem do dać i narzędzi wyszukiwania, a także zawartości hurtowni danych. Jednak niektórzy użytkownicy mogą być przytłoczeni ilością informacji przekazywanych podczas sesji szkoleniowej. Następnie należy przeprowadzić kilka sesji przypominających, aby uzyskać stałe wsparcie i odpowiedzieć na konkretne pytania. W niektórych przypadkach tworzona jest grupa użytkowników w celu zapewnienia tego rodzaju wsparcia.

Zbieranie opinii

Po wdrożeniu hurtowni danych użytkownicy mogą korzystać z i dać przebywających w hurtowni danych w różnych celach. Najczęściej analitycy lub użytkownicy używają i dać w hurtowni danych dla:

1 Zidentyfikuj trendy firmy
2 Przeanalizuj profile zakupowe klienci
3 Podział I klienci i
4 Zapewnij najlepsze usługi dla klienci – dostosować usługi
5 Formułuj strategie marketing
6 Sporządzaj konkurencyjne oferty na potrzeby analiz kosztów i pomocy w kontroli
7 Wspieraj podejmowanie strategicznych decyzji
8 Zidentyfikuj pojawiające się możliwości
9 Popraw jakość bieżących procesów biznesowych
10 Sprawdź zysk

Podążając za kierunkiem rozwoju hurtowni danych można przeprowadzić szereg przeglądów systemu w celu uzyskania informacji zwrotnej

zarówno przez zespół programistów, jak i przez społeczność użytkowników końcowych.
Uzyskane wyniki mogą zostać uwzględnione w kolejnym cyklu rozwojowym.

Ponieważ hurtownia danych ma podejście przyrostowe, ważne jest, aby uczyć się na sukcesach i błędach poprzednich rozwiązań.

2.5 Podsumowanie

W tym rozdziale omówiono podejścia obecne w literaturze. W części 1 omówiono koncepcję hurtowni danych i jej rolę w naukach decyzyjnych. W sekcji 2 opisano główne różnice między hurtowniami danych a systemami OLTP. W sekcji 3 omówiono model hurtowni danych Monash, który został wykorzystany w sekcji 4 do opisania działań związanych z procesem tworzenia hurtowni danych, twierdzenia te nie były oparte na rygorystycznych badaniach. To, co dzieje się w rzeczywistości, może bardzo różnić się od tego, co podaje literatura, jednak wyniki te można wykorzystać do stworzenia podstawowego bagażu, który podkreśla koncepcję hurtowni danych dla tych badań.

Rozdział 3

Metody badawcze i projektowe

Ten rozdział dotyczy metod badawczych i projektowych dla tego badania. W pierwszej części przedstawiono ogólny pogląd na dostępne metody badawcze służące pozyskiwaniu informacji, ponadto omówiono kryteria wyboru najlepszej metody do konkretnego badania. W części 2 omówiono następnie dwie metody wybrane według powyższych kryteriów; jedno z nich zostanie wybrane i przyjęte z powodów określonych w sekcji 3, w której podane są również przyczyny wykluczenia drugiego kryterium. W części 4 przedstawiono projekt badawczy, a w części 5 wnioski.

3.1 Badania systemów informatycznych

Badania systemów informacyjnych nie ograniczają się po prostu do sfery technologicznej, ale muszą być również rozszerzone o cele behawioralne i organizacyjne.
Zawdzięczamy to tezom różnych dyscyplin, od nauk społecznych po przyrodnicze; prowadzi to do konieczności zastosowania pewnego spektrum metod badawczych obejmujących metody ilościowe i jakościowe do systemów informatycznych.
Wszystkie dostępne metody badawcze są ważne, w rzeczywistości kilku badaczy, takich jak Jenkins (1985), Nunamaker i in. (1991) i Galliers (1992) twierdzą, że nie ma określonej, uniwersalnej metody prowadzenia badań w różnych dziedzinach systemów informatycznych; w rzeczywistości metoda może być odpowiednia dla konkretnego badania, ale nie dla innych. To prowadzi nas do konieczności wyboru metody, która jest odpowiednia dla naszego konkretnego projektu badawczego: do tego wyboru Benbasat et al. (1987) stwierdzają, że należy wziąć pod uwagę charakter i cel badań.

3.1.1 Charakter badań

Różne metody badawcze oparte na przyrodzie można podzielić na trzy szeroko znane tradycje w informatyce: badania pozytywistyczne, interpretacyjne i krytyczne.

3.1.1.1 Badania pozytywistyczne

Badania pozytywistyczne są również znane jako badania naukowe lub empiryczne. Ma na celu: „wyjaśnianie i przewidywanie tego, co wydarzy się w świecie społecznym, poprzez przyjrzenie się prawidłowościom i związkom przyczynowo-skutkowym między elementami, które go tworzą” (Shanks i in. 1993).

Badania pozytywistyczne cechuje również powtarzalność, uproszczenia i obalenia. Co więcej, badania pozytywistyczne dopuszczają istnienie relacji apriorycznych między badanymi zjawiskami.
Według Galliersa (1992) taksonomia jest metodą badawczą zaliczaną do paradygmatu pozytywistycznego, która jednak nie ogranicza się do tego, w rzeczywistości są to eksperymenty laboratoryjne, eksperymenty terenowe, studia przypadków, demonstracje twierdzeń, przewidywania i symulacje. Korzystając z tych metod, badacze przyznają, że badane zjawiska można obserwować obiektywnie i rygorystycznie.

3.1.1.2 Badania interpretacyjne

Neuman (1994) opisuje badania interpretacyjne, często nazywane fenomenologią lub antypozytywizmem, jako „systematyczną analizę społecznego sensu działania poprzez bezpośrednią i szczegółową obserwację ludzi w sytuacjach naturalnych, w celu dojścia do zrozumienia i interpretacją tego, jak ludzie tworzą i utrzymują swój społeczny świat”. Badania interpretatywne odrzucają założenie, że obserwowane zjawiska można obserwować obiektywnie. W rzeczywistości opierają się one na subiektywnych interpretacjach. Co więcej, badacze interpretatywni nie narzucają a priori znaczeń badanym zjawiskom.

Ta metoda obejmuje badania subiektywne/argumentacyjne, badania w działaniu, badania opisowe/interpretacyjne, badania przyszłości i odgrywanie ról. Oprócz tych ankiet i studiów przypadków, podejście to może obejmować badania osób lub organizacji w złożonych sytuacjach rzeczywistych.

3.1.1.3 Badania krytyczne

Wyszukiwanie krytyczne jest najmniej znanym podejściem w naukach społecznych, ale ostatnio zwróciło na siebie uwagę badaczy zajmujących się systemami informatycznymi. Filozoficzne założenie, że rzeczywistość społeczna jest historycznie wytwarzana i reprodukowana przez ludzi, a także systemy społeczne wraz z ich działaniami i interakcjami. Ich zdolność jest jednak pośredniczona przez szereg względów społecznych, kulturowych i politycznych.

Podobnie jak badania interpretacyjne, badania krytyczne argumentują, że badania pozytywistyczne nie mają nic wspólnego z kontekstem społecznym i ignorują jego wpływ na ludzkie działania.
Z drugiej strony badania krytyczne krytykują badania interpretacyjne za to, że są zbyt subiektywne i nie mają na celu pomocy ludziom w poprawie ich życia. Największą różnicą między badaniami krytycznymi a pozostałymi dwoma podejściami jest ich wymiar ewaluacyjny. Podczas gdy obiektywność tradycji pozytywistycznych i interpretacyjnych polega na przewidywaniu lub wyjaśnianiu status quo lub rzeczywistości społecznej, badania krytyczne mają na celu krytyczną ocenę i transformację badanej rzeczywistości społecznej.

Krytyczni badacze zwykle sprzeciwiają się status quo w celu usunięcia różnic społecznych i poprawy warunków społecznych. Badania krytyczne opierają się na procesowym spojrzeniu na interesujące nas zjawiska i dlatego są zwykle podłużne. Przykładami metod badawczych są wieloletnie studia historyczne i etnograficzne. Wyszukiwanie krytyczne nie było jednak szeroko stosowane w badaniach systemów informacyjnych

3.1.2 Cel badań

Wraz z charakterem badania jego cel może służyć jako wskazówka dla badacza w wyborze określonej metody badawczej. Zakres projektu badawczego jest ściśle powiązany z pozycją badań w stosunku do cyklu badawczego, który składa się z trzech faz: budowania teorii, testowania teorii i udoskonalania teorii. Tak więc, w oparciu o rozmach w odniesieniu do cyklu badawczego, projekt badawczy może mieć cel wyjaśniający, opisowy, eksploracyjny lub prognostyczny.

3.1.2.1 Badania eksploracyjne

Badania eksploracyjne mają na celu zbadanie zupełnie nowego tematu oraz sformułowanie pytań i hipotez dla przyszłych badań. Ten rodzaj badań jest wykorzystywany w budowaniu teorii w celu uzyskania wstępnych odniesień w nowej dziedzinie. Zwykle stosuje się jakościowe metody badawcze, takie jak studia przypadków czy badania fenomenologiczne.

Możliwe jest jednak również zastosowanie technik ilościowych, takich jak badania eksploracyjne lub eksperymenty.

3.1.3.3 Wyszukiwanie opisowe

Badania opisowe mają na celu analizę i szczegółowy opis konkretnej sytuacji lub praktyki organizacyjnej. Jest to odpowiednie do konstruowania teorii i może być również używane do potwierdzania lub kwestionowania hipotez. Badania opisowe zwykle polegają na wykorzystaniu pomiarów i próbek. Odpowiednie metody badawcze obejmują ankiety i analizy tła.

3.1.2.3 Badania wyjaśniające

Badania wyjaśniające próbują wyjaśnić, dlaczego coś się dzieje. Opiera się na faktach, które zostały już zbadane i próbuje znaleźć przyczyny tych faktów.
Zatem badania wyjaśniające są zwykle budowane na podstawie badań eksploracyjnych lub opisowych i mają charakter pomocniczy w stosunku do testowania i udoskonalania teorii. Badania wyjaśniające zazwyczaj wykorzystują studia przypadków lub metody badawcze oparte na ankietach.

3.1.2.4 Badania prewencyjne

Badania prewencyjne mają na celu przewidywanie obserwowanych zdarzeń i zachowań, które są badane (Marshall i Rossman 1995). Przewidywanie jest standardowym naukowym testem prawdy. Ten rodzaj badań zazwyczaj wykorzystuje ankiety lub analizę danych dać historycy. (Jin 1989)

Z powyższego omówienia wynika, że istnieje szereg możliwych metod badawczych, które można zastosować w konkretnym badaniu. Jednak musi istnieć konkretna metoda, która jest bardziej odpowiednia niż inne dla określonego rodzaju projektu badawczego. (Galliers 1987, Yin 1989, De Vaus 1991). Dlatego każdy badacz musi dokładnie ocenić mocne i słabe strony różnych metod, aby przyjąć najbardziej odpowiednią metodę badawczą zgodną z projektem badawczym. (Jenkins 1985, Pervan i Klass 1992, Bonomia 1985, Yin 1989, Himilton i Ives 1992).

3.2. Możliwe metody wyszukiwania

Celem tego projektu było zbadanie doświadczeń australijskich organizacji z i dać przechowywane z rozwojem hurtownia danych. Dane że obecnie w Australii brakuje badań w obszarze hurtowni danych, niniejszy projekt badawczy jest jeszcze w fazie teoretycznej cyklu badawczego i ma cel eksploracyjny. Zbadanie doświadczeń australijskich organizacji wdrażających hurtownie danych wymaga interpretacji rzeczywistego społeczeństwa. W konsekwencji filozoficzne założenie leżące u podstaw projektu badawczego jest zgodne z tradycyjną interpretacją.

Po dokładnym zbadaniu dostępnych metod zidentyfikowano dwie możliwe metody badawcze: ankiety i studia przypadków, które można wykorzystać do badań eksploracyjnych (Shanks i in. 1993). Galliers (1992) argumentuje przydatność tych dwóch metod do tego konkretnego badania w swojej poprawionej taksonomii, mówiąc, że nadają się one do konstrukcji teoretycznych. W kolejnych dwóch podsekcjach szczegółowo omówiono każdą metodę.

3.2.1 Metoda badań ankietowych

Metoda badań sondażowych wywodzi się ze starożytnej metody spisowej. Spis polega na zebraniu informacji z całej populacji. Ta metoda jest droga i niepraktyczna, zwłaszcza jeśli populacja jest duża. Tak więc, w porównaniu ze spisem powszechnym, badanie ankietowe jest zwykle skoncentrowane na zebraniu informacji dla niewielkiej liczby lub próby przedstawicieli populacji (Fowler 1988, Neuman 1994). Próba odzwierciedla populację, z której została pobrana, z różnym stopniem dokładności, w zależności od struktury próby, wielkości i zastosowanej metody selekcji (Fowler 1988, Babbie 1982, Neuman 1994).

Metodę ankiety definiuje się jako „zdjęcia praktyk, sytuacji lub poglądów w określonym momencie, sporządzone za pomocą kwestionariuszy lub wywiadów, z których można wyciągnąć wnioski
wykonane” (Galliers 1992:153) [zdjęcia migawkowe praktyk, sytuacji lub poglądów w określonym momencie, wykonane za pomocą kwestionariuszy lub wywiadów, z których można wyciągnąć wnioski]. Ankiety dotyczą zbierania informacji o pewnych aspektach badania od pewnej liczby uczestników poprzez zadawanie pytań (Fowler 1988). Te kwestionariusze i wywiady, które obejmują bezpośrednie wywiady telefoniczne i wywiady ustrukturyzowane, są również technikami zbierania danych dać wykorzystywane w ankietach (Blalock 1970, Nachmias i Nachmias 1976, Fowler 1988), można wykorzystać obserwacje i analizy (Gable 1994). Ze wszystkich tych metod zbierania bogów dać, wykorzystanie kwestionariusza jest najpopularniejszą techniką, ponieważ zapewnia, że i dać

gromadzone informacje są uporządkowane i sformatowane, co ułatwia klasyfikację informacji (Hwang 1987, de Vaus 1991).

Analizując I dać, strategia badania często wykorzystuje techniki ilościowe, takie jak analiza statystyczna, ale można również zastosować techniki jakościowe (Galliers 1992, Pervan

i Klass 1992, Gable 1994). Normalnie, ja dać zebrane są wykorzystywane do analizy rozkładów i wzorców skojarzeń (Fowler 1988).

Chociaż ankiety są ogólnie odpowiednie do wyszukiwań dotyczących pytania „co?” (co) lub wywodząc się z tego, jak „quanto” (ile) i „quant'è” (ile), można je zadać poprzez pytanie „dlaczego” (Sonquist i Dunkelberg 1977, Yin 1989). Według Sonquista i Dunkelberga (1977) dociekanie badawcze ma na celu postawienie twardych hipotez, programów ewaluacyjnych, opisanie populacji i wypracowanie modeli zachowań ludzkich. Co więcej, ankiety mogą być wykorzystywane do badania opinii, warunków, przekonań, cech, oczekiwań, a nawet przeszłych lub obecnych zachowań określonej populacji (Neuman 1994).

Ankiety pozwalają badaczowi odkryć relacje populacyjne, a wyniki są zwykle bardziej ogólne niż inne metody (Sonquist i Dunkelberg 1977, Gable 1994). Ankiety pozwalają badaczom objąć szerszy obszar geograficzny i dotrzeć do dużej liczby respondentów (Blalock 1970, Sonquist i Dunkelberg 1977, Hwang i Lin 1987, Gable 1994, Neuman 1994). Wreszcie, ankiety mogą dostarczyć informacji, które nie są dostępne gdzie indziej lub w formie wymaganej do analiz (Fowler 1988).

Istnieją jednak pewne ograniczenia dotyczące przeprowadzania ankiety. Wadą jest to, że badacz nie może uzyskać wielu informacji o badanym obiekcie. Wynika to z faktu, że badania przeprowadzane są tylko w określonym czasie, a co za tym idzie, istnieje ograniczona liczba zmiennych i osób, które badacz może

badania (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Inną wadą jest to, że przeprowadzenie ankiety może być bardzo kosztowne pod względem czasu i zasobów, zwłaszcza jeśli obejmuje wywiady bezpośrednie (Fowler 1988).

3.2.2. Metoda badania zapytania

Metoda badania dociekającego polega na dogłębnym zbadaniu konkretnej sytuacji w jej rzeczywistym kontekście przez określony czas, bez jakiejkolwiek interwencji ze strony badacza (Shanks i C. 1993, Eisenhardt 1989, Jenkins 1985). Głównie ta metoda jest używana do opisu relacji między badanymi zmiennymi w konkretnej sytuacji (Galliers 1992). Badania mogą dotyczyć jednego lub wielu przypadków, w zależności od analizowanego zjawiska (Franz i Robey 1987, Eisenhardt 1989, Yin 1989).

Metodę badania dociekającego definiuje się jako „badanie empiryczne, które bada współczesne zjawisko w jego rzeczywistym kontekście, przy użyciu wielu źródeł pochodzących od jednego lub więcej podmiotów, takich jak ludzie, grupy lub organizacje” (Yin 1989). Nie ma wyraźnego oddzielenia zjawiska od jego kontekstu i nie ma kontroli ani eksperymentalnej manipulacji zmiennymi (Yin 1989, Benbasat i in. 1987).

Istnieje wiele technik zbierania bogów dać które można zastosować w metodzie badawczej, do których należą obserwacje bezpośrednie, przeglądy archiwaliów, kwestionariusze, przegląd dokumentacji i wywiady ustrukturyzowane. Różnorodność technik zbioru dać, ankiety pozwalają naukowcom zająć się obydwoma dać jakościowy i ilościowy jednocześnie (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Podobnie jak w przypadku metody sondażowej, badacz ankietowy pełni rolę obserwatora lub badacza, a nie aktywnego uczestnika badanej organizacji.

Benbasat i wsp. (1987) twierdzą, że metoda dociekania jest szczególnie odpowiednia do konstruowania teorii badawczej, która zaczyna się od pytania badawczego i jest kontynuowana przez szkolenie.

teorii w procesie kolekcjonowania dać. Nadaje się również na scenę

Jeśli chodzi o budowanie teorii, Franz i Robey (1987) sugerują, że metoda dociekania może być również stosowana w fazie złożonej teorii. W tym przypadku na podstawie zebranych dowodów dana teoria lub hipoteza jest weryfikowana lub obalana. Ponadto zapytanie nadaje się również do badań zajmujących się pytaniami „jak” lub „dlaczego” (Yin 1989).

W porównaniu z innymi metodami ankiety pozwalają badaczowi na bardziej szczegółowe uchwycenie istotnych informacji (Galliers 1992, Shanks i in. 1993). Ponadto badania pozwalają badaczowi zrozumieć naturę i złożoność badanych procesów (Benbasat i in. 1987).

Istnieją cztery główne wady związane z metodą zapytania. Pierwszym z nich jest brak kontrolowanych potrąceń. Subiektywność badacza może zmienić wyniki i wnioski badania (Yin 1989). Drugą wadą jest brak kontrolowanej obserwacji. W przeciwieństwie do metod eksperymentalnych badacz dociekający nie może kontrolować badanych zjawisk, ponieważ są one badane w ich naturalnym kontekście (Gable 1994). Trzecią wadą jest brak powtarzalności. Wynika to z faktu, że badacz raczej nie obserwuje tych samych zdarzeń i nie może zweryfikować wyników konkretnego badania (Lee 1989). Wreszcie, ze względu na brak powtarzalności, trudno jest uogólnić wyniki uzyskane z jednego lub kilku badań (Galliers 1992, Shanks i in. 1993). Wszystkie te problemy nie są jednak nie do pokonania iw rzeczywistości badacz może je zminimalizować, stosując odpowiednie działania (Lee 1989).

3.3. Uzasadnij metodologię badań przyjęty

Spośród dwóch możliwych metod badawczych dla tego badania, za najbardziej odpowiednią uważa się metodę ankietową. Ten dochodzeniowy został odrzucony po dokładnym rozważeniu powiązanych

zalety i słabości. Wygoda lub nieodpowiedniość każdej metody dla tego badania została omówiona poniżej.

3.3.1. Niewłaściwa metoda badawcza zapytania

Metoda dociekania wymaga dogłębnego zbadania konkretnej sytuacji w jednej lub kilku organizacjach w pewnym okresie czasu (Eisenhardt 1989). W takim przypadku okres ten może przekroczyć ramy czasowe podane dla tego badania. Innym powodem, dla którego nie należy stosować metody dociekania, jest to, że wyniki mogą cierpieć z powodu braku rygoru (Yin 1989). Subiektywność badacza może wpływać na wyniki i wnioski. Innym powodem jest to, że ta metoda jest bardziej odpowiednia dla pytań badawczych typu „jak” lub „dlaczego” (Yin 1989), podczas gdy pytanie badawcze w tym badaniu jest typu „co”. Wreszcie, trudno jest uogólniać wyniki tylko jednego lub kilku badań (Galliers 1992, Shanks i in. 1993). Z tego powodu nie wybrano metody badań ankietowych, ponieważ nie była ona odpowiednia dla niniejszego badania.

3.3.2. Wygoda metody wyszukiwania badanie

W czasie przeprowadzania tych badań praktyka przechowywania danych nie była powszechnie stosowana przez australijskie organizacje. Stąd niewiele było informacji na temat ich wdrażania w organizacjach australijskich. Dostępne informacje pochodziły od organizacji, które wdrożyły lub stosowały a hurtownia danych. W tym przypadku najodpowiedniejsza jest metoda badań ankietowych, ponieważ pozwala ona na uzyskanie informacji, które nie są dostępne gdzie indziej lub w formie wymaganej do analizy (Fowler 1988). Ponadto metoda badań dociekliwych pozwala badaczowi uzyskać dobry wgląd w praktyki, sytuacje lub poglądy w danym czasie (Galliers 1992, Denscombe 1998). Poproszono o przegląd, aby zwiększyć świadomość australijskich doświadczeń w zakresie hurtowni danych.

Ponadto Sonquist i Dunkelberg (1977) stwierdzają, że wyniki badań ankietowych są bardziej ogólne niż inne metody.

3.4. Projekt badań ankietowych

Ankieta dotycząca praktyk w zakresie hurtowni danych została przeprowadzona w 1999 r. Populacja docelowa składała się z australijskich organizacji zainteresowanych badaniami nad hurtowniami danych, ponieważ prawdopodobnie były one już świadome dać które przechowują, a zatem mogą dostarczyć przydatnych informacji dla tego badania. Populacja docelowa została zidentyfikowana na podstawie wstępnej ankiety przeprowadzonej wśród wszystkich australijskich członków „The Data Warehousing Institute” (Tdwi-aap). W tej części omówiono projekt fazy badań empirycznych niniejszego badania.

3.4.1. Technika zbierania dać

Spośród trzech technik powszechnie stosowanych w badaniach ankietowych (tj. ankiety pocztowej, wywiadu telefonicznego i wywiadu osobistego) (Nachmias 1976, Fowler 1988, de Vaus 1991) do niniejszego badania przyjęto ankietę pocztową. Pierwszym powodem przyjęcia tego ostatniego jest to, że może on dotrzeć do populacji rozproszonej geograficznie (Blalock 1970, Nachmias i Nachmias 1976, Hwang i Lin 1987, de Vaus 1991, Gable 1994). Po drugie, ankieta pocztowa jest odpowiednia dla osób z wyższym wykształceniem (Fowler 1988). Kwestionariusz pocztowy do tego badania był skierowany do sponsorów projektów hurtowni danych, dyrektorów i/lub kierowników projektów. Po trzecie, kwestionariusze pocztowe są odpowiednie, gdy dostępna jest bezpieczna lista adresów (Salant i Dilman 1994). TDWI, w tym przypadku zaufane stowarzyszenie hurtowni danych, dostarczyło listę mailingową swoich australijskich członków. Kolejną zaletą kwestionariusza pocztowego w porównaniu z kwestionariuszami telefonicznymi lub wywiadami osobistymi jest to, że pozwala on respondentom na dokładniejsze udzielanie odpowiedzi, zwłaszcza gdy respondenci muszą zapoznać się z aktami lub omówić pytania z innymi osobami (Fowler 1988).

Potencjalną wadą może być czas potrzebny na przeprowadzenie ankiet drogą pocztową. Zwykle ankieta pocztowa jest przeprowadzana w następującej kolejności: listy pocztowe, oczekiwanie na odpowiedzi i wysłanie potwierdzenia (Fowler 1988, Bainbridge 1989). W związku z tym łączny czas może być dłuższy niż czas wymagany w przypadku wywiadów bezpośrednich lub wywiadów telefonicznych. Jednak całkowity czas może być znany z góry (Fowler 1988, Denscombe 1998). Czas spędzony na przeprowadzaniu wywiadów osobistych nie może być znany z góry, ponieważ różni się w zależności od wywiadu (Fowler 1988). Wywiady telefoniczne mogą być szybsze niż kwestionariusze pocztowe i wywiady osobiste, ale mogą mieć wysoki wskaźnik bez odpowiedzi ze względu na niedostępność niektórych osób (Fowler 1988). Ponadto wywiady telefoniczne są na ogół ograniczone do stosunkowo krótkich list pytań (Bainbridge 1989).

Inną słabością kwestionariusza wysłanego pocztą jest wysoki wskaźnik braku odpowiedzi (Fowler 1988, Bainbridge 1989, Neuman 1994). Jednak podjęto środki zaradcze, powiązując to badanie z zaufaną instytucją zajmującą się hurtownią danych (tj. TDWI) (Bainbridge 1989, Neuman 1994), która wysyła dwa listy przypominające do osób, które nie odpowiedziały (Fowler 1988, Neuman 1994), a także zawiera dodatkowy list wyjaśniający cel badania (Neuman 1994).

3.4.2. Jednostka analizy

Celem niniejszego opracowania jest uzyskanie informacji na temat wdrożenia hurtowni danych i jej wykorzystania w australijskich organizacjach. Populacją docelową są wszystkie australijskie organizacje, które wdrożyły lub wdrażają, tj hurtownia danych. Następnie poszczególne organizacje są rejestrowane. Ankieta została wysłana do organizacji zainteresowanych adopcją hurtownia danych. Ta metoda gwarantuje, że zebrane informacje pochodzą z najbardziej odpowiednich zasobów każdej uczestniczącej organizacji.

3.4.3. Próbka ankiety

Listę mailingową uczestników badania uzyskano z TDWI. Z tej listy wybrano 3000 organizacji australijskich jako podstawę do doboru próby. Do próby wysłano list uzupełniający wyjaśniający projekt i cel badania wraz z formularzem odpowiedzi i opłaconą z góry kopertą na zwrot wypełnionego kwestionariusza. Spośród 3000 organizacji 198 zgodziło się wziąć udział w badaniu. Spodziewano się tak małej liczby odpowiedzi data duża liczba australijskich organizacji, które wówczas przyjęły lub przyjmowały strategię hurtowni danych w swoich organizacjach. Tak więc populacja docelowa dla tego badania składa się tylko z 198 organizacji.

3.4.4. Treść kwestionariusza

Konstrukcja kwestionariusza została oparta na modelu hurtowni danych Monash (omówionym wcześniej w części 2.3). Treść kwestionariusza została oparta na przeglądzie literatury przedstawionym w rozdziale 2. Kopię kwestionariusza rozesłanego do uczestników badania można znaleźć w Załączniku B. Kwestionariusz składa się z sześciu części, które naśladują etapy omawianego modelu. Poniższe sześć akapitów krótko podsumowuje zawartość każdej sekcji.

Sekcja A: Podstawowe informacje o organizacji
Ta sekcja zawiera pytania dotyczące profilu organizacji uczestniczących. Dodatkowo część pytań dotyczy statusu projektu hurtowni danych uczestnika. Informacje poufne, takie jak nazwa organizacji, nie zostały ujawnione w analizie ankiety.

Sekcja B: Start
Pytania w tej sekcji dotyczą rozpoczynania pracy z hurtowniami danych. Zadano pytania dotyczące inicjatorów projektu, sponsorów, wymaganych umiejętności i wiedzy, celów rozwoju hurtowni danych oraz oczekiwań użytkowników końcowych.

Sekcja C: Projektowanie
Ta sekcja zawiera pytania związane z działaniami planistycznymi hurtownia danych. W szczególności pytania dotyczyły zakresu wdrożenia, czasu trwania projektu, kosztu projektu oraz analizy kosztów i korzyści.

Sekcja D: Rozwój
W dziale rozwojowym znajdują się pytania związane z działalnością rozwojową firmy hurtownia danych: zbiór wymagań użytkowników końcowych, źródła dać, logiczny model dać, prototypy, planowanie pojemności, architektury techniczne i wybór narzędzi do tworzenia hurtowni danych.

Sekcja E: Działanie
Kwestie operacyjne związane z działaniem i rozszerzalnością hurtownia danych, ponieważ ewoluuje w kolejnym etapie rozwoju. Tam jakość danych, strategie odświeżania dać, ziarnistość dać, skalowalność hurtownia danych i kwestie bezpieczeństwa hurtownia danych należały do rodzaju zadawanych pytań.

Sekcja F: Rozwój
Ta sekcja zawiera pytania związane z używaniem programu hurtownia danych przez użytkowników końcowych. Badacz był zainteresowany celem i użytecznością hurtownia danych, przyjęte strategie przeglądu i szkolenia oraz strategię kontroli hurtownia danych przyjęte.

3.4.5. Odsetek odpowiedzi

Chociaż ankiety pocztowe są krytykowane za niski wskaźnik odpowiedzi, podjęto kroki w celu zwiększenia wskaźnika zwrotów (jak omówiono powyżej w sekcji 3.4.1). Termin „wskaźnik odpowiedzi” odnosi się do odsetka osób w określonej próbie badawczej, które odpowiedziały na kwestionariusz (Denscombe 1998). Poniższy wzór został wykorzystany do obliczenia wskaźnika odpowiedzi dla tego badania:

Liczba osób, które odpowiedziały
Wskaźnik odpowiedzi = —————————————————————————– X 100 Łączna liczba wysłanych kwestionariuszy

3.4.6. Pilot testowy

Zanim kwestionariusz został wysłany do próby, pytania zostały przetestowane poprzez przeprowadzenie prób pilotażowych, zgodnie z sugestią Lucka i Rubina (1987), Jacksona (1988) i de Vausa (1991). Celem badań pilotażowych jest ujawnienie niezręcznych, niejednoznacznych wyrażeń i trudnych do interpretacji pytań, wyjaśnienie użytych definicji i terminów oraz określenie przybliżonego czasu potrzebnego do wypełnienia kwestionariusza (Warwick i Lininger 1975, Jackson 1988, Salant i Dilmana 1994). Próby pilotażowe przeprowadzono, wybierając osoby o charakterystyce podobnej do cech osób końcowych, zgodnie z sugestią Davisa e Cosenza (1993). W tym badaniu jako osoby pilotażowe wybrano sześciu specjalistów ds. hurtowni danych. Po każdym teście pilotażowym dokonywano niezbędnych poprawek. Z przeprowadzonych testów pilotażowych uczestnicy przyczynili się do przemodelowania i zresetowania ostatecznej wersji kwestionariusza.

3.4.7. Metody analizy Dać

I dać Dane ankietowe zebrane z zamkniętych kwestionariuszy zostały przeanalizowane przy użyciu pakietu oprogramowania statystycznego o nazwie SPSS. Wiele odpowiedzi zostało przeanalizowanych przy użyciu statystyk opisowych. Wiele kwestionariuszy zostało zwróconych niekompletnych. Zostały one potraktowane bardziej ostrożnie, aby upewnić się, że i dać braki nie były konsekwencją błędów we wprowadzaniu danych, ale dlatego, że pytania nie były odpowiednie dla rejestrującego lub rejestrujący postanowił nie odpowiadać na jedno lub więcej szczegółowych pytań. Te brakujące odpowiedzi zostały zignorowane podczas analizowania danych dać i zostały zakodowane jako „-9”, aby zapewnić ich wykluczenie z procesu analizy.

Podczas przygotowywania kwestionariusza pytania zamknięte zostały wstępnie zakodowane poprzez przypisanie każdej opcji numeru. Numer był następnie używany do trenowania i dać podczas analizy (Denscombe 1998, Sapsford i Jupp 1996). Na przykład w pytaniu 1 sekcji B wymieniono sześć opcji: zarząd, dyrektor wyższego szczebla, dział IT, jednostka biznesowa, konsultanci i inni. w pliku dać SPSS wygenerowano zmienną dla „inicjatora projektu” z sześcioma etykietami wartości: „1” dla „zarządu”, „2” dla „dyrektora wyższego szczebla” itd. na ulicy. Zastosowanie skali Likertina w części pytań zamkniętych pozwoliło również na bezproblemową identyfikację za pomocą odpowiednich wartości liczbowych wprowadzonych do SPSS. W przypadku pytań z niewyczerpującymi odpowiedziami, które nie wykluczały się wzajemnie, każda opcja była traktowana jako pojedyncza zmienna z dwiema etykietami wartości: „1” dla „zaznaczone” i „2” dla „niezaznaczone”.

Pytania otwarte potraktowano inaczej niż pytania zamknięte. Odpowiedzi na te pytania nie zostały wprowadzone do SPSS. Zamiast tego zostały przeanalizowane ręcznie. Zastosowanie tego typu pytań pozwala na uzyskanie informacji o swobodnie wyrażanych poglądach i osobistych doświadczeniach respondentów (Bainbridge 1989, Denscombe 1998). Tam, gdzie było to możliwe, dokonano kategoryzacji odpowiedzi.

Do analizy daćstosowane są metody prostej analizy statystycznej, takie jak częstość odpowiedzi, średnia, odchylenie standardowe i mediana (Argyrous 1996, Denscombe 1998).
Test Gamma był skuteczny w uzyskiwaniu ilościowych miar powiązań między dać liczby porządkowe (Norusis 1983, Argyrous 1996). Testy te były odpowiednie, ponieważ użyte skale porządkowe nie miały wielu kategorii i można je było przedstawić w tabeli (Norusis 1983).

3.5 Sommarii

W tym rozdziale omówiono metodologię badań oraz projekt przyjęty do tego badania.

Wybór najodpowiedniejszej metody badawczej do konkretnego badania trwa
uwzględnienie szeregu zasad, w tym charakteru i rodzaju badań, a także zalet i słabości każdej z możliwych metod (Jenkins 1985, Benbasat i in. 1097, Galliers i Land 1987, yin 1989, Hamilton i Ives 1992, Galliers 1992, Neuman 1994). Biorąc pod uwagę brak istniejącej wiedzy i teorii dotyczącej przyjęcia hurtowni danych w Australii, niniejsze badanie wymaga interpretacyjnej metody badawczej z eksploracyjną zdolnością do eksploracji doświadczeń australijskich organizacji. Wybrana metoda badawcza została wybrana w celu zebrania informacji na temat przyjęcia koncepcji hurtowni danych przez australijskie organizacje. Jako technikę zbierania wybrano ankietę pocztową dać. Uzasadnienie metody badawczej i techniki zbierania dać wybór zostanie podany w tym rozdziale. Ponadto omówiono jednostkę analizy, zastosowaną próbę, wskaźniki odpowiedzi, zawartość kwestionariusza, test wstępny kwestionariusza oraz sposób analizy dać.

Projektowanie Hurtownia danych:

Łączenie relacji encji i modelowania wymiarowego

ABSTRACT
sklep dać jest głównym aktualnym problemem dla wielu organizacji. Kluczowy problem w rozwoju magazynowania dać to jego projekt.
Rysunek musi obsługiwać wykrywanie pojęć w pliku hurtownia danych do starszego systemu i innych źródeł dać a także łatwe zrozumienie i skuteczność w realizacji hurtownia danych.
Dużo literatury magazynowej dać zaleca stosowanie modelowania relacji między jednostkami lub modelowania wymiarowego do reprezentowania projektu hurtownia danych.
W tym artykule pokazujemy, jak można połączyć obie reprezentacje w podejściu do projektowania hurtownia danych. Stosowane podejście jest systematyczne

zbadane w studium przypadku i zidentyfikowane w wielu ważnych implikacjach dla profesjonalistów.

MAGAZYN DANYCH

Un hurtownia danych jest zwykle definiowany jako „zorientowany tematycznie, zintegrowany, zmienny w czasie i nieulotny zbiór danych wspierających decyzje kierownictwa” (Inmon i Hackathorn, 1994). Zorientowany tematycznie i zintegrowany wskazuje, że hurtownia danych ma na celu przekroczenie granic funkcjonalnych starszych systemów, aby zaoferować zintegrowaną perspektywę dać.
Wariant czasowy dotyczy historycznego lub szeregowego charakteru wideo dać w hurtownia danych, co umożliwia analizę trendów. Nieulotny wskazuje, że hurtownia danych nie jest stale aktualizowany, jak np baza danych firmy OLTP. Raczej jest aktualizowany okresowo, z dać ze źródeł wewnętrznych i zewnętrznych. The hurtownia danych jest specjalnie zaprojektowany do badań, a nie do aktualizacji integralności i wydajności operacyjnej.
Idea przechowywania I dać nie jest nowy, był jednym z celów zarządzania dać od lat sześćdziesiątych (Il Martin, 1982).
I hurtownia danych oferują infrastrukturę dać dla systemów wspomagających zarządzanie. Systemy wspomagające zarządzanie obejmują systemy wspomagania decyzji (DSS) oraz systemy informacji wykonawczej (EIS). DSS to komputerowy system informacyjny zaprojektowany w celu usprawnienia procesu, a co za tym idzie, podejmowania decyzji przez ludzi. EIS jest zazwyczaj systemem dostarczania dać co umożliwia kierownictwu firmy łatwy dostęp do widoku dać.
Ogólna architektura a hurtownia danych podkreśla rolę hurtownia danych we wsparciu zarządzania. Oprócz oferowania infrastruktury dać ds. EIS i DSS, al hurtownia danych można uzyskać do niego bezpośredni dostęp za pomocą zapytań. TO dać zawarte w hurtownia danych opierają się na analizie wymagań dotyczących informacji zarządczej i są pozyskiwane z trzech źródeł: wewnętrznych systemów przestarzałych, systemów pozyskiwania danych specjalnego przeznaczenia oraz zewnętrznych źródeł danych. TO dać w starszych systemach wewnętrznych są one często zbędne, niespójne, niskiej jakości i przechowywane w różnych formatach, więc muszą zostać uzgodnione i oczyszczone, zanim będą mogły zostać załadowane do

hurtownia danych (Inmon, 1992; McFadden, 1996). TO dać z systemów pamięci masowej dać ad hoc i ze źródeł dać zewnętrzne są często używane do rozszerzania (aktualizacji, zastępowania) i dać ze starszych systemów.

Istnieje wiele przekonujących powodów, dla których warto rozwijać a hurtownia danych, które obejmują lepsze podejmowanie decyzji dzięki efektywnemu wykorzystaniu większej ilości informacji (Ives 1995), wsparcie skupienia się na całości spraw (Graham 1996) oraz zmniejszenie kosztów podejmowania decyzji dać dla EIS i DSS (Graham 1996, McFadden 1996).

Niedawne badanie empiryczne wykazało średni zwrot z inwestycji dla i hurtownia danych o 401% po trzech latach (Graham, 1996). Jednak inne badania empiryczne nt hurtownia danych stwierdzili istotne problemy, w tym trudności w mierzeniu i alokacji korzyści, brak jasnego celu, niedoszacowanie zakresu i złożoności procesu przechowywania dać, zwłaszcza w odniesieniu do źródeł i czystości dać. sklep dać można uznać za rozwiązanie problemu zarządzania dać między organizacjami. Manipulacja dać jako zasób społeczny pozostaje od wielu lat jednym z kluczowych problemów w zarządzaniu systemami informacyjnymi na całym świecie (Brancheau i in. 1996, Galliers i in. 1994, Niederman i in. 1990, Pervan 1993).

Popularne podejście do zarządzania aktywami dać w latach osiemdziesiątych był rozwój modelu dać społeczny. Model dać social został zaprojektowany tak, aby oferować stabilną podstawę do rozwoju nowych systemów aplikacji, np baza danych oraz rekonstrukcja i integracja starszych systemów (Brancheau i in.

1989, Goodhue i in. 1988:1992, Kim i Everest 1994). Istnieje jednak kilka problemów związanych z tym podejściem, w szczególności złożoność i koszt każdego zadania oraz długi czas potrzebny do osiągnięcia namacalnych rezultatów (Beynon-Davies 1994, Earl 1993, Goodhue i in. 1992, Periasamy 1994, Shanks 1997 ).

Il hurtownia danych jest to oddzielna baza danych, która współistnieje ze starszymi bazami danych, zamiast je zastępować. Pozwala zatem kierować zarządzaniem dać i uniknąć kosztownej przebudowy starszych systemów.

ISTNIEJĄCE PODEJŚCIA DO PROJEKTOWANIA DANYCH

MAGAZYN

Proces budowania i doskonalenia a hurtownia danych należy rozumieć raczej jako proces ewolucyjny niż tradycyjny cykl rozwoju systemów (Desio, 1995, Shanks, O'Donnell i Arnott 1997a). Na projekt składa się wiele procesów hurtownia danych takie jak inicjalizacja, planowanie; informacje uzyskane z wymagań stawianych kierownictwu firmy; źródła, przemiany, oczyszczanie dać i synchronizuj ze starszymi systemami i innymi źródłami dać; systemy dostarczania w trakcie opracowywania; monitorowanie hurtownia danych; i bezsensu procesu ewolucyjnego i budowania hurtownia danych (Stinchi, O'Donnell i Arnott 1997b). W tym czasopiśmie skupiamy się na tym, jak narysować i dać przechowywane w kontekście tych innych procesów. Istnieje wiele proponowanych podejść do architektury wideo hurtownia danych w literaturze (Inmon 1994, Ives 1995, Kimball 1994, McFadden 1996). Każda z tych metodologii ma krótki przegląd z analizą ich mocnych i słabych stron.

Podejście Inmona (1994) do Hurtownia danych Wnętrze

Inmon (1994) zaproponował cztery iteracyjne etapy projektowania hurtownia danych (patrz rysunek 2). Pierwszym krokiem jest zaprojektowanie szablonu dać społeczne, aby zrozumieć, jak ja dać można zintegrować w różnych obszarach funkcjonalnych w ramach organizacji poprzez podział i dać przechowywać w obszarach. Model dać jest przeznaczony do przechowywania dać związanych z podejmowaniem decyzji, m.in dać historyczne i włączone dać odliczane i sumowane. Drugim krokiem jest określenie obszarów tematycznych do wdrożenia. Opierają się one na priorytetach określonych przez konkretną organizację. Trzeci krok polega na narysowaniu a baza danych dla obszaru tematycznego, zwróć szczególną uwagę na uwzględnienie odpowiednich poziomów szczegółowości. Inmon zaleca stosowanie modelu encji i relacji. Czwartym krokiem jest identyfikacja systemów źródłowych dać wymagane i opracować procesy transformacji w celu przechwytywania, czyszczenia i formatowania i dać.

Siłą podejścia Inmona jest model dać społeczne oferuje podstawę do integracji dać w ramach organizacji i wsparcia planowania dla iteracyjnego rozwoju hurtownia danych. Wadą jest trudność i koszt zaprojektowania modelu dać społeczne, trudność w zrozumieniu modeli podmiotów i relacji stosowanych w obu modelach, tj dać społeczne i że dać przechowywane według obszaru tematycznego i stosowność dać z rysunku hurtownia danych do realizacji baza danych relacyjny, ale nie dla baza danych wielowymiarowy.

Ives' (1995) Podejście do Hurtownia danych Wnętrze

Ives (1995) proponuje czteroetapowe podejście do projektowania systemu informacyjnego, które jego zdaniem ma zastosowanie do projektowania hurtownia danych (patrz rysunek 3). Podejście to w dużym stopniu opiera się na inżynierii informacyjnej w zakresie rozwoju systemów informatycznych (Martin 1990). Pierwszym krokiem jest określenie celów, czynników sukcesu i krytycznych oraz kluczowych wskaźników wydajności. Kluczowe procesy biznesowe i niezbędne informacje są modelowane, aby doprowadzić nas do modelu dać społeczny. Drugi krok obejmuje opracowanie definiującej architektury dać przechowywane według obszaru, baza danych di hurtownia danych, wymagane komponenty technologii, zestaw wsparcia organizacyjnego wymaganego do wdrożenia i obsługi hurtownia danych. Trzeci krok obejmuje wybór wymaganych pakietów oprogramowania i narzędzi. Czwarty krok to szczegółowy projekt i budowa hurtownia danych. Ives zauważa ten sklep dać jest to ograniczony proces iteracyjny.

Mocne strony podejścia Ives to wykorzystanie specyfikacji technicznych do określenia wymagań informacyjnych, wykorzystanie ustrukturyzowanego procesu wspierającego integrację hurtownia danych, odpowiedni dobór sprzętu i oprogramowania oraz wykorzystanie technik reprezentacji wielokrotnej hurtownia danych. Jego wady są nieodłącznie związane ze złożonością. Inne obejmują trudności w rozwijaniu wielu poziomów baza danych all'interno del hurtownia danych w rozsądnym czasie i kosztach.

Podejście Kimballa (1994). Hurtownia danych Wnętrze

Kimball (1994) zaproponował pięć iteracyjnych etapów projektowania hurtownia danych (patrz ryc. 4). Jego podejście jest szczególnie poświęcone rysowaniu solówki hurtownia danych oraz na wykorzystaniu modeli wymiarowych zamiast modeli jednostek i relacji. Kimball analizuje te modele wymiarowe, ponieważ liderom biznesowym łatwiej jest zrozumieć biznes, jest to bardziej efektywne w przypadku złożonych konsultacji, a projektowanie baza danych fizyczna jest bardziej wydajna (Kimball 1994). Kimball przyznaje, że opracowanie hurtownia danych jest iteracyjny i tyle hurtownia danych rozdzielone można zintegrować poprzez podział na tablice o wspólnych wymiarach.

Pierwszym krokiem jest określenie konkretnego obszaru tematycznego, który należy udoskonalić. Drugi i trzeci etap obejmują kształtowanie wymiarowe. W drugim kroku miary identyfikują interesujące elementy w obszarze tematycznym i grupują je w tabelę faktów. Na przykład w obszarze tematycznym sprzedaży miary zainteresowania mogą obejmować liczbę sprzedanych przedmiotów i dolara jako walutę sprzedaży. Trzeci krok polega na określeniu wymiarów, które są sposobami grupowania faktów. W obszarze tematycznym sprzedaży odpowiednie wymiary mogą obejmować przedmiot, lokalizację i okres. Tabela faktów ma wieloczęściowy klucz łączący ją z każdą z tabel wymiarów i zazwyczaj zawiera bardzo dużą liczbę faktów. Natomiast tabele wymiarów zawierają opisowe informacje o wymiarach i innych atrybutach, których można użyć do grupowania faktów. Proponowana powiązana tabela faktów i wymiarów tworzy tak zwany schemat gwiazdy ze względu na swój kształt. Czwarty krok polega na zbudowaniu a baza danych wielowymiarowy, aby udoskonalić wzór gwiazdy. Ostatnim krokiem jest identyfikacja systemów źródłowych dać wymagane i opracować procesy transformacji w celu przechwytywania, czyszczenia i formatowania i dać.

Mocne strony podejścia Kimballa obejmują wykorzystanie modeli wymiarowych do reprezentowania i dać przechowywane, co ułatwia zrozumienie i prowadzi do wydajnego projektu fizycznego. Model wymiarowy, który również chętnie wykorzystuje oba systemy baza danych relacyjne mogą być udoskonalone lub systemy baza danych wielowymiarowy. Jego wady obejmują brak niektórych technik ułatwiających planowanie lub integrację wielu schematów gwiezdnych w ramach hurtownia danych oraz trudność projektowania na podstawie skrajnie zdenormalizowanej struktury w modelu wymiarowym a dać w starszych systemach.

Podejście McFaddena (1996) do danych Projektowanie magazynu

McFadden (1996) proponuje pięcioetapowe podejście do rysowania hurtownia danych (patrz rysunek 5).
Jego podejście opiera się na syntezie pomysłów z literatury i koncentruje się na zaprojektowaniu singla hurtownia danych. Pierwszym krokiem jest analiza wymagań. Chociaż specyfikacje techniczne nie są określone, notatki McFaddena identyfikują podmioty dać specyfikacje i ich atrybuty oraz odsyła czytelników Watsona i Frolicka (1993) do uchwycenia wymagań.
W drugim kroku rysowany jest model relacji encji hurtownia danych a następnie zweryfikowane przez kierownictwo firmy. Trzeci krok obejmuje określenie mapowania ze starszych systemów i zewnętrznych źródeł hurtownia danych. Czwarty krok obejmuje procesy opracowywania, wdrażania i synchronizacji dać w hurtownia danych. W ostatnim kroku opracowywana jest dostawa systemu z naciskiem na interfejs użytkownika. McFadden zauważa, że proces rysowania jest generalnie iteracyjny.

Mocne strony podejścia McFaddena to zaangażowanie liderów biznesu w określanie wymagań oraz znaczenie zasobów daćich czyszczenie i zbieranie. Jego wadą jest brak procesu podziału dużego projektu hurtownia danych w wielu zintegrowanych etapach i tam

trudności w zrozumieniu encji i modeli relacji stosowanych w projektowaniu hurtownia danych.

Wybierają nas nie tylko ci, którzy są nam bliscy.

0/5 (0 Recenzji)

Więcej informacji można znaleźć w Agencji Internetowej Online

Zapisz się, aby otrzymywać najnowsze artykuły e-mailem.

Admin CEO

👍Agencja internetowa | Ekspert agencji internetowych w zakresie marketingu cyfrowego i SEO. Agencja internetowa Online jest agencją internetową. Dla Agenzia Web Online sukces w transformacji cyfrowej opiera się na fundamentach Iron SEO w wersji 3. Specjalizacje: Integracja Systemów, Integracja Aplikacji Korporacyjnych, Architektura Zorientowana na Usługi, Cloud Computing, Hurtownia Danych, Business Intelligence, Big Data, portale, intranety, Aplikacja Webowa Projektowanie i zarządzanie relacyjnymi i wielowymiarowymi bazami danych. Projektowanie interfejsów dla mediów cyfrowych: użyteczność i grafika. Agencja Internetowa oferuje firmom następujące usługi: -SEO w Google, Amazon, Bing, Yandex; -Analiza internetowa: Google Analytics, Menedżer tagów Google, Yandex Metrica; -Konwersje użytkowników: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM w Google, Bing, Amazon Ads; -Marketing w mediach społecznościowych (Facebook, Linkedin, Youtube, Instagram).

Zobacz pełną biografię

Digital Marketing Baza danych DBMS Hurtownia danych Nauka danych Reklama w Internecie Technologia informacyjna Agencja internetowa Agencja reklamowa Marketing

Podziel się:

Lubię:

Więcej informacji można znaleźć w Agencji Internetowej Online