fbpx

Хранилище за данни и ERP | ЦЕНТРАЛЕН АРХИВ НА ДАННИ: ИСТОРИЯ И ЕВОЛЮЦИИ

АРХИВ DATA ЦЕНТРАЛНО: ИСТОРИЯ И ЕВОЛЮЦИИ


Двете доминиращи теми на корпоративните технологии през 90-те са
заявява i склад за данни и ERP. Дълго време тези двама мощни
токове са били част от корпоративните ИТ, без никога да са имали
кръстовища. Сякаш бяха материя и антиматерия. Но
нарастването на двете явления неизбежно е довело до едно
тяхното пресичане. Днес компаниите са изправени пред проблема с
какво да правя с ERP e склад за данни. Тази статия ще илюстрира
какви са проблемите и как се решават от компаниите.
В НАЧАЛОТО…
В началото имаше склад за данни. Склад за данни е роден за
система за обработка на приложения за обработка на транзакции.
В ранните дни запомнянето на данни трябваше да бъде
просто контрапункт на обработващите приложения на
транзакции. Но в днешно време има много по-сложни визии
отколкото какво а склад за данни. В днешния свят
склад за данни той се вмъква в структура, която може да бъде
наречена Фабрика за корпоративна информация.
КОРПОРАТИВНАТА ИНФОРМАЦИОННА ФАБРИКА
(CIF)
Фабриката за корпоративна информация има архитектурни компоненти
стандарт: ниво на трансформация на код и интеграция
който интегрира i данни докато аз данни те се преместват от средата на
екологично приложение на склад за данни на компанията; а
склад за данни на компанията, където i данни
подробни и интегрирани истории. The склад за данни на фирмата служи като
основа, върху която могат да бъдат изградени всички останали части
на околната среда на склад за данни; оперативно хранилище на данни (ODS).
ODS е хибридна структура, която съдържа някои аспекти на данните
склад и други аспекти на OLTP среда; данни, в които i
различните отдели могат да имат своя собствена версия на данните
склад; а склад за данни на проучване, при което i
Фирмените „мислители“ могат да представят своите запитвания
72 часа без вредно въздействие върху склад за данни; и спомен
близка линия, в която данни стар и данни групови детайли могат да бъдат
съхранявани евтино.
КЪДЕ ERP се комбинира с
КОРПОРАТИВНА ИНФОРМАЦИОННА ФАБРИКА
ERP се слива с Фабриката за корпоративна информация на две места.
Първо като основно приложение (изходно ниво), което предоставя
данни от заявлението до склад за данни. В този случай i данни,
генерирани като страничен продукт от процеса на транзакция,
са интегрирани и заредени в склад за данни на компанията. The
втора точка на обединение между ERP и CIF и ODS. Наистина, много
среди ERP се използва като класически ODS.
В случай че ERP се използва като основно приложение, то
същата ERP може да се използва и в CIF като ODS. В
ако обаче ERP ще се използва и в двете роли, има
това трябва да е ясно разграничение между двете субекти. С други думи,
когато ERP играе ролята на основно приложение и ODS,
две архитектурни единици трябва да са различни. Ако сингъл
внедряването на ERP се опитва да играе и двете роли
в същото време неизбежно ще има проблеми в
проектиране и изпълнение на тази структура.
ОТДЕЛЕНИ ОД и ОСНОВНИ ПРИЛОЖЕНИЯ
Има много причини, които водят до разделяне на компонентите
архитектурен. Може би най-показателният въпрос за отделяне на
различни компоненти на архитектурата е, че всеки компонент
на архитектурата има свой собствен поглед. Необходимо е основното приложение
за цел, различна от ODS. Опитайте се да се припокриете
изходен изглед на приложението върху света на ODS или обратно
не е правилен начин за работа.
Следователно първият проблем на ERP в CIF е този на
проверете дали има разлика между базовите приложения и
ЦУР.
МОДЕЛИ НА ДАННИ В КОРПОРАТИВАТА
ИНФОРМАЦИОНЕН ФАБРИКА
За постигане на сближаване между различните компоненти
на архитектурата на CIF, трябва да има модел на данни. Аз
модели на данни служат като връзка между различните компоненти
архитектура като базови приложения и ODS. НА
модели на данни станете "интелектуалната пътна карта", за да имате
правилно значение от различните архитектурни компоненти на CIF.
Вървейки ръка за ръка с тази идея, идеята е, че трябва да има
бъде страхотен и уникален модел на данни. Очевидно трябва
да бъде модел на данни за всеки от компонентите и освен това там
това трябва да е разумен път, свързващ различните модели.
Всеки компонент на архитектурата - ODS, базови приложения,
склад за данни компания и т.н. .. - има нужда от своя собствена
модел на данни. И така трябва да има точно определение на
като тези модели на данни те се свързват помежду си.
ПРЕМЕСТЕТЕ I DATA НА ДАТАТА НА ERP
СКЛАД
Ако произходът на данни е основно приложение и / или ODS, когато
ERP вложки i данни в склад за данни, такова вмъкване трябва
се срещат на най-ниското ниво на „детайлност“. Обобщение или
просто обобщавам i данни като излязат
от основното приложение на ERP или от ERP ODS не е
правилното нещо. НА данни подробности са необходими в датата
склад, за да формира основата на процеса DSS. Такива данни
те ще бъдат преоформени по много начини от данни и проучвания
дел склад за данни.
Изместването на данни от основната среда на приложение
на ERP към средата на склад за данни на фирмата се извършва в a
разумно отпуснат. Тази смяна се случва след това
около 24 часа от актуализацията или създаването в ERP. Фактът на
имат "мързеливо" движение на богове данни в склад за данни
на компанията позволява на данни идващи от ERP за "уреждане".
Веднъж аз данни са депозирани в основното приложение,
тогава можете безопасно да местите i данни на ERP
в компанията. Друга цел, постижима благодарение на движението
"Мързеливи" богове данни е ясното разграничение между оперативните процеси и
DSS. С "бързо" движение на данни разделителната линия
между DSS и оперативната остава неясна.
Движението на данни от ODS на ERP до склад за данни
на фирмата се извършва периодично, обикновено
седмично или месечно. В този случай движението на
данни то се основава на необходимостта от „почистване“ на старото данни историци.
Разбира се, ODS съдържа i данни които са много по-нови
респект за данни историци, открити в склад за данни.
Изместването на данни в склад за данни почти никога не се прави
"Търговия на едро" (на едро). Копирайте таблица
от ERP средата до склад за данни няма смисъл. Един подход
много по-реалистично е движението на избрани единици от данни.
Само данни които са се променили от последната актуализация на датата
склад са тези, които трябва да бъдат преместени в данните
склад. Един от начините да разберете кои данни те са модифицирани
тъй като последната актуализация е да разгледаме времевите марки на данни
намерени в ERP средата. Дизайнерът избира всички промени
които са възникнали от последната актуализация. Друг подход
е да се използват техники за придобиване на промяна данни, с
тези техники се анализират с дневник и лента с дневник, за да се
определете кои данни трябва да бъде преместен от ERP средата в
Това на склад за данни. Тези техники са най-добри в
колко дневници и ленти с дневници могат да бъдат прочетени от ERP файловете
без допълнителни ефекти върху останалите ресурси на ERP.
ДРУГИ УСЛОВИЯ
Един от проблемите с ERP в CIF е какво се случва с другите
източници на приложения или ai данни на ОРВ, които трябва да допринесат за
склад за данни но те не са част от ERP средата. предвид
затворен характер на ERP, особено на SAP, опитът да се интегрира
ключове от външни източници на данни с i данни които идват от ERP към
време за движение i данни в склад за данни, това е голямо предизвикателство.
И колко точно са вероятностите, че i данни на приложения или
ODS извън ERP средата ще бъдат интегрирани в данните
склад? Шансовете всъщност са много високи.
НАМИРАМ DATA ИСТОРИКА ОТ ERP
Друг проблем с данни на ERP е резултатът
от необходимостта да има данни исторически в рамките на склад за данни.
Обикновено склад за данни нужди данни историци. Е
обикновено ERP технологията не ги съхранява данни
исторически, поне не до точката, в която е необходима на датата
склад. Когато голямо количество от данни историците започват да
да бъде добавен към ERP средата, такава среда трябва да бъде
почистен. Да предположим например a склад за данни трябва да
да бъдат натоварени с пет години на данни исторически, докато ERP държи
максимум шест месеца от тях данни. Стига компанията да е доволна от
събира различни данни исторически с течение на времето,
тогава няма проблеми с използването на ERP като източник за
склад за данни. Но когато склад за данни deve andare
назад във времето и вземете богове данни историци, които не са били
по-рано събрани и записани от ERP, след това от ERP средата
става неефективно.
ERP и метаданни
Друго съображение за ERP и склад за данни е това
върху съществуващите метаданни в ERP средата. Както и метаданни
те преминават от ERP средата към склад за данни, The
метаданните трябва да се преместват по същия начин. Освен това, т.е.
метаданните трябва да бъдат трансформирани във формат и структура
изисква от инфраструктурата на склад за данни. Има голяма
разлика между оперативните метаданни и метаданните DSS. Метаданните
оперативни са главно за разработчика и за
програмист. DSS метаданните са предимно за потребителя
финалът. Съществуващите метаданни в ERP приложения или ODS
те трябва да бъдат преобразувани и това преобразуване не винаги е лесно
и директно.
ИЗТОЧНИК НА ERP ДАННИТЕ
Ако ERP се използва като доставчик на данни за склад за данни ci
трябва да е солиден интерфейс, който се движи i данни от околната среда
ERP за околната среда склад за данни. Интерфейсът трябва:
▪ да бъде лесен за използване
▪ разрешаване на достъп до данни на ERP
▪ вземете значението на данни които са на път да бъдат преместени
в склад за данни
▪ знаят ограниченията на ERP, които могат да възникнат през
време, когато влезете в данни на ERP:
▪ референтна цялост
▪ йерархични взаимоотношения
▪ имплицитни логически връзки
▪ конвенция за кандидатстване
▪ всички структури на данни поддържа се от ERP и така нататък ...
▪ бъдете ефективни при достъп данни, като предоставя:
▪ директно движение на данни
▪ придобиване на промяна данни
▪ подпомагат навременния достъп до данни
▪ разбират формата на данни, и така нататък…
ИНТЕРФЕЙС С САП
Интерфейсът може да бъде от два вида, домашен или търговски.
Някои от основните търговски интерфейси включват:
▪ SAS
▪ Решения за грундиране
▪ D2k и така нататък ...
МНОЖЕСТВЕНИ ERP ТЕХНОЛОГИИ
Третирането на ERP средата като на една технология е
голяма грешка. Има много ERP технологии, всяка със своя собствена
силни страни. Най-известните доставчици на пазара са:
▪ SAP
▪ Oracle Financials
▪ PeopleSoft
Джей Ди Едуардс
▪ Баан
SAP
SAP е най-големият и най-пълен ERP софтуер. Приложения
на SAP обхващат много видове приложения в много области. SAP има
репутацията на:
▪ много голям
▪ много трудно и скъпо за изпълнение
▪ нуждае се от много хора и консултанти
изпълнени
▪ има нужда от специализирани хора за изпълнение
▪ отнема много време за изпълнение
Освен това SAP има репутацията да запомня вашата данни MOLTO
внимателно, затруднявайки достъпа на човек до тях
лице извън зоната на SAP. Силата на SAP е да бъде
способни да улавят и съхраняват голямо количество данни.
SAP наскоро обяви намерението си да продължи
неговите приложения ai склад за данни. Има много плюсове и минуси
в използването на SAP като доставчик на склад за данни.
Едно от предимствата е, че SAP вече е инсталиран и че повечето от
консултантите вече познават SAP.
Недостатъците на SAP като доставчик на склад за данни Sono
много: SAP няма опит в света на склад за данни
Ако SAP е доставчик на склад за данни, е необходимо да се "извади"
i данни от SAP ал склад за данни. Dato рекорд на SAP от
затворена система, едва ли ще бъде лесно да вкарам i от SAP
то (???). Има много наследени среди, които задвижват SAP,
като IMS, VSAM, ADABAS, ORACLE, DB2 и т.н.
SAP настоява за подход "не е изобретен тук". SAP не иска
си сътрудничат с други доставчици, за да използват или създават склад за данни.
SAP настоява да генерира целия си софтуер самостоятелно.
Въпреки че SAP е голяма и мощна компания, фактът на
опит за пренаписване на технологията на ELT, OLAP, администриране на
система и дори базовия код на dbms това е просто лудост.
Вместо да възприеме сътрудничество с доставчиците
di склад за данни отдавна, SAP е следвал подхода, който
те "знаят повече". Това отношение задържа успеха, който
SAP може да има в областта на склад за данни.
Отказът на SAP да разреши на външни доставчици достъп
бързо и грациозно към тях данни. Самата същност на използването
un склад за данни е лесен достъп до данни. Цялата история на SAP е
въз основа на затрудняване на достъпа данни.
Липсата на опит на SAP при работа с големи обеми данни;
в областта на склад за данни има обеми от данни никога не виждани оттогава
SAP и за обработка на тези големи количества данни трябва да имате такъв
подходяща технология. SAP очевидно не е наясно с това
технологична бариера, която съществува за влизане в полето за данни
склад.
Корпоративната култура на SAP: SAP създаде бизнес
при получаване на i данни от системата. Но за да направите това, трябва да имате
различен манталитет. Традиционно софтуерните компании, които бяха
добри в получаването на данни в среда не са били добри в
получаване на данни, за да отидете в другата посока. Ако SAP може да направи този вид
switch ще бъде първата компания, която ще го направи.
Накратко, под въпрос е дали дадена компания трябва да избере
SAP като доставчик на склад за данни. Съществуват много сериозни рискове
от една страна и много малко награди, от друга. Но има и друго
причина, която обезкуражава избора на SAP като доставчик на дати
склад. Защото всяка компания трябва да има една и съща дата
склад на всички останали компании? The склад за данни е сърцето
конкурентно предимство. Ако всяка компания прие същото
склад за данни би било трудно, дори да не е невъзможно,
постигане на конкурентно предимство. Изглежда, че SAP смята, че a
склад за данни може да се разглежда като бисквитка и това е a
допълнителен знак за тяхното „вземете данните
в ".
Никой друг доставчик на ERP не е толкова доминиращ като SAP.
Несъмнено ще има компании, които ще следват пътя на SAP
за техните склад за данни но вероятно тези дати
Складовете на SAP ще бъдат големи, скъпи и много взискателни
време за тяхното създаване.
Тези среди включват такива дейности като „обработка на банкови каси”,
процеси за резервации на авиокомпании, процеси за жалби
застраховка и т.н. По-ефективна беше системата за транзакции,
по-очевидна беше необходимостта от разделяне между оперативния процес и
DSS (система за подкрепа на решенията). С ресурсните системи обаче
човешки и лични, никога не сте изправени пред големи обеми
транзакции. И, разбира се, когато човек е нает
или напуснете компанията, това е запис на транзакция.
Но по отношение на други системи, системите за човешки ресурси и
личните просто нямат много транзакции. Следователно в
системи от човешки и лични ресурси не е съвсем очевидно, че съществува
се нуждаете от DataWarehouse. В много отношения тези системи
представляват обединяването на DSS системи.
Но има и друг фактор, който трябва да се има предвид, ако човек трябва
прави с datawarehouse и PeopleSoft. В много среди, т.е. данни
човешките и личните ресурси са второстепенни за бизнеса
първична компания. Повечето компании се представят
производство, продажби, предоставяне на услуги и така нататък. НА
системите за човешки и лични ресурси обикновено са вторични (или на
подкрепа) към основната бизнес линия на компанията. Следователно е така
двусмислен и неудобен a склад за данни отделно за
подкрепа за човешки и лични ресурси.
PeopleSoft е много различен от SAP в това отношение. Със SAP е така
задължително да има склад за данни. С PeopleSoft не е така
тогава толкова ясно. Хранилището за данни не е задължително с PeopleSoft.
Най-доброто нещо, което може да се каже за данни PeopleSoft е, че данните
склад може да се използва за съхранение i данни относно
стари човешки и лични ресурси. Втора причина за
които една компания би искала да използва склад за данни a
в ущърб на средата PeopleSoft е да се позволи достъп и
безплатен достъп до инструменти за анализ, ai данни от PeopleSoft. Но
в допълнение към тези причини, може да има случаи, когато е за предпочитане да не
има хранилище за данни за данни PeopleSoft.
в обобщение
Има много прозрения за изграждането на дата
склад в ERP софтуер.
Някои от тях са:
▪ Има смисъл да имате склад за данни който изглежда като всеки
друго в бранша?
▪ Колко гъвкав е ERP склад за данни софтуер?
▪ ERP склад за данни софтуерът може да се справи с обем от
данни който се намира в "склад за данни арена "?
▪ Какъв е опитът, от който се занимава доставчикът на ERP
изправени лесно и евтино от гледна точка на времето, ai данни? (Какво
е опитът на доставчиците на ERP при доставката на евтини, на
време, лесен за достъп до данни?)
▪ Какво е разбирането на архитектурата на DSS и на
„Фабрика за корпоративна информация“ от доставчика на ERP?
▪ ERP доставчиците разбират как да стигнат данни във вътрешността на
среда, но също така да разберете как да ги експортирате?
▪ Колко отворени са ERP доставчиците към днешна дата инструменти
складиране?
Всички тези съображения трябва да се вземат предвид при определянето
къде да поставите склад за данни който ще бъде домакин на i данни ERP и други
данни. Като цяло, освен ако няма убедителна причина за това
за да направите друго, препоръчително е да изградите склад за данни от
от средата на доставчика на ERP.
ГЛАВА 1
Преглед на BI организацията
Ключови точки:
Хранилищата с информация работят по обратния начин
към архитектурата на бизнес разузнаването (BI):
Корпоративната култура и ИТ могат да ограничат успеха в
изграждане на BI организации.
Технологиите вече не са ограничителният фактор за BI организациите. The
Проблемът за архитектите и проектантите не е, ако
технология съществува, но ако те могат ефективно да приложат
налична технология.
За много компании a склад за данни това е малко повече от депозит
пасивно разпределение i данни на потребители, които се нуждаят от него. НА данни
те се извличат от изходните системи и се попълват в целеви структури
di склад за данни. Аз данни те също могат да се почистват с цялото
късмет. Въпреки това не се добавя допълнителна стойност
събрани от данни по време на този процес.
По същество, пасивните DW, в най-добрия случай, осигуряват
само аз данни чист и работещ за потребителските асоциации. Там
създаването на информация и аналитичното разбиране зависят
изцяло от потребители. Преценете дали DW (Склад за данни) бъда
успехът е субективен. Ако съдим за успеха по
способност за ефективно събиране, интегриране и почистване i данни
корпоративна на предсказуема основа, тогава да, DW е успех.
От друга страна, ако погледнем колекцията, консолидацията и тя
информационна експлоатация на организацията като цяло, тогава
DW е повреда. DW предоставя малка или никаква стойност на
информация. В резултат на това потребителите са принудени да се справят,
като по този начин се създават информационни силози. Тази глава представя
пълен изглед за обобщение на архитектурата на BI (Business
Интелигентност) на фирмите. Нека започнем с описание на BI и
след това ще преминем към дискусии за дизайна и
информационно развитие, за разлика от простото предоставяне i данни
на потребителите. След това дискусиите са фокусирани върху изчисляването на
стойността на вашите усилия за BI. Заключваме, като дефинираме как IBM
отговаря на архитектурните BI изисквания на вашата организация.
Описание на архитектурата на
организация на BI
Сега са мощни информационни системи, ориентирани към транзакциите
на дневен ред във всяко голямо предприятие, тъй като те се изравняват
ефективно детска площадка за компании по целия свят.
Оставането на конкурентоспособност обаче сега изисква аналитични системи
ориентирани към които могат да революционизират способността на компанията чрез преоткриване и
използвайки информацията, която вече имат. Тези системи
аналитиката произтича от разбирането от богатството на данни
на разположение. BI може да подобри производителността на цялата информация
на компанията. Компаниите могат да подобрят взаимоотношенията с клиентите и
доставчици, подобряване на печалбата от продукти и услуги, генериране
нови и най-добри оферти, контрол на риска и наред с много други
приходите драстично намаляват разходите. С BI вашето
компанията най-накрая започва да използва информация за клиентите
като конкурентен актив благодарение на приложения, чиито цели са
пазар.
Да имаш правилния бизнес означава да имаш окончателни отговори
ключови въпроси като:
▪ Кой от нашите клиенти те ни карат да печелим повече или там
изпращат ли на загуба?
▪ Където живеят най-добрите ни клиенти във връзка с магазин/
склад те често?
▪ Кои от нашите продукти и услуги могат да се продават най-много
ефективно и на кого?
▪ Кои продукти могат да се продават най-ефективно и на кого?
▪ Коя разпродажба е най-успешна и защо?
▪ Кои канали за продажба са най-ефективни за кои продукти?
▪ Как можем да подобрим отношенията с най-добрите си клиенти?
Повечето компании имат данни груб за отговор
тези въпроси.
Операционните системи генерират големи количества продукт, от
клиент и данни пазар от точки за продажба, резервации,
от системи за обслужване на клиенти и техническа поддръжка. Предизвикателството е
извлечете и използвайте тази информация.
Много компании се възползват само от малки части от тях данни
за стратегически анализи.
I данни останали, често съединени с i данни произтичащи от външни източници като i
„Правителствени доклади“ и друга закупена информация са едно
златна мина, която само чака да бъде проучена, ей данни трябва да
бъдете усъвършенствани само в информативния контекст на вашия
организация.
Това знание може да се приложи по няколко начина, вариации
от проектирането на обща корпоративна стратегия до
лична комуникация с доставчици, чрез кол центрове,
фактуриране, Интернет и други точки. Днешната бизнес среда диктува
че DW и свързаните с него BI решения се развиват допълнително
изпълнението на традиционни структури на данни което аз данни нормализира до
атомно ниво и "ферми звезда / куб".
Това, което е необходимо, за да останем конкурентоспособни, е сливане на
традиционни и усъвършенствани технологии в опит да подкрепят a
обширен аналитичен пейзаж.
И накрая, общата среда трябва да подобри знанията
на компанията като цяло, като се уверите, че предприетите действия
като последица от извършените анализи те са полезни, за да го правят всички
полза.
Да приемем например, че сте класирали своите клиенти в категориите
висок или нисък риск.
Ако тази информация се генерира от модел за добив или
други средства, той трябва да бъде поставен в DW и направен достъпен за
всеки, чрез всякакви средства за достъп, като i
статични отчети, електронни таблици, таблици или аналитична обработка в
линия (OLAP).
В момента обаче много от този тип информация
остават в силозите на данни на лицата или отделите, които те генерират
Анализът. Организацията като цяло има слаба или никаква видимост
за разбиране. Само чрез смесване на този тип съдържание
информация във вашата компания DW можете да премахнете силозите на
информация и издигнете вашата Dw среда.
Има две основни пречки пред развитието на организацията
на BI.
Първо, имаме проблема със самата организация
от свързаните разпоредби.
Въпреки че не можем да помогнем с промени в политиката
организация, ние можем да ви помогнем да разберете компонентите на
BI организация, нейната архитектура и как
Технологията на IBM улеснява нейното развитие.
Втората пречка за преодоляване е липсата на технологии
интегриран и познаването на метод, който припомня цялото пространство
на BI за разлика от само малък компонент.
IBM реагира на промените в технологията
на интеграция. Вашата отговорност е да предоставите дизайн
самосъзнателно. Тази архитектура трябва да бъде разработена с
технология, избрана за интеграция без ограничения или поне с
технология, която се придържа към отворените стандарти. Също и твоя
ръководството на компанията трябва да гарантира, че предприятието на Bi е
извършва се по график и да не се допуска
разработване на информационни силози в резултат на самообслужване
програми или цели.
Това не означава, че BI средата не е чувствителна към
да реагират на различните нужди и изисквания на различните потребители; вместо това означава
че изпълнението на тези индивидуални нужди и изисквания е
направено в полза на цялата BI организация.
Описание на архитектурата на BI организацията може
можете да намерите на страница 9 на фигура 1.1. Архитектурата демонстрира
богата комбинация от технологии и техники.
От традиционната гледна точка архитектурата включва следните компоненти
на склад
Атомен слой.
Това е основата, сърцето на целия DW и следователно на
стратегическо отчитане.
I данни съхраняваните тук ще запазят историческа цялост, доклади от
данни и включва получената метрика, както и чистота,
интегрирани и съхранявани с помощта на извличащите шаблони.
Цялото последващо използване на тях данни и свързаната информация е
извлечени от тази структура. Това е отличен източник за
добив на данни и за отчети със структурирани SQL заявки
Оперативен депозит на данни или база данни на
данни(Оперативно съхранение на данни (ODS) или отчитане
база данни.)
Това е структура на данни специално проектиран за
техническа отчетност.
I данни съхраняват и пренасят тези структури най-накрая
разпространява се в склада през организационната зона (постановка
област), където може да се използва за стратегическо отчитане.
Постановка.
Първата спирка за повечето данни предназначени за околната среда на
склад е организационната зона.
Тук аз данни те се интегрират, почистват и трансформират в данни полезно това
ще попълни структурата на склада
Дата мартове.
Тази част от архитектурата представлява структурата на данни usata
специално за OLAP. Наличието на марките с данни, ако i данни Sono
съхранявани в звездната схема, които се припокриват данни
многоизмерни в релационна среда или в картотеки
di данни собственост, използвана от специфична технология OLAP, като например
DB2 OLAP сървър, той не е от значение.
Единственото ограничение е, че архитектурата улеснява използването на данни
многоизмерна.
Архитектурата включва също критични технологии и техники на Bi
които се разграничават като:
Пространствен анализ
Пространството е неочаквано информация за анализатора и
критично е да се завърши разделителната способност. Космосът може
представляват информацията на хората, живеещи в определена
местоположение, както и информация къде се намира това местоположение
физически в сравнение с останалия свят.
За да извършите този анализ, трябва да започнете, като обвържете своя
информация в координати на географска ширина и дължина. Това е то
наричан "геокодиране" и трябва да бъде част от добива,
трансформация и процеса на зареждане (ETL) на ниво
на вашия склад.
Извличане на данни.
Извличането на данни позволява на нашите компании да развиват
брой клиенти, за да се предскажат тенденциите в продажбите и да се позволи
управлението на отношенията с i клиенти (CRM), наред с други инициативи на
BI.
Извличането на данни следователно той трябва да бъде интегриран със структурите на
данни на DWHouse и се поддържа от складови процеси за
да установи както ефективното, така и ефективното използване на технологията и
свързани техники.
Както е посочено в архитектурата на BI, атомното ниво на
Dwhouse, както и datamarts, е отличен източник на данни
за добив. Същите тези структури също трябва да бъдат
получателите на резултатите от извличането, за да се установи наличността на
най-широката публика.
Агенти.
Има различни агенти, които изследват клиента за всяка точка, като например, т.е.
операционни системи на компанията и същите dw. Тези агенти могат
да бъдат усъвършенствани невронни мрежи, обучени да научават за
тенденции на всяка точка, като бъдещия продукт, базиран на търсенето
за промоции на продажби, базирани на правила двигатели, на които да реагирате
un Дато съвкупност от обстоятелства или дори прости агенти, които
те съобщават за изключения на „топ мениджърите“. Тези процеси го правят
обикновено присъства в реално време и следователно трябва
да бъдат тясно свързани с движението на същите данни.
Всички тези структури на данни, технологии и техники гарантират
че няма да прекарате нощта, генерирайки организация на
вашата BI.
Тази дейност ще се развива постепенно, за малки
точки.
Всяка стъпка е независим проект и се отчита
като итерация във вашата dw или BI инициатива. Итерациите
може да включва внедряването на нови технологии, за
започнете с нови техники, като добавите нови структури данни ,
зареждане i данни допълнителен, или с разширяване на анализа
вашата среда. Този параграф е обсъден повече
в дълбочина в глава 3.
В допълнение към традиционните структури на Dw и инструментите на Bi има и други
функции на вашата BI организация, за която дължите
дизайн, като например:
Клиентски допирни точки (Докосване на клиента
точки).
Както при всяка съвременна организация, има редица
клиентски точки за контакт, които показват как да изживеете опит
положително за вашето клиенти. Има традиционни канали като i
търговци, оператори на табла, директна поща, мултимедия и печат
реклама, както и най-актуалните канали като имейл и уеб, т.е. данни
продукти с някаква точка за контакт трябва да бъдат придобити,
транспортирани, почистени, трансформирани и след това населени в структури на данни на
BI.
Основи на данни оперативни и потребителски асоциации (оперативни
бази данни и потребителски общности).
В края на точките за контакт на клиенти ще намерите основите на данни
приложение на фирмените и потребителски общности. НА данни съществуващи
Sono данни традиционни, които трябва да бъдат обединени и обединени с данни че
поток от контактните точки, за да задоволи необходимото
информация.
Анализатори. (Анализатори)
Основният бенефициент на BI средата е анализаторът. Той е този, който
ползи от сегашното извличане на данни оперативен, интегриран с
различни източници на данни , допълнен с функции като анализ
географски (геокодиране) и представени в BI технологии, които
ви позволяват да извличате, OLAP, усъвършенствано отчитане и анализ на SQL
географски. Основният интерфейс за анализатора към средата на
отчитането е BI порталът.
Анализаторът обаче не е единственият, който се възползва от архитектурата на
BI.
Ръководители, големи асоциации на потребители и дори партньори, доставчици и i
клиенти те трябва да намерят предимства в бизнес BI.
Цикъл за обратно подаване.
BI архитектурата е среда за обучение. Принцип
Характерно за разработката е да позволи устойчиви структури на данни
да се актуализира чрез използвана BI технология и чрез действия
потребителски интрапез. Пример е оценката на
клиент (клиентска оценка).
Ако отделът по продажбите направи модел за добив
от резултатите на клиента за използване на нова услуга, а след това
отдел продажби не трябва да бъде единствената група бенефициенти
на услугата.
Вместо това, моделът за добив трябва да бъде направен като част
естествен поток от данни в рамките на компанията и резултатите на клиента
тя трябва да се превърне в интегрирана част от информационната среда на
склад, видим за всички потребители. IBM Suite на Bi-bi-centric
включително DB2 UDB, DB2 OLAP сървърът включва най-много
част от важните компоненти на технологията, дефинирани на фигурата
1.1.
Използваме архитектура, както се появява в тази книга за
дайте ни ниво на приемственост и покажете как всеки продукт
на IBM отговарят на общата схема на BI.
Предоставяне на информационното съдържание (Предоставяне
Информационно съдържание)
Проектирането, разработването и внедряването на вашата BI среда е
трудна операция. Дизайнът трябва да обхваща толкова много
настоящи и бъдещи бизнес изисквания. Дизайнът на архитектурата
той трябва да е пълен, за да включва всички намерени заключения
по време на фазата на проектиране. Изпълнението трябва да остане
ангажиран с една-единствена цел: да развие архитектурата на BI
както е официално представено на чертежа и въз основа на изискванията на
бизнес.
Особено трудно е да се твърди, че дисциплината ще осигури
относителен успех.
Това е просто, защото не разработвате цяла BI среда
изведнъж, но се случва с малки стъпки с течение на времето.
Идентифицирането на BI компонентите на вашата архитектура обаче е
важно по две причини: Вие ще ръководите всички последващи решения
архитектурни техники.
Ще можете съзнателно да проектирате конкретно използване на технологията
въпреки че може да не получите представител, който се нуждае от
технология за няколко месеца.
Разбирането на вашите бизнес изисквания в достатъчна степен ще повлияе на типа
на продукти, които ще придобиете за вашата архитектура.
Дизайнът и развитието на вашата архитектура осигуряват
че вашият склад е
не случайно събитие, а по-скоро "добре обмислено",
внимателно изградена реклама опера на изкуството като мозайка от
смесена технология.
Проектирайте информационното съдържание
Всички първоначални планове трябва да се фокусират и идентифицират
основни компоненти на BI, които ще са необходими на околната среда
общо в настоящето и в бъдещето.
Познаването на бизнес изискванията е важно.
Дори преди да започне цялото конвенционално планиране,
проектант често може да идентифицира един или два
компонент веднага.
Балансът на компонентите, които може да са необходими за
вашата архитектура обаче не може да бъде намерена лесно.
По време на фазата на проектиране основната част от архитектурата
свързва сесията за разработка на приложения (JAD) при търсене
за идентифициране на бизнес изискванията.
Понякога тези изисквания могат да бъдат възложени на външни изпълнители
заявки и отчитане.
Например потребителите декларират, че ако искат да автоматизират
в момента отчет трябва да се генерира ръчно чрез интегриране
две текущи съотношения и добавяне на изчисленията, получени от
комбинация от данни.
Въпреки че това изискване е просто, то определя определено
функционалност на функцията, която трябва да включите, когато
купувайте инструменти за отчитане за вашата организация.
Дизайнерът трябва също да следва допълнителни изисквания за
вземете пълна картина. Потребителите искат да се абонират
този доклад?
Подмножествата на отчета се генерират и изпращат по имейл на различните
потребители? Искате ли да видите този отчет на фирмения портал?
Всички тези изисквания са част от простата нужда от
заменете ръчен отчет според изискванията на потребителите. Ползата
от тези видове изисквания е, че всеки, потребители и дизайнери, има
разбиране на концепцията за докладите.
Има обаче и други видове бизнес, които трябва да планираме.
Когато бизнес изискванията са посочени под формата на
Бизнес стратегически въпроси, това е лесно за опитен дизайнер
Разберете изискванията за мярка / факт и измерение.
Фигура 1.2 илюстрира компоненти за измерване и размери на a
Бизнес проблем.
Ако потребителите на JAD не знаят как да декларират своите изисквания
под формата на бизнес проблем, дизайнерът често предоставя
примери за пропускане на стартиране на сесията за събиране
изисквания.
Експертният дизайнер може да помогне на потребителите да разберат не само
стратегическа търговия, но и как да я обучавате.
Подходът за събиране на изискванията е обсъден в глава 3; за
сега искаме само да посочим необходимостта от проектиране за всички
видовете изисквания за BI
Стратегическият бизнес проблем е не само изискване
Бизнес, но и дизайнерска подсказка. Ако трябва да отговорите
на многоизмерен въпрос, тогава трябва да запомните,
изпрати i данни размери и ако трябва да съхранявате i
данни многоизмерни, трябва да решите какъв вид технология или
техника, която ще използвате.
Прилагате ли запазена схема на куб звезда или и двете?
Както можете да видите, дори прост бизнес проблем
може да окаже значително влияние върху дизайна. въпреки това
тези видове бизнес изисквания са обикновени и, разбира се, поне
от опитни дизайнери и проектанти.
Има достатъчно дебати относно технологиите и подкрепата на
Предлагат се OLAP и широка гама от решения. До сега
споменахме необходимостта от комбиниране на просто отчитане с i
размерните изисквания на бизнеса и как тези изисквания
влияят върху техническите архитектурни решения.
Но какви са изискванията, които не са лесно разбрани
от потребители или от екипа на DW? Никога няма да имате нужда от анализа
пространствен (пространствен анализ)?
Моделите за добив на данни те ще бъдат необходимата част от вас
бъдеще? Кой знае?
Важно е да се отбележи, че тези видове технологии не са много
известен от общите потребителски общности и членове на екипа на
Dw, отчасти това може да се случи, защото те обикновено
те се обработват от някои вътрешни или трети страни технически експерти. Това е
краен случай на проблемите, които генерират тези видове технологии. Аз
потребителите не могат да описват бизнес изискванията или да ги рамкират
за да предоставят насоки на дизайнерите, те могат
останете незабелязани или, по-лошо, просто игнорирани.
По-проблематично става, когато дизайнерът и разработчикът се провалят
те могат да разпознаят приложението на един от тези напреднали, но
критични технологии.
Както често сме чували дизайнерите да казват: „е, защо
Не го ли оставяме настрана, докато не получим това друго нещо?
„Наистина ли се интересуват от приоритети или просто избягват i
изисквания, които не разбират? Това е най-вероятно последната хипотеза.
Да приемем, че вашият екип по продажбите е съобщил за изискване
на бизнеса, както е посочено на Фигура 1.3, както можете да видите,
изискването е оформено под формата на бизнес проблем. Там
разликата между този проблем и типичния размерен проблем е
разстоянието. В този случай групата за продажби иска да знае,
на месечна база, общи продажби от продукти, складове и
клиенти които живеят на 5 мили от склада, в който се намират
те купуват.
За съжаление дизайнерите или архитектите просто могат
игнорирайте космическия компонент, като кажете, „имаме клиента,
продукт и i данни от депозита. Спазваме разстоянието до
друга итерация.
"Грешен отговор. Този тип бизнес проблем се отнася
изцяло BI. Той представлява по-дълбоко разбиране на
нашия бизнес и стабилно пространство за анализ за нашите анализатори.
BI е извън обикновената заявка или стандартното отчитане, или
дори OLAP. Това не означава, че тези технологии не го правят
са важни за вашата BI, но сами по себе си те не представляват
BI средата.
Дизайн за информационния контекст
(Проектиране за информационно съдържание)
След като установихме бизнес изискванията, които ги отличават
в чертежа трябва да бъдат включени различни основни компоненти
общо архитектурно. Някои от компонентите на BI са част от
от първоначалните ни усилия, докато някои няма да бъдат приложени за
няколко месеца.
Всички известни изисквания обаче са отразени в дизайна, така че
когато трябва да внедрим определена технология, ние сме
пригответе се да го направите. Нещо в проекта ще отразява мисленето
традиционни.
Например, Фигура 1.1, в началото на главата, показва дата
март, който пази данни размерни.
Този набор от данни се използва за поддръжка на по-късни употреби на
данни измерено в размер от бизнес проблемите, които
ние сме идентифицирали. Като допълнителни документи са
генерирани, като например разработването на дизайн на данни, ние
ще започнем да формализираме как i данни те се разпространяват в околната среда.
Установихме необходимостта от представяне на данни така, че
размерни, разделящи ги (според специфичните нужди
определен) на мартове.
Следващият въпрос, на който трябва да се отговори, е: как ще бъдат изградени
тези данни мартове?
Изграждате ли звездите, за да поддържате кубчетата, или просто кубчета, или просто звездите?
(или десни кубчета, или десни звезди). Генерирайте архитектурата за данните
зависими марти, които изискват атомен слой за всички данни
придобити? Позволете на независими данни за събиране на данни данни
директно от операционни системи?
Каква куб технология ще се опитате да стандартизирате?
Имате огромни количества богове данни необходими за анализ на размерите
или имате нужда от националните си кубчета за продажби на един
на седмична база или и на двете? Изградете мощен предмет
като DB2 OLAP сървър за финанси или кубчета Cognos
PowerPlay за вашата търговска организация или и двете?
Това са великите решения за архитектурен дизайн, които
те ще повлияят на вашата BI среда от тук нататък. Мда,
установили сте нужда от OLAP. Сега как ще изпълните това
вид техника и технология?
Как някои от по-напредналите технологии влияят на вашата
рисунки? Предполагаме, че сте установили нужда
място във вашата организация. Сега трябва да извикате
издания на архитектурни чертежи, макар и непланирани
за извършване на космически компоненти в продължение на няколко месеца. Архитектът трябва
проектирайте днес въз основа на това, което е необходимо. Предскажете необходимостта от
пространствен анализ, който генерира, съхранява, извършва и предоставя
достъп до данни пространство. Това от своя страна трябва да служи като a
ограничение по отношение на вида на технологията и спецификациите
софтуерна платформа, която можете да разгледате в момента. За
например административната система на база данни релационна
(RDBMS), които извършвате за вашия атомен слой, трябва да има
налично стабилно пространствено разширение. Това би гарантирало
максимална производителност при използване на геометрия и обекти
място във вашите аналитични приложения. Ако вашата RDBMS не
мога да се справя с i данни (пространствено-ориентиран) вътрешно, така че ще трябва
стабилна уна база данни (пространствено-центричен) външен. Това усложнява
управление на издания и компрометиране на цялостната ви производителност,
да не говорим за допълнителните проблеми, създадени за вашите
DBA, тъй като те вероятно имат минимално разбиране
на основите на данни пространство също. От друга страна, ако вашият
RDMBS обработва всички пространствени и свързани компоненти
оптимизаторът е наясно със специалните нужди (например,
индексиране) на пространствените обекти, тогава вашите DBA могат да се справят
незабавно управлявайте изданията и можете да вдигнете
производителност.
Също така трябва да настроите зоната на поставяне (зоната на сцената) и слоя
атомна среда, за да включва почистване на адреси (a
ключов елемент за пространствения анализ), както и следното
спестяване на космически обекти. Поредицата от издания на
дизайнът продължава и сега, след като въведохме идеята за почистване
адрес. Първо, това приложение ще диктува вида на
софтуер, необходим за вашите ETL усилия.
Нуждаете се от продукти като Trillium, за да ви предоставят адрес
чист или доставчик на ETL, който сте избрали да предоставите
функционалност?
Засега е важно да оцените нивото на дизайна, който правите
той трябва да бъде завършен, преди да започнете да правите своя
околна среда (склад). Горните примери трябва
демонстрират множество дизайнерски решения, които трябва да последват
идентифициране на всяко конкретно бизнес изискване. Ако е направено
правилно, тези дизайнерски решения насърчават
взаимозависимостта между физическите структури на вашата среда,
избор на използваната технология и потока на разпространение
информационно съдържание. Без тази конвенционална архитектура
на BI, вашата организация ще бъде обект на смесване
хаотична от съществуващите технологии, в най-добрия случай, толкова обединени
не е точно, за да осигури привидна стабилност.
Поддържайте информационно съдържание
Довеждането на стойността на информацията до вашата организация е
много трудна операция. Без достатъчно разбиране
и опит, или правилно планиране и рисуване, дори
по-добрите отбори биха се провалили. От друга страна, ако имате голяма
интуиция и детайлен дизайн, но няма дисциплина за
екзекуция, просто си пропиляхте парите и времето
защото усилията ви са обречени на неуспех. Съобщението трябва
бъдете ясни: Ако ви липсва един или повече от тях
умения, разбиране / опит или планиране / рисуване o
дисциплина за изпълнение, това ще доведе до осакатяване или
унищожи конструкцията на BI организацията.
Подготвен ли е екипът ви достатъчно? Има някой на твоя
BI екип, който разбира огромния аналитичен пейзаж
в BI среди, в необходимите техники и технологии
за постигане на този пейзаж? В екипа ви има някой
които могат да разпознаят разликата в приложението между напреднали
статично отчитане и OLAP или разликите между ROLAP и OLAP? Един от
Членовете на вашия екип ясно разпознават пътя
екстракт и как може да повлияе на склада или как
може ли складът да поддържа производителността на добива? Член
на екипа разбира стойността на данни пространство или технология
базирани на агенти? Имате ли някой, който оценява уникалното приложение
на ETL инструменти спрямо брокерска технология
съобщение? Ако нямате, вземете си. BI е много повече
голям от нормализиран атомен слой, на OLAP, на схемите a
звезда и ODS.
Имайте разбирането и опита да разпознаете изискванията
на BI и техните решения е от съществено значение за вашите способности
правилно формализирайте нуждите и дизайна на потребителите
и изпълняват техните решения. Ако вашата потребителска общност има
трудност при описване на изискванията, това е работа на екипа
склад предоставят това разбиране. Но ако екипът на
склад
не разпознава конкретното приложение на BI - например дадено
копаене - тогава това не е най-доброто нещо, което BI средите правят
често се ограничават до пасивни депозити. Игнорирайте ги обаче
технологиите не намалява тяхното значение и ефекта, който имат
за появата на вашите възможности за бизнес разузнаване
организация, както и информационната структура, която проектирате
за насърчаване.
Дизайнът трябва да включва понятието за дизайн, изд
и двете изискват компетентно лице. В допълнение, дизайнът
изисква екипна философия и наблюдение
на стандартите. Например, ако вашата компания е създала такава
стандартна платформа или е идентифицирала конкретна RDBMS, която вие
искат да се стандартизират в цялата платформа, това се очертава
всички в екипа се придържат към тези стандарти. Като цяло един
екипът излага необходимостта от нормализиране (на потребителя
communites), но самият екип не желае да се присъедини към
стандарти, установени и в други области на компанията или може би дори в
подобни компании. Това не само е хипокритично, но гарантира, че фирмата не го прави
е в състояние да използва съществуващите ресурси и инвестиции. Това не означава
че няма ситуации, които да гарантират платформа или такава
нестандартна технология; усилията на склада обаче
те трябва ревниво да защитават стандартите на предприятието до
че бизнес изискванията не диктуват друго.
Третият ключов компонент, необходим за изграждане на BI
организацията е дисциплината.
Зависи общо, еднакво от индивидите и от околната среда.
Проектантите, спонсорите, архитектите и потребителите трябва да оценят
дисциплина, необходима за изграждане на информационната структура на компанията.
Дизайнерите трябва да насочват своите усилия по проектиране по такъв начин, че
завърши други необходими усилия в обществото.
Да предположим например, че вашата компания изгражда a
ERP приложение, което има складов компонент.
Така че отговорността на ERP дизайнерите е да си сътрудничат с
екип за складова среда, за да не се състезават и те
дублирана работа вече започна.
Дисциплината също е предмет, който трябва да бъде зает
от цялата организация и обикновено се създава и поверява на
изпълнително ниво.
Готови ли са ръководителите да се придържат към проектиран подход? A
подход, който обещава да създаде информационно съдържание, което към
end ще донесе стойност за всички области на предприятието, но може би
компрометира ли отделни лица или ведомствени програми? Помнете поговорката
„Мисленето за всичко е по-важно от мисленето за едно нещо“.
Тази поговорка е вярна за BI организациите.
За съжаление много складове фокусират усилията си
опитвайки се да се обърне и да донесе стойност на определен отдел или на
конкретни потребители, с малко внимание към организацията в
общ. Да предположим, че изпълнителната власт иска помощ от
къща за къщи. Екипът отговаря с 90 дни работа
включва не само доставката на изискванията за уведомяване, определени от
изпълнителен, но гарантира, че всички данни база се смесват в нивото
атомна, преди да бъде въведена в куб технологията
предложение.
Това инженерно допълнение гарантира, че фирмата
werehouse ще се възползва от данни необходимо за мениджъра.
Изпълнителният директор обаче говори с външни консултантски фирми
са предложили подобно приложение с доставка за по-малко от 4
седмици.
Ако приемем, че вътрешният екип на къщата е компетентен,
изпълнителният директор има избор. Кой може да подкрепи дисциплината на
допълнително инженерство, необходимо за култивиране на доброто
информационно предприятие или могат да изберат да извършват свои собствени
бързо решение. Последното изглежда наистина избрано
твърде често и служи само за създаване на информационни контейнери на
които се възползват само от няколко или неженените
Краткосрочни и дългосрочни цели
Архитектите и проектантите трябва да го официализират
дългосрочен поглед върху общата архитектура и планове за
прерастват в BI организация. Тази комбинация от
краткосрочна печалба и дългосрочно планиране
представляват двете лица на начинанията на BI. Печалбата в краткосрочен план
изтичането е аспектът на BI, който е свързан с повторения на
вашия склад.
Тук се фокусират проектантите, архитектите и спонсорите
отговарят на специфични търговски изисквания. На това ниво е
изграждат се физически структури, закупуват се технологии и
се прилагат техники. Те по никакъв начин не са създадени да се справят
специфични изисквания, определени от конкретни потребителски общности.
Всичко се прави, за да се отговори на конкретно определени изисквания
от определена общност.
Дългосрочното планиране обаче е другата страна
на BI. Това е мястото, където плановете и проектите са го гарантирали
изгради всякаква физическа структура, избраните технологии и
техники, направени с поглед към компанията. И
дългосрочно планиране, което осигурява сплотеност
необходими, за да се гарантира, че бизнес ползите произтичат от всички
констатираните краткосрочни печалби.
Обосновете усилията си за BI
Un склад за данни сам по себе си няма присъща стойност. С други
думи, няма присъща стойност сред технологиите на
складови и техники за изпълнение.
Стойността на всяко складово усилие се намира в действията
изпълнени в резултат на складовата среда и съдържание
информативно израснал с течение на времето. Това е критична точка за разбиране
преди да се опитате да оцените стойността на дадена инициатива
Къща.
Твърде често архитектите и проектантите се опитват да приложат стойност
физически и технически компоненти на склада, когато в действителност стойността е
основана с бизнес процесите, които са повлияни положително от
склад и добре придобита информация.
Тук се крие предизвикателството да се намери BI: Как оправдавате инвестицията?
Ако самата къща няма вътрешна стойност, дизайнерите на
проектът трябва да проучи, дефинира и формализира ползите
постигнато от онези лица, които ще използват склада за
подобряване на специфични бизнес процеси или стойността на
защитена информация или и двете.
За да усложни нещата, всеки търговски процес
засегнати от складови усилия, биха могли да дадат ползи
„Значително“ или „леко“. Значителни предимства осигуряват едно
осезаем показател за измерване на възвръщаемостта на инвестицията (ROI) - ad
например, обърнете инвентара допълнително време за период
специфични или за по-ниски разходи за транспорт на пратка. Това е повече
трудно е да се дефинират леките предимства, като подобрен достъп до
информация, по отношение на осезаема стойност.
Свържете вашия проект, за да знаете
Бизнес заявки
Твърде често дизайнерите на проекти се опитват да свържат стойност
на склада с аморфни цели на фирмата. Като заявява това
„Стойността на склад се основава на способността ни да
удовлетворяване на стратегически искания “отваряме
реч. Но само по себе си не е достатъчно, за да се определи дали
инвестирането в инвентар има смисъл. По-добре е да свържете повторения
склад със специфични и известни търговски заявки.
Измерване на възвръщаемостта на инвестициите
Изчисляването на ROI в настройка на склад може да бъде
особено трудно. Особено трудно е предимството
принцип на дадено повторение е нещо нематериално или
лесно за измерване. Едно проучване установи, че потребителите възприемат
двете основни предимства на BI инициативите:
▪ Създайте способност за вземане на решения
▪ Създайте достъп до информация
Тези бонуси са меки (или меки) бонуси. Лесно е да се види
как можем да изчислим възвръщаемост на инвестициите въз основа на твърд олово (или
по-голям) като намаляването на разходите за транспорт, но как
измерваме ли способността да вземаме по-добри решения?
Това определено е предизвикателство за дизайнерите на проекти, когато
те се опитват да накарат компанията да инвестира в определена
складови усилия. Увеличаване на продажбите или намаляване на разходите
те вече не са централните теми, които движат BI средата.
Вместо това търсите достъп в бизнес заявки
по-добре за информация, така че даден отдел да може
взимайте по-бързи решения. Това са стратегически двигатели за
което се оказва еднакво важно за бизнеса, но те са
по-двусмислени и по-трудни за характеризиране в осезаема метрика.
В този случай изчисляването на ROI може да бъде измамно, ако не и без значение.
Планиращите проекти трябва да могат да демонстрират стойност
осезаемо за ръководителите да решат дали да инвестират в
важи определено повторение. Няма обаче да предлагаме нов
метод за изчисляване на възвръщаемостта на инвестициите, нито ще правим някакви про или аргументи
срещу него.
Налични са много статии и книги, които обсъждат основите на
изчислете ROI. Има специални предложения за стойности като стойност
за инвестиции (ВАС), предлагани от групи като Gartner, които можете
да изследва. Вместо това ще се съсредоточим върху основните аспекти на всеки
ROI или други ценни предложения, които трябва да имате предвид.
Прилагане на ROI
В допълнение към спора за „твърди“ ползи срещу „леки“ ползи
свързани с усилията за BI има и други въпроси, които трябва да се разгледат
когато прилагаме ROI. Например:
Отдайте твърде много спестявания на усилията на DW, които ще дойдат
comunque
Да кажем, че вашата компания е преминала от архитектура на
мейнфрейм към разпределена UNIX среда. Така че всеки
спестявания, които могат (или не) да бъдат реализирани с това усилие
не трябва да се приписва изключително, ако на всички (?), на
склад.
Неотчитане на всичко разходи. И има много неща от
се вземат под внимание. Обмислете следния списък:
▪ Разходи за стартиране, включително осъществимост.
▪ Разходи за специален хардуер със свързано съхранение e
комуникация
▪ Разходи за софтуер, включително управление на данни и разширения
клиент / сървър, ETL софтуер, DSS технологии,
приложения за визуализация, програмиране и поток
софтуер за работа и проследяване ,.
▪ Разходи за проектиране на структурата данни, с реализацията, и
оптимизацията на
▪ Разходи за разработка на софтуер, пряко свързани с усилията
BI
▪ Разходи за домашна поддръжка, включително оптимизиране на
производителност, включително контрол на версията на софтуера e
помощни операции
Приложете възвръщаемост на инвестициите “Big-Bang”.
Изграждането на склада като едно и огромно усилие
той е обречен да се провали, така че изчислява и ROI за дадена инициатива
на голямо предприятие Предложението е изненадващо и това на дизайнерите
продължават да правят слаби опити за оценка на стойността на цялото
усилие.
Защото дизайнерите се опитват да дадат парична стойност
по бизнес инициатива, ако това е широко известно и прието
Трудно ли е да се изчислят конкретни повторения? Как е възможно? Не е
възможно с малки изключения. Не го прави.
След като установихме какво да не правим, когато изчисляваме
ROI, ето няколко точки, които ще ни помогнат при дефинирането на
надежден процес за оценка на стойността на вашите BI усилия.
Получаване на съгласие за възвръщаемост на инвестициите. Независимо от вашата
избор на техника за оценка на стойността на вашите BI усилия, трябва
да бъдат договорени от всички страни, включително организаторите на проекти,
спонсори и корпоративни ръководители.
Намалете възвръщаемостта на инвестициите до разпознаваеми части. Необходима стъпка към
разумното изчисление на възвръщаемостта на инвестициите е да се съсредоточи върху това изчисление
конкретен проект. Това ви позволява да изчислите стойност
въз основа на конкретни бизнес изисквания, които се изпълняват
Определете разходите. Както споменахме, трябва да има много разходи
разглеждан. Освен това разходите трябва да включват не само свързаните с тях
до единичната итерация, но също и до свързаните с това разходи
за гарантиране на съответствие с фирмените стандарти.
Определете ползите. Ясно свързване на ROI с изискванията
търговски, трябва да можем да идентифицираме
ползи, които ще доведат до изпълнение на изискванията.
Намалете разходите и ползите от предстоящите печалби. Това е пътят
най-добрият начин да базирате оценките си на нетна настояща стойност
(NPV) за разлика от опитите да се предскаже бъдеща стойност в
бъдещи печалби.
Сведете времето си за разделяне на възвръщаемостта на инвестициите до минимум. Е "
добре документиран в дългосрочен план, той е бил използван във вашия
Възвръщаемост на инвестициите.
Използвайте повече от една формула за възвръщаемост на инвестициите. Съществуват многобройни методи за
Прогноза за възвръщаемост на инвестициите и трябва да планирате дали да използвате такава или
плюс, включително нетната настояща стойност, вътрешната скорост на връщане
(IRR) и възстановяване.
Определете повторяемия процес. Това е от решаващо значение за изчисляване
всяка дългосрочна стойност. A
единичен повторяем процес за всички последователности на проекта a
последвам.
Изброените проблеми са най-често срещаните, определени от експерти
от средата на къщата. Настояването от страна на ръководството на
доставянето на ROI от „Големия взрив“ е много объркващо. Ако стартирате всички
вашите изчисления на възвръщаемостта на инвестициите, като ги намалите до разпознаваеми и осезаеми части, имате
добър шанс за оценка на точна оценка на възвръщаемостта на инвестициите.
Въпроси относно предимствата на възвръщаемостта на инвестициите
Каквито и да са вашите предимства, меки или твърди, можете да използвате
някои основни въпроси за определяне на тяхната стойност. Да се
пример, използвайки проста система за скала, от 1 до 10, вие
можете да откриете въздействието на всяко усилие, като използвате следното
въпроси:
▪ Как бихте оценили разбирането за данни следвайки това
проектът на вашата компания?
▪ Как бихте оценили подобренията на процеса в резултат на
този проект?
▪ Как бихте измерили въздействието на новите прозрения и умозаключения сега
предоставени от тази итерация
▪ Какво е въздействието на новите компютърни среди e
изпълнение в резултат на наученото?
Ако отговорите на тези въпроси са малко, възможно е
компанията не си струва направената инвестиция. Въпроси с висок
отбелязване на точки за значителни печалби от стойност и трябва
служат като насоки за по-нататъшно разследване.
Например висок резултат за подобрения на процеса
трябва да накара дизайнерите да проучат как стоят процесите
са подобрени. Може да откриете, че някои или всички печалби са постигнати
те са осезаеми и следователно парична стойност може да бъде лесно
приложени.
Извличане на максимума от първата итерация на
склад
Най-големият резултат от вашите бизнес усилия често е в
първите няколко повторения. Тези първи усилия традиционно
установяване на най-полезното информационно съдържание за обществеността e
създава помощ за технологичната основа за следващите
BI приложения.
Обикновено всяка следваща последователност от данни на проект от
складовете носят все по-малко допълнителна стойност за предприятието в
общ. Това е особено вярно, ако итерацията не го направи
добавя нови теми или не отговаря на нуждите на нова
общност от потребители.
Тази функция за съхранение се отнася и за батериите
увеличаване на данни историци. Тъй като последващите усилия изискват повече
данни и още как данни се изсипват в склада с течение на времето, по-голямата част от
данни става по-малко подходящо за използвания анализ. Тези данни Sono
често се нарича данни дреме и винаги е скъпо да ги държите, защото
те почти никога не се използват.
Какво означава това за спонсорите на проекти? По същество, т.е.
първите спонсори споделят повече от инвестиционните разходи.
Това е основно, защото те са тласъкът за намиране на слоя
голяма технологична среда и складови ресурси,
включително органични.
Но тези първи стъпки носят най-висока стойност и следователно дизайнерите
често трябва да оправдават инвестицията.
Проектите, направени след вашата BI инициатива, могат да имат разходи
по-нисък (в сравнение с първия) и директен, но носи по-малка стойност
към компанията.
И собствениците на организации трябва да започнат да обмислят
хвърли натрупването на данни и по-малко подходящи технологии.
Копаене на данни: Копаене Давам
Многобройни архитектурни компоненти изискват вариации на
технологии и техники за извличане на данни -
например различните "агенти" за разглеждане на интересните точки на
клиенти, операционните системи на компанията и за същата dw. Тези
агентите могат да бъдат усъвършенствани невронни мрежи, обучени на
пот тенденции, като бъдещо търсене на продукти въз основа на
промоции за продажби; базирани на правила двигатели за
реагирайте на едно цяло Дато обстоятелства, например диагноза
препоръки за лечение и лечение; или дори прости агенти
с ролята на докладване на изключения на висши мениджъри (отгоре
ръководители). Обикновено тези процеси на екстракция данни si
проверете в реално време; следователно те трябва да бъдат обединени
напълно с движението на данни стеси.
Онлайн обработка на аналитична обработка
Онлайн анализ
Възможността за нарязване, нарязване, търкаляне, пробиване
и извършете анализа
какво-ако, е в обхвата на целта на апартамента
Технология на IBM. Например функциите за аналитична обработка
онлайн (OLAP) съществува за DB2, който внася анализ на размерите в
двигател на база данни същото.
Функциите добавят размерна полезност към SQL докато
възползвайте се от всички предимства, като естествена част от DB2. Друг
пример за интеграция на OLAP е инструментът за извличане, DB2
OLAP сървър анализатор. Тази технология позволява кубчетата на
DB2 OLAP сървърът да бъде бързо и автоматично
анализирани за идентифициране и докладване на стойностите на данни необичайно или неочаквано
през целия куб до търговския анализатор. И накрая, функциите на
DW Center предоставя на архитектите средства за контрол, сред които
други неща, профилът на DB2 OLAP сървърния куб като част
характер на ETL процесите.
Пространствен анализ Пространствен анализ
Пространството представлява половината от аналитичните котви (проводимост)
необходимо за панорама
широк аналитичен (времето представлява другата половина). Атомното ниво
(атомно ниво) на склада, представено на фигура 1.1,
тя включва основите на времето и пространството. Записите
на анализа на времевия котва за информация за време и адрес
анализ на котва пространство. Печати за време (времеви клейма)
те извършват анализа навреме и информацията за адреса води
анализът от космоса. Диаграмата показва геокодиране - процес на
преобразуване на адреси в точки на карта или точки в пространството
така че понятия като разстояние и вътрешни / външни могат да бъдат
използва се при анализ - провежда се на атомно ниво и пространствен анализ
което се предоставя на анализатора. IBM предоставя разширения
пространство, разработено с Института за изследване на околната среда (ESRI),
al база данни DB2, така че да могат да бъдат пространствени обекти
съхранявани като нормална част от база данни релационна. DB2
Пространствени разширители, те също така предоставят всички SQL разширения за
възползвайте се от пространствения анализ. Например SQL разширения от
въпрос за
разстояние между адресите или дали дадена точка е вътре или извън дадена област
полигонални, са аналитичен стандарт с пространствения
Удължител. Вижте глава 16 за повече информация.
База данни-Resident Tools Tools База данни-
Постоянен
DB2 има много функции за пребиваване в BI, които помагат
в действието за анализ. Те включват:
▪ Рекурсивни функции за извършване на анализ, като например „намиране
всички възможни пътеки на полета от Сан Франциско a Ню Йорк".
▪ Аналитичните функции за класиране, кумулативни функции, куб
и сборове за улесняване на задачи, които обикновено се случват
само с технологията OLAP, те вече са естествена част от
двигател на база данни
▪ Възможност за създаване на таблици, които съдържат резултати
Продавачи на база данни лидерите смесват повече възможности за BI
в база данни същото.
Основните доставчици на база данни те смесват повече от
BI функционалност в база данни същото.
Това осигурява най-добрата производителност и повече възможности за изпълнение на
BI решения.
Обсъдени са характеристиките и функциите на DB2 V8
подробно в следните глави:
Основи на техническата архитектура и управление на данните
(Глава 5)
▪ Основи на DB2 BI (Глава 6)
▪ DB2 материализирани таблици на заявки (материализирани заявки
Таблици) (Глава 7)
▪ DB2 OLAP функции (Глава 13)
▪ Подобрена DB2 BI
Функции и функции) (Глава 15)
Опростена система за доставка на данни
Система за доставка на данни опростена
Архитектурата, представена на фигура 1.1, включва няколко
структури данни физически. Единият е складът на данни оперативен.
Като цяло ODS е субектно ориентиран,
интегрирани и актуални. Бихте ли изградили ODS за поддръжка, реклама
например офисът за продажби. Продажбите на ODS ще се интегрират данни
идващи от множество различни системи, но биха запазили само, реклама
например днешните транзакции. ODS може да се актуализира
дори много пъти на ден. В същото време процесите
натиснете i данни интегрирани в други приложения. Тази структура е
специално проектиран да се интегрира данни текущи и динамични д
би бил вероятен кандидат за анализи в реално време,
как да предоставяте агенти за услуги клиенти информация за продажбите
течения на клиент, извличащ информация за тенденцията на продажбите
от самия склад. Друга структура, показана на фигура 1.1, е
официален статут на dw. Не само това е мястото
изпълнението на необходимата интеграция, на качеството на данниИ
на трансформацията на данни на склад по пътя, но също е
надежден и временен склад за данни отговори това
може да се използва в анализи в реално време. Ако решите
използвайте ODS или място за поставяне, едно
от най-добрите инструменти за попълване на тези структури данни използвайки
различни операционни източници е хетерогенната разпределена заявка на DB2.
Тази възможност се предоставя от незадължителната DB2 функция
наречен DB2 Relational Connect (само заявка) и чрез DB2
DataJoiner (отделен продукт, който доставя приложението,
вмъкването, актуализирането и възможността за анулиране a
Хетерогенни разпределени RDBMS).
Тази технология позволява на архитектите да данни di legare данни di
производство с аналитични процеси. Не само технологията
на практика се адаптира към всяка от заявките за репликация, които
може да се покажат с анализи в реално време, но това
те също могат да се свържат с голямо разнообразие от бази на данни още
популярни, включително DB2, Oracle, Sybase, SQL Server,
Informix и други. DB2 DataJoiner може да се използва за попълване
структура данни официално като ODS или дори таблица
постоянно представени в склада, предназначен за реставрация
бързи актуализации или за продажба. Разбира се,
същите тези структури данни може да се попълни с помощта на
друга основна технология, предназначена за репликация на данни, IBM
DataPropagator Relational. (DataPropagator е отделен продукт
за централни системи. DB2 UNIX, Linux, Windows и OS / 2 включват
репликационни услуги на данни като стандартна функция).
Друг метод за преместване на данни опериращ наоколо
за предприятието е интегратор на корпоративно приложение в противен случай
известен като посредник за съобщения
уникалната технология позволява несравним контрол да се центрира
(насочване) и се премести данни около компанията. IBM има брокер
на по-широко използваното съобщение, MQSeries или вариант
на продукта, който включва изискванията на електронна търговия, IBM
WebSphere MQ.
За повече дискусия за това как да се използва MQ, за да се поддържа a
склад и BI среда, посетете уеб сайт на книгата. Засега е така
достатъчно е да се каже, че тази технология е отлична среда за
улавяне и преобразуване (с помощта на MQSeries Integrator) данни
целеви оператори, наети за BI решения. Там
MQ технологията е интегрирана и пакетирана в UDB V8, която
това означава, че опашките за съобщения вече могат да се управляват
сякаш са DB2 таблици. Концепцията за заваряване на
съобщения на опашка и вселена база данни релационни глави
към мощна среда за доставка данни.
Нулева латентност Нулева латентност
Крайната стратегическа цел за IBM е анализ на нулева латентност (zerolatency).
Както е дефинирано от
Gartner, BI системата трябва да може да извежда, усвоява
и предоставя информация за анализатори при поискване. Предизвикателството,
разбира се, това се крие в това как да се смесва данни текущо и в реално време
с необходимата историческа информация, като i данни свързан модел / на
тенденция или извлечено разбиране, като очертаване на
клиент.
Такава информация включва например идентификацията на клиенти ad
висок или нисък риск или кои продукти i клиенти те ще купят много
вероятно ако вече имат малко сирене в количките си
пазаруване.
Получаването на нулева латентност всъщност зависи от две
основни механизми:
▪ Пълно обединение на данни които се анализират с
утвърдени техники и с инструментите, разработени от BI
▪ Система за доставка на данни ефективно да се гарантира, че
анализът в реално време е наистина достъпен
Тези нулеви предпоставки за латентност не се различават от двете
цели, поставени от IBM и описани по-горе.
Тясното съединение на данни е част от
безпроблемна интеграция, организирана от IBM. И създайте система
доставка на данни е напълно зависим от
налична технология, която опростява процеса на доставка на
данни. Следователно две от трите цели на IBM са критични
за да реализираме третото. IBM съзнателно разработва своя собствена
технология, която да гарантира, че нулевата латентност е реалност за
складови усилия.
Резюме / Синтез
Организацията BI предоставя пътна карта за
създайте вашата среда
итеративно. Трябва да се коригира, за да отразява нуждите на
вашия бизнес, както настоящ, така и бъдещ. Без архитектурна визия
големи, повторенията на запасите са малко повече от
случайни внедрения на централен склад, които не правят много за
създайте голямо, информативно предприятие.
Първото препятствие за ръководителите на проекти е как да се оправдаят
инвестиции, необходими за развитието на BI организацията.
Въпреки че изчисляването на възвръщаемостта на инвестициите остава основна опора за
складови постижения, става все по-трудно
прогнозирайте точно. Това доведе до други методи за
определяне дали получавате парите си. The
закупува се например стойност на инвестицията2 (ВАС)
като решение.
Тя се очертава над архитектите на данни и на планиращите проекти
умишлено генерират и предоставят информация на асоциации на
потребители, а не просто да предоставят услуга на данни. Има
огромна разлика между двете. Информацията е нещо, което го прави
разлика във вземането на решения и ефективността; относително, т.е.
данни те са градивни елементи за извличане на тази информация.
Макар и критично към източника данни за адресиране на искания
търговски, BI средата трябва да играе по-голяма роля
при създаване на информационно съдържание. Трябва да вземем
допълнителни мерки за почистване, интегриране, трансформиране или
в противен случай създайте информационно съдържание, според което
потребителите могат да предприемат действия и затова трябва да сме сигурни, че те
действията и тези решения, когато това е разумно, се отразяват
в BI среда. Ако отместим склада да обслужва само на данни,
гарантира се, че потребителските асоциации ще създадат съдържанието
информация, необходима за предприемане на действия. Това гарантира, че техните
общността ще може да взема по-добри решения, но фирмата
страда от липсата на знания, които са използвали.
Dato че архитектите и организаторите на проекти инициират проекти
специфични за BI средата, те остават отговорни пред предприятието
общо взето. Прост пример за тази двупосочна функция
лица на итерациите на BI се намира в източника данни. Всички
данни получени за конкретни търговски заявки трябва да бъдат
населен в първия атомен слой. Това гарантира развитието на
корпоративен информационен актив, както и управление, адресиране на
специфични за потребителя заявки, дефинирани в итерацията.

Коя е хатата?
Склад за данни това е сърцето на архитектурата на информационните системи
от 1990 г. и поддържа информационни процеси, като предлага солидна
интегрирана платформа на данни историци, взети като основа за по-късно
анализ. НА склад за данни предлагат лекота на интегриране в a
света на приложните системи, които не са съвместими помежду си. Дата
склад се е превърнал в тенденция. Склад за данни
организира и съхранява i данни необходими за информационните процеси д
аналитична въз основа на дълга историческа времева перспектива. всичко
това включва значителна и постоянна ангажираност в строителството e
при поддържане на склад за данни.
И така, какво е a склад за данни? A склад за данни и:
▪ ориентирани към предметите
▪ интегрирана система
▪ вариантно време
▪ нелетлив (не отменя)
колекция от данни използва се в подкрепа на управленски решения в
изпълнение на процеса.
I данни вмъкнати в склад за данни възникват в повечето
случаи от оперативна среда. The склад за данни се прави от a
единица за съхранение, физически отделена от останалата част
система, която съдържа данни предварително трансформиран от
приложения, които работят върху информация, произтичаща от околната среда
оперативен.
Буквалната дефиниция на a склад за данни заслужава задълбочен поглед
обяснение, тъй като има важни мотивации и значения на
фонд, описващ характеристиките на склад.
ПРЕДМЕТ ОРИЕНТАЦИЯ ОРИЕНТАЦИЯ
ТЕМАТИЧНИ
Първата характеристика на a склад за данни е, че е ai-ориентирана
основни играчи в една компания. Оценяването на процесите чрез i
данни той е за разлика от по-класическия метод, който предвижда
ориентация на приложенията към процеси и функции,
метод в по-голямата си част споделен от повечето от
по-стари насочени системи.
Операционният свят е проектиран около приложения и функции
като заеми, спестявания, банкови карти и доверие за институция
финансови. Светът на dw е организиран около субекти
като клиент, продавач, продукт и бизнес.
Изравняването около темите засяга дизайна и
по реализацията на данни намерени в dw. По-подходящо,
основният аргумент засяга най-важната част от
ключова структура.
Светът на приложението се влияе както от дизайна на датата
основа и от процеса на проектиране. Светът на
dw е фокусиран единствено върху моделирането данни Отгоре е
чертеж на база данни. Дизайнът на процеса (във формата му
класически) не е част от dw средата.
Разликите между избора на процес / функция и приложение
Изборът по предмет също се разкрива като разлики в съдържанието
от данни на подробно ниво. НА данни del dw не включват i данни че
те няма да се използват за DSS процеса, докато приложения
оперативно ориентиран към данни съдържат i данни да задоволява
незабавно изискванията за функционалност / обработка, които могат или
минус като полза за анализатора на DSS.
Друг важен начин, по който оперативно ориентирани приложения
ai данни различавам се от данни на dw е в докладите на данни. Аз данни
оперативни поддържат непрекъсната връзка между две или повече таблици
въз основа на бизнес правило, което е активно. НА данни от dw
те обхващат спектър от време и съотношенията, намерени в dw, са
много. Много правила за търговия (и съответно много
доклади на данни ) са представени в склада на данни между две o
множество таблици.
(За подробно обяснение как взаимоотношенията между данни Sono
управлявани в DW, ние се позоваваме на Техническата тема за това
въпрос.)
От друга гледна точка освен тази на разликата
от основно значение между избор на функционалност / процес и приложение
при избор на предмет, има по-голяма разлика между системите
оперативни и данни и DW.
ИНТЕГРАЦИЯ ИНТЕГРАЦИЯ
Най-важният аспект на средата на dw е, че i данни намерен
в рамките на dw те се интегрират лесно. ВИНАГИ. БЕЗ
ИЗКЛЮЧЕНИЯ. Самата същност на dw средата е, че i данни
съдържащи се в границите на склада са интегрирани.
Интеграцията се разкрива по много различни начини - в конвенции
идентифицирани като последователни, до степен на постоянни променливи, в
кодифицирани структури, състоящи се във физическите атрибути на данни
последователни и т.н.
През годините дизайнерите на различни приложения са го правили
провеждане на много решения за това как трябва да се кандидатства
да бъдат разработени. Индивидуализирани решения за стил и дизайн
приложенията на дизайнерите се разкриват по сто начина: в
разлики в кодирането, структурата на ключовете, физическите характеристики,
конвенции за идентификация и т.н. Колективният капацитет на мнозина
дизайнери на приложения за създаване на противоречиви приложения
това е легендарно. Фигура 3 разкрива някои от по-различните разлики
важно в начина, по който са проектирани приложенията.
Кодиране: Кодиране:
Дизайнерите на приложения избраха полево кодиране -
секс - по няколко начина. Дизайнерът представя секса като
"m" и "f". Друг дизайнер представя секса като "1"
и "0". Друг дизайнер представя секса като "x" e
"Y". Друг дизайнер представя секса като "мъжки" e
"женски пол". Всъщност няма значение как сексът идва в DW. "М"
и "F" вероятно са толкова добри, колкото цялото
представителство.
Важното е, че от какъвто и произход да идва полето на пола,
това поле пристига в DW в постоянно интегрирано състояние. На
следствие, когато полето се зарежда в DW от
приложение, където е представено във формат
"M" и "F", т.е. данни трябва да се преобразува във формат DW.
Измерване на атрибути: Измерване на
Атрибути:
Дизайнерите на приложения избраха да измерват тръбопровода в
най-различни начини в курса
Няколко години. Дизайнер съхранява i данни на тръбопровода в
сантиметри. Друг дизайнер на приложения съхранява i данни
на тръбопровода в инчове. Още един дизайнер от
магазини за приложения i данни от тръбопровода в милиони кубически фута
за секунда. И друг дизайнер съхранява информацията за
тръбопровод по отношение на ярдовете. Какъвто и да е източникът, когато
информацията за тръбопровода пристига в DW те трябва да бъдат
измерена по същия начин.
Според индикациите на фигура 3 въпросите за интеграцията
те засягат почти всеки аспект на проекта - характеристиките
физически на данни, дилемата да има повече от един източник на данни, The
въпрос на несъответстващи идентифицирани мостри, формати на данни
непоследователни и т.н.
Какъвто и да е аргументът за дизайна, резултатът е един и същ -
i данни трябва да се съхранява в DW в единствено число e
глобално приемлив начин, дори когато операционните системи на
фонд съхранява по различен начин i данни.
Когато DSS анализаторът гледа DW, целта на анализатора
трябва да бъде експлоатацията на данни които са в склада,
вместо да се чудите за достоверността или последователността на
данни.
ВАРИАНТНОСТ НА ВРЕМЕТО
Всички аз данни в DW те са точни в даден момент от времето.
Тази основна характеристика на данни в DW е много различно от данни
намерени в операционната среда. НА данни от операционната среда са
точно като в момента на достъп. С други думи,
в операционната среда, когато има достъп до устройство данни, Но също така
изчакайте да отразява точни стойности, както в момента на достъп.
Защо аз данни в DW са толкова точни, колкото в някакъв момент в
време (т.е. не „точно сега“), т.е. данни намерен в DW
те са "вариация във времето".
Разликата във времето на данни DW се споменава по много начини.
Най-простият начин е, че i данни на DW представляват данни това е
дълъг хоризонт - пет до десет години. Хоризонта
времето, представено за операционната среда, е много по-кратко
▪ от днешните текущи стойности до шестдесет и деветдесет
Приложения, които трябва да работят добре и трябва да бъдат
на разположение за обработка на транзакции трябва да носи
минимално количество от данни ако признаят някаква степен на
гъвкавост. Така че оперативните приложения имат хоризонт
кратко време, като тема на дизайна на
аудио приложения.
Вторият начин, по който в DW се появява „вариация във времето“, е в
ключова структура. Всяка ключова структура в DW съдържа,
имплицитно или изрично, времеви елемент, като например
ден, седмица, месец и т.н. Елементът на времето е почти винаги
в долната част на конкатенирания ключ, намерен в DW. В тези
понякога елементът време ще съществува имплицитно, в зависимост от случая
където цял файл се дублира в края на месеца или тримесечието.
Третият начин за показване на вариацията във времето е, че i данни дел
DW, само коректно регистриран, не може да бъде
актуализиран. НА данни на DW са, за всички практически цели, дълги
поредица от снимки (моментна снимка). Разбира се, ако снимките са
са направени неправилно, тогава могат да бъдат моментни снимки
модифициран. Но ако приемем, че снимките са готови
правилно, те не се променят веднага щом приключат. В някои
случаите могат да бъдат неетични или дори невалидни, че моментните снимки в
DW са модифицирани. НА данни работещ, като е прецизен като в
при достъп те могат да бъдат актуализирани, както се представя
нуждата.
НЕ ЛЕТКИ
Четвъртата важна характеристика на DW е, че тя не е летлива.
Правят се актуализации, вмъквания, анулирания и промени
редовно за оперативна среда запис по запис. Но
основна манипулация на данни които се случват в DW е много повече
просто. Има само два вида операции, които се извършват в
DW - първоначалното зареждане на данни и достъп до данни. Няма
всяка актуализация на данни (в общия смисъл на
актуализация) в DW като нормална операция по обработка.
Има няколко много мощни последици от тази разлика
основа между оперативна обработка и обработка на DW. На нивото
дизайн, необходимостта да бъдете внимателни при актуализирането
аномално не е фактор в DW, тъй като актуализирането на данни нито един
извършено. Това означава, че на физическо ниво на дизайн,
могат да се вземат свободи за оптимизиране на достъпа до данни,
по-специално при работа с темите за нормализиране и
физическа денормализация. Друго следствие от простотата
на операциите на DW е в основната технология, използвана за
стартирайте DW средата. Трябва да поддържате актуализации
запис по запис онлайн (както често се случва с
оперативна обработка) технологията се изисква да има
много сложни основи при очевидна простота.
Технологията, която поддържа архивиране и възстановяване, транзакции
и целостта на данни и откриването и отстраняването на състоянието на задънена улица е
доста сложен и не е необходим за обработка на DW.
Характеристиките на DW, дизайнерска ориентация,
интеграция на данни в рамките на DW, вариация във времето и простота
управление на данни, всичко това води до среда, която е много, много
различен от класическата работна среда. Източникът на почти всички
данни на DW са работната среда. Изкушаващо е да се мисли
че има масивна излишък на данни между двете среди.
Всъщност първото впечатление, което много хора получават, е това
голямо съкращение на данни между операционната среда и
DW. Подобна интерпретация е повърхностна и доказва такава
липса на разбиране какво се случва в DW.
Всъщност има минимум съкращения от данни между работната среда
и аз данни на DW. Нека разгледаме следното:
▪ И данни се филтрират Дато че преминавате от операционната среда
към DW средата. Много данни те никога не отпадат
от операционната среда. Освен че i данни които са необходими за
DSS обработката намират своята посока в околната среда
▪ времевия хоризонт на данни тя е много различна от околната среда
на другия. НА данни в работната среда те са много свежи. НА данни
в DW те са много по-стари. Само от гледна точка
от времевия хоризонт, има много малко припокриване
между работната среда и DW.
▪ DW съдържа данни резюме, които никога не са намерени
в околната среда
▪ И данни претърпяват фундаментална трансформация от
тъй като преминават към Фигура 3 илюстрира това най-много
част от данни са значително модифицирани при условие
да бъдат избрани и преместени в DW. Казано по друг начин,
най-много данни е физически модифициран e
радикално как се премества в DW. От гледна точка
интеграцията не са еднакви данни които пребивават
в операционната среда.
В светлината на тези фактори излишъкът на данни между двете среди е
рядко събитие, което води до по-малко от 1% излишък между двете
среди.
СТРУКТУРА НА СКЛАДА
DW имат различна структура. Има различни обобщени и ди нива
подробности, които разграничават DW.
Различните компоненти на DW са:
▪ Метаданни
Давам актуални подробности
Давам от стари детайли
Давам леко обобщено
Давам силно обобщено
Несъмнено основната грижа е за i данни на детайла
течения. Това е основната грижа, защото:
▪ И данни текущите подробности отразяват най-новите събития,
които винаги представляват голям интерес и
▪ i данни на текущите детайли са обемни, защото е така
съхранявани при най-ниското ниво на гранулиране e
▪ i данни текущите подробности почти винаги се съхраняват на
дискова памет, до която има бърз достъп, но скъпа д
комплекс от
I данни по-стари подробности са данни които се съхраняват на
някакъв спомен за Маса. Има спорадичен достъп и е
съхранявани на ниво на детайлност, съвместимо с данни подробно
течения. Въпреки че не е задължително да се съхранява на
алтернативна памет, поради големия обем на данни обединени с
спорадичен достъп до данни, носителят на паметта за данни di
по-старите детайли обикновено не се съхраняват на диск.
I данни обобщени с лека ръка са данни които се дестилират отдолу
ниво на детайлност, установено на текущото ниво на детайлност. Това
Нивото на DW почти винаги се съхранява в паметта на диска. НА
проблеми на дизайна, които се представят на архитекта на данни
при изграждането на това ниво на DW са:
▪ Коя единица време е обобщението, направено по-горе
▪ Какво съдържание, атрибутите ще обобщават леко
съдържание на данни
Следващото ниво на данни намерен в DW е този на данни силно
обобщено. НА данни силно обобщени са компактни и лесни
достъпни. НА данни понякога се срещат силно обобщени
в DW среда и в други случаи i данни силно обобщени са
намерени извън непосредствените стени на технологията, хостваща DW.
(във всеки случай, т.е. данни силно обобщени са част от DW
независимо къде i данни са физически настанени).
Последният компонент на DW е този на метаданните. В много отношения
метаданните се намират в различно измерение от останалите данни
на DW, тъй като метаданните не съдържат никакви Дато пряко
взети от операционната среда. Метаданните имат специална роля e
много важно в DW. Метаданните се използват като:
▪ директория, която да помогне на DSS анализатора да намери
съдържание на DW,
▪ ръководство за картографиране на данни на това как аз данни Те бяха
трансформиран от работна среда в DW среда,
▪ ръководство за алгоритмите, използвани за обобщаване между данни di
текущи подробности ei данни малко обобщено, т.е. данни силно
обобщения,
Метаданните играят много по-важна роля в DW средата
в сравнение с това, което някога са имали в операционната среда
СРЕДНА СЪХРАНЕНИЕ НА СТАРИ ДЕТАЙЛИ
Магнитна лента може да се използва за съхраняване на този тип
данни. Всъщност има голямо разнообразие от инструменти за запаметяване, които
те трябва да се вземат предвид за запазване на стари данни di
детайл.
В зависимост от обема на данни, честотата на достъп, цената
от инструментите и вида на достъпа е напълно вероятно
че другите инструменти ще се нуждаят от старото ниво на детайлност
в DW.
ПОТОК НА ДАННИ
Има нормален и предсказуем поток от богове данни в рамките на DW.
I данни въведете DW от работната среда. (ЗАБЕЛЕЖКА: има
някои много интересни изключения от това правило. Въпреки това, почти
tutti i данни въведете DW от работната среда). Dato че аз данни
въведете DW от работната среда, той се трансформира, както е бил
описано по-горе. При условие, че въведете DW, т.е. данни Влез в
текущо ниво на детайлност, както е показано. Той пребивава там и се използва
докато настъпи едно от трите събития:
▪ е пречистен,
▪ е обобщено и / или
▪ е
Остарял процес в DW ход i данни актуални подробности
a данни на стари детайли, според възрастта на данни. Процеса
обобщението използва детайлите на данни да се изчисли i данни
леко обобщени и силно обобщени нива на данни. Има
някои изключения от показания поток (ще бъдат обсъдени по-късно).
Въпреки това, обикновено, за по-голямата част от данни намерен
в рамките на DW, потокът от данни е както е на снимката.
ИЗПОЛЗВАНЕ НА СКЛАДА ЗА ДАННИ
Не е изненадващо, че различните нива на данни в рамките на DW не
те получават различни нива на използване. Като правило, колкото по-високо е нивото на
обобщение, плюс i данни те се използват.
Много приложения се случват в данни силно обобщени, докато старите
данни детайли почти никога не се използват. Има добра причина в
преместете организацията към парадигмата за използване на ресурсите. Още има
обобщение i данни, колкото по-бързо и по-ефективно е да стигнете до данни, себе си
un магазин установи, че извършва много процеси на ниво детайлност на DW,
след това съответно голямо количество машинни ресурси
се консумира. В най-добрия интерес на всеки е да се преследва
както при високо ниво на обобщение възможно най-скоро.
За много магазини използва DSS анализатор в DW преди средата
данни на ниво детайлност. В много отношения пристигането a данни подробно
изглежда като защитно одеяло, дори когато са налични
други нива на обобщение. Една от дейностите на архитекта на данни è
отвикнете потребителя на DSS от постоянна употреба на данни на ниво плюс
ниска детайлност. Има две налични причини
от архитекта на данни:
▪ чрез инсталиране на система за възстановяване на такси, при която крайният потребител плаща
консумирани ресурси e
▪ които показват, че времето за реакция може да бъде много добро
получено, когато поведението с i данни то е на високо ниво
на обобщение, докато лошото време за реакция е резултат от
поведение на данни при ниско ниво на
ДРУГИ СЪОБРАЖЕНИЯ
Има някои други съображения за изграждане и управление
DW.
Първото съображение е това на индексите. НА данни на по-високите нива на
обобщението може да бъде свободно индексирано, докато i данни
на по-ниските нива на детайлност те са толкова обемисти, че могат да бъдат
индексиран пестеливо. От същия знак, т.е. данни на високите нива на
детайлите могат да бъдат сравнително лесно ремонтирани,
докато обемът на данни на по-ниските нива е толкова голям, че i данни които не са
те могат лесно да бъдат ремонтирани. Следователно моделът
от данни и официалната работа, извършена от дизайна, задава
основа за DW, приложена почти изключително за нивото
детайл ток. С други думи, дейностите по моделиране на
данни те не се прилагат за обобщаващи нива в почти всеки случай.
Друго структурно съображение е това на подразделението на
данни от DW.
Разделянето може да се извърши на две нива - на ниво dbms и др
ниво на приложение. В дивизията на нивото dbms, The dbms è
информира за дивизиите и ги проверява съответно. В случай че
разделение на ниво приложение, само програмистът е
информиран за подразделенията и отговорността за тях
администрацията е оставена на него
Под нивото dbms, много работа се извършва автоматично. Има
много гъвкавост, свързана с автоматичното администриране на
дивизии. В случай на разделяне на ниво приложение на данни дел
склад за данни, много се работи върху програмиста, но
Крайният резултат е гъвкавост в администрирането на данни в датата
склад
ДРУГИ АНОМАЛИИ
Докато компонентите на склад за данни работи както е описано
за почти всички данни, има някои полезни изключения, които трябва
да бъдат обсъдени. Изключение е това на данни публични обобщения
(публични обобщени данни). Това са данни обобщения, които са били
изчислено извън склад за данни но те се използват от обществото. НА данни
публичните резюмета се съхраняват и управляват в склад за данни,
въпреки че, както беше споменато по-горе, те са измислени. НА
счетоводителите работят, за да произвеждат такива на тримесечие данни като
доходи, тримесечни разходи, тримесечна печалба и т.н. Работата
извършено от счетоводителите е външно за склад за данни. Въпреки това, т.е. данни Sono
използвани “вътрешно” в компанията – от маркетинг, продажби и др.
Друга аномалия, която няма да бъде обсъждана, е тази на данни външен.
Друг страхотен вид данни които могат да бъдат намерени на дата
склад е този на постоянни подробни данни. Те причиняват
трябва да се съхранява постоянно i данни на едно ниво
подробно по етични или правни причини. Ако дадена компания излага i
има нужда от свързани работници с опасни вещества данни
подробен и постоянен. Ако дадена компания произвежда продукт, който
тя включва обществената безопасност, какви части от самолета има
нуждата за данни постоянни данни, както и дали фирма
сключва опасни договори.
Компанията не може да си позволи да пренебрегне подробностите защо
през следващите няколко години, в случай на съдебен процес, отзоваване, a
спорен строителен дефект и др. експозицията на компанията
може да е страхотно. Следователно има уникален тип данни
известни като постоянни подробни данни.
РЕЗЮМЕ
Un склад за данни е ориентиран, интегриран, вариант обект на
време, колекция от данни енергонезависими в подкрепа на нуждите на
решение на администрацията. Всяка от основните функции на
un склад за данни има своите последици. Плюс това са четири
нива на данни дел склад за данни:
▪ Стари детайли
▪ Текущи подробности
Давам леко обобщено
Давам силно обобщено
Метаданните също са важна част от склад за данни.
РЕЗЮМЕ
Концепцията за съхранението на данни наскоро получени
много внимание и това се превърна в тенденция от 90-те години. Това е всичко
поради способността на a склад за данни за преодоляване на
ограничения на системите за административна подкрепа като i
системи за помощ при вземане на решения (DSS) и информационни системи
изпълнителен (EIS).
Въпреки че концепцията за склад за данни изглежда обещаващо,
прилагам i склад за данни може да бъде проблематично, защото
мащабни процеси на съхранение. Въпреки
сложност на проектите за съхранение данни, много доставчици
и консултанти, които съхраняват данни те твърдят, че
съхранението на данни токът не включва проблеми.
В началото на този изследователски проект обаче почти няма
бяха проведени независими, строги и систематични изследвания. На
Следователно е трудно да се каже какво наистина се случва
в индустрията при строителство склад за данни.
Това проучване изследва практиката на съхранение на данни
съвременници, която има за цел да развие по-богато разбиране
на австралийската практика. Анализ на предоставената литература
контекст и основа за емпирично изследване.
Има редица резултати от това търсене. Първо
място, това проучване разкрива настъпилите дейности
по време на разработването на склад за данни. В много области, т.е. данни събрани
потвърди практиката, отчетена в литературата. Второ
сайт, проблеми и проблеми, които могат да повлияят
развитие на склад за данни са идентифицирани от това проучване.
И накрая, ползите, получени от австралийските организации, свързани с
използването на склад за данни са разкрити.
Глава 1
Изследователски контекст
Концепцията за съхранение на данни е получила широка популярност
експозиция и се превърна в нововъзникваща тенденция в
90-те (McFadden 1996, TDWI 1996, Shah and Milstein 1997,
Шанкс и други. 1997, Eckerson 1998, Adelman and Oates 2000). Това
може да се види от нарастващия брой статии на датата
складиране в търговски публикации (Литъл и Гибсън 1999).
Много статии (вж. Например Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett and King 1996, Graham et al. 1996,
Sakaguchi and Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997, McCarthy 1997, O 'Donnell 1997, Edwards 1998, TDWI
1999) отчита значителни ползи за организациите
които изпълняват i склад за данни. Те подкрепиха тяхната теория
с анекдотични доказателства за успешни внедрения, високата възвръщаемост
относно данните за инвестициите (ROI) и, също така, предоставяне на насоки
справка или методологии за разработване на склад за данни
(Shanks et al. 1997, Seddon and Benjamin 1998, Little and Gibson
1999). В краен случай Graham et al. (1996) имат
отчете средна възвръщаемост от тригодишна инвестиция от 401%.
Голяма част от настоящата литература обаче е пренебрегната
сложността, свързана с предприемането на подобни проекти. Проектите на
склад за данни те обикновено са сложни и мащабни д
следователно те предполагат голяма вероятност да се провалят, ако не са
внимателно контролирани (Shah and Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs and Clymer 1998, Rao
1998). Те изискват огромни количества както човешки, така и ресурси
финансови и, време и усилия за изграждането им (Hill 1998, Crofts 1998). The
типичното време и необходимите финансови средства са съответно
около две години и два или три милиона долара (Braly 1995, Foley
1997b, Bort 1998, Humphries et al. 1999). Тези времена и средства
финансите са необходими за контрол и консолидация на много аспекти
различни видове съхранение на данни (Cafasso 1995, Hill 1998). От страната
съображения за хардуера и софтуера, други функции, които варират
от добива на данни към процесите на зареждане на данни, от
капацитет на паметта за управление на актуализации и мета данни
за обучение на потребители те трябва да бъдат взети предвид.
По време на старта на този изследователски проект имаше много малко
академични изследвания, проведени в областта на съхранението на данни,
особено в Австралия. Това се виждаше от недостига на статии
публикувани при съхранение на данни от вестници или други писания
академици от онова време. Много от академичните трудове
на разположение описва опита в САЩ. Липсата на
Академичните изследвания в областта на съхранение на данни на sl са причинили
търсене на строги изследвания и емпирични изследвания (McFadden 1996,
Шанкс и други. 1997, Литъл и Гибсън 1999). По-специално проучванията
проучване на процеса на изпълнение на склад за данни
те трябва да бъдат направени за разширяване на знанията
общо за изпълнението на склад за данни e
те ще послужат като основа за бъдещо изследователско проучване (Shanks ed
други. 1997, Литъл и Гибсън 1999).
Следователно целта на това изследване е да проучи какво е всъщност
това се случва, когато организациите поддържат и използват данни
склад в Австралия. По-конкретно, това проучване ще включва
анализ на цял процес на разработка на a склад за данни,
като се започне от започване и планиране чрез проектиране и
внедряване и последващо използване в рамките на организациите
Австралийски. Освен това проучването ще допринесе и за съществуващата практика
идентифициране на области, където практиката може да бъде по-нататъшна
подобрена и неефективността и рисковете могат да бъдат сведени до минимум или
избягва. Освен това ще служи като основа за други изследвания по склад за данни in
Австралия и ще запълни празнината, която в момента съществува в литературата.
Изследователски въпроси
Целта на това изследване е да проучи участващите дейности
при изпълнението на склад за данни и използването им от
Австралийски организации. По-специално се изучават елементите
по отношение на планирането, разработването на проекти, ал
въпросната експлоатация, употреба и рискове. Оттук и въпросът
на това изследване е:
„Как е настоящата практика на склад за данни в Австралия?"
За да отговорите ефективно на този проблем, a
определен брой допълнителни изследователски въпроси. По-специално три
под-въпроси са идентифицирани от литературата, т.е.
представен в глава 2, за да ръководи този изследователски проект:
Как съм склад за данни от организации
Австралийски? Какви са проблемите?
Какви са предимствата?
При отговора на тези въпроси беше използвана рисунка
проучвателно изследване, използващо проучване. Като проучване
проучвателно, отговорите на горните въпроси не са пълни
(Shanks et al. 1993, Denscombe 1998). В този случай е така
за подобряване на реакциите към тях е необходима триангулация
въпроси. Разследването обаче ще даде солидна основа за
бъдеща работа, разглеждаща тези въпроси. Подробен
дискусия относно обосновката на метода на изследване и върху дизайна
е представен в глава 3.
Структура на изследователския проект
Този изследователски проект е разделен на две части: контекстуално проучване
на концепцията за съхранение на данни и емпирични изследвания (вж
фигура 1.1), всяка от които е обсъдена по-долу.
Част I: Контекстуално проучване
Първата част от изследването се състоеше в преразглеждане на
текуща литература за различни видове съхранение на данни, включително i
системи за помощ при вземане на решения (DSS), информационни системи
изпълнителен директор (EIS), казусите на склад за данни и концепции за дати
склад. Освен това резултатите от фаума sui склад за данни и богове
групи за срещи за експерти и професионалисти, водени от групата на
Изследванията на Monash DSS допринесоха за тази фаза на изследването
която е била предназначена за получаване на информация за практиката на данните
склад и да идентифицира рисковете, свързани с тяхното приемане.
През този период на контекстуално изучаване, разбиране
проблемната област е създадена, за да предостави знания за
основа за последващи емпирични изследвания. Това обаче
беше непрекъснат процес по време на провеждането на проучването на
изследвания.
Част II: Емпирични изследвания
Сравнително новата концепция за съхранение на данни, особено
в Австралия създаде необходимост от провеждане на разследване за
вземете обща картина на опитното използване. Това
част беше направена, след като проблемният домейн беше
са установени чрез обширен преглед на литературата. Концепцията
на складирането на данни, формирано по време на фазата на контекстуално проучване е
беше използван като вход за първоначалния въпросник на това проучване.
След това въпросникът беше прегледан. Шест експерти по срещи
склад участва в теста. Целта на теста на
Първоначалният въпросник беше да се провери за пълнота и точност
някой въпроси. Въз основа на резултатите от теста, въпросникът е
е модифициран и модифицираната версия е изпратена на
участници в анкетата. Върнатите тогава въпросници бяха
анализиран за i данни в таблици, диаграми и други формати. НА
резултати от анализ на данни образуват моментна снимка на
практика на съхранение на данни в Австралия.
ПРЕГЛЕД НА СЪХРАНЕНИЕТО НА ДАННИ
Концепцията за съхранение на данни се е развила с подобренията
на компютърните технологии.
Тя е насочена към преодоляване на проблемите, срещани от групи от
поддръжка на приложения като Система за подкрепа на решения (DSS) e
Изпълнителна информационна система (EIS).
В миналото най-голямата пречка пред тези приложения е била
невъзможността на тези приложения да предоставят a база данни
необходими за анализ.
Това се дължи главно на естеството на работата на
лидерство. Интересите на ръководството на компанията варират
постоянно в зависимост от третираната зона. Следователно аз данни
основен за тези приложения трябва да може да
променя се бързо в зависимост от частта, която ще се третира.
Това означава, че i данни те трябва да са налични във формуляра
адекватни за необходимите анализи. Всъщност групите за подкрепа на
приложения са открили много трудности в миналото да събират и
интеграция данни от сложни и разнообразни източници.
Останалата част от този раздел представя общ преглед на концепцията за
съхранение на данни и се занимава с това как склад за данни може да надвишава i
Проблеми с групите за поддръжка на приложения.
Терминът „Склад за данни”Издаден от Уилям Инмон през 1990г.
Често цитираната му дефиниция вижда Склад за данни Ела
колекция от данни субектно ориентирани, интегрирани, нестабилни и променливи
с течение на времето, в подкрепа на управленските решения.
Използвайки тази дефиниция, Inmon посочва, че i данни жители
в ун склад за данни трябва да притежава следното 4
Характеристика:
▪ Ориентиран към обекта
▪ Интегрирани
▪ Нелетливи
▪ Променлива във времето
Под Subject Oriented Inmon означава, че i данни в датата
склад в най-големите организационни области, които са били
дефинирани в модела данни. Например всички данни относно клиенти
се съдържат в предметната област КЛИЕНТИ. По същия начин всички
данни свързани с продуктите се съдържат в предметната област
ПРОДУКТИ.
Под Integrati Inmon означава, че i данни идващи от различни
платформи, системи и местоположения се комбинират и съхраняват в
единствено място. Следователно данни подобно трябва да се трансформира
в последователни формати, които да се добавят и сравняват
лесно.
Например мъжкият и женският пол са представени
от буквите M и F в една система и с 1 и 0 в друга. За
да ги интегрира по правилния начин, трябва един или двата формата
да се трансформира така, че двата формата да са равни. В това
В случая бихме могли да променим M на 1 и F на 0 или обратно. Ориентиран към
предмет и интегрира показват, че склад за данни е предназначен за
осигуряват функционална и напречна визия на данни дава част
на компанията.
Нелетливи означава, че i данни в склад за данни римангоно
последователно и актуализиране на данни не е необходимо. Вместо това всеки
промяна в данни оригиналите се добавя към база данни на датата
склад. Това означава, че историкът на данни се съдържа в
склад за данни.
За променливи във времето Inmon показва, че i данни в склад за данни
винаги съдържат маркери за време и i данни нормално
те пресичат определен времеви хоризонт. Например a
склад за данни може да съдържа 5 години исторически ценности на клиенти Дал
1993 до 1997 г. Наличието на историка и времеви редове
от данни ви позволява да анализирате тенденциите.
Un склад за данни той може да събере своите данни от системи
OLTP; от произхода данни външни за организацията и / или от други специалисти
улавяне на системни проекти данни.
I данни екстрактите могат да преминат през процес на почистване, през
този случай i данни те се трансформират и интегрират преди да бъдат
съхранявани в база данни дел склад за данни. Тогава аз данни
пребиваващи в база данни дел склад за данни се предоставят
инструменти за вход и възстановяване на крайни потребители. Използвайки
тези инструменти крайният потребител има достъп до интегрирания изглед
на организацията на данни.
I данни пребиваващи в база данни дел склад за данни Sono
съхранявани както в детайли, така и в обобщени формати.
Нивото на обобщението може да зависи от естеството на данни. Аз данни
подробно може да се състои от данни ток и данни историци
I данни реални не са включени в склад за данни докато аз данни
в склад за данни са освежени.
В допълнение към съхранението на i данни себе си, а склад за данни може също
съхранявайте различен тип Дато наречен METADATA който
опишете i данни пребиваващи в неговия база данни.
Има два вида метаданни: метаданни за развитие и
анализ.
Метаданните за разработка се използват за управление и автоматизация
процеси на извличане, почистване, картографиране и зареждане на данни в
склад за данни.
Информацията, съдържаща се в метаданните за разработка, може да съдържа
подробности за операционните системи, подробности за елементите, които трябва да бъдат извлечени,
модел данни дел склад за данни и корпоративни правила за
преобразуване на данни.
Вторият тип метаданни, известен като аналитични метаданни
дава възможност на крайния потребител да изследва съдържанието на данните
склад за намиране на данни налични и тяхното значение в термини
ясни и нетехнически.
Следователно метаданните за анализ функционират като мост между данните
складови и крайни потребителски приложения. Тези метаданни могат
съдържат бизнес модела, описания на данни кореспонденти
към бизнес модела, предварително дефинирани заявки и отчети,
информация за потребителски данни за вход и индекс.
Метаданните за анализ и развитие трябва да бъдат обединени в едно
интегрирани метаданни за ограничаване, за да работят правилно.
За съжаление много от съществуващите инструменти имат свои собствени
метаданни и понастоящем няма съществуващи стандарти, които
позволяват на инструментите за съхранение на данни да ги интегрират
метаданни. За да поправят тази ситуация, много търговци от
основните инструменти за съхранение на данни са формирали Meta Data
Съвет, който по-късно стана Коалиция за метаданни.
Целта на тази коалиция е да изгради набор от метаданни
стандарт, който позволява различни инструменти за съхранение на данни на
конвертиране на метаданни
Усилията им доведоха до раждането на Мета
Спецификация за обмен на данни (MDIS), която ще позволи обмена
на информация между архивите на Microsoft и свързаните с тях MDIS файлове.
Съществуването на данни както обобщени / индексирани, така и подробни дава
на потребителя възможността да извърши БУРЕНЕ НА ДЪРВАНЕ
(пробиване) хайде данни индексирани към детайлни и обратно.
Съществуването на данни подробна история позволява създаването на
анализ на тенденциите във времето. В допълнение метаданните за анализ могат
да се използва като директория на база данни дел склад за данни за
Помогнете на крайните потребители да намерят i данни необходимо.
В сравнение с OLTP системите, с тяхната способност да поддържат
анализ на данни и докладване, склад за данни тя се разглежда като система
по-подходящи за информационни процеси като извършване e
отговаряйте на запитвания и изготвяйте отчети. Следващият раздел
ще подчертае подробно разликите в двете системи.
СКЛАД ЗА ДАННИ СРЕЩУ OLTP СИСТЕМИТЕ
Много от информационните системи в рамките на организациите
те са предназначени да поддържат ежедневни операции. Тези
системи, известни като OLTP СИСТЕМИ, улавят транзакции
непрекъснато се актуализира всеки ден.
I данни в рамките на тези системи те често се модифицират, добавят или
изтрит. Например адресът на клиента просто се променя
той се мести от едно място на друго. В този случай новият адрес
ще бъдат регистрирани чрез промяна на адресното поле на база данни.
Основната цел на тези системи е да намалят разходите за
транзакции и същевременно намалява времето за обработка.
Примерите за OLTP системи включват критични действия като писане
счетоводство на поръчки, ведомости за заплати, фактури, производство, услуги за а клиенти.
За разлика от OLTP системите, които са създадени за процеси
въз основа на транзакции и събития, т.е. склад за данни са създадени
да осигури подкрепа за процеси, базирани на анализ на данни е су
процеси на вземане на решения.
Това обикновено се постига чрез интегриране на i данни от различни системи
OLTP и външни в един "контейнер" на данни,както е дискутирано
в предишния раздел.
Модел на процеса на съхранение на данни Monash
Моделът на процеса за склад за данни Monash е разработен от
изследователи от Monash DSS Research Group, се основава на
литератури на склад за данни, върху опита в подкрепа на
разработване на системни полета, при дискусии с доставчици на
приложения за използване на склад за данни, на група експерти
в използването на склад за данни.
Фазите са: Иницииране, Планиране, Развитие, Експлоатация и
Обяснения. Диаграмата обяснява итеративния характер o
еволюционно развитие на a склад за данни процес с използване
двупосочни стрелки, поставени между различните етапи. В това
"итеративен" и "еволюционен" контекст означават това при всеки
стъпка от процеса, възможни са дейности по изпълнение
винаги се разпространява обратно към предишния етап. Това е
поради естеството на проекта на a склад за данни в който
допълнителни заявки от частта поемат по всяко време
краен потребител. Например, по време на фазата на разработване на a
процес на склад за данни, един се изисква от крайния потребител
ново измерение или предметна област, която не се отнася до
оригинален план, това трябва да се добави към системата. Това
причинява промяна в проекта. Резултатът е, че
дизайнът трябва да промени изискванията на документите, създадени до момента
по време на фазата на проектиране. В много случаи текущото състояние на
проектът трябва да се върне към етапа на проектиране, където
новото искане трябва да бъде добавено и документирано. Потребителя
окончателният трябва да може да види ревизираната конкретна документация и
промени, направени във фазата на развитие. В края на
този цикъл на разработка проектът трябва да получи отлична обратна връзка от
и двата екипа, екипът за разработка и потребителския екип. НА
след това обратната връзка се използва повторно за подобряване на бъдещ проект.
Планиране на капацитета
DW обикновено са много големи и растат
много бързо (Best 1995, Rudin 1997a) след
количество от данни историци, които те запазват от живота си. Там
растежът може да бъде причинен и от данни допълнително се изисква от
потребителите да увеличат стойността на данни които вече имат. На
съответно изискванията за съхранение за данни possono
да бъдат значително подобрени (Eckerson 1997). Така е
от съществено значение за осигуряване, провеждане на планиране на
капацитет, с който системата, която трябва да се изгради, може да нараства
нарастващи нужди (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
При планирането на dw мащабируемост, човек трябва да знае
Очакван ръст в размера на склада, видове въпроси
вероятно ще бъде извършено и броят на поддържаните крайни потребители (Най-добър
1995, Rudin 1997b, Foley 1997a). Изграждане на мащабируеми приложения
изисква комбинация от мащабируеми и технически сървърни технологии
мащабируем дизайн на приложения (Best 1995, Rudin 1997b.
И двете са необходими при създаването на приложение
изключително мащабируема. Мащабируемите сървърни технологии могат
улесняват и печелят добавянето на памет, памет и
CPU без влошаваща производителност (Lang 1997, Telephony 1997).
Има две основни мащабируеми сървърни технологии: изчисляване
симетрично множествено (SMP) и масивна обработка
паралелно (MPP)) (IDC 1997, Humphries et al. 1999). Един сървър
SMP обикновено има множество процесори, споделящи памет,
автобусна система и други ресурси (IDC 1997, Humphries et al. 1999).
За увеличаване могат да се добавят допълнителни процесори
нея мощност изчислителна. Друг метод за увеличаване на
мощност изчислявайки SMP сървъра, комбинирате множество
SMP машини. Тази техника е известна като групиране (Humphries
и др. 1999). MPP сървърът, от друга страна, има по няколко процесора
със собствена памет, шинна система и други ресурси (IDC 1997,
Хамфрис и др. 1999). Всеки процесор се нарича възел. A
увеличаване на мощност може да се постигне изчислително
добавяне на допълнителни възли към MPP сървъри (Humphries et al.
1999).
Слабост на SMP сървърите е, че твърде много операции за въвеждане и извеждане
(I / O) може да претовари системата на шината (IDC 1997). Това
проблемът не възниква в MPP сървърите, тъй като всеки
процесорът има своя собствена шинна система. Взаимовръзките обаче
между всеки възел те обикновено са много по-бавни от системата на шината
на SMPs. Освен това MPP сървърите могат да добавят слой
допълнителна сложност за разработчиците на приложения (IDC
1997). По този начин изборът между SMP и MPP сървъри може да бъде повлиян
от много фактори, включително сложността на въпросите, връзката
цена / производителност, необходимия капацитет за обработка,
dw приложения предотвратени и увеличаването на размера на база данни
на dw и в броя на крайните потребители.
Многобройни мащабируеми техники за проектиране на приложения
те могат да се използват при планиране на капацитета. Едно
използва различни периоди за уведомяване като дни, седмици, месеци и години.
Като има различни периоди на уведомяване, база данни могат да бъдат разделени на
управляемо групирани парчета (Inmon et al. 1997). Друг
техниката е да се използват обобщени таблици, които са изградени
обобщаване данни da данни подробно. По този начин, т.е. данни обобщения са повече
компактен, отколкото подробен, което изисква по-малко място в паметта.
Така че данни подробности могат да се съхраняват в единица
по-евтино съхранение, което спестява още повече място за съхранение.
Въпреки че използването на обобщени таблици може да спести място на
памет, те изискват много усилия, за да ги поддържат актуализирани
в съответствие с търговските нужди. Тази техника обаче е
широко използвани и често използвани заедно с техниката
предишен (Best 1995, Inmon 1996a, Chauduri and Dayal
1997).
Определяне Склад за данни Технически
Архитектура Дефиниция на техники
архитектури от dw
Първоначалните възприемачи на складирането на данни са замислени предимно
централизирано изпълнение на dw, където всички данни, включително
i данни външни, бяха интегрирани в един,
физическо хранилище (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Основното предимство на този подход е, че крайните потребители
Имам достъп до изгледа в предприемачески мащаб
(изглед за цялото предприятие) на данни организационна (Ovum 1998). Друг
предимството е, че предлага стандартизация на данни чрез
организацията, което означава, че има само една версия или
дефиниция за всяка терминология, използвана в хранилището на dw
(reposity) метаданни (Flanagan and Safdie 1997, Ovum 1998). The
недостатък на този подход, от друга страна, е, че е скъп и труден
да се изгради (Flanagan and Safdie 1997, Ovum 1998, Inmon et al.
1998). Не след дълго след архитектурата за съхранение данни
централизираната стана популярна, концепцията за добив се разви
от по-малките подмножества на данни в подкрепа на нуждите на
специфични приложения (Varney 1996, IDC 1997, Berson and Smith
1997, паун 1998). Тези малки системи са получени от повече
голям склад за данни централизирана. Те се наричат ​​дата
зависими ведомствени складове или зависими данни.
Архитектурата на зависимите данни, известна като
тристепенна архитектура, в която първият ред се състои от датата
централизиран склад, вторият се състои от складовете на данни
ведомствен и третият се състои от достъп до данни и инструментите на
анализ (Demarest 1994, Inmon et al. 1997).
Мартите за данни обикновено се изграждат след склад за данни
централизирана е изградена, за да отговори на нуждите на
спецификации на единицата (White 1995, Varney 1996).
Маркери за данни съхраняват i данни много подходящо по отношение на детайлите
единици (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
Предимството на този метод е, че няма да има такъв Дато които не са
интегриран и че i данни те ще бъдат по-малко излишни в рамките на данните
мартове, тъй като всички данни идват от депозит от данни интегриран.
Друго предимство е, че ще има малко връзки между всеки
data mart и свързани източници на данни защото всеки март има само данни
източник на данни. Плюс с тази архитектура на място, потребители
окончанията все още могат да имат достъп до общия преглед на данни
корпоративна организационна. Този метод е известен като
метод отгоре надолу, при който марковете с данни се изграждат след датата
склад (паун 1998, Гоф 1998).
Увеличаване на необходимостта от ранно показване на резултати, някои
организациите са започнали да изграждат независими данни
(Flanagan and Safdie 1997, White 2000). В този случай данните се маркират
те вземат своите данни директно от основите на данни OLTP и не оттогава
централизирано и интегрирано съхранение, като по този начин елиминира необходимостта от
разполагат с централния склад.
Всеки март с данни изисква поне една връзка към своите източници
di данни. Недостатък на наличието на множество връзки за всяка дата
mart е, че в сравнение с двете предишни архитектури,
изобилие от данни се увеличава значително.
Всеки март с данни трябва да съхранява всички данни локално се изисква за
нямат ефект върху OLTP системите. Това причинява данни
те се съхраняват в различни данни (Inmon et al. 1997).
Друг недостатък на тази архитектура е, че тя води до
създаване на сложни взаимовръзки между данните и техните данни
източници на данни които са трудни за изпълнение и контрол (Inmon ed
други. 1997).
Друг недостатък е, че крайните потребители не могат да захранват
достъп до общия преглед на информацията за компанията, тъй като i данни
от различните данни не са интегрирани (Ovum 1998).
Още един недостатък е, че може да има повече от един
дефиниция за всяка терминология, използвана в генерираните от нея данни
несъответствия на данни в организацията (Ovum 1998).
Въпреки недостатъците, обсъдени по-горе, независимите данни се маркират
те все още привличат интереса на много организации (IDC 1997).
Един фактор, който ги прави привлекателни, е, че те се развиват по-бързо
и изискват по-малко време и ресурси (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Следователно те основно обслужват
като доказателствени проекти, които могат да се използват за идентифициране
бързо ползите и / или несъвършенствата в проекта (Parsaye
1995, Braly 1995, Newing 1996). В този случай, от част
прилагането в пилотния проект трябва да бъде малко, но важно
за организацията (Newing 1996, Mansell-Lewis 1996).
Изследвайки прототипа, крайните потребители и администрацията могат
решете дали да продължите или да спрете проекта (Фланаган и Сафди
1997).
Ако решението е да продължи, данните се маркират за други сектори
те трябва да се изграждат един по един. Има два варианта за
крайни потребители въз основа на техните нужди от изграждане на данни
независими матри: интегрирани / обединени и неинтегрирани (Ovum
1998)
При първия метод трябва да се изгради всеки нов март за данни
въз основа на текущите данни и модели данни използвана
от фирмата (Varney 1996, Berson and Smith 1997, Peacock 1998).
Необходимостта от използване на модела данни на фирмата го прави необходимо
уверете се, че има само едно определение за всяка терминология
използвано чрез данни, това също така, за да се увери, че датата
могат да се присъединят различни марки, за да се даде преглед на
корпоративна информация (Bresnahan 1996). Този метод е
наричан отдолу нагоре и е най-добре, когато има ограничение върху
финансови средства и време (Flanagan and Safdie 1997, Ovum 1998,
паун 1998, Гоф 1998). При втория метод данните се маркират
построен може да отговори само на нуждите на конкретна единица.
Вариант на обединените данни е склад за данни разпределение
в който база данни сървърния концентратор на сървъра се използва за присъединяване към много
данни мартове в един депозит от данни разпределени (White 1995). В
този случай, т.е. данни компаниите се разпределят в няколко данни.
Заявките за крайни потребители се препращат към база данни
сървър хъб мидълуер, който извлича всички данни изисква се от данните
marts и връща резултатите на приложенията на крайния потребител. Това
метод предоставя бизнес информация на крайните потребители. Въпреки това,
проблемите на информационните маркери все още не са елиминирани
независим. Има и друга архитектура, която може да се използва, която е
наречен склад за данни виртуален (White 1995). Този обаче
архитектурата, която е описана на фигура 2.9, не е архитектура
на съхранение на данни реално, тъй като не премества товара
от OLTP системи до склад за данни (Демарест 1994).
Всъщност исканията за данни крайните потребители са преминали през
OLTP системи, които връщат резултати след обработка на
потребителски заявки. Въпреки че тази архитектура позволява на потребителите
за генериране на отчети и формулиране на заявки, не може да предоставя i
данни история и преглед на фирмената информация от i данни
от различните OLTP системи не са интегрирани. И така, този
архитектурата не може да задоволи анализа на данни комплекс, който ad
пример за прогноза.
Избор на приложението за достъп и
възстановяване на данни
Целта на изграждането на a склад за данни е да предаде
информация за крайните потребители (Inmon et al 1997, Poe 1996,
McFadden 1996, Shanks et al 1997, Hammergren 1998); един или
приложения за множествен достъп и възстановяване данни трябва да се предостави. Да се
днес има голямо разнообразие от тези приложения, сред които потребителят може
изберете (Hammergren 1998, Humphries et al 1999). The
избраните приложения определят успеха на усилията
на съхранение на данни в организация, защото
приложенията са най-видимата част от склад за данни на потребителя
окончателен (Inmon et al 1997, Poe 1996). За успешна среща
склад, трябва да може да подпомага дейностите по анализ на данни
краен потребител (Poe 1996, Seddon and Benjamin 1998, Eckerson
1999). Така че "нивото" на това, което крайният потребител иска, трябва да бъде
идентифицирани (Poe 1996, Mattison 1996, Inmon et al 1997,
Хамфрис и др. 1999).
Като цяло крайните потребители могат да бъдат групирани в три
категории: изпълнителни потребители, бизнес анализатори и потребители на енергия (Poe
1996, Humphries et al. 1999). Изпълнителните потребители се нуждаят
лесен достъп до предварително дефинирани набори от доклади (Humphries ed
други 1999). Тези взаимоотношения могат лесно да бъдат постигнати с
навигация в менютата (Poe 1996). Плюс това, докладите трябва
представяне на информация с помощта на графично представяне
като таблици и шаблони за бързо доставяне
информация (Humphries et al 1999). Бизнес анализатори, които не го правят
те могат да имат технически възможности за изграждане на взаимоотношения
нула сами по себе си, трябва да могат да променят текущите съотношения за
отговарят на техните специфични нужди (Poe 1996, Humphries et al
1999). Мощните потребители, от друга страна, са този вид крайни потребители
те имат способността да генерират и пишат заявки и отчети от
нула (Poe 1996, Humphries et al 1999). Те са тези, които
разработване на отчети за други типове потребители (Poe 1996, Humphries
и др. 1999).
След като се определят изискванията на крайния потребител, това трябва да се направи
избор на приложения за достъп и извличане данни тра тути
наличните (Poe 1996, Inmon et al 1997).
Достъп до данни и инструменти за извличане могат да бъдат
класифицирани в 4 типа: инструмент OLAP, инструмент EIS / DSS, инструмент за заявки и
инструмент за отчитане и извличане на данни.
OLAP инструментите позволяват на потребителите да създават ad hoc заявки, както и
тези, направени на база данни дел склад за данни. Плюс тези продукти
позволяват на потребителите да пробият от данни общо за тези
подробно.
Инструментите за EIS / DSS осигуряват ръководни отчети като анализ „какво ще стане“
и достъп до доклади, организирани в менюта. Докладите трябва да бъдат
предварително дефинирани и обединени с менюта за по-лесна навигация.
Инструментите за заявки и отчитане позволяват на потребителите да създават отчети
предварително дефинирани и конкретни.
Инструментите за извличане на данни се използват за идентифициране на взаимоотношения, които
може да хвърли нова светлина върху забравените операции в данни дел
склад за данни.
Наред с оптимизирането на изискванията на всеки тип потребител, т.е.
избраните инструменти трябва да бъдат интуитивни, ефективни и лесни за използване.
Те също трябва да бъдат съвместими с други части на архитектурата e
в състояние да работи със съществуващи системи. Предлага се също така
изберете инструменти за достъп и извличане на данни с цени и производителност
разумен. Други критерии за разглеждане включват ангажираността на
доставчик на инструмента в подкрепа на техния продукт и разработките, които го правят
същото ще има и в бъдещи версии. За да се гарантира ангажираност на потребителя
при използването на хранилището за данни екипът за разработка включва
потребители в процеса на избор на инструмент. В такъв случай
трябва да се извърши практическа оценка на потребителя.
За да подобри стойността на хранилището за данни, екипът за разработка може
също така осигуряват уеб достъп до своите хранилища за данни. A
уеб-активирана база данни позволява на потребителите достъп данни
от отдалечени места или по време на пътуване. Също така информацията може
да се предоставя на по-ниски разходи чрез намаляване на разходите
на обучение.
2.4.3 Склад за данни Фаза на експлоатация
Тази фаза се състои от три дейности: определяне на стратегии за дати
опресняване, контрол на дейностите по съхранение на данни и управление на
сигурност на хранилището за данни.
Определяне на стратегии за опресняване на данни
След първоначалното качване, т.е. данни в база данни на хранилището за данни
те трябва периодично да се опресняват, за да се възпроизвеждат
промени, направени на данни оригинали. Следователно е необходимо да се вземе решение
кога да се опреснява, колко често трябва
и как да опресните данни. Препоръчва се да се направи
опресняване на данни когато системата може да бъде изключена офлайн. Там
честотата на опресняване се определя от разчитащия екип за разработка
относно изискванията на потребителя. Има два подхода за опресняване на
база данни: пълно опресняване и непрекъснато зареждане на
промени.
Първият подход, пълно опресняване, изисква презареждане на
tutti i данни от нулата. Това означава, че всички данни задължително трябва
да бъдат извлечени, почистени, трансформирани и интегрирани във всяко опресняване. Това
подход трябва да се избягва, доколкото е възможно, тъй като
отнема много време и ресурси.
Алтернативен подход е непрекъснатото зареждане на
промени. Това добавя i данни които са променени
от последния цикъл на опресняване на хранилището за данни. Идентифицирането на
нови или модифицирани записи значително намалява количеството на
данни които трябва да се разпространяват до хранилището на данни във всяка
актуализация, тъй като само тези данни ще бъде добавен към база данни
на хранилището за данни.
Има поне 5 подхода, които могат да се използват за оттегляне
i данни нов или модифициран. За да се получи ефективна стратегия на
опресняване на данни комбинация от тези подходи може да бъде полезна
вземете всички промени в системата.
Първият подход, който използва времеви клейма, предполага, че идва
възложени на всички данни модифициран и актуализиран времеви клей, така че
за да можете лесно да идентифицирате всички данни модифициран и нов.
Този подход обаче не е широко използван в повечето
част от днешните операционни системи.
Вторият подход е да се използва делта файл, генериран от
приложение, което съдържа само промените, направени в данни.
Използването на този файл също усилва цикъла на актуализация.
Въпреки това дори този метод не е бил използван в много
приложения.
Третият подход е да се сканира регистрационен файл, който
той основно съдържа информация, подобна на делта файла. Единствения
Разликата е, че се създава регистрационен файл за процеса на възстановяване и
може да бъде трудно за разбиране.
Четвъртият подход е модифицирането на кода на приложението.
Въпреки това по-голямата част от кода на приложението е стар и
чуплив; следователно тази техника трябва да се избягва.
Последният подход е да се сравни данни източници с файла
основен от данни.
Контрол на дейностите по съхранение на данни
След като хранилището за данни е пуснато на потребителите, то е
необходимо да се следи с течение на времето. В този случай администраторът
от хранилището на данни може да използва един или повече инструменти за управление e
контрол за наблюдение на използването на хранилището за данни. В частност
информация за хората и времето може да бъде събрана в
които имат достъп до хранилището за данни. Хайде данни събраните могат да бъдат създадени
профил на извършената работа, който може да се използва като вход
при изпълнението на възвръщаемостта на плащането от потребителя. Обратното плащане
позволява на потребителите да бъдат информирани за разходите за обработка на
склад за данни.
Освен това може да се използва и контролът на хранилището за данни
идентифицирайте видовете заявки, техния размер, броя на заявките на
ден, време за реакция на заявката, достигнати сектори и количество
di данни обработени. Друга цел на проверката на
datawarehouse е да идентифицира данни които не се използват. Тези данни
те могат да бъдат премахнати от хранилището за данни, за да се подобри времето
отговор на изпълнение на заявка и контролиране на растежа на
данни които се намират в рамките на база данни на хранилището за данни.
Управление на сигурността на хранилището на данни
Хранилището за данни съдържа данни интегрирана, критична, чувствителна
може да се достигне лесно. По тази причина трябва
да бъдат защитени от неоторизирани потребители. Един от начините да
внедряване на сигурност е да се използва функцията на СУБД
да присвоите различни привилегии на различни типове потребители. В това
начин, трябва да се поддържа профил за всеки тип потребител
достъп. Друг начин да защитите хранилището за данни е да го шифровате
както е написано в база данни на хранилището за данни. Достъп до
данни и инструментите за извличане трябва да дешифрират данни преди да представя i
резултати за потребителите.
2.4.4 Склад за данни Фаза на внедряване
Това е последната фаза в цикъла на внедряване на хранилището на данни. The
дейностите, които трябва да се извършат на този етап, включват обучение на
потребителите да използват хранилището за данни и да извършват прегледи
на хранилището за данни.
Обучение на потребителите
Първо трябва да се направи обучение на потребителите
достъп до данни на хранилището за данни и използването на
извличане. Като цяло сесиите трябва да започват с
въвеждането на концепцията за съхранение на данни, към
съдържание на хранилището на данни, до мета данни и основните характеристики
на инструменти. След това по-напредналите потребители също могат да изучават
физически таблици и характеристиките на потребителите на достъп до данни и инструменти на
извличане.
Има много подходи за обучение на потребители. Един от
те предоставят избор от много потребители или анализатори, избрани от
набор от потребители, разчитащи на тяхното лидерство и умения
комуникация. Те се обучават в лично качество на
всичко, което трябва да знаят, за да се запознаят с
система. След обучението те се връщат към работата си д
започват да учат други потребители как да използват системата. На
въз основа на наученото други потребители могат да започнат
проучете хранилището за данни.
Друг подход е да обучавате много потребители в едно и също
време, сякаш посещавате курс в класната стая. Този метод
подходящ е, когато има много потребители, които трябва да бъдат обучени
по същото време. Още един метод е да се тренира
всеки потребител поотделно, един по един. Този метод е
подходящ, когато има малко потребители.
Целта на обучението на потребителите е да се запознаят
с достъп до данни и инструментите за извличане, както и съдържанието на
склад за данни. Някои потребители обаче могат да бъдат претоварени
количеството информация, предоставена по време на сесията
обучение. Така че трябва да се направят редица
актуализиране на сесиите текуща помощ и за отговор
към конкретни въпроси. В някои случаи група от
потребителите да предоставят този тип поддръжка.
Събиране на обратна връзка
След като хранилището за данни бъде пуснато, потребителите могат
използвайте i данни пребиваващи в хранилището за данни за различни цели.
Основно, анализаторите или потребителите използват данни в
база данни за:
1 Идентифицирайте фирмените тенденции
2 Анализирайте потребителските профили на клиенти
3 Разделете i клиенти и аз
4 Осигурете най-добрите услуги на клиенти - персонализирате услуги
5 Формулирайте стратегии маркетинг
6 Направете конкурентни оценки за анализ на разходите и помощ
контрол
7 Подкрепете вземането на стратегически решения
8 Определете възможностите за поява
9 Подобряване на качеството на текущите бизнес процеси
10 Проверете печалбата
Следвайки насоките за развитие на хранилището за данни, те биха могли
провеждане на поредица от ревизии на системата за получаване на обратна връзка
както от екипа за разработка, така и от общността
крайни потребители.
Получените резултати могат да бъдат взети предвид за
следващ цикъл на развитие.
Тъй като хранилището за данни има инкрементален подход,
от съществено значение е да се поучите от успехите и грешките на предишните
развитие.
2.5 Резюме
В тази глава подходите, намерени в
литература. Раздел 1 обсъжда концепцията за
хранилище за данни и неговата роля в науката за вземане на решения. В
раздел 2 описва основните разлики между
хранилище за данни и OLTP системи. Раздел 3 обсъди
Използваният модел на Monash хранилище за данни
в раздел 4, за да опише дейностите, включени в процеса
разработването на хранилище за данни, тези тези не се основават на
строги изследвания. Това, което се случва в действителност, може да бъде
много различно от това, което литературата съобщава, обаче тези
резултатите могат да се използват за създаване на основен багаж, който
подчертайте концепцията за хранилище на данни за това изследване.
Глава 3
Методи за изследване и проектиране
Тази глава се занимава с методи за изследване и проектиране на
това учение. Първата част показва общ поглед върху методите
на разположение и за извличане на информация
Обсъдени са критериите за избор на най-добрия метод за такъв
конкретно проучване. След това в раздел 2 се обсъждат два метода
избран с критериите, посочени по-горе; от тях ще бъдат избрани и
прие един с мотивите, посочени в раздел 3, където са те
бяха представени и причините за изключването на другия критерий. Там
раздел 4 представя изследователския проект и раздел 5 le
заключения.
3.1 Изследвания в информационните системи
Изследванията в информационните системи не се ограничават само до
към технологичната сфера, но трябва да се разшири, за да се включи
цели, свързани с поведението и организацията.
Това дължим на тезите от различни дисциплини, вариращи от
социални към природни науки; това води до необходимостта от a
определен спектър от изследователски методи, включващи количествени методи
и качествени, които да се използват за информационни системи.
Всички налични методи за изследване са важни, всъщност разнообразни
изследователи като Jenkins (1985), Nunamaker et al. (1991) и Galliers
(1992) твърдят, че не съществува универсален специфичен метод
да провежда изследвания в различни области на информационните системи; наистина
метод може да е подходящ за конкретно търсене, но не
за другите. Това ни води до необходимостта да изберем метод, който
е подходящ за конкретния ни изследователски проект: за това
избор Benbasat и сътр. (1987) заявяват, че те трябва да бъдат взети предвид
естеството и целта на изследването.
3.1.1 Същност на изследването
Могат да бъдат различни методи, основани на естеството на изследването
класифицирани в три широко известни традиции в науката
информация: позитивистки, интерпретативни и критични изследвания.
3.1.1.1 Позитивистки изследвания
Позитивистките изследвания са известни още като научни изследвания или
емпиричен. Той се опитва да: „обясни и предскаже какво ще се случи в
социалния свят, разглеждащ закономерностите и причинно-следствените връзки
сред съставните му елементи "(Shanks et al 1993).
Позитивистките изследвания също се характеризират с повторяемост,
опростявания и опровержения. Освен това признават позитивистките изследвания
съществуването на априорни отношения между изследваните явления.
Според Galliers (1992) таксономията е изследователски метод
включени в позитивистката парадигма, която обаче не се ограничава само до това,
всъщност има лабораторни експерименти, полеви експерименти,
казуси, доказателства на теореми, прогнози и симулации.
Използвайки тези методи, изследователите признават, че явленията
изследваното може да се наблюдава обективно и строго.
3.1.1.2 Интерпретативни изследвания
Интерпретативно изследване, което често се нарича феноменология или
антипозитивизмът е описан от Neuman (1994) като „анализ
систематичен за социалния смисъл на действието чрез директен д
подробно наблюдение на хората в природни ситуации по ред
да се стигне до разбирането и тълкуването на това как
хората създават и поддържат своя социален свят ”. Проучвания
тълкувателно отхвърля предположението, че наблюдаваните явления
може да се наблюдава обективно. Всъщност те са базирани
върху субективни интерпретации. Освен това изследователите-интерпретатори не го правят
те налагат априорни значения на явленията, които изучават.
Този метод включва субективни / аргументирани изследвания, действия на
изследвания, описателни / интерпретативни изследвания, бъдещи изследвания и игри на
роля. В допълнение към тези проучвания и казуси могат да бъдат
включени в този подход, тъй като се отнасят до проучванията на
лица или организации в сложни ситуации
на реалния свят.
3.1.1.3 Критично изследване
Критичните изследвания са най-малко познатият подход в науките
социална, но наскоро получи вниманието на изследователите
в областта на информационните системи. Философското предположение, че
социалната реалност е исторически произведена и възпроизведена от хората,
както и социалните системи с техните действия и взаимодействия. Техен
умението обаче се опосредства от редица съображения
социални, културни и политически.
Освен интерпретационните изследвания, критичните изследвания твърдят, че
позитивистките изследвания нямат нищо общо със социалния контекст и игнорират
влиянието му върху човешките действия.
Критичното изследване, от друга страна, критикува интерпретативното изследване за
бъдете прекалено субективни и защото няма за цел да помогне
хората да подобрят живота си. Най-голямата разлика между
критично изследване и другите два подхода е оценъчното му измерение.
Докато обективността на позитивистките и интерпретативни традиции е за
прогнозиране или обяснение на статуквото или социалната реалност, критични изследвания
има за цел да оцени критично и трансформира социалната реалност по-долу
студио.
Критичните изследователи обикновено се противопоставят на статуквото, за да го направят
премахване на социалните различия и подобряване на социалните условия. Там
критичното изследване се ангажира с процедурен поглед върху
явления от интерес и следователно обикновено е надлъжен.
Примери за изследователски методи са дългосрочните исторически изследвания и
етнографски изследвания. Критичните изследвания обаче не бяха
широко използвани в изследванията на информационните системи
3.1.2 Цел на изследването
Заедно с естеството на изследването може да се използва и неговата цел
да насочва изследователя при избора на определен метод
Изследвания. Целта на изследователския проект е тясно свързана
позицията на търсенето по отношение на цикъла на търсене, който се състои от
три фази: изграждане на теорията, тест на теорията и усъвършенстване на
теория. По този начин, въз основа на момента по отношение на изследователския цикъл, a
изследователският проект може да има обяснителна, описателна цел
проучване или предсказване.
3.1.2.1 Изследователски изследвания
Изследователското изследване е насочено към изследване на дадена тема
напълно нови и формулират въпроси и хипотези за изследване
бъдеще. Този тип изследвания се използват при изграждането на
теория за получаване на първоначални препратки в нова област.
Обикновено се използват качествени изследователски методи, като случаи
проучване или феноменологични изследвания.
Възможно е обаче да се използват и количествени техники като
изследователски разследвания или експерименти.
3.1.3.3 Описателни изследвания
Дескриптивното изследване е насочено към голям анализ и описание
детайлизира конкретна организационна ситуация или практика. Това
подходящ е за изграждане на теории и може да се използва и за
потвърждават или оспорват хипотези. Дескриптивно изследване обикновено
включва използването на измервания и проби. Най-подходящите методи за изследване
те включват разследване и анализ на основата.
3.1.2.3 Обяснителни изследвания
Обяснителните изследвания се опитват да обяснят защо нещата се случват.
Тя е изградена върху факти, които вече са проучени и се опитва да намери
причините за тези факти.
Така че обяснителните изследвания обикновено се основават на изследвания
изследователски или описателен и е спомагателен за тестване и усъвършенстване
теориите. Обяснителните изследвания обикновено използват казуси
o изследователски методи, базирани на проучвания.
3.1.2.4 Превантивни изследвания
Превантивното изследване има за цел да предскаже събития и поведения
под наблюдение, че те се изучават (Маршал и Росман
1995). Предсказанието е стандартният научен тест за истина.
Този тип изследвания обикновено използват разследване или анализ на
данни историци. (Ин 1989)
Горната дискусия показва, че има редица
възможни изследователски методи, които могат да бъдат използвани при изследване
особено. Трябва обаче да има специфичен метод, който да е по-подходящ
други за определен тип изследователски проект. (Галие
1987, Ин 1989, Де Ваус 1991). Следователно всеки изследовател има
трябва внимателно да оцените силните и слабите страни на
различни методи, за да се възприеме най-подходящият метод за изследване д
съвместим с изследователския проект. (Jenkins 1985, Pervan and Klass
1992, Бономия 1985, Ин 1989, Химилтън и Айвс 1992).
3.2. Възможни методи за изследване
Целта на този проект беше да се проучи опитът в
Австралийски организации с i данни съхранявани с един
развитие на склад за данни. Dato който в момента има такъв
липса на изследвания в областта на съхранението на данни в Австралия,
този изследователски проект е все още в теоретичната фаза на цикъла
изследвания и има изследователска цел. Проучване на опита в
Австралийски организации, приемащи складиране на данни
изисква тълкуване на реалното общество. Следователно
следва философското предположение, залегнало в основата на изследователския проект
традиционната интерпретация.
След стриктен преглед на наличните методи те бяха идентифицирани
два възможни метода за изследване: проучвания и казуси
(казуси), които могат да се използват за изследвания
изследователски (Shanks et al. 1993). Galliers (1992) твърди, че
пригодността на тези два метода за това конкретно изследване в
неговата таксономия преразгледана, казвайки, че те са подходящи за строителство
теоретична. Следващите два подраздела обсъждат всеки метод в
детайл.
3.2.1 Метод за изследване на разследването
Методът за изследване на изследванията идва от древния метод на
преброяване. Преброяването се състои от събиране на информация от
цяла популация. Този метод е скъп и непрактичен в
особено ако населението е голямо. Така че, в сравнение с
преброяване, изследването обикновено е фокусирано върху
събира информация за малък брой или извадка от
представители на населението (Fowler 1988, Neuman 1994). A
извадката отразява популацията, от която е взета, с различни
нива на точност, в зависимост от структурата на пробата,
размер и използван метод за подбор (Fowler 1988, Babbie
1982, Нойман 1994).
Методът на проучването се определя като „моментни снимки на практики,
ситуации или възгледи в определен момент от времето, предприети с използване
въпросници или интервюта, от които могат да се направят изводи
направен "(Galliers 1992: 153) [снимка на файловете,
ситуации или възгледи в определен момент от време, предприети с използване
въпросници или интервюта, от които могат да се правят изводи]. The
проучванията се занимават със събирането на информация за определени аспекти
от изследването, от редица участници, които правят
въпроси (Фаулър 1988). Дори тези въпросници и интервюта, които
включват телефонни интервюта лице в лице и структурирани интервюта,
са техниките за събиране на данни най-често използвани в
разследвания (Blalock 1970, Nachmias and Nachmias 1976, Fowler
1988), могат да се използват наблюдения и анализи (Gable
1994). От всички тези методи за събиране на данни, използването на
въпросникът е най-популярната техника, тъй като гарантира, че i данни
събраните са структурирани и форматирани и по този начин улеснява
класификация на информацията (Hwang 1987, de Vaus 1991).
При анализа на данни, стратегия за разследване често използва
количествени техники, като статистически анализ, но те могат да бъдат
се използват и качествени техники (Galliers 1992, Pervan
и Klass 1992, Gable 1994). Обикновено, т.е. данни събрани са
използва се за анализ на разпределения и модели на асоцииране
(Фаулър 1988).
Въпреки че проучванията обикновено са подходящи за изследвания
справяне с въпроса "какво?" (какво) или от него
производно, като „квант“ (колко) и „квант“ (колко), esse
може да бъде зададен чрез въпроса „защо“ (Sonquist и
Dunkelberg 1977, Yin 1989). Според Sonquist и Dunkelberg
(1977), изследователското разследване сочи към трудни хипотези, програма на
оценка, описване на популацията и разработване на модели на
човешко поведение. Също така могат да се използват проучвания
да проучи определено мнение за населението, условията,
минали мнения, характеристики, очаквания и дори поведение
или понастоящем (Neuman 1994).
Разследванията позволяват на изследователя да открие връзките между
популация и резултатите обикновено са по-общи от
други методи (Sonquist and Dunkelberg 1977, Gable 1994). The
проучванията позволяват на изследователите да се свържат с географска област
по-широко и да достигне до много регистранти (Blalock 1970,
Sonquist и Dunkelberg 1977, Hwang and Lin 1987, Gable 1994,
Neuman 1994). И накрая, проучванията могат да предоставят информацията
които не са достъпни другаде или във формата, необходима за анализ
(Фаулър 1988).
Има обаче някои ограничения при провеждането на разследване. Едно
недостатък е, че изследователят не може да получи много информация
за изследвания обект. Това се дължи на факта, че
разследванията се извършват само в определено време и следователно
има ограничен брой променливи и хора, които изследователят може
да учи (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Друг недостатък е това, което може да бъде извършването на анкета
много скъпи от гледна точка на време и ресурси, особено ако
включва лични интервюта (Fowler 1988).
3.2.2. Метод за изследване на разследването
Методът за разследване включва задълбочено проучване на
конкретна ситуация в реалния й контекст в
определен период от време, без никаква намеса на
изследовател (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Този метод се използва главно за описване на връзките между
променливите, които се изучават в конкретна ситуация
(Galliers 1992). Разследванията могат да включват отделни случаи или
множество, в зависимост от анализираното явление (Franz and Robey 1987,
Айзенхард 1989, Ин 1989).
Методът за изследване на анкетата се нарича „анкета
емпирично изследване, което изучава съвременно явление в рамките на
реалния му контекст, като се използват множество източници, събрани от или
множество субекти като хора, групи или организации “(Ин 1989).
Няма ясно разделение между явлението и неговия контекст д
няма експериментален контрол или манипулация на променливите (Ин
1989, Benbasat et al 1987).
Съществуват разнообразни техники за събиране на данни че могат
да бъдат използвани в метода на проучване, който включва
преки наблюдения, прегледи на архивни записи, въпросници,
преглед на документацията и структурирани интервюта. Като
разнообразна гама от техники за събиране данни, запитванията
позволяват на изследователите да се справят и с двете данни качествено това
количествено в същото време (Bonoma 1985, Eisenhardt 1989, Yin
1989, Gable 1994). Както е в случая с метода на изследване, a
разследващият изследовател действа като наблюдател или изследовател, а не
като активен участник в изследваната организация.
Benbasat et al. (1987) твърдят, че методът на изследване е
особено подходящ за изграждане на теория на изследванията, която
започва с изследователски въпрос и продължава с обучение
на теория по време на процеса на събиране данни. Битие
подходящ и за сцената
на строителната теория, Franz and Robey (1987) предполагат това
методът на разследване също може да се използва за комплекса
теория етап. В случая, въз основа на събраните доказателства, един
дадена теория или хипотеза се проверява или опровергава. Освен това разследването е
подходящ и за изследвания, занимаващи се с въпроси „като“ или
„защо“ (Ин 1989).
В сравнение с други методи, запитванията позволяват на изследователя да
улавяне на по-подробна важна информация (
1992, Shanks et al. 1993). Освен това разследванията позволяват
изследовател, за да разбере същността и сложността на изследваните процеси
(Benbasat et al 1987).
Има четири основни недостатъка, свързани с метода
разследване. Първият е липсата на контролирани отчисления. Там
Субективността на изследователя може да изкриви резултатите и заключенията
от изследването (Ин 1989). Вторият недостатък е липсата на
контролирано наблюдение. За разлика от експерименталните методи,
изследователят не може да контролира изучаваните явления
тъй като те се изследват в техния естествен контекст (Gable 1994). The
трети недостатък е липсата на възпроизводимост. Това се дължи на факта
че изследователят е малко вероятно да наблюдава същите събития, напр
не може да провери резултатите от конкретно проучване (Lee 1989).
И накрая, като последица от невъзпроизводимостта е трудно
обобщават резултатите, получени от едно или повече разследвания (
1992, Shanks et al. 1993). Всички тези проблеми обаче се провалят
са непреодолими и всъщност могат да бъдат сведени до минимум
изследовател, прилагащ подходящи действия (Lee 1989).
3.3. Обосновете методологията на изследването
приета
От двата възможни метода на изследване за това изследване,
проучването се счита за най-подходящо. Тази анкета е
беше изхвърлен след внимателно обмисляне на роднината
достойнства и слабости. Удобството или неуместността на всеки
метод за това изследване е разгледан по-долу.
3.3.1. Неподходящ метод за изследване
на запитване
Методът за разследване изисква задълбочено проучване за един
конкретна ситуация в рамките на една или повече организации за a
период от време (Айзенхард 1989). В този случай периодът може
надвишава времевата рамка, дадена за това проучване. Друг
причина за неприемането на метода на разследване е, че резултатите
те могат да страдат от липса на строгост (Ин 1989). Субективност
на изследователя може да повлияе на резултатите и заключенията. Друг
причината е, че този метод е по-подходящ за изследване на въпроси
от типа „как“ или „защо“ (Ин 1989), докато изследователският въпрос
за това изследване е от типа „какво“. Не на последно място
Важното е, че е трудно да се обобщят резултатите само от едно o
малко разследвания (Galliers 1992, Shanks et al. 1993). В основата на
това основание методът за изследване на разследването не е такъв
е избран като неподходящ за това проучване.
3.3.2. Удобство на метода на изследване
разследване
Когато това изследване беше проведено, практиката на съхранение на данни
не беше широко приет от
Австралийски организации. Така че, нямаше много информация
относно тяхното изпълнение в рамките на
Австралийски организации. Наличната информация дойде
от организации, които са внедрили или използвали данни
склад. В този случай методът на анкетно изследване е най-много
подходящ, тъй като позволява да се получи информация, която не е
достъпни другаде или във формата, необходима за анализ (Fowler 1988).
В допълнение, методът за изследване на проучването позволява на изследователя да
да получите добра представа за практиките, ситуациите или ситуациите
наблюдавано в даден момент (Galliers 1992, Denscombe 1998).
Беше поискан преглед за увеличаване на
знания за австралийския опит в съхранението на данни.
Отново, Sonquist и Dunkelberg (1977) заявяват, че резултатите от
анкетните изследвания са по-общи от другите методи.
3.4. Проучване проучване дизайн
Разследването на практиката за съхранение на данни е проведено през 1999 г.

Целевата популация се състои от организации
Австралийци, които се интересуват от проучвания за съхранение на данни
вероятно вече информиран за i данни че те съхраняват и,
следователно тя може да предостави полезна информация за това проучване. Там
целевата популация беше идентифицирана с първоначално проучване на
всички австралийски членове на „Институтът за съхранение на данни“ (Tdwiaap).
Този раздел обсъжда дизайна на изследователската фаза
емпиричен анализ на това проучване.
3.4.1. Техника на събиране на данни
От трите техники, често използвани в проучванията на проучванията
(т.е. въпросник по пощата, телефонно интервю и интервю
лично) (Nachmias 1976, Fowler 1988, de Vaus 1991), per
това проучване беше прието на въпросника по пощата. Първият
причината за приемането на последното е, че може да постигне a
географски разпръснато население (Blalock 1970, Nachmias e
Nachmias 1976, Hwang and Lin 1987, de Vaus 1991, Gable 1994).
Второ, пощенският въпросник е подходящ за участници
високообразован (Fowler 1988). Въпросникът по пощата за това
проучването е адресирано до спонсори на проекти за складиране на данни,
директори и / или ръководители на проекти. Трето, въпросниците за
пощата са подходящи, когато имате безопасен списък с
адреси (Salant and Dilman 1994). TDWI, в този случай, a
довереното сдружение за съхранение на данни предостави пощенския списък
на нейните австралийски членове. Друго предимство на въпросника
по пощата по отношение на телефонния въпросник или интервюта
лично е, че позволява на регистрантите да реагират повече
точност, особено когато регистрантите трябва да се консултират
записва или обсъжда въпроси с други хора (Фаулър
1988).
Потенциален недостатък може да бъде времето, необходимо за
провеждане на въпросници по пощата. Обикновено, въпросник на
пощата се провежда в тази последователност: изпращайте писма, изчаквайте ги
отговори и изпратете потвърждение (Fowler 1988, Bainbridge 1989).
Следователно общото време може да е по-дълго от времето, необходимо за
лични интервюта или телефонни интервюта. както и да е
общото време може да се знае предварително (Фаулър 1988,
Denscombe 1998). Времето, прекарано в провеждането на интервютата
лично не може да се знае предварително, тъй като варира от
интервю с другия (Фаулър 1988). Телефонни интервюта
може да бъде по-бързо от изпращането на въпросници и
но личните интервюта могат да имат висок процент неуспехи
реакция поради недостъпността на някои хора (Fowler 1988).
Освен това телефонните интервюта обикновено се ограничават до списъци с
относително кратки въпроси (Bainbridge 1989).
Друга слабост на въпросника по пощата е високата степен на
липса на отговор (Fowler 1988, Bainbridge 1989, Neuman
1994). Въпреки това бяха предприети контрамерки чрез асоцииране
това проучване с доверена институция в областта на данните
складиране (т.е. TDWI) (Bainbridge 1989, Neuman 1994),
който изпраща две напомнящи писма до тези, които не са отговорили
(Fowler 1988, Neuman 1994) и също така включва писмо
което обяснява целта на изследването (Neuman 1994).
3.4.2. Единица за анализ
Целта на това проучване е да получи информация за
внедряването на съхранение на данни и неговото използване
в рамките на австралийски организации. Целевата популация
се състои от всички австралийски организации, които имат
внедрени или се изпълняват, т.е. склад за данни. В
след това отделните организации се регистрират. Въпросникът
изпратено е до организации, заинтересовани от осиновяване
di склад за данни. Този метод гарантира, че информацията
колекциите идват от най-подходящите ресурси на всяка организация
участник.
3.4.3. Проба от анкетата
Пощенският списък на респондентите от проучването е получен от
TDWI. От този списък 3000 австралийски организации
са избрани като основа за вземане на проби. A
допълнително писмо, обясняващо проекта и целта на разследването,
заедно с карта за отговор и предплатен плик за
върнете попълнения въпросник, изпратени на извадката.
От 3000 организации 198 се съгласиха да участват в
проучване. Очакваше се толкова малък брой отговори Дато il
голям брой австралийски организации, които са имали тогава
прегърнали или прегърнали стратегията за среща
складиране в рамките на техните организации. Така че
целевата популация за това проучване се състоеше само от 198
организации.
3.4.4. Съдържание на въпросника
Структурата на въпросника се основава на модела на датата
Складиране на Монаш (обсъдено по-рано в част 2.3). The
съдържанието на въпросника се основава на анализа на
литература, представена в глава 2. Копие от въпросника
могат да бъдат намерени по пощата на участниците в анкетата
в приложение Б. Въпросникът се състои от шест раздела, които
следвайте фазите на третирания модел. Следващите шест параграфа
обобщава накратко съдържанието на всеки раздел.
Раздел А: Основна информация за организацията
Този раздел съдържа въпроси, свързани с профила на
участващи организации. Освен това някои от въпросите са
отнасящи се до състоянието на проекта за съхранение на данни от
участник. Поверителна информация като име
на организацията не са разкрити в анализа на проучването.
Раздел Б: Старт
Въпросите в този раздел са свързани със стартовата дейност на
съхранение на данни. За колко време са задавани въпроси
става въпрос за инициатори на проекти, спонсори, умения и знания
изисквания, целите на развитието на съхранението на данни и
очаквания на крайния потребител.
Раздел В: Дизайн
Този раздел съдържа въпроси, свързани с дейността на
планиране на склад за данни. По-конкретно, въпросите са
посочете обхвата на изпълнение, продължителността на проекта, разходите
на проекта и анализ на разходите / ползите.
Раздел Г: Развитие
В раздела за разработка има въпроси, свързани с дейността на
развитие на склад за данни: колекция от изисквания на потребителя
окончателно, източниците на данни, логическият модел на данни, прототипи,
планиране на капацитет, технически архитектури и избор на
инструменти за съхранение на данни.
Раздел Д: Операция
Въпроси за експлоатация, свързани с операция изд
разширяемост на склад за данни, тъй като еволюира в
следващ етап на развитие. Там качество на данните, стратегиите на
опресняване на данни, детайлността на данни, мащабируемост на данните
склад и проблемите със сигурността на склад за данни те бяха между
видовете зададени въпроси.
Раздел Е: Развитие
Този раздел съдържа въпроси, свързани с използването на датата
склад от крайни потребители. Изследователят се интересуваше
за целта и полезността на склад за данни, преглед и стратегии
процедури за обучение и стратегия за контрол на данните
склад приет.
3.4.5. Степен на отговор
Въпреки че пощенските проучвания са критикувани, че имат
нисък отговор, бяха взети мерки за увеличаване на
норма на възвръщаемост (както беше обсъдено по-рано в част
3.4.1). Терминът "процент на отговор" се отнася до процента на
хората в определена извадка от анкета, която отговаря на
въпросник (Denscombe 1998). Използвано е следното
формула за изчисляване на степента на отговор за това проучване:
Брой хора, които са отговорили
Честота на отговор =
——————————————————————————— X 100
Общ брой изпратени въпросници
3.4.6. Пилотен тест
Преди въпросникът да бъде изпратен на извадката, въпросите са
бяха тествани чрез провеждане на пилотни тестове, както предлага Luck
и Рубин (1987), Джаксън (1988) и де Ваус (1991). Целта на
пилотното тестване е да разкрие всички неудобни, двусмислени и изрази
трудни въпроси за тълкуване, за изясняване на всякакви
дефиниции и използвани термини и за идентифициране на приблизително време
необходими за попълване на въпросника (Warwick and Lininger 1975,
Jackson 1988, Salant and Dilman 1994). Пилотните тестове бяха
извършва се чрез подбор на предмети със сходни характеристики с тези
от крайните теми, както е предложено от Davis e Козенца (1993). в
това проучване бяха шестима специалисти по складиране на данни
избрани за пилотни теми. След всеки пилотен тест те са
са направени необходимите корекции. От проведените пилотни тестове, т.е.
Участниците помогнаха да се преработи и нулира
окончателна версия на въпросника.
3.4.7. Методи за анализ Di Давам
I данни на анкетата, събрана от затворени въпросници са
бяха анализирани с помощта на статистически програмен пакет
наречен SPSS. Много от отговорите са анализирани
използвайки описателна статистика. Редица въпросници
те се върнаха непълни. Те бяха лекувани с майор
внимание, за да се уверите, че i данни изчезналите не бяха един
последица от грешки при въвеждане на данни, но защо въпросите не
са били подходящи за декларатор или деклараторът е решил, че не
отговорете на един или повече конкретни въпроси. Тези отговори
по време на анализа на данни и са били
кодирани като „- 9“, за да се установи тяхното изключване от процеса
анализ.
При изготвянето на въпросника затворените въпроси бяха
предварително кодирани чрез задаване на номер на всяка опция. Броя
след това се използва за приготвяне на данни по време на анализ
(Denscombe 1998, Sapsford and Jupp 1996). Например имаше
шест опции, изброени във въпрос 1 от раздел Б: съвет
администрация, старши изпълнителен директор, ИТ отдел, звено
на бизнеса, консултанти и др. Във файла на данни на SPSS, е
генерирана е променлива, която указва „инициатора на проекта“,
с шест етикета за стойност: „1“ за „борда на директорите“, „2“
за „изпълнителен директор на високо ниво“ и т.н. Използването на скалата на Likertin
в някои от затворените въпроси също се допуска
идентификация, която не изисква усилия, като се използват стойностите
съответните числа, въведени в SPSS. За въпроси с
неизчерпателни отговори, които не са взаимно изключващи се,
всяка опция беше третирана като единична променлива с две
етикети на стойност: '1' за 'маркиран' и '2' за 'немаркиран'.
Отворените въпроси бяха третирани по различен начин от въпросите
затворен. Отговорите на тези въпроси не бяха публикувани в
SPSS. Напротив, те бяха анализирани на ръка. Използването на това
тип въпроси ви позволява да получите информация за идеите
свободно изразен и личен опит на регистрантите
(Bainbridge 1989, Denscombe 1998). Когато е възможно, това е направено
категоризация на отговорите.
За анализ на данни, се използват методи за прост статистически анализ,
като честотата на отговорите, средната стойност, отклонението на квадрат
средна и средна стойност (Argyrous 1996, Denscombe 1998).
Гама тестът се провежда, за да се получат количествени измервания
асоциации между данни ординали (Norusis 1983, Argyrous 1996).
Тези тестове бяха подходящи, тъй като използваните редови везни не бяха
те имаха много категории и можеха да бъдат показани в таблица
(Norusis 1983).
3.5 Резюме
В тази глава методологията на изследването и
проекти, приети за това проучване.
Избор на най-подходящия метод за търсене за a
поема конкретно проучване
обмислете редица правила, включително естеството и вида
изследвания, както и достойнствата и слабостите на всяко възможно
метод (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987,
ин 1989, Хамилтън и Айвс 1992, Галиерс 1992, Неуман 1994). Изглед
липсата на съществуващи знания и теория за това
на приемането на хранилища за данни в Австралия, това проучване от
изследването изисква интерпретационен метод на изследване с умение
проучвателна за изследване на опита на организациите
Австралийски. Избраният метод за търсене е избран за
събира информация относно приемането на концепцията за датата
складови помещения от австралийски организации. A
Като техника за събиране е избран пощенски въпросник данни, Le
обосновки за метода на изследване и техниката на събиране данни
избраните ще бъдат предоставени в тази глава. Също така беше
беше представена дискусия за аналитичната единица, пробата
използваните проценти на отговори, съдържанието на въпросника,
предварително тестване на въпросника и метода за анализ данни.

Проектиране на a Склад за данни:
Комбиниране на взаимоотношения между субекти и моделиране на измерения
Резюме
Съхранявайте i данни това е основен проблем в момента за мнозина
организации. Ключов проблем за развитието
на съхранението на данни това е неговият дизайн.
Дизайнът трябва да поддържа откриването на понятия в данните
склад наследена система и други източници на данни а също и един
лесно разбиране и ефективност при внедряване на данни
склад.
Голяма част от литературата за съхранение данни препоръчва се
използването на моделиране на взаимоотношения на обекти или моделиране на измерения за
представляват чертежа на склад за данни.
В този вестник показваме как и двете
представянията могат да се комбинират в подход за
рисунка на склад за данни. Използваният подход е систематичен
изследван в казус и е идентифициран в редица
важни последици от професионалистите.
СЪХРАНЕНИЕ НА ДАННИ
Un склад за данни обикновено се определя като "ориентиран към субекта,
интегрирано, вариативно във времето и нестабилно събиране на данни в подкрепа
на решенията на ръководството "(Inmon и Hackathorn, 1994).
Тематично ориентираният и интегриран показва, че склад за данни è
предназначени да преминат функционалните граници на системата legaci per
предлагат интегрирана перспектива на данни.
Вариантът на времето засяга историческия или времевия ред на данни in
un склад за данни, което позволява да се анализират тенденциите.
Нелетливи показва, че склад за данни не е непрекъснато
актуализиран като a база данни на OLTP. По-скоро е актуална
периодично, с данни от вътрешни и външни източници. The
склад за данни той е специално създаден за изследвания
вместо за целостта на актуализациите и производителността на
операции.
Идеята за съхранение на i данни не е ново, това беше една от целите
управление на данни от 1982-те години (Il Martin, XNUMX).
I склад за данни те предлагат инфраструктурата данни за управление
поддържащи системи. Системите за управленска подкрепа включват решение
поддържащи системи (DSS) и изпълнителни информационни системи (EIS).
DSS е компютърна информационна система, която е
предназначени да подобрят процеса и съответно сцеплението на
човешко решение. EIS обикновено е система за доставка на
данни което позволява на бизнес мениджърите да имат лесен достъп до изгледа
от данни.
Общата архитектура на a склад за данни подчертава ролята на
склад за данни в подкрепа на управлението. В допълнение към предлагането
инфраструктурата данни за EIS и DSS, ал склад за данни е възможно
достъп до него директно чрез заявки. НА данни включени в дата
склад се основават на анализ на информационните изисквания на
управление и са получени от три източника: вътрешни наследени системи,
системи за събиране на данни със специално предназначение и външни източници на данни. НА
данни във вътрешните наследени системи те често са излишни,
непоследователни, ниско качество и се съхраняват в различни формати
така че те трябва да бъдат примирени и почистени, преди да могат да бъдат заредени в
склад за данни (Inmon, 1992; McFadden, 1996). НА данни от
от системи за съхранение данни ad hoc и от източници данни
външните се изразходват, използвани за увеличаване (актуализиране, замяна) i
данни от наследени системи.
Има много убедителни причини да се развие a склад за данни,
които включват по-добро вземане на решения чрез използване
действителна повече информация (Ives 1995), поддръжка за фокус
за цялостния бизнес (Graham 1996) и намаляването на разходите за
предоставяне на данни за EIS и DSS (Graham 1996, McFadden
1996).
Неотдавнашно емпирично проучване установи средно възвръщаемост на
инвестиции за i склад за данни 401% след три години (Греъм,
1996). Останалите емпирични изследвания на склад за данни имам
установи значителни проблеми, включително затруднения при измерването и
присвояване на обезщетения, липса на ясна цел, подценяване
цел и сложност на процеса на съхранение i даннив
особено по отношение на източниците и чистотата на данни.
Съхранявайте i данни може да се разглежда като решение
към проблема с управлението данни между организациите. Там
манипулация на данни като социален ресурс той остава един от тях
ключови въпроси при управлението на информационните системи около
свят в продължение на много години (Brancheau et al. 1996, Galliers et al. 1994,
Niederman et al. 1990, Перван 1993).
Популярен подход за управление данни през осемдесетте беше
разработването на модел данни социална. Модел данни социален беше
проектиран да предложи стабилна основа за разработването на нови системи
приложения и база данни и наследствена реконструкция и интеграция
системи (Brancheau et al.
1989, Goodhue et al. 1988: 1992, Ким и Еверест 1994).
Има обаче много проблеми с този подход, в
по-специално сложността и цената на всяка задача, както и дългото време
необходими за осезаеми резултати (Beynon-Davies 1994, Earl
1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997).
Il склад за данни това е отделна база данни, която съществува съвместно с наследство
бази данни, вместо да ги замества. Следователно ви позволява да
ръководи управлението на данни и избягвайте скъпо възстановяване
на наследени системи.
СЪЩЕСТВУВАЩИ ПОДХОДИ ЗА ЧЕРТЕЖ НА ДАТАТА
СКЛАД
Процесът на изграждане и усъвършенстване a склад за данни
трябва да се разбира по-скоро като еволюционен процес, отколкото като
жизнен цикъл на разработка на традиционни системи (Дезио, 1995, Шанкс,
O'Donnell and Arnott 1997a). Има много процеси, свързани с a
проект на склад за данни като инициализация, планиране;
информация, получена от реквизитите, изискани от управителите на компании;
източници, трансформации, почистване на данни и синхронизиране от наследство
системи и други източници на данни; системи за доставка в процес на разработка;
мониторинг на склад за данни; и глупост на процеса
еволюционно и изграждане на a склад за данни (Шин, О'Донъл
и Arnott 1997b). В това списание се фокусираме върху това как
теглене i данни съхранявани в контекста на тези други процеси.
Предлагат се редица подходи за архитектурата на данните
склад в литературата (Inmon 1994, Ives 1995, Kimball 1994
McFadden 1996). Всяка от тези методологии има кратко
преглед с анализ на техните силни страни и не.
Подходът на Inmon (1994) за Склад за данни
Дизайн
Inmon (1994) предлага четири итеративни стъпки за проектиране на дата
склад (виж фигура 2). Първата стъпка е да се проектира модел
данни социални, за да разберем как аз данни може да се интегрира
във функционални области в рамките на организацията
чрез разделяне на данни съхранявайте в зони. Модел данни то е създадено за
съхранявам данни свързани с вземането на решения, включително данни
исторически и включени данни изведени и обобщени. Втората стъпка е
идентифициране на предметните области за изпълнение. Те са базирани
по приоритети, определени от определена организация. Третият
стъпката включва рисуване a база данни за предметната област, пози
отделя се специално внимание на включването на подходящи нива на детайлност.
Inmon препоръчва да се използва модел на обект и връзка. Четвърто
стъпката е да се идентифицират системи от източници данни изисква се и се развива
процеси на трансформация за придобиване, почистване и форматиране i данни.
Силните страни на подхода на Inmon са в това, че моделът данни социален
осигурява основата за интегриране на данни в рамките на организацията
и планиране на подкрепа за итеративно развитие на датата
склад. Недостатъците му са трудността и цената на рисуване
модел данни социални, трудността при разбирането на моделите на субектите д
взаимоотношения, използвани и в двата модела, това данни социална и тази на данни
съхранявани по предметната област и целесъобразността на данни дел
рисунка на склад за данни за реализацията на база данни
релационни, но не и за база данни многоизмерна.
Подходът на Айвс (1995) към Склад за данни
Дизайн
Айвс (1995) предлага четиристепенен подход за рисуване на
информационна система, която той смята за приложима при проектирането на дата
склад (виж фигура 3). Подходът много се основава на
Информационно инженерство за разработване на информационни системи
(Мартин 1990). Първата стъпка е да се определят целите, факторите
критични и успешни и ключови показатели за изпълнение. НА
ключови бизнес процеси и необходимата информация са
оформен, за да ни доведе до модел данни социална. Втората стъпка
тя включва разработването на определяща архитектура данни
съхранявани по области, база данни di склад за данни, компонентите
на технологиите, които са необходими, наборът от организационна подкрепа
необходими за прилагане и работа с склад за данни. Третият
стъпката включва избора на необходимите софтуерни пакети и инструменти.
Четвъртата стъпка е детайлното проектиране и изграждане на
склад за данни. Айвс отбелязва, че за съхранение данни е обвързан
итеративен процес.
Силата на подхода на Айвс е използването на технически спецификации за
определят изискванията за информация, използването на структуриран такъв
процес в подкрепа на интеграцията на склад за данни,
подходящият избор на хардуер и софтуер и използването на множество
техники за представяне на склад за данни. Неговите недостатъци
те са присъщи на сложността. Други включват трудност в
развиват много нива на база данни all'interno del склад за данни in
разумно време и цена.
Подходът на Kimball (1994) към Склад за данни
Дизайн
Kimball (1994) предлага пет итеративни стъпки за изготвяне на дата
склад (виж фигури 4). Неговият подход е особено
посветен на рисунката на соло склад за данни и относно използването на шаблони
размерни за предпочитане пред модели на обекти и взаимоотношения. Кимбол
анализирайте тези размерни модели, защото е по-лесно за мен да разбера
бизнес мениджърите са по-ефективни при работа
комплексни консултации и дизайн на база данни физически е повече
ефикасен (Kimball 1994). Кимбъл признава, че развитието на a
склад за данни е итеративно и това склад за данни отделена кутия
да бъдат интегрирани чрез разделяне на таблици с измерения
често срещани.
Първата стъпка е да се идентифицира конкретната предметна област, която трябва да бъде
усъвършенствана. Втората и третата стъпка се отнасят до моделирането
измерен. Във втората стъпка измерванията идентифицират нещата от
интерес към предметната област и групирани в таблица с факти.
Например в дадена област на продажбите лихвените мерки
те могат да включват количеството продадени артикули и долара
като валута на продажбите. Третата стъпка включва идентифициране на
измерения, които са начините, по които те могат да бъдат групирани i
факти. В областта на продажбите, съответните измерения
те могат да включват елемент, местоположение и период от време. Там
таблицата на фактите има многокомпонентен ключ за връзка към всеки един
от таблици с размери и обикновено съдържа много голям брой
страхотно всъщност. За разлика от това, дъските с размер съдържат
описателна информация за размерите и други атрибути, които
те могат да се използват за групиране на факти. Фактическата таблица e
измеренията, свързани с предложението, формират това, което се нарича едно
звезден модел поради своята форма. Четвъртата стъпка включва
изграждане a база данни многоизмерен, за да го усъвършенствате
звездна схема. Последната стъпка е да се идентифицират изходните системи данни
необходими и развиват процеси на трансформация за придобиване, почистване
и формат i данни.
Силните страни на подхода на Kimball включват използването на модели
размерна, за да представлява i данни съхранявани, които го правят
лесен за разбиране и води до ефективен физически дизайн. A
размерния модел, който лесно използва и двете
системи на база данни релационните системи могат да бъдат усъвършенствани или системи
база данни многоизмерна. Недостатъците му включват липса
някои техники за улесняване на планирането или интегрирането на
много звездни модели в рамките на един склад за данни и
трудност при проектиране от екстремно денормализираната структура в a
размерния модел a данни в наследствена система.
Подходът на McFadden (1996) към данните
Складски дизайн
McFadden (1996) предлага подход от пет стъпки
Нарисувай склад за данни (вижте фигура 5).
Неговият подход се основава на синтез на идеи от литературата
и е фокусиран върху рисуването на соло склад за данни. Първият
стъпка включва анализ на изискванията. Дори ако спецификата
техники не са предписани, бележките на McFadden идентифицират
субект данни спецификации и техните атрибути и се отнася до читателите на Уотсън
и Frolick (1993) за придобиване на изискванията.
Във втората стъпка се изчертава модел на обект на връзка
склад за данни и след това валидирани от бизнес мениджъри. Третият
стъпката включва определяне на картографирането от старата система
и външни източници на склад за данни. Четвъртата стъпка включва
процеси в разработването, разпространението и синхронизирането на данни в
склад за данни. В последната стъпка доставката на системата е
разработен с особен акцент върху потребителския интерфейс.
Макфадън посочва, че процесът на рисуване обикновено е
итеративно.
Силните страни на подхода на Макфадън разчитат на участие
от бизнес мениджърите при определяне на изискванията, а също
значението на ресурсите данни, тяхното почистване и събиране. Тя
недостатъците са свързани с липсата на процес за разделяне a
страхотен проект на склад за данни в много интегрирани етапи и
трудности при разбирането на модела на обекта и взаимоотношенията, използвани при проектирането на
склад за данни.

    0/5 (0 мнения)
    0/5 (0 мнения)
    0/5 (0 мнения)

    Научете повече от Online Web Agency

    Абонирайте се, за да получавате най-новите статии по имейл.

    аватар на автора
    администратор Изпълнителен Директор
    👍Онлайн уеб агенция | Уеб агенция експерт по дигитален маркетинг и SEO. Web Agency Online е уеб агенция. За Agenzia Web Online успехът в дигиталната трансформация се основава на основите на Iron SEO версия 3. Специалности: системна интеграция, интеграция на корпоративни приложения, ориентирана към услуги архитектура, облачни изчисления, хранилище на данни, бизнес разузнаване, големи данни, портали, интранет, уеб приложение Проектиране и управление на релационни и многомерни бази данни Проектиране на интерфейси за цифрови медии: използваемост и графики. Онлайн Уеб агенцията предлага на компаниите следните услуги: -SEO в Google, Amazon, Bing, Yandex; -Уеб анализи: Google Analytics, Google Tag Manager, Yandex Metrica; -Потребителски реализации: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM в Google, Bing, Amazon Ads; -Маркетинг в социалните медии (Facebook, Linkedin, Youtube, Instagram).
    Моята Agile поверителност
    Този сайт използва технически и профилиращи бисквитки. Като щракнете върху приемам, вие разрешавате всички бисквитки за профилиране. Чрез щракване върху отхвърляне или X, всички бисквитки за профилиране се отхвърлят. Чрез щракване върху персонализиране е възможно да изберете кои профилиращи бисквитки да активирате.
    Този сайт е в съответствие със Закона за защита на данните (LPD), Федералния закон на Швейцария от 25 септември 2020 г. и GDPR, Регламент на ЕС 2016/679, свързан със защитата на личните данни, както и със свободното движение на такива данни.