https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

Складирање податоци и ERP | ЦЕНТРАЛНА АРХИВА НА ПОДАТОЦИ: ИСТОРИЈА И ЕВОЛУЦИЈА

АРХИВА ПОДАТОЦИ ЦЕНТРАЛНО: ИСТОРИЈА И ЕВОЛУЦИЈА

Двете доминантни теми на корпоративната технологија во 90-тите се
наведува јас складиште на податоци и ERP. Долго време овие двајца моќни
струите биле дел од корпоративната ИТ без воопшто да има
раскрсници. Речиси како да беа материја и анти-материја. Но
растот на двете појави неминовно доведе до едно
нивното вкрстување. Денес компаниите се соочуваат со проблемот на
што да правиме со ERP д складиште на податоци. Оваа статија ќе илустрира
кои се проблемите и како се решаваат од компаниите .
НА ПОЧЕТОК…
На почетокот постоеше складиште на податоци. Складиште на податоци е роден за
спротивстави на системот за апликација за обработка на трансакции.
Во раните денови меморирање на податоци требаше да биде
само контрапункт на апликациите за обработка на е-пошта
трансакции. Но, во денешно време има многу пософистицирани визии
за тоа што може да направи складиште на податоци. Во денешниот свет,
складиште на податоци се вметнува во структура која може да биде
наречена фабрика за корпоративни информации.
ФАБРИКАТА ЗА КОРПОРАТИВНИ ИНФОРМАЦИИ
(CIF)
Фабриката за корпоративни информации има архитектонски компоненти
стандард: ниво на трансформација и интеграција на кодот
кој ги интегрира i податоци додека јас податоци тие се движат од околината на
примена во околината складиште на податоци на компанијата; а
складиште на податоци на компанијата каде што на податоци
детални и интегрирани историчари. На складиште на податоци на компанијата служи како
темел на кој може да се изградат сите други делови
на животната средина на складиште на податоци; оперативна продавница за податоци (ODS).
ODS е хибридна структура која содржи некој аспект од податоците
магацин и други аспекти на OLTP околина; data marts, каде што i
различни оддели можат да имаат своја верзија на податоците
магацин; а складиште на податоци на истражување во кое и
компаниските „филозофи“ (мислители) можат да ги достават своите прашања за
72 часа без штетно дејство врз складиште на податоци; и меморија
блиска линија, во која податоци стари и податоци рефус детали може да биде
складирани евтино.
КАДЕ СЕ КОМБИНИРА ERP СО
ФАБРИКА ЗА КОРПОРАТИВНИ ИНФОРМАЦИИ
ERP се спојува со фабриката за корпоративни информации на две места.
Првенствено како основна апликација која обезбедува i
податоци на апликацијата до складиште на податоци. Во овој случај јас податоци,
генерирани како нуспроизвод на трансакциски процес,
се интегрирани и вчитани во складиште на податоци на компанијата. На
втора точка на спојување помеѓу ERP и CIF и ODS. Всушност, многу
средини ERP се користи како класичен ODS.
Во случај ERP да се користи како основна апликација, тоа
истиот ERP може да се користи и во CIF како ODS. Во
сепак, ако ERP треба да се користи во двете улоги, таму
мора да постои јасна дистинкција помеѓу двата ентитета. Со други зборови,
кога ERP ја игра улогата на основна апликација и ODS, le
мора да се разликуваат два архитектонски ентитети. Ако сингл
спроведувањето на ERP се обидува да ги исполни двете улоги
во исто време неизбежно ќе има проблеми во
дизајн и имплементација на оваа структура.
ПОСЕБНИ КОРИСНИЦИ И ОСНОВНИ АПЛИКАЦИИ
Постојат многу причини што доведуваат до разделување на компонентите
архитектонски. Можеби најелоквентното прашање за раздвојување на
различни компоненти на архитектурата е дека секоја компонента
на архитектурата има свој поглед. Основната апликација служи
за поинаква намена од онаа на ОДС. Обидете се да се преклопите
основен приказ на апликација за светот на ODS или обратно
тоа не е правилен начин на работа.
Следствено, првиот проблем на ERP во CIF е тој на
проверете дали има разлика помеѓу основните апликации и
ОДС.
МОДЕЛИ НА ПОДАТОЦИ ВО КОРПОРАТИВНАТА
ФАБРИКА ЗА ИНФОРМАЦИИ
Да се постигне кохезија помеѓу различните компоненти
на архитектурата на CIF, мора да постои модел на податоци. На
модели на податоци тие служат како врска помеѓу различните компоненти
архитектура како што се основните апликации и ODS. НА
модели на податоци станете „интелектуална патна карта“ за да го имате
правилно значење од различните архитектонски компоненти на CIF.
Одејќи рака под рака со овој поим, идејата е дека треба да има
бидете одличен и уникатен модел на податоци. Секако дека мора
биде модел на податоци за секоја од компонентите и понатаму таму
тоа мора да биде разумна патека што ги поврзува различните модели.
Секоја компонента на архитектурата - ODS, основни апликации,
складиште на податоци на компанијата, и така натаму .. – треба свој
модел на податоци. И затоа мора да има прецизна дефиниција за
како овие модели на податоци тие се поврзуваат едни со други.
ПОМЕСТИ I ПОДАТОЦИ НА ЕРП ВО ПОДАТОЦИТЕ
СКУШЕН
Доколку потеклото на податоци е основна апликација и/или ODS, кога
ERP вметнува i податоци во складиште на податоци, овој запис мора
се одвиваат на најниско ниво на грануларност. Повторете или
едноставно агрегираат i податоци како што излегуваат
од основната апликација ERP или ERP ODS не е таму
правилна работа. НА податоци потребни се детали во податоците
магацин за да ја формираат основата на процесот DSS. Таков податоци
тие ќе бидат преобликувани на многу начини со помош на податоци и истражување
del складиште на податоци.
Преместувањето на податоци од основната околина за апликација
на ERP на животната средина на складиште на податоци на друштвото се врши во а
разумно опуштен начин. Таа промена се случува после тоа
околу 24 часа од ажурирањето или креирањето во ERP. Фактот на
имаат „мрзливо“ движење на податоци во складиште на податоци
на компанијата дозволува на податоци кои доаѓаат од ERP да се "решат".
Откако јас податоци се депонирани во основната апликација,
тогаш можете безбедно да се движите i податоци на ERP
во претпријатието. Друга цел што може да се постигне благодарение на движењето
„мрзливи“ богови податоци е јасното разграничување помеѓу оперативните процеси и
DS екстензија. Со „брзо“ движење на податоци демаркационата линија
помеѓу ДСС и оперативните останува нејасно.
Движењето на податоци од ODS на ERP до складиште на податоци
на компанијата се врши периодично, обично
неделно или месечно. Во овој случај движењето на
податоци се заснова на потребата да се „исчистат“ старите податоци историчари.
Секако, ODS содржи i податоци кои се многу понови
почит кон податоци историчарите пронајдени во складиште на податоци.
Преместувањето на податоци во складиште на податоци тоа речиси никогаш не е направено
„големопродажба“ (на веледрогерски начин). Копирај табела
од ERP околината до складиште на податоци нема смисла. Еден пристап
многу пореално е движењето на избраните единици на податоци.
Само на податоци кои се променети од последното ажурирање на податоците
магацин се тие што треба да се префрлат во податоците
магацин. Еден начин да се знае кои од нив податоци тие се изменети
бидејќи последното ажурирање е да се погледнат временските печати на податоци
пронајдени во ERP околината. Дизајнерот ги избира сите промени
кои се појавија од последното ажурирање. Друг пристап
е да се користат техники за снимање на промени податоци. со
овие техники ги анализираат дневниците и лентите од списанието со цел да
одреди кои податоци мора да се премести од околината ERP во
Тоа на складиште на податоци. Овие техники се најдобри во
како логовите и лентите од списанието може да се читаат од ERP-датотеките
без понатамошен ефект врз другите ERP ресурси.
ДРУГИ КОМПЛИКАЦИИ
Еден од проблемите со ERP во CIF е што се случува со другите
извори на апликација или ai податоци на ОДС за кои треба да придонесат
складиште на податоци но тие не се дел од ERP околината. Датум на
затворена природа на ERP, особено SAP, обидот да се интегрираат
клучеви од надворешни извори на податоци кон јас податоци кои доаѓаат од ERP ал
време за движење i податоци во складиште на податоци, тоа е голем предизвик.
А кои точно се веројатностите дека и податоци на апликации или
ODS надвор од околината ERP ќе биде интегрирана во податоците
магацин? Шансите се всушност многу високи.
НАЈДЕТЕ ПОДАТОЦИ ИСТОРИСКИ ОД ERP
Друг проблем со и податоци на ERP е резултатот
од потребата да се има податоци историчарите во рамките на складиште на податоци.
Обично на складиште на податоци потреби податоци историчари. И
ERP технологијата обично не ги складира овие податоци
историски, барем не до степен до кој тоа е неопходно во датумот
магацин. Кога голема количина на податоци историчарите започнуваат ад
за да се додаде во ERP околината, таа околина мора да биде
исчистено. На пример, да претпоставиме а складиште на податоци деба
биде натоварен со пет години од податоци историски додека ERP држи до
најмногу шест месеци од овие податоци. Се додека компанијата е задоволна со
соберете серија од податоци историјата како минува времето,
тогаш нема проблем со користење на ERP како извор за
складиште на податоци. Но, кога на складиште на податоци мора да одам
назад во времето и земете богови податоци историчари кои не биле
претходно собрани и зачувани од ERP, потоа ERP околината
станува неефикасен.
ERP И МЕТА ПОДАТОЦИ
Друго размислување за ERP e складиште на податоци Дали е тоа
на постоечките метаподатоци во ERP околината. Како и метаподатоци
тие се движат од ERP околината во дел складиште на податоци, i
метаподатоците мора да се преместуваат на ист начин. Понатаму, и
метаподатоците мора да се трансформираат во формат и структура
бара од инфраструктурата на складиште на податоци. Има еден голем
разлика помеѓу оперативните метаподатоци и метаподатоци DSS. Метаподатоците
оперативни се главно за инвеститорот и за
програмер. Метаподатоците на DSS се првенствено за вас
финалето. Постојни метаподатоци во ERP апликации или ODS
тие треба да се претворат и оваа конверзија не е секогаш лесна
и директно.
ИЗВОРИ НА ПОДАТОЦИТЕ ERP
Доколку ERP се користи како добавувач на податоци за складиште на податоци ci
мора да биде солиден интерфејс што се движи i податоци од околината
ERP на животната средина складиште на податоци. Интерфејсот мора:
▪ да биде лесен за употреба
▪ дозволи пристап до податоци на ERP
▪ подигнете го значењето на податоци кои се пред преместување
во складиште на податоци
▪ да ги знае ограничувањата на ERP што може да се појават
моментот кога е направен пристап податоци на ERP:
▪ референцијален интегритет
▪ хиерархиски односи
▪ имплицитни логички врски
▪ конвенција за апликација
▪ сите структури на податоци поддржан од ERP, и така натаму…
▪ бидете ефикасни во пристапот податоци, со обезбедување:
▪ директно движење на податоци
▪ стекнување промена податоци
▪ поддржува навремен пристап до податоци
▪ разбирање на форматот на податоци, и така натаму…
ИНТЕРФЕЈС СО SAP
Интерфејсот може да биде од два вида, домашен или комерцијален.
Некои од главните комерцијални интерфејси вклучуваат:
▪ САС
▪ Prime Solutions
▪ D2k, и така натаму…
ПОВЕЌЕ ЕРП ТЕХНОЛОГИИ
Третирањето на ERP околината како да е единствена технологија е a
голема грешка. Постојат многу ERP технологии, секоја со своја
јаки страни. Најпознати продавачи на пазарот се:
▪ SAP
▪ Oracle Financials
▪ PeopleSoft
Џеј Ди Едвардс
▪ Баанс
САП
SAP е најголемиот и најсеопфатен ERP софтвер. Апликациите
на SAP опфаќа многу видови на апликации во многу области. SAP има
репутацијата да се биде:
▪ многу голем
▪ многу тешко и скапо за спроведување
▪ треба многу луѓе и консултанти да бидат
имплементирани
▪ има потреба од специјализирани лица за реализација
▪ потребно е многу време за спроведување
Исто така SAP има репутација за складирање на своите податоци многу
внимателно, што го отежнува пристапот до нив
лице надвор од областа SAP. Силата на SAP е да се биде
способен за фаќање и складирање на голема количина на податоци.
SAP неодамна ја објави својата намера да го продолжи
неговите апликации за складиште на податоци. Има многу добри и лоши страни
при користење на SAP како снабдувач на складиште на податоци.
Предност е што SAP е веќе инсталиран и што повеќето од
консултантите веќе го знаат SAP.
Недостатоците да се има SAP како добавувач на складиште на податоци се
многу: SAP нема искуство во светот на складиште на податоци
Доколку SAP е снабдувач на складиште на податоци, потребно е да се „извади“
i податоци од SAP до складиште на податоци. Дато евиденција на SAP на
затворен систем, тешко дека ќе биде лесно да се внесе од SAP
тоа (???). Постојат многу наследени средини кои го напојуваат SAP,
како што се IMS, VSAM, ADABAS, ORACLE, DB2 и така натаму.
SAP инсистира на пристап „не измислен овде“. SAP не сака
соработувајте со други продавачи за да го користите или креирате складиште на податоци.
SAP инсистира на генерирање на целиот свој софтвер самиот.
Иако SAP е голема и моќна компанија, фактот на
обид да се преработи технологијата на ELT, OLAP, администрација на
системот, па дури и базата на кодови на dbms тоа е само лудост.
Наместо усвојување на кооперативен однос со добавувачите
di складиште на податоци долгогодишен, SAP го следи пристапот кој
тие „знаат најдобро“. Овој став го кочи успехот што
SAP може да има во областа на складиште на податоци.
Одбивањето на SAP да дозволи пристап до надворешните продавачи
брзо и благодатно до нив податоци. Самата суштина на користењето
un складиште на податоци е лесен пристап до податоци. Целата приказна за SAP е
врз основа на тоа што го отежнува пристапот податоци.
Недостатокот на искуство на SAP во справувањето со големи количини на податоци;
во полето на складиште на податоци постојат томови на податоци никогаш не видено оттогаш
SAP и за управување со овие големи количини на податоци мора да имате еден
соодветна технологија. SAP очигледно не е свесен за ова
технолошка бариера која постои за да влезе во полето на податоци
магацин.
Корпоративната култура на SAP: SAP создаде бизнис
во добивањето на i податоци од системот. Но, за да го направите ова мора да имате
различен начин на размислување. Традиционално, софтверските компании кои беа
не биле добри во внесување податоци во околина
добивање на податоци за да оди на друг начин. Ако SAP може да го направи овој вид
switch ќе биде првата компанија што ќе го стори тоа.
Накратко, прашање е дали една компанија треба да избере
SAP како добавувач на складиште на податоци. Постојат многу сериозни ризици
од една страна и многу малку награди од друга. Но, постои уште една
причина што го обесхрабрува изборот на SAP како снабдувач на податоци
магацин. Затоа што секоја компанија треба да има ист датум
магацин на сите други фирми? На складиште на податоци тоа е срцето
на конкурентската предност. Ако секоја компанија го усвои истото
складиште на податоци би било тешко, но не и невозможно,
постигне конкурентска предност. Се чини дека SAP мисли дека а
складиште на податоци може да се види како бисквит и тоа е а
уште еден знак за нивното „добијте ги податоците
во ".
Ниту еден друг ERP продавач не е толку доминантен како SAP.
Несомнено ќе има компании кои ќе одат по патот на SAP
за нивните складиште на податоци но веројатно овие датуми
Магацините на SAP ќе бидат големи, скапи и бараат многу
време за нивно создавање.
Овие средини вклучуваат такви активности како што се обработка на банкарски шалтери,
процеси за резервации на авиокомпании, процеси за жалби
осигурување, и така натаму. Трансакцискиот систем беше поефикасен,
поочигледна беше потребата за поделба меѓу оперативните и процесните
DSS (Систем за поддршка на одлуки). Меѓутоа, со системите за ресурси
човечки и лични, никогаш не се соочуваме со големи количини на
трансакции. И, се разбира, кога ќе се вработи човек
или ја напушти компанијата ова е евиденција на трансакција.
Но, во однос на другите системи, системи за човечки ресурси и
Личните луѓе едноставно немаат многу трансакции. Затоа, во
човечки ресурси и кадровски системи не е сосема очигледно дека постои
потребен е DataWarehouse. На многу начини овие системи
претставуваат обединување на DSS системите.
Но, постои уште еден фактор што мора да се земе предвид ако треба
направи со datawarehouse и со PeopleSoft. Во многу кругови, т.е податоци
Човечките ресурси и личните ресурси се споредни за бизнисот
раководител на компанијата. Повеќето компании настапуваат
производство, продажба, давање услуги и така натаму. НА
Системите за човечки ресурси и персонал обично се секундарни (или на
поддршка) на главната деловна линија на компанијата. Затоа, тоа е
двосмислено и незгодно а складиште на податоци одделно за
поддршка на човечките и личните ресурси.
PeopleSoft е многу различен од SAP во овој поглед. Со SAP, тоа е
задолжително да постои а складиште на податоци. Со PeopleSoft, тоа не е
тогаш толку јасно. Магацинот за податоци е опционален со PeopleSoft.
Најдоброто нешто што може да се каже за податоци PeopleSoft е дека податоците
магацин може да се користи за складирање i податоци во врска со
стари човечки и лични ресурси. Втора причина за
кои една компанија би сакала да ги користи а складиште на податоци a
недостаток на околината PeopleSoft е да дозволи пристап и
слободен пристап до алатките за анализа, ај податоци од PeopleSoft. Но
покрај овие причини, може да има случаи каде што е подобро да не се
имаат складиште за податоци за податоци PeopleSoft.
Во краток преглед
Постојат многу идеи за изградба на податоци
магацин во рамките на ERP софтвер.
Некои од нив се:
▪ Има смисла да се има а складиште на податоци кој личи на кој било
друго во индустријата?
▪ Колку е флексибилен ERP складиште на податоци софтвер?
▪ ERP складиште на податоци софтверот може да се справи со обем од
податоци кој се наоѓа во аскладиште на податоци арена“?
▪ Што е евидентирање на траги што го прави продавачот на ERP
соочени со лесен и евтин, одзема време, тој податоци? (што
е ERP продавачите евиденција за испорака на ефтин, на
време, лесен за пристап до податоци?)
▪ Какво е разбирањето на DSS архитектурата и на
„Фабрика за корпоративни информации“ од продавачот на ERP?
▪ Продавачите на ERP разбираат како да добијат податоци внатре во
на животната средина, но, исто така, се разбере како да ги извезуваат?
▪ Колку е отворен продавачот на ERP за алатките за податоци
складирање?
Сите овие размислувања мора да се направат при определувањето
каде да се стави складиште на податоци кој ќе биде домаќин на и податоци на ERP и други
податоци. Во принцип, освен ако не постои убедлива причина за тоа
да се направи поинаку, се препорачува да се изгради складиште на податоци од
од околината на продавачот ERP.
ПОГЛАВЈЕ 1
Преглед на организацијата БИ
Клучните точки:
Информациските складишта работат на спротивен начин
за архитектура на деловна интелигенција (БИ):
Корпоративната култура и ИТ може да го ограничат успехот во
градење на организации за БИ.
Технологијата повеќе не е ограничувачки фактор за БИ организациите. На
проблем за архитектите и планерите на проекти не е дали на
технологијата постои, но доколку тие можат ефикасно да ја имплементираат
достапна технологија.
За многу компании А складиште на податоци тоа е малку повеќе од депозит
пасивен кој дистрибуира i податоци на корисниците на кои им е потребно. НА податоци
тие се извлекуваат од изворните системи и се пополнуваат во целни структури
di складиште на податоци. На податоци може да се исчистат и со целина
богатство. Сепак, не се додава дополнителна вредност
собрани од податоци во текот на овој процес.
Во суштина, пасивниот Dw, во најдобар случај, дава
само јас податоци чисти и оперативни за здруженијата на корисници. Таму
создавањето информации и аналитичкото разбирање зависат
целосно од корисниците. Судејќи дали DW (Складиште на податоци) е
успехот е субјективен. Ако го оцениме успехот на
способност за ефикасно собирање, интегрирање и чистење i податоци
корпоративно на предвидлива основа, тогаш да, DW е успех.
Од друга страна, ако ја погледнеме наплатата, консолидација и ете
експлоатација на информации организацијата како целина, тогаш
DW е неуспех. DW дава мала или никаква вредност
информации. Како резултат на тоа, корисниците се принудени да се задоволат,
со што се создаваат силоси на информации. Ова поглавје претставува
сеопфатен поглед за резимирање на архитектурата на БИ(Бизнис
разузнавање) на компаниите. Да почнеме со опис на БИ и
потоа ќе преминеме на дискусиите за дизајнот и
развој на информации, наспроти едноставно обезбедување i податоци
на корисниците. Дискусиите потоа се фокусирани на пресметката на
вредноста на вашите напори за БИ. Заклучуваме со дефинирање како IBM
потсетува на архитектонските барања за БИ на вашата организација.
Архитектура опис на
БИ организација
Моќните информациски системи ориентирани кон трансакциите се сега
на дневен ред во секое големо претпријатие, како што се нивелираат
ефективно полето за игра за корпорациите во светот.
За да се остане конкурентен, сепак, сега се потребни системи аналитички
ориентирана кон тоа може да направи револуција во способноста на компанијата со повторно откривање на ед
користејќи ги информациите што веќе ги имаат. Овие системи
аналитички произлегуваат од разбирањето од богатството на податоци
достапни. БИ може да ги подобри перформансите на сите информации
на претпријатието. Бизнисите можат да ги подобрат односите меѓу клиентите и клиентите
добавувачи, подобрување на профитот на производи и услуги, генерира
нови и најдобри понуди, проверете го ризикот и меѓу многу други
заработката драстично ги намалува трошоците. Со твоето БИ
компанијата конечно почнува да ги користи информациите за клиентите
како конкурентна предност благодарение на апликациите кои имаат цели на
пазар.
Да се има вистински бизнис значи да се има дефинитивни одговори
клучни прашања како:
▪ Кој од нашите клиенти нè тераат да заработуваме повеќе, или таму
дали губат?
▪ Каде што живеат нашите најдобри клиенти во врска со продавница/
магацин тие често?
▪ Кои од нашите производи и услуги може да се продаваат повеќе
ефикасно и на кого?
▪ Кои производи може најефективно да се продаваат и на кого?
▪ Која продажна кампања е поуспешна и зошто?
▪ Кои продажни канали се најефективни за кои производи?
▪ Како можеме да ги подобриме односите со нашите најдобри клиенти?
Повеќето компании имаат податоци грубо да се одговори
овие прашања.
Оперативните системи генерираат големи количини на производи, на
клиент и на податоци на пазарот од продажни места, од резервации,
од системите за услуги на клиентите и техничка поддршка. Предизвикот е
извлечете и искористете ги овие информации.
Многу компании профитираат само од нивните мали фракции податоци
за стратешки анализи.
I податоци преостанати, често во комбинација со i податоци изведување на надворешни извори како што се i
„Владини извештаи“ и други купени информации се едно
рудник за злато само чека да биде истражен, т.е податоци мора
само да се рафинира во вашиот информативен контекст
организација.
Ова знаење може да се примени на различни начини, варијации
од дизајнирање на севкупна корпоративна стратегија до
лична комуникација со добавувачите, преку телефонски центри,
фактурирање, интернет и други точки. Денешното деловно опкружување диктира
дека DW и сродните BI решенија се развиваат понатаму
извршувањето на традиционалните структури на податоци како што се јас податоци нормализиран на
атомско ниво и „фарми со ѕвезди/коцки“.
Она што е потребно за да остане конкурентно е спојување на
традиционални и напредни технологии во обид да се поддржи а
огромен аналитички пејзаж.
Конечно, општата средина мора да го подобри знаењето
на претпријатието како целина, осигурувајќи дека преземените дејствија
како последица на спроведените анализи добро им доаѓаат така што сите се
корист.
На пример, да речеме дека го рангирате своето клиенти во категориите
висок или низок ризик.
Дали оваа информација е генерирана од модел на рударство или
други средства, мора да се стави во Dw и да се направи пристапен до
било кој, со помош на какви било средства за пристап, како што се i
статички извештаи, табели, табели или аналитичка обработка во
линија (OLAP).
Сепак, во моментов, многу од овој вид на информации
остануваат во силосите на податоци на поединците или одделенијата што ги генерираат
анализата. Организацијата како целина има мала или никаква видливост
за разбирање. Само со мешање на овој тип на содржина
информации во вашето претпријатие dw можете да ги елиминирате силосите на
информации и подигнете ја вашата околина Dw.
Постојат две големи пречки за развој на организација
на БИ.
Прво, го имаме проблемот на самата организација
на соодветната дисциплина.
Дури и ако не можеме да помогнеме со промените на политиките
на организацијата, можеме да помогнеме да се разберат компонентите на
организација на БИ, нејзината архитектура и како
IBM технологијата го олеснува нејзиниот развој.
Втората бариера што треба да се надмине е недостатокот на технологија
интегриран и познавање на метод кој го повикува целиот простор
на БИ наспроти само мала компонента.
IBM реагира на промените во технологијата
на интегрирани. Ваша одговорност е да обезбедите дизајн
Самосвесен. Оваа архитектура мора да се развива со
технологија избрана за интеграција без ограничувања, или барем, со
технологија која се придржува до отворените стандарди. Исто така, твое
менаџментот на компанијата мора да осигура дека претпријатието на Би е
се спроведува според програмата и тоа да не се дозволи
развој на информациски силоси кои произлегуваат од самопослужување
агенди или цели.
Ова не значи дека околината на БИ не е чувствителна
реагираат на различните потреби и барања на различни корисници; наместо тоа, тоа значи
дека имплементацијата на тие индивидуални потреби и барања е
направено во корист на целата БИ организација.
Опис на BI архитектурата на организацијата може
може да се најде на страница 9 на слика 1.1. Архитектурата покажува
богата мешавина на технологии и техники.
Од традиционален поглед, архитектурата ги вклучува следните компоненти
на магацин
Атомски слој (Атомски слој).
Ова е основата, срцето на целиот Dw и затоа на
стратешко известување.
I податоци складирани овде ќе го задржат историскиот интегритет, извештаите на
податоци и да ја вклучи изведената метрика, како и да биде чиста,
интегрирани и складирани со користење на шаблони за рударство.
Сета последователна употреба на овие податоци а поврзаните информации е
кои произлегуваат од оваа структура. Ова е одличен извор за
екстракција на податоци и за извештаи со структурирани SQL барања
Оперативен магацин на податоци или извештај основа на
податоци(Складирање на оперативни податоци (ODS) или известување
база на податоци.)
Ова е структура на податоци специјално дизајниран за
техничко известување.
I податоци складирани и пријавени погоре овие структури можат конечно
се пропагира во складиштето преку зоната на постановка (стајинг
област), каде што може да се користи за стратешко сигнализирање.
Површина за поставување.
Првата станица за повеќето податоци наменети за животната средина на
магацин е зоната на организацијата.
Еве јас податоци се интегрираат, чистат и трансформираат во податоци корисно тоа
тие ќе ја населат структурата на складот
Датум марти.
Овој дел од архитектурата ја претставува структурата на податоци користени
специјално за OLAP. Присуството на datamarts, ако i податоци се
зачувани во шемите со ѕвезди што ги преклопуваат податоци
повеќедимензионални во релациона средина или во кабинети за поднесување документи
di податоци комерцијално се користи од специфична OLAP технологија, како што е
DB2 OLAP сервер, тоа не е релевантно.
Единственото ограничување е што архитектурата го олеснува користењето на податоци
повеќедимензионални.
Архитектурата вклучува и критични Би технологии и техники
кои се разликуваат како:
Просторна анализа
Просторот е информативна неочекувана добивка за аналитичарот и
тоа е критично за целосна резолуција. Простор може
ги претставуваат информациите на луѓето кои живеат во одредено
локација, како и информации за тоа каде се наоѓа таа локација
физички во споредба со остатокот од светот.
За да ја спроведете оваа анализа, мора да започнете со врзување на вашата
информации за координати на географска должина и ширина. Што значи
се нарекува „геокодирање“ и мора да биде дел од екстракцијата,
трансформација, и на процесот на вчитување (ETL) на ниво
атомски број на вашиот магацин.
Рударство на податоци.
Извлекувањето на податоци им овозможува на нашите компании да растат
број ди клиенти, да ги предвиди продажните трендови и да овозможи
управување со односите со клиенти (CRM), меѓу другите иницијативи на
БИ.
Извлекувањето на податоци затоа мора да се интегрира со структурите на
податоци на Dwhouse и поддржан од магацински процеси за
да ја утврдат и ефективната и ефикасната употреба на технологијата и
поврзани техники.
Како што е наведено во архитектурата БИ, атомското ниво на
Dwhouse, како datamarts, е одличен извор на податоци
за екстракција. Истите тие структури исто така мора да бидат
примателите на резултатите од екстракција за да се обезбеди достапност до
најголема публика (најширока публика).
Агенти.
Постојат различни „агенти“ за проверка на клиентот за која било точка како, т.е
оперативните системи на компанијата и самите dw. Овие агенти можат
бидете напредни невронски мрежи обучени за учење
трендови на секоја точка, како што се идната побарувачка на производи врз основа
на продажните промоции, мотори засновани на правила за да реагираат
un дато збир на околности, па дури и едноставни агенти кои
тие ги посочуваат исклучоците на „врвните раководители“. Овие процеси да
генерално присутни во реално време и затоа мора
да биде тесно поврзан со нивното движење податоци.
Сите овие структури на податоци, гаранција за технологии и техники
дека нема да ја поминете ноќта создавајќи организација на
вашиот БИ.
Оваа активност ќе се развива во поединечни чекори, за мали
поени.
Секој чекор е независен проект напор и е пријавен
како повторување во вашата иницијатива за dw или BI. Итерациите
може да вклучи имплементација на нови технологии, за
започнете со нови техники, додавајќи нови структури на податоци ,
вчитување i податоци дополнителни , или со проширување на анализата на
вашата околина. Овој став е дискутиран повеќе
детално во поглавје 3.
Покрај традиционалните структури на алатките Dw и Bi, постојат и други
функции на вашата БИ организација за кои должите
дизајн, како што се:
Точки на допир на клиенти (допир со клиенти
поени).
Како и кај сите модерни организации, постојат голем број на
допирни точки на клиентите кои покажуваат како да имате искуство
позитивно за твоето клиенти. Постојат традиционални канали како што се i
трговци, оператори на разводни табли, директна пошта, мултимедија и печатење
рекламирање, како и најактуелните канали како што се е-пошта и веб, т.е податоци
мора да се набават производи со одредена точка на допир,
транспортирани, исчистени, трансформирани и потоа населени во структури на податоци на
БИ.
Основи на податоци оперативни и кориснички здруженија (Оперативно
бази на податоци и кориснички заедници).
На крајот од контактните точки на клиенти се наоѓаат темелите податоци
на апликацијата и корисничките заедници на компанијата. НА податоци постоечки
се податоци традиционална која мора да се соедини и да се спои со податоци дека
течат од допирните точки за да го исполнат потребното
информации.
Аналитичарите. (Аналитичарите)
Примарниот корисник на околината на БИ е аналитичарот. Тој е тој кој
придобивките од сегашната екстракција на податоци оперативен, интегриран со
различни извори на податоци , зголемени со карактеристики како што се аналитика
географски (геокодирање) и претставени во БИ технологии кои
овозможуваат рударство, OLAP, напредно SQL известување и анализа
географски. Примарниот интерфејс за аналитичарот со околината
известувањето е порталот БИ.
Сепак, аналитичарот не е единствениот што има корист од архитектурата на
БИ.
Директори, големи здруженија на корисници, па дури и членови, добавувачи и i
клиенти треба да најде бенефиции во претпријатието БИ.
Задна јамка за довод.
BI архитектурата е средина за учење. Принцип
карактеристика на развојот е да се овозможи упорни структури на податоци
да се ажурира со користена БИ технологија и со акции
кориснички претпријатија. Пример е евалуацијата на
клиент (клиент бодување).
Ако одделот за продажба спроведува модел на рударство
на оценките на клиентот како да се користи нова услуга, потоа на
одделот за продажба не треба да биде единствената група корисници
на услугата.
Наместо тоа, моделот на рударството треба да се изведе како дел
природата на протокот на податоци во рамките на компанијата и резултатите на клиентите
треба да стане интегриран дел од информациската средина на
магацин, видлив за сите корисници. Би-би-центричен IBM Suite
вклучувајќи DB2 UDB, DB2 OLAP серверот ги вклучува повеќето
дел од важните компоненти на технологијата, дефинирани на сликата
1.1.
Ние ја користиме архитектурата како што е прикажана во оваа книга
дајте ни ниво на континуитет и да покажете како секој производ
на IBM се вклопуваат во општата шема на БИ.
Обезбедување информативна содржина (Обезбедување
информативна содржина)
Дизајн, развој и имплементација на вашата БИ околина е
напорна задача. Дизајнот мора да ги опфаќа и двете
сегашните и идните деловни барања. Архитектонскиот дизајн
мора да биде целосна за да ги вклучи сите пронајдени заклучоци
за време на фазата на дизајнирање. Извршувањето мора да остане
посветени на една единствена цел: да се развие архитектурата на БИ
како што е формално претставено во цртежот и врз основа на барањата на
Бизнис.
Особено е тешко да се тврди дека дисциплината ќе обезбеди
релативен успех.
Ова е едноставно затоа што не создавате BI околина за секого
одеднаш, но се одвива во мали чекори со текот на времето.
Сепак, идентификувањето на BI компонентите на вашата архитектура е
важно од две причини: Вие ќе ги водите сите наредни одлуки
архитектонски техники.
Ќе можете свесно да дизајнирате одредена употреба на технологијата
иако можеби нема да добиете повторување што треба
технологија за неколку месеци.
Доволно разбирање на вашите деловни барања ќе влијае на видот
на производи што ќе ги стекнете за вашата архитектура.
Планирањето и развојот на вашата архитектура обезбедуваат
дека вашиот магацин е
не случаен настан, туку „добро осмислен“,
внимателно конструирана реклама опера на уметноста како мозаик на
мешана технологија.
Дизајнирајте информативна содржина
Целиот првичен дизајн мора да се фокусира и да го идентификува
главните компоненти на БИ кои ќе ѝ бидат потребни на вашата околина
општо во сегашноста и во иднината.
Познавањето на деловните барања е важно.
Дури и пред да започне целото формално планирање, на
планерот на проектот често може да идентификува еден или два
компонента веднаш.
Рамнотежата на компонентите што може да бидат потребни за
вашата архитектура, сепак, не може лесно да се најде.
За време на фазата на проектирање, главниот дел од архитектурата
ја врзува сесијата за развој на апликации (JAD) за пребарување
да се идентификуваат деловните барања.
Понекогаш овие барања може да се аутсорсираат на алатки
прашања и известување.
На пример, корисниците наведуваат дека ако сакаат да автоматизираат
во моментов извештај треба да се генерира рачно интегрирање
два тековни соодноси и собирање на пресметките добиени од
комбинација на податоци.
Иако ова барање е едноставно, тој дефинира одредено
функционалноста на функцијата што мора да ја вклучите кога
купи алатки за известување за организацијата.
Дизајнерот, исто така, мора да следи дополнителни барања за
добие целосна слика. Корисниците сакаат да се претплатат на
овој извештај?
Подгрупите на извештајот се генерираат и се испраќаат преку е-пошта до различните
корисници? Сакате да го видите овој извештај на порталот на компанијата?
Сите овие барања се дел од едноставната потреба да
заменете рачен извештај како што бараат корисниците. Придобивката
од овие типови барања е што ги имаат сите, корисници и програмери
разбирање на концептот на извештаи.
Меѓутоа, постојат и други видови бизниси за кои треба да планираме.
Кога деловните барања се наведени во форма на
Деловни стратешки прашања, лесно е за искусниот планер
да ги препознае барањата за димензии и мерки/факти.
Слика 1.2 илустрира големина и димензионални компоненти на а
деловен проблем.
Ако корисниците на JAD не знаат како да ги пријават своите барања
во форма на деловен проблем, дизајнерот често ќе испорача
примери за прескокнување-почнување на сесијата за собирање податоци
барања.
Експертскиот дизајнер може да им помогне на корисниците да го разберат не само
стратешка трговија, но и како да се формира.
Пристапот за собирање барања е дискутиран во поглавје 3; За
сега сакаме само да укажеме на потребата од дизајнирање за секого
видовите барања за БИ
Стратешкото деловно прашање е, не само услов
Бизнис, но и дизајн поим. Ако треба да одговорите
на повеќедимензионално прашање, тогаш треба да запаметите,
поднесете i податоци димензионални, и ако треба да го запаметите
податоци повеќедимензионални, треба да одлучите каква технологија или
техника што ќе ја примените.
Дали имплементирате шема на резервирана коцка ѕвезда или и двете?
Како што можете да видите, дури и едноставен деловен проблем
може значително да влијае на дизајнот. Сепак
овие типови деловни барања се обични и се разбира, барем
од искусни проектни планери и дизајнери.
Имаше доволно дебата за технологиите и поддршката на
OLAP и широк спектар на решенија се достапни. До сега
ја спомнавме потребата од обединување на едноставното известување со i
барања за големина на бизнисот и како овие барања
влијаат на техничките архитектонски одлуки.
Но, кои се барањата кои не се лесно разбрани
од корисниците или од тимот на Dw? Анализата некогаш ќе ви треба
просторна (просторна анализа)?
Моделите за рударство на податоци тие ќе бидат неопходен дел од вашиот
иднина? Кој знае?
Важно е да се напомене дека овие видови на технологии не се многу
познати од општите заедници на корисници и членовите на тимот на
Dw, делумно, ова може да се случи затоа што тие обично
со нив управуваат некои внатрешни или трети технички експерти. Тоа е
граничен случај на проблемите што ги создаваат овие типови технологии. Себе
корисниците не можат да ги опишат деловните барања или да ги обликуваат
со цел да им дадат насоки на дизајнерите, тие можат
поминете незабележано или, уште полошо, едноставно игнорирајте.
Попроблематично станува кога дизајнерот и развивачот не успеваат
може да ја препознае примената на една од овие напредни но
критични технологии.
Како што често сме слушнале како дизајнерите велат: „Па, зошто
не го оставаме настрана додека не го добиеме ова другото?
„Дали тие се вистински заинтересирани за приоритетите или едноставно избегнуваат т
барања што не ги разбираат? Најверојатно е последната претпоставка.
Да речеме дека вашиот тим за продажба објавил барање
на бизнисот, како што е наведено на слика 1.3, како што можете да видите, на
барањето е врамено во форма на деловен проблем. Таму
разликата помеѓу овој проблем и типичниот димензионален проблем е
далечината. Во овој случај, продажниот тим сака да знае,
на месечно ниво вкупните продажби од производи, магацини и
клиенти кои живеат на 5 милји од магацинот каде што
купуваат.
За жал, дизајнерите или архитектите едноставно можат
игнорирајте ја просторната компонента велејќи: „го имаме клиентот
производ и јас податоци на депозитот. Ние го држиме растојанието до
уште една итерација.
"Погрешен одговор. Овој вид на деловен проблем се однесува
целосно БИ. Тоа претставува подлабоко разбирање на
нашиот бизнис и робустен аналитички простор за нашите аналитичари.
BI е надвор од едноставното барање или стандардното известување
дури и OLAP. Ова не значи дека овие технологии не успеваат
тие се важни за вашиот БИ, но сами по себе не се
околината БИ.
Дизајн за информативен контекст
(Дизајн за информативна содржина)
Сега кога ги идентификувавме деловните барања што се истакнуваат
различни основни компоненти, мора да бидат вклучени во дизајнот
општи архитектонски. Некои од компонентите на БИ се дел
на нашите првични напори, додека некои нема да се спроведат за
неколку месеци.
Сепак, сите познати барања се рефлектираат во дизајнот така што
кога треба да имплементираме одредена технологија, ние сме
подгответе се да го направите тоа. Нешто во врска со проектот ќе ја одрази мислата
трдизионале.
На пример, слика 1.1, на почетокот на поглавјето, покажува податок
март кој го одржува и податоци димензионални.
Овој сет на податоци се користи за поддршка на подоцнежните употреби на
податоци димензионални водени од Деловните прашања кои
идентификувавме. Како што се дополнителните документи
генерирани, како што е развојот на дизајнот на податоци, ние
ќе почнеме да го формализираме како јас податоци се шират во околината.
Констатиравме потреба од застапување и податоци така
димензионални, поделувајќи ги (според специфичните потреби
утврдени) на data marts.
Следното прашање на кое треба да се одговори е како ќе се градат
овие податоци марш?
Дали ги градите ѕвездите за да ги поддржат коцките, или само коцките или само ѕвездите?
(или прави коцки, или прави ѕвезди). Генерирајте ја архитектурата за податоците
зависни мартови кои бараат атомски слој за сите податоци
стекнуваш? Дозволете независни податоци мартови да стекнат i податоци
директно од оперативните системи?
Која технологија Cube ќе се обидете да ја стандардизирате?
Имате огромни количини на богови податоци потребни за димензионална анализа
или ви требаат коцки од вашата национална продажна сила на едно
неделно или и двете? Изградете моќен предмет
како што се DB2 OLAP Server for Finance или Cognos коцки
PowerPlay за вашата продажна организација или и двете?
Ова се големите архитектонски дизајн одлуки кои
тие ќе влијаат на вашата БИ околина понатаму. Да,
сте идентификувале потреба за OLAP. Сега како ќе го спроведеш тоа
тип на техника и технологија?
Како некои од најнапредните технологии влијаат на вашата
цртежи? Да претпоставиме дека сте идентификувале потреба
простор во вашата организација. Сега треба да се јавите на
изданија на архитектонски цртежи дури и ако не се планирани
врши вселенски компоненти неколку месеци. Архитектот мора
дизајн денес врз основа на она што е потребно. Предвидете ја потребата за
просторна анализа која генерира, складира, врши и испорачува
пристап до податоци просторни. Ова за возврат треба да послужи како а
ограничување во однос на видот на технологијата и спецификациите
софтверска платформа за која можеби размислувате моментално. За
на пример, системот на администрација на база на податоци релациона
(RDBMS) што го изведувате за вашиот атомски слој мора да има
достапен робустен просторен опсег. Ова би обезбедило
максимални перформанси при користење на геометрија и објекти
простор во вашите аналитички апликации. Ако вашиот RDBMS не го прави тоа
може да се справи со јас податоци (просторно-центрично) внатрешно, па ќе мора
воспостави а база на податоци (просторно-центрично) надворешен. Ова го комплицира
управување со проблеми и да влијае на вашите вкупни перформанси,
да не зборуваме за дополнителните проблеми создадени за вашите
DBA, бидејќи тие веројатно имаат минимално разбирање
на темелите на податоци просторно исто така. Од друга страна, ако вашиот мотор
RDMBS се справува со сите просторни компоненти и сродни
оптимизатор е свесен за посебни потреби (на пример,
индексирање) на просторни објекти, тогаш вашите DBA може да се справат
брзо управувајте со проблемите и можете да ги подигнете
престациони.
Исто така, треба да ја прилагодите областа за поставување и слој
на атомската средина да вклучи чистење на адресата (не
клучен елемент за просторна анализа), како и следниот
заштеда на вселенски објекти. Сукцесијата на изданијата на
цртањето продолжува сега кога го воведовме поимот чистење
адреса. Како прво, оваа апликација ќе го диктира типот на
неопходен софтвер за вашиот ETL напор.
Ви требаат производи како Trillium за да ви дадат адреса
чист, или продавач на ETL по ваш избор за да го обезбеди тоа
функционалност?
Засега е важно да го цените стандардот на дизајнот
мора да се заврши пред да започнете со спроведување на вашето
средина (магацин). Горенаведените примери треба
го демонстрираат мноштвото извлекување одлуки што мора да следат
идентификација на кое било одредено деловно барање. Ако е направено
правилно, овие одлуки за дизајн промовираат
меѓузависноста помеѓу физичките структури на вашата околина, на
избор на технологија што се користи и протокот на размножување на
информативна содржина. Без оваа конвенционална архитектура
на БИ, вашата организација ќе биде предмет на мешавина
хаотичен од постоечките технологии, во најдобар случај, обединети на некој начин
неточни за да се обезбеди привидна стабилност.
Одржувајте информациска содржина
Донесувањето на вредноста на информациите во вашата организација е
многу тешка операција. Без доволно разбирање
и искуство, или правилно планирање и дизајн, дури и на
подобри тимови би пропаднале. Од друга страна, ако имате одличен
интуиција и детално планирање но без дисциплина за
егзекуција, само си ги потрошил парите и времето
затоа што вашиот напор сигурно ќе пропадне. Пораката треба
бидете јасни: ако ви недостасува една или повеќе од овие
вештини, разбирање/искуство или планирање/цртање о
дисциплина за спроведување, ова ќе доведе до парализирање или
уништи зградата на организацијата БИ.
Дали вашиот тим е доволно подготвен? Има некој на твое
Тим на БИ кој го разбира огромниот аналитички пејзаж на располагање
во БИ средини, во потребните техники и технологии
да го ефектуира тој пејзаж? Има некој во вашиот тим
кој може да ја препознае разликата на примена помеѓу напредни
статичко известување и OLAP, или разликите помеѓу ROLAP и OLAP? Еден од
членовите на вашиот тим јасно го препознаваат начинот на
екстракт и како тоа може да влијае на складиштето или како
дали магацинот може да ги поддржи перформансите на рударството? Член
на тимот ја разбира вредноста на податоци простор или технологија
базирани на агенти? Дали имате некој кој ја цени уникатната апликација
на ETL алатки против брокерската технологија
порака? Ако го немате, земете го. БИ е многу повеќе
голем од нормализиран атомски слој, од OLAP, од шемите a
ѕвезда и ОДС.
Имајте разбирање и искуство за да ги препознаете барањата
на БИ и нивните решенија е од суштинско значење за вашата способност
правилно да ги формализираат потребите на корисниците и да дизајнираат
и ги спроведуваат нивните решенија. Ако вашата корисничка заедница има
тешкотии во опишувањето на барањата, тоа е задача на тимот на
магацин обезбеди тоа разбирање. Но, доколку тимот на
магацин
не ја препознава специфичната апликација на БИ - на пример, податоци
рударство- тогаш тоа не е најдоброто нешто што го прават околините на БИ
често се ограничуваат да бидат пасивни депозити. Сепак, игнорирајте ги овие
технологиите не ја намалуваат нивната важност и ефектот што го имаат
за појавата на сопствените можности за деловна интелигенција
организацијата, како и информациската структура што ја дизајнирате
да промовира.
Планирањето мора да го вклучува поимот цртање, ед
и двете бараат компетентен поединец. Плус, дизајнирање
бара тимска филозофија и набљудување
на стандардите. На пример, ако вашата компанија има основано а
стандардна платформа или има идентификувано одреден RDBMS што вие
сакаат да се стандардизираат низ платформата, тоа е неизбежно
сите во тимот се придржуваат до тие стандарди. Генерално еден
тимот ја изложува потребата за нормализација (на корисникот
заедница), но самиот тим не е подготвен да се приклучи на
стандарди поставени и во други области во компанијата или можеби дури и во
слични компании. Ова не само што е лицемерно, туку и потврдува дека фирмата не го прави тоа
е во состојба да ги искористи постоечките ресурси и инвестиции. Тоа не значи
дека не постојат ситуации кои гарантираат платформа или а
нестандардизирана технологија; сепак напорите на магацинот
треба љубоморно да ги чува стандардите на претпријатието до
дека деловните барања не диктираат поинаку.
Третата клучна компонента потребна за да се изгради БИ
организацијата е дисциплина.
Тоа зависи вкупно, подеднакво од поединците и од околината.
Планерите на проектите, спонзорите, архитектите и корисниците мора да го ценат тоа
дисциплина неопходна за градење на информациската структура на компанијата.
Дизајнерите мора да ги насочат своите дизајнерски напори на таков начин што
заврши други неопходни потфати во општеството.
На пример, да речеме дека вашата компанија гради a
ERP апликација која има магацинска компонента.
Значи, одговорност на дизајнерите на ERP е да соработуваат со
тим на магацинска средина за да не се натпреварува или
дуплирајте ја веќе започнатата работа.
Дисциплината е исто така тема што треба да биде зафатена
од целата организација и вообичаено се основа и се доверува на а
извршно ниво.
Дали директорите се подготвени да се придржуваат до дизајниран пристап? А
пристап кој ветува создавање информациска содржина што е
на крајот тоа ќе донесе вредност за сите области на претпријатието, но можеби
Дали тоа ги компромитира индивидуалните или одделенските агенди? Запомнете ја изреката
„Да се размислува за сè е поважно отколку да се размислува само за една работа“.
Оваа изрека е точна за организациите на БИ.
За жал, многу магацини ги фокусираат своите напори
бара да вози и да донесе вредност на одреден оддел или а
специфични корисници, со мало внимание на организацијата во
општо. Да претпоставиме дека менаџерот бара помош од тимот во
магацин. Тимот одговара со 90-дневна работа што
вклучува не само доставување на барањата за известување дефинирани со
менаџер но гарантира дека сите податоци база се мешаат во ниво
атомски пред да биде воведен во технологијата на коцки
предлог.
Овој инженерски додаток гарантира дека подвигот на
магацинот ќе има корист од податоци потребни на менаџерот.
Сепак, извршната власт разговараше со надворешни консултантски фирми дека
имаат предложено слична апликација со испорака за помалку од 4
недели.
Под претпоставка дека внатрешниот тим на магацинот е компетентен,
менаџерот има избор. Кој може да ја поддржи дисциплината на
потребен е дополнителен инженеринг за одгледување на бунарот
информативно претпријатие или може да изберат да направат свои
брзо решение. Вториот се чини дека е вистински избран
премногу често и служи само за создавање контејнери за информации на
од кои корист имаат неколку или поединецот.
Краткорочни и долгорочни цели
Архитектите и планерите на проекти мора да формализираат a
долгорочна визија за целокупната архитектура и планови за
расте во организација на БИ. Оваа комбинација на
краткорочен профит и долгорочно планирање
ги претставуваат двете лица на напорите БИ. Краткорочна добивка
истекот е аспект на БИ што е поврзан со повторувањата на
вашиот магацин.
Ова е местото каде што се фокусираат планерите, архитектите и спонзорите
исполнуваат специфични деловни барања. Токму на ова ниво на
се градат физички структури, се купува технологија и на
се имплементираат техники. Тие во никој случај не се направени да се соочат
специфични барања како што се дефинирани од одредени заедници на корисници.
Сè е направено со цел да се одговори на дефинираните специфични барања
од одредена заедница.
Меѓутоа, планирањето на долг дострел е другиот аспект
на БИ. Ова е местото каде што плановите и дизајните гарантираа дека тоа е
изградена било каква физичка структура, избраните технологии и
реализирани техники направени со око кон претпријатието. И на
долгорочно планирање кое обезбедува кохезија
неопходни за да се осигури дека придобивките од бизнисот се акумулираат на сите
пронајдените краткорочни добивки.
Оправдајте го вашиот напор за БИ
Un складиште на податоци само по себе нема вродена вредност. Во други
зборови, не постои вродена вредност помеѓу технологиите
складиште и техники за имплементација.
Вредноста на секој магацин напор се наоѓа во акциите
изведена како резултат на магацинската средина и содржина
информации култивирани со текот на времето. Ова е критична точка за разбирање
пред да се обидете да ја процените вредноста на која било иницијатива од
дома.
Премногу често, архитектите и планерите се обидуваат да применат вредност
магацин физички и технички компоненти кога всушност вредноста е
основа со деловни процеси кои се позитивно под влијание на
магацин и добро стекнати информации.
Тука лежи предизвикот за основање БИ: Како ја оправдувате инвестицијата?
Доколку самата куќарка нема внатрешна вредност, дизајнерите на
проектот мора да ги истражи, дефинира и формализира придобивките
постигнат од оние лица кои ќе го користат магацинот за
подобрување на специфичните деловни процеси или вредноста на
заштитени информации или и двете.
За да се комплицираат темите, секој деловен процес
погодени од напорите во складиштето би можеле да обезбедат придобивки
„значително“ или „малку“. Значителни предности обезбедуваат а
опиплива метрика за мерење на повратот на инвестицијата (ROI) – на пр
на пример, превртување на залиха дополнително време во текот на одреден период
специфични или за пониски трошоци за транспорт по пратка. Тоа е повеќе
Тешко е да се одредат малите придобивки, како што е подобрен пристап до
информации, во смисла на материјална вредност.
Поврзете го вашиот проект за да го знаете
деловни барања
Премногу често, дизајнерите на проекти се обидуваат да поврзат вредност
на магацинот со аморфни цели на претпријатието. наведувајќи дека
„Вредноста на магацинот се заснова на нашата способност
задоволува стратешки барања“ пријатно го отвораме
говорот. Но, само тоа не е доволно за да се утврди дали
инвестицијата во складиштето има смисла. Подобро е да се поврзат повторувањата
на магацин со специфични комерцијални барања и белешки.
Измерете ја рентабилноста
Пресметувањето на рентабилност во складиште може да биде
особено тешко. Особено е тешко ако водството
начело на одредено повторување е нешто нематеријално или
лесен за мерење. Една студија покажа дека корисниците перцепираат
двете главни придобивки од иницијативите за БИ:
▪ Создадете способност за донесување одлуки
▪ Создадете пристап до информации
Овие придобивки се меки (или благи) придобивки. Лесно е да се види
како можеме да пресметаме ROI врз основа на тврд раб (o
поголема) како што е намалувањето на трошоците за транспорт, но како
дали ја мериме способноста за донесување подобри одлуки?
Ова е дефинитивно предизвик за планерите на проекти кога
тие се обидуваат да ја натераат компанијата да инвестира во едно конкретно
магацин напор. Зголемување на продажбата или намалување на трошоците
тие повеќе не се централните теми што ја движат околината на БИ.
Наместо тоа, барате пристап во деловните барања
најдобро на информациите за да може одреден оддел
донесувајте одлуки побрзо. Ова се стратешки двигатели а
кои се еднакво важни за фирмата но се
понејасно и потешко да се карактеризира во опиплива метрика.
Во овој случај, пресметувањето на ROI може да биде погрешно, ако не и ирелевантно.
Дизајнерите на проекти мора да бидат способни да покажат вредност
опипливи за директорите да одлучат дали инвестицијата во
одредено повторување е важно. Но, нема да предложиме нов
метод за пресметување на рентабилност, ниту пак ќе дадеме некаков про или аргумент
против него.
Постојат многу написи и книги кои ги дискутираат основите за
пресметај ROI. Постојат посебни вредносни предлози како вредност
на инвестиции (VOI), понудени од групи како Гартнер, што можете
да истражуваат. Наместо тоа, ќе се фокусираме на основните аспекти на кој било
ROI или други предлози за вредност што треба да ги земете во предвид.
Примена на рентабилност
Покрај аргументот за „тешките“ придобивки наспроти „меките“ придобивки
Поврзани со напорите на БИ, треба да се разгледаат и други прашања
кога применуваме ROI. На пример:
Припишување премногу заштеди на напорите на DW што би дошле
Во секој случај
Да речеме дека вашата компанија преминала од архитектура на
мејнфрејм до дистрибуирана UNIX околина. Значи било кој
заштеди кои може (или не) да се реализираат со тој напор
не треба да се припишува исклучиво, ако на сите (?), на
магацин.
Не сметководството за се е скапо. И има многу работи за
Земи во предвид. Размислете за следнава листа:
▪ Трошоци за стартување, вклучително и изводливост.
▪ Трошоци за посветен хардвер со поврзано складирање д
комуникации
▪ Цена на софтверот, вклучително и управување со податоци и екстензии
клиент/сервер, ETL софтвер, DSS технологии, алатки
визуелизација, распоред и апликации за проток
софтвер за работа и следење, .
▪ Трошоци за проектирање на структурата податоци, со реализацијата, и
оптимизацијата на
▪ Трошоци за развој на софтвер директно поврзани со напорот
BI
▪ Трошоци за домашна поддршка, вклучително и оптимизација на
перформанси, вклучително и контрола на верзијата на софтверот д
операции за помош
Примени „Big-Bang“ ROI.
Реализацијата на магацинот како единствен и џиновски напор
е обврзана да пропадне, така што исто така пресметајте го рентабилноста за иницијатива
на големо претпријатие Понудата е изненадувачка и дека дизајнерите
продолжи да прави слаби обиди да ја процени вредноста на целината
напор.
Затоа што дизајнерите се обидуваат да дадат парична вредност
на иницијативата на претпријатието доколку е нашироко познато и прифатено дека
Дали е тешко да се проценат одредени повторувања? Како е можно? Тоа не е
можно со неколку исклучоци. Не правете го тоа.
Сега кога утврдивме што не треба да правиме при пресметувањето
ROI, еве неколку точки кои ќе ни помогнат во дефинирањето
сигурен процес за проценка на вредноста на вашите напори за БИ.
Добивање согласност за рентабилност. Без разлика на вашата
избор на техника за да се процени вредноста на вашите напори за БИ, мора
да бидат договорени од сите страни, вклучувајќи ги и планерите на проектот,
корпоративни спонзори и директори.
Разделете го ROI на делови што може да се идентификуваат. Неопходен чекор кон во
разумна пресметка на рентабилност е да се концентрира таа пресметка на a
конкретен проект. Ова потоа ви овозможува да ја процените вредноста
врз основа на специфични деловни барања кои се исполнети
Дефинирајте ги трошоците. Како што споменавме, мора да има бројни трошоци
сметано. Понатаму, трошоците мора да ги вклучуваат не само поврзаните трошоци
на еднократното повторување, но и на придружните трошоци
за да се обезбеди усогласеност со корпоративните стандарди.
Дефинирајте ги придобивките. Со јасно поврзување на ROI со барањата
специфични занаети, треба да можеме да ги идентификуваме
бенефиции кои ќе доведат до исполнување на барањата.
Намалете ги трошоците и придобивките во непосредна добивка. Тоа е патот
најдобар начин да ги засновате вашите вреднувања на нето сегашната вредност
(NPV) за разлика од обидот да се предвиди идната вредност во
идна заработка.
Одржувајте го времето за да го поделите вашиот ROI на минимум. И'
добро документирано за долго време што се користи во вашите
Рентабилност.
Користете повеќе од една формула за рентабилност. Постојат бројни методи за
Предвидување на рентабилност и треба да планирате дали да користите едно или
плус, вклучувајќи ја нето сегашната вредност, внатрешната брзина на повратните информации
(IRR) и закрепнување.
Дефинирајте повторлив процес. Ова е клучно за пресметување
било која долгорочна вредност. Треба да се документира а
еден повторлив процес за сите последователни проектни секвенци a
следат.
Наведените проблеми се најчестите што ги дефинираат експертите
на околината на магацинот. Инсистирањето на раководството на
имањето на „Big-Bang“ ROI е многу збунувачки. Ако ги започнете сите
ги имате вашите пресметки за рентабилност со нивно разложување на препознатливи, опипливи делови
добра шанса да се процени точната проценка на рентабилноста.
Прашања за придобивките од рентабилноста
Без оглед на вашите придобивки, меки или тврди, можете да ги користите
некои основни прашања за одредување на нивната вредност. До
пример користејќи едноставен систем на скала, од 1 до 10, вие
можете да го следите влијанието на секој напор користејќи го следново
продолжи:
▪ Како би го оцениле разбирањето на податоци следејќи го ова
проект на вашата компанија?
▪ Како би ги процениле подобрувањата на процесот како резултат на
овој проект?
▪ Како би го измериле влијанието на новите сознанија и заклучоци сега
достапни со оваа повторување
▪ Какво е влијанието на новите компјутерски средини д
како резултат на наученото?
Ако одговорите на овие прашања се малку, можно е тоа
претпријатието не вреди за вложената инвестиција. Прашања со висока
поени за значителни добивки од вредност и треба
служат како водичи за понатамошна истрага.
На пример, висок резултат за подобрувања на процесот
треба да ги наведе дизајнерите да погледнат како стојат процесите
е подобрена. Може да откриете дека некои или сите придобивки се направени
тие се опипливи и затоа лесно може да има парична вредност
Применето.
Извлекување на максимум од првата итерација на
магацин
Најголемиот резултат од вашиот деловен напор е често во
првите неколку повторувања. Овие рани напори традиционално
воспоставување на најкорисна информативна содржина за јавноста д
воспоставува помош за основање на технологијата за подоцна
БИ апликации.
Обично секоја наредна последователна секвенца на податоци на проектот на
магацините носат се помалку дополнителна вредност на претпријатието
општо. Ова е особено точно ако повторувањето не успее
додава нови аргументи или не ја задоволува потребата од нов
корисничка заедница.
Оваа функција за складирање важи и за стекови
расте со податоци историчари. Како што последователните напори бараат повеќе
податоци и колку повеќе податоци се влеваат во магацинот со текот на времето, повеќето од
податоци станува помалку релевантен за користената анализа. Овие податоци се
често се нарекува податоци спијат и секогаш е скапо да се чуваат бидејќи
тие речиси никогаш не се користат.
Што значи ова за спонзорите на проектот? Во суштина, т.е
првите спонзори делат повеќе од инвестициските трошоци.
Ова е примарно бидејќи тие се поттик за основање на слојот
големи магацински ресурси и технолошка средина,
вклучувајќи органски.
Но, овие први чекори носат најголема вредност, а со тоа и дизајнерите
на проектот често мора да ја оправда инвестицијата.
Проектите направени по вашата иницијатива за БИ може да имаат трошоци
инфериорен (во споредба со првиот) и директен, но носи помала вредност
на претпријатието.
И сопствениците на организации треба да почнат да размислуваат
фрли акумулација на податоци и помалку релевантни технологии.
Рударство на податоци: екстракција Дати
Бројни архитектонски компоненти бараат варијации на
технологии и техники за ископување податоци-
на пример, различните „агенти“ за испитување на точките од интерес на
клиенти, оперативните системи на компанијата и за истиот dw. Овие
агентите можат да бидат обучени напредни невронски мрежи
тенденции, како што се идната побарувачка на производи врз основа на
продажни промоции; мотори базирани на правила за
реагираат на збир дато на околности, на пример, дијагноза
медицински препораки и препораки за третман; или дури и едноставни агенти
со улога на известување за исклучоци на високи менаџери (врв
директори). Генерално овие процеси на екстракција податоци si
проверете во реално време; затоа, тие мора да бидат обединети
целосно со движењето на податоци стеси.
Обработка на онлајн аналитичка обработка
Онлајн аналитика
Способност за сечење, коцки, тркалање, дупчење
и извршете ја анализата
што-ако, е во опсегот, целта на пакетот
IBM технологија. На пример, функциите на аналитички третман
онлајн (OLAP) постојат за DB2 што носи димензионална анализа во
мотор на база на податоци исто.
Функциите додаваат димензионална корист на SQL додека
искористете ги сите придобивки од тоа да бидете природен дел од DB2. Друга
пример за OLAP интеграција е алатката за екстракција, DB2
Сервер за анализатор OLAP. Оваа технологија им овозможува на коцките на
DB2 OLAP серверот да биде брз и автоматски
анализирани за лоцирање и известување за вредностите на податоци необично или неочекувано
за сета коцка на аналитичарот за тргување. И конечно, функциите на
Центарот DW обезбедува средства за проверка на архитектите, меѓу другото
други работи, профилирајте ја коцката на серверот DB2 OLAP како дел
природата на ETL процесите.
Просторна анализа Просторна анализа
Просторот претставува половина од аналитичките сидра (проводници).
потребни за панорама
широко аналитичко (времето ја претставува другата половина). Атомското ниво
(атомско ниво ) на складиштето, претставено на слика 1.1,
ги вклучува основите и за времето и за просторот. Снимките
Анализа на сидро заснована на време за информации за времето и адресата
сидро анализа од вселената. Временски печати
спроведе анализа на време и адресира информации
просторна анализа. Дијаграмот покажува геокодирање-процес на
претворање на адреси во точки на карта или точки во просторот
така што концептите како растојание и внатре/надвор можат да бидат
се користи во анализата – спроведена на атомско ниво и просторна анализа
што му се става на располагање на аналитичарот. IBM обезбедува екстензии
простор, развиен со Институтот за истражување на системот за животна средина (ESRI),
al база на податоци DB2 така што просторните објекти можат да бидат
се чуваат како нормален дел од база на податоци релациски. db2
Просторни проширувачи, тие исто така ги обезбедуваат сите екстензии на SQL за
искористете ја предноста на просторната анализа. На пример, SQL екстензии од
прашање за
растојание помеѓу адресите или ако точката е внатре или надвор од област
дефинирани полигонални, се аналитички стандард со Просторниот
проширувачи. Видете поглавје 16 за повеќе информации.
База на податоци-Resident Tools Tools База на податоци-
Постојан
DB2 има многу функции за помош на SQL BI
во акцијата за анализа. Тие вклучуваат:
▪ Рекурзивни функции за извршување на анализа, како што се „најди
сите можни патеки за летање од Сан Франциско a Њујорк".
▪ Аналитички функции за рангирање, кумулативни функции, коцка
и собирање за да се олеснат задачите што вообичаено се случуваат
само со OLAP технологијата, сега се природен дел од
мотор на база на податоци
▪ Способност за креирање табели кои содржат резултати
Продавачите на база на податоци лидерите мешаат повеќе од БИ способности
во база на податоци стесо
Главните добавувачи на база на податоци се мешаат повеќе од
функционалноста на БИ во база на податоци стесо
Ова обезбедува најдобри перформанси и повеќе опции за извршување за les
БИ решенија.
Дискутирани се карактеристиките и функциите на DB2 V8
детално во следните поглавја:
Техничка архитектура и Основи за управување со податоци
(Поглавје 5)
▪ Основи на DB2 BI (Поглавје 6)
▪ DB2 материјализирани табели за барања (материјализирано барање
Табели) (Поглавје 7)
▪ Функции на DB2 OLAP (Поглавје 13)
▪ DB2 Enhanced BI карактеристики и функции (Enhanced BI
Карактеристики и функции) (Поглавје 15)
Поедноставен систем за испорака на податоци
Систем за испорака на податоци поедноставен
Архитектурата прикажана на Слика 1.1 вклучува неколку
структури податоци физички. Едниот е магацинот на податоци оперативни.
Општо земено, ODS е објектно ориентиран,
интегриран и актуелен. Дали би изградиле ODS за поддршка, на пр
на пример, канцеларијата за продажба. Продажбата на ODS би ја дополнила податоци
од многу различни системи, но само би задржале, на пр
на пример, денешните трансакции. ODS може да се ажурира
дури и неколку пати на ден. Во исто време, процесите
притисни i податоци интегрирани во други апликации. Овој објект е
специјално дизајнирани да се интегрираат податоци струјни и динамички д
би бил веројатен кандидат за поддршка на аналитика во реално време,
како да се обезбедат сервисни агенти клиенти информации за продажба
струи на клиентите со извлекување информации за продажните трендови
од самиот магацин. Друга структура прикажана на слика 1.1 е
формален статус за dw. Не само што е ова место за
извршувањето на потребната интеграција, квалитетот на податоциИ
на трансформацијата на податоци на акции доаѓаат, но тоа е исто така
сигурен и привремен простор за складирање за податоци го реплицираше тоа
може да се користи во аналитика во реално време. Ако одлучите да
користете ODS или област за поставување, една
од најдобрите алатки за населување на овие структури податоци користење
различни оперативни извори е хетерогено дистрибуирано барање на DB2.
Оваа способност се испорачува со опционалната карактеристика DB2
наречен DB2 Relational Connect (само прашања) и преку DB2
DataJoiner (посебен производ кој го доставува прашањето,
вметнувањето, ажурирањето и можноста за откажување a
хетерогено распределени RDBMS).
Оваа технологија им овозможува на архитектите да податоци да се врзуваат податоци di
производство со аналитички процеси. Не само што технологијата може
се приспособат на буквално секое од барањата за репликација кои
можеби ќе излезат со анализа во реално време, но тоа
тие исто така можат да се поврзат со широк спектар на бази податоци повеќе
популарни, вклучувајќи DB2, Oracle, Sybase, SQL Server,
Информикс и други. DB2 DataJoiner може да се користи за пополнување
структура податоци формални како ODS или дури и маса
постојано застапен во магацин наменет за реставрација
брзо на инстант ажурирања или на продажба. Нормално,
истите овие структури податоци може да се насели со користење
уште една важна технологија дизајнирана за репликација на податоци, IBM
DataPropagator Relational. (DataPropagator е посебен производ
за централни системи. Вклучуваат DB2 UNIX, Linux, Windows и OS/2
услуги за репликација на податоци како стандардна карактеристика).
Друг метод за движење податоци работат наоколу
на претпријатието е претпријатие апликација интегратор инаку
познат како посредник за пораки.Ова
Уникатната технологија овозможува ненадмината контрола да се центрира
(таргетирање) и се движи податоци околу компанијата. IBM го има брокерот
од најшироко користената порака, MQSeries или варијација
на производот кој ги вклучува барањата на е-трговија, IBM
WebSphere MQ.
За повеќе дискусија за тоа како да се искористи MQ за поддршка на a
магацин и околина на БИ, посетете веб-страница на книгата. Засега е
доволно е да се каже дека оваа технологија е одличен медиум за
фаќање и трансформирање (со користење на MQSeries Integrator) податоци
насочени оперативци регрутирани за решенија за БИ. Таму
MQ технологијата е интегрирана и спакувана во UDB V8, која
значи дека сега може да се управуваат редиците за пораки
како да се DB2 табели. Концептот на заварување на
редица пораки и универзумот на база на податоци релациски глави
кон моќна средина за испорака на податоци.
Нулта латентност Нулта латентност
Крајната стратешка цел за IBM е анализа на нулта латентност.
Како што е дефинирано од
Гартнер, системот на БИ мора да може да заклучи, асимилира
и да обезбеди информации за аналитичарите по барање. Предизвикот,
се разбира, тоа лежи во начинот на мешање податоци тековно и во реално време
со потребните историски информации, како што се з податоци поврзан модел/на
тенденција, или извлеченото разбирање, како разграничување на
клиентите.
Таквите информации вклучуваат, на пример, идентификација на клиенти ad
висок или низок ризик или кои производи i клиенти ќе купат многу
веројатно ако веќе имаат малку сирење во количките
аквизиции.
Добивањето нулта латентност всушност зависи од два
фундаментални механизми:
▪ Целосно спојување на податоци кои се анализирани со
воспоставени техники и со алатките развиени од БИ
▪ Систем за испорака на податоци ефикасно да се обезбеди тоа
анализата во реално време е всушност достапна
Овие предуслови за нулта латентност не се разликуваат од двата
цели утврдени од IBM и опишани погоре.
Тесната спојка на податоци е дел од програмата
беспрекорна интеграција организирана од IBM. И создадете систем
на испорака на податоци ефикасна е целосно зависна од
достапна технологија која го поедноставува процесот на испорака на
податоци. Како резултат на тоа, две од трите цели на IBM се критични
да го направи третиот. IBM свесно го развива своето
технологија за да се обезбеди нулта латентност е реалност за
магацински напори.
Резиме / Синтеза
Организацијата БИ обезбедува патоказ за
креирајте ја вашата околина
итеративно. Мора да се прилагоди за да ги одразува потребите на
вашиот бизнис, и сегашен и иден. Без архитектонска визија
широк, акции претставници се малку повеќе од
случајни имплементации на централно складиште кои не прават малку
создаде широко, информативно претпријатие.
Првата пречка за проект менаџерите е како да го оправдаат
инвестиции неопходни за развој на организацијата БИ.
Додека пресметката на рентабилноста остана главен за
магацински достигнувања, станува се потешко да се
предвиди точно. Ова доведе до други методи за
определување дали ја добивате вредноста на вашите пари. На
се набавува вредност на инвестицијата2 (VOI), на пример
како решение.
Тоа е обврска на архитектите на податоци и на проектните планери
намерно генерираат и обезбедуваат информации на здруженијата на
корисници, а не само да даваат sui услуга податоци. Има
огромна разлика помеѓу двете. Информацијата е нешто што некој го прави
разлика во процесите на одлучување и ефективноста; релативно, т.е
податоци тие се градежни блокови за изведување на тие информации.
Дури и ако е критичен кон изворот податоци да одговори на барањата
бизнис, околината на БИ треба да има поголема улога
во креирањето на информативна содржина. Мора да земеме
дополнителните мерки за чистење, интегрирање, трансформирање или
во спротивно креирајте информативна содржина според која на
корисниците можат да преземат акција и затоа треба да се погрижиме дека тие
активностите и тие одлуки, каде што е разумно, имаат повратни информации
во околината на БИ. Ако го префрлиме складот да служи само на податоци,
се уверува дека асоцијациите на корисници ќе ја креираат содржината
информации потребни за преземање акција. Ова осигурува дека нивните
заедницата ќе може да донесува подобри одлуки, но претпријатието
страда од недостаток на знаење што го користеле.
Дато дека архитектите и планерите на проекти иницираат проекти
специфични за околината на БИ, тие остануваат одговорни пред претпријатието
во голема мера. Едноставен пример за оваа функција за двајца
лицата на повторувањата на БИ се наоѓаат во изворот податоци. Сите
податоци добиени за конкретни комерцијални барања мора да бидат
населени во првиот атомски слој. Ова обезбедува развој на
корпоративни информации средства, како и управување, рута на
специфични кориснички барања дефинирани во итерацијата.

W hatisa D ata W магацин ?
Складиште на податоци тоа е срцето на архитектурата на информациските системи
од 1990 година и ги поддржува информациските процеси нудејќи солидна
интегрирана платформа на податоци историски земен како основа за подоцна
анализи. НА складиште на податоци нудат леснотија на интеграција во a
свет на некомпатибилни апликациски системи. Датум
магацинот еволуираше во мода. Складиште на податоци
организирајте и складирајте i податоци неопходни за информациски процеси д
аналитички врз основа на долга историска временска перспектива. Сите
ова вклучува значителен и постојан напор во изградбата и
во одржувањето на складиште на податоци.
Значи, што е а складиште на податоци? А складиште на податоци и:
▪ ориентиран кон предмет
▪ интегриран систем
▪ временска варијација
▪ неиспарлив (не се откажува)
збирка на податоци се користи за поддршка на менаџерските одлуки во
спроведување на процесите.
I податоци вметната во складиште на податоци се јавуваат во повеќето од
случаи од оперативни средини. На складиште на податоци е направен од еден
единица за складирање, физички одвоена од остатокот од
систем, кој содржи податоци претходно обработени од
апликации кои работат на информации кои произлегуваат од околината
оперативни.
Буквалната дефиниција на а складиште на податоци заслужува темелна истрага
објаснување бидејќи постојат важни мотивации и значења на
фонд кој ги опишува карактеристиките на еден магацин.
ОРИЕНТАЦИЈА НА ПРЕДМЕТ
ТЕМАТСКИ
Првата карактеристика на а складиште на податоци е дека е насочена кон
главните играчи во една компанија. Водичот на процесите низ
податоци тоа е во контраст со покласичниот метод кој предвидува
ориентацијата на апликациите кон процеси и функции,
метод кој најчесто го споделуваат повеќето
постари системи за насочување.
Оперативниот свет е дизајниран околу апликации и функции
како што се заеми, заштеди, банкарски картички и доверба за институција
финансиски. Светот на dw е организиран околу теми
како што се купувачот, продавачот, производот и активноста.
Порамнувањето околу темите влијае на дизајнот и
на изработка на податоци пронајден во dw. Најзначајно,
главната тема влијае на најважниот дел од
клучна структура.
Светот на апликацијата е под влијание и на дизајнот на податоците
основа отколку од дизајнот на процесот. Светот на
dw е фокусиран исклучиво на видео моделирање податоци Тоа е на
цртање на база на податоци. Дизајнот на процесот (во неговата форма
класичен) не е дел од околината dw.
Разликите помеѓу изборот на процес/функција апликација и
избор за предмет се откриваат и како разлики во содржината
на податоци на детално ниво. НА податоци del dw не вклучува i податоци дека
тие нема да се користат за процесот на DSS, додека апликациите
оперативно ориентирани податоци содржат i податоци да задоволи
веднаш функционалните/преработувачките барања кои можат да о
барем има некаква употреба за DSS аналитичар.
Друг важен начин на кој оперативно ориентирани апликации
ai податоци се разликуваат од податоци на dw е во извештаите на податоци. На податоци
оперативците одржуваат постојана врска помеѓу две или повеќе табели
врз основа на деловно правило кое е активно. НА податоци од dw
тие опфаќаат спектар на време и соодносите што се наоѓаат во dw се
многу. Многу трговски правила (и соодветно, многу
извештаи за податоци ) се застапени во залиха на податоци помеѓу две или
повеќе табели.
(За детално објаснување за тоа како односите помеѓу податоци се
управувана во ДВ, за тоа се повикуваме на Техничката тема
прашање.)
Од ниедна друга перспектива освен онаа на разликата
фундаментално помеѓу изборот на функционална/процес и примена
избор на предмет, има поголема разлика помеѓу системите
оперативни и податоци и ДВ.
ИНТЕГРАЦИЈА ИНТЕГРАЦИЈА
Најважниот аспект на dw околината е тоа што i податоци пронајден
во рамките на dw тие лесно се интегрираат. СЕКОГАШ. БЕЗ
ИСКЛУЧОКИ. Самата суштина на dw околината е дека i податоци
содржани во границите на складот се интегрирани.
Интеграцијата се открива на многу различни начини – во конвенции
идентификувани конзистентни, до степен на конзистентни варијабли, во
конзистентни кодифицирани структури, во физичките атрибути на податоци
конзистентна, и така натаму.
Со текот на годините, дизајнерите на неколку апликации го направија тоа
поседување на многу одлуки за тоа како една апликација треба
бидат развиени. Стилски и индивидуализирани одлуки за дизајн
од апликациите на дизајнерите се откриваат на сто начини: во
разлики во кодирањето, клучна структура, физички карактеристики,
конвенции за идентификација и така натаму. Колективниот капацитет на многумина
дизајнерите на апликации да создадат неконзистентни апликации
тоа е легендарно. Слика 3 изложува некои од повеќе разлики
важно во начинот на кој се дизајнирани апликациите.
Кодирање: Кодирај:
Дизајнерите на апликации избраа кодирање на терен -
секс- на различни начини. Дизајнер го претставува сексот како
„m“ и „f“. Друг дизајнер го претставува полот како „1“
и „0“. Друг дизајнер го претставува полот како „х“ и
"y". Друг дизајнер го претставува полот како „машки“ и
„женски“. Навистина не е важно како сексот ќе влезе во ДВ. Нив"
и „F“ веројатно се добри како сите
застапеност.
Она што е важно е дека од кое било потекло сексуалното поле потекнува,
тоа поле пристигнува во DW во конзистентна интегрирана состојба. Од
последица кога полето се вчитува во DW од
апликација каде што е сфатена во формат
„М“ и „Ф“, т.е податоци мора да се конвертира во формат DW.
Мерење на атрибути: Мерење на
Атрибути:
Дизајнерите на апликации избраа да го измерат гасоводот во
различни начини во текот на курсот
Некои години. Дизајнер складира i податоци на гасоводот во
сантиметри. Друг дизајнер на апликации ги складира податоци
на цевководот во однос на инчи. Друг дизајнер на
продавници за апликации i податоци на гасоводот во милиони кубни стапки
во секунда. И друг дизајнер ги складира информациите за
цевковод во однос на дворови. Без оглед на изворот, кога
информациите за гасоводот пристигнуваат во ДВ тие мора да бидат
се мери на ист начин.
Според укажувањата на слика 3 прашањата за интеграција
тие влијаат на речиси секој аспект од дизајнот - карактеристиките
физички богови податоци, дилемата да се има повеќе од еден извор на податоци, на
прашање на неконзистентни идентификувани примероци, формати на податоци
неконзистентни, и така натаму.
Без оглед на аргументот на дизајнот, резултатот е ист -
i податоци мора да се складира во DW во еднина e
глобално прифатлив начин дури и кога оперативните системи на
фонд продавница поинаку i податоци.
Кога аналитичарот на DSS гледа во DW, леќата на аналитичарот
треба да биде експлоатација на податоци кои се во магацинот,
наместо да се прашувам за кредибилитетот или доследноста на
податоци.
ВРЕМЕНСКА ВАРИЈАНЦИЈА
Сите податоци во ДВ тие се точни до одреден момент во времето.
Оваа основна карактеристика на податоци во ДВ е многу различно од податоци
пронајдени во работната средина. НА податоци на работната средина се
точни како во моментот на пристапот. Со други зборови,
во работната средина при пристап до единица податоци, има да
почекајте да ги одрази точните вредности како во моментот на пристапот.
Зошто јас податоци во ДВ се точни како некогаш во
време (т.е. не „во моментов“), т.е податоци најдена во ДВ
тие се „временска варијанса“.
Временската варијанса на податоци ДВ се споменува на многу начини.
Наједноставниот начин е дека јас податоци на DW претставуваат податоци тоа е
долг временски хоризонт – пет до десет години. Хоризонтот
времето претставено за оперативната средина е многу пократко
▪ од денешните сегашни вредности до шеесет деведесет
Апликации кои треба да работат добро и треба да бидат
достапни за обработка на трансакции мора да донесе на
минимална количина на податоци доколку признаат каков било степен на
флексибилност. Значи, оперативните апликации имаат хоризонт
кратка временска рамка, како дизајнерски аргумент на
звучни апликации.
Вториот начин на кој „временска варијанса“ се појавува во DW е во
клучна структура. Секоја клучна структура во DW содржи,
имплицитно или експлицитно, временски елемент, како на пр
ден, недела, месец итн. Елементот на време е скоро секогаш
на дното на споениот клуч што се наоѓа во DW. Во овие
прилики, елементот време ќе постои имплицитно, како што е случајноста
каде што цела датотека се дуплира на крајот на месецот или кварталот.
Третиот начин на кој се прикажува временската варијанса е дека i податоци del
DW, само правилно регистриран, не може да биде
ажурирани. НА податоци на ДВ се, за сите практични цели, долги
серија на снимки (слика). Се разбира, ако снимките е
се направени погрешно, тогаш снимките може да бидат
изменета. Но, под претпоставка дека снимките се направени
правилно, не се менуваат штом се направат. Во некои
случаи може да биде неетички или дури и невалидно тоа што снимките во
DW се изменети. НА податоци оперативен, точен како во
моментот на пристап, тие можат да се ажурираат како што изгледа
потребата.
НЕ СТАРЛИВИ
Четвртата важна карактеристика на DW е тоа што не е испарлива.
Направени се ажурирања, вметнувања, бришења и промени
редовно за оперативни средини рекорд по рекорд. Но
основна манипулација со податоци потребни во ДВ е многу повеќе
едноставно. Постојат само два вида на операции кои се случуваат во
DW – првичното вчитување на податоци и пристап до податоци. Нема
нема ажурирање на податоци (во општа смисла на
ажурирање) во DW како нормална операција за обработка.
Има некои многу моќни последици од оваа разлика
основа помеѓу оперативната обработка и DW обработката. На ниво
по дизајн, потребата да се биде внимателен при надградбата
ненормално не е фактор во DW, бидејќи ажурирањето на податоци не е
спроведена. Ова значи дека на физичко ниво на дизајн,
може да се преземат слободи за да се оптимизира пристапот до податоци,
особено во справувањето со темите на стандардизација и на
физичка денормализација. Друга последица на едноставноста
од работењето на ДВ е во основната технологија што се користи за
стартувајте ја околината DW. Мора да поддржува ажурирања
запис по запис во линија (како што е често случај со
оперативна обработка) се бара технологијата да има некои
многу сложени основи под привидна едноставност.
Технологијата која поддржува резервна копија и обновување, трансакции
и интегритетот на податоци а откривањето и лек за застојот е
доста сложени и не се неопходни за DW обработка.
Карактеристики на DW, дизајнерска ориентација,
интеграција на податоци во рамките на DW, временска варијанса и едноставност
на управување со податоци, сè води кон средина која е многу, многу
различна од класичната работна средина. Изворот на речиси сите
податоци на DW се оперативната средина. Примамливо е да се размислува
дека има масовен вишок на податоци помеѓу двете средини.
Всушност, првиот впечаток што го имаат многу луѓе е оној на
голем вишок на податоци помеѓу работната средина и околината на
DW продолжување. Таквото толкување е површно и докажува а
недостаток на разбирање што се случува во ДВ.
Навистина има минимум вишок податоци помеѓу работната средина
ед јас податоци на ДВ. Го разгледуваме следново:
▪ Јас податоци тие се филтрираат дато дека поминувате од оперативната средина
кон околината на DW. Многумина податоци тие никогаш не се онесвестуваат
од работната средина. Само што јас податоци кои се потребни за
Обработката на DSS ја наоѓа својата насока во околината
▪ временскиот хоризонт на податоци многу се разликува од околината
на другиот. НА податоци во работната средина тие се многу свежи. НА податоци
во ДВ се многу постари. Само од перспектива
од временскиот хоризонт, има многу мало преклопување
помеѓу работната средина и DW.
▪ ДВ содржи податоци резиме што никогаш не се пронајдени
во околината
▪ Јас податоци подлежат на фундаментална трансформација бидејќи
моментот кога ќе преминат на Слика 3 илустрира дека најмногу
дел од податоци се значително изменети под услов
да бидат избрани и преместени во DW. Со други зборови, на
повеќето податоци е физички модифициран д
радикално како што се преместува во ДВ. Од гледна точка
на интеграција не се исти податоци кои престојуваат
во работната средина.
Со оглед на овие фактори, вишокот на податоци помеѓу двете средини е
ретка појава, што доведува до помалку од 1% вишок помеѓу двете
средини.
СТРУКТУРАТА НА МАГАЦИН
DWs имаат посебна структура. Постојат различни нивоа на резиме и на
детал што ги разграничува DWs.
Различните компоненти на DW се:
▪ Метаподатоци
▪ Дати тековни детали
▪ Дати со стари детали
▪ Дати малку сумирано
▪ Дати високо сумирани
Убедливо главната грижа е за и податоци на детали
струи. Тоа е примарна грижа бидејќи:
▪ Јас податоци тековните детали ги одразуваат најновите настани,
кои секогаш се од голем интерес и
▪ јас податоци тековните детали се обемни затоа што е
складирани на најниско ниво на грануларност e
▪ јас податоци тековните детали се скоро секогаш зачувани на
меморија на дискот, која е брза за пристап, но скапа и
комплекс од
I податоци на детали се постари податоци кои се чуваат на
некое сеќавање на маса. Има пристап спорадично и тоа е
складирани на ниво на детали компатибилно со податоци детално
струи. Иако не е задолжително да се чува на медиум од
алтернативна меморија, поради големиот волумен на податоци обединети со
спорадичен пристап на податоци, медиумот за складирање за податоци di
постарите детали обично не се складираат на дискот.
I податоци лесно сумирани тие се податоци кои се дестилираат на дното
ниво на детали пронајдено на сегашното ниво на детали. Ова
Нивото на DW е скоро секогаш зачувано во меморијата на дискот. НА
проблеми на дизајнот кои се претставуваат пред архитектот на податоци
во изградбата на ова ниво на ДВ се:
▪ Која единица време е сумирањето направено погоре
▪ Која содржина, атрибутите малку ќе ги сумираат
содржината на податоци
Следното ниво на податоци најдена во ДВ е онаа на податоци високо
сумирани. НА податоци високо сумирани се компактни и лесно
достапни. НА податоци понекогаш се среќаваат високо сумирани
во околината на DW и во други случаи i податоци високо сумирани тие се
пронајдени надвор од непосредните ѕидови на технологијата во која се сместени DW.
(во секој случај, т.е податоци високо сумирани се дел од ДВ
без разлика каде јас податоци се физички сместени).
Последната компонента на DW е компонентата на метаподатоци. Во многу аспекти
метаподатоците се наоѓаат во различна димензија од другите податоци
на ДВ, бидејќи метаподатоците не содржат никакви дато директно
преземени од работната средина. Метаподатоците имаат посебна улога д
многу важно во ДВ. Метаподатоците се користат како:
▪ именик кој ќе му помогне на аналитичарот DSS да го лоцира
Содржина на DW,
▪ водич за мапирање на податоци за тоа како јас податоци беа
трансформирано од опкружување за работа во околина на DW,
▪ водич за алгоритмите што се користат за сумирање помеѓу i податоци di
тековен детал ei податоци малку сумирано, т.е податоци високо
сумирано,
Метаподатоците играат многу поголема улога во околината на DW
во споредба со она што некогаш го имале во оперативното опкружување
МЕДИУМ ЗА СКЛАДИРАЊЕ СТАРИ ДЕТАЛИ
За складирање на таков вид може да се користи магнетна лента
податоци. Навистина има широк спектар на медиуми за складирање кои
треба да се земе предвид за зачувување на старите податоци di
детали
Во зависност од обемот на податоци, фреквенција на пристап, цена
од алатките и видот на пристапот, тоа е сосема веројатно
дека на другите алатки ќе им треба старото ниво на детали
во ДВ.
ТЕКОТ НА ПОДАТОЦИ
Постои нормален и предвидлив тек на податоци во рамките на ДВ.
I податоци тие влегуваат во DW од работната средина. (ЗАБЕЛЕШКА: има
некои многу интересни исклучоци од ова правило. Сепак, речиси
Сите податоци внесете го DW од работната средина). Дато тоа јас податоци
тие влегуваат во DW од работната средина, се трансформира како што беше
опишано претходно. Под услов да внесете DW, т.е податоци тие влегуваат во
сегашното ниво на детали, како што е прикажано. Таму престојува и се користи
додека не се случи еден од трите настани:
▪ се прочистува,
▪ е сумиран и/или
▪ е
Застарениот процес во DW се движи i податоци тековни детали
a податоци на детали стари, според возраст од податоци. Процесот
сумирањето користи детали за податоци да се пресмета на податоци
малку сумирани и високо сумирани нивоа на податоци. Има
некои исклучоци од прикажаниот тек (ќе се дискутира подоцна).
Меѓутоа, обично, за огромното мнозинство на податоци пронајден
во рамките на DW, протокот на податоци тоа е како што е претставено.
КОРИСТЕЊЕ НА СПОРЕДОТ НА ПОДАТОЦИ
Не е изненадувачки различните нивоа на податоци во рамките на ДВ не
добиваат различни нивоа на употреба. Како по правило, колку е повисоко нивото на
сумирање, плус i податоци тие се користат.
Многу употреби се случуваат во податоци високо сумирани, додека стариот
податоци на детали речиси никогаш не се користат. Има добра причина во
преместете ја организацијата кон парадигмата за искористување на ресурсите. Повеќе има
резиме i податоци, толку побрзо и поефикасно се доаѓа до него податоци. погледнете
un продавница најдете дека врши обработка на многу детали на ниво на DW,
потоа соодветно големо количество машински ресурси
се консумира. Во најдобар интерес на сите е да се оди на судење
како во високо ниво на сумирање што е можно поскоро.
За многу продавници, аналитичарот на DSS во пред-DW средина користел
податоци на ниво на детали. Во многу аспекти пристигнувањето во податоци детално
личи на сигурносно ќебе, дури и кога се достапни
други нивоа на сумирање. Една од активностите на архитектот на податоци è
одвикнете го корисникот на DSS од постојана употреба на податоци на плус ниво
ниски детали. Достапни се две причини
на архитектот на податоци:
▪ инсталирање на систем за поврат на наплата, каде што крајниот корисник плаќа
потрошени ресурси д
▪ што укажува дека може да биде многу добро време на одговор
добиени кога однесувањето со и податоци тоа е на висок стандард
на сумирање, додека слабото време на одговор доаѓа од
однесување на податоци на ниско ниво на
ДРУГИ ПОГЛАВИ
Постојат неколку други размислувања за изградба и управување
ДВ
Првото разгледување е она на индексите. НА податоци на највисоките нивоа на
сумирањето може слободно да се индексира, додека i податоци
на пониски нивоа на детали тие се толку гломазни што може да бидат
умерено индексирани. Од истиот принцип, т.е податоци на високите нивоа на
деталите може релативно лесно да се обноват,
додека обемот на податоци на пониските нивоа е толку голем што и податоци не
тие можат лесно да се обноват. Следствено, моделот
на податоци и формалната работа направена од страна на дизајнот претставува на
основа за ДВ се применува речиси исклучиво на ниво
детална струја. Со други зборови, активностите за моделирање на
податоци тие не се однесуваат на нивоата на сумирање, речиси во секој случај.
Друго структурно разгледување е она на подподелбата на
податоци од ДВ.
Поделбата може да се направи на две нивоа – на ниво на dbms и ал
ниво на апликација. Во поделбата на ниво dbms, На dbms è
информирани за поделбите и соодветно ги контролира. Во случајот на
поделба на ниво на апликација, само програмерот е
информирани за поделбите и одговорноста на нив
администрацијата му е препуштена
Под нивото dbms, многу работа се врши автоматски. Ете го
многу нефлексибилност поврзана со автоматската администрација на
поделби. Во случај на примена на ниво на поделба на податоци del
складиште на податоци, многу работа паѓа на програмерот, но на
крајниот резултат е флексибилност во администрацијата на податоци во датумот
магацин
ДРУГИ АНОМАЛИИ
Додека компонентите на складиште на податоци тие работат како што е опишано
за речиси сите податоци, постојат некои корисни исклучоци кои мора
да се дискутира. Исклучок е оној на податоци јавни резимеа
(јавни збирни податоци). Овие се податоци резимеа кои биле
пресметано од складиште на податоци но тие се користат од општеството. НА податоци
јавните резимеа се чуваат и управуваат во складиште на податоци,
иако како што е споменато погоре тие се сфатени. НА
сметководителите работат на производство на такви квартални податоци како
приходи, квартални расходи, квартален профит итн. Работата
направено од сметководители е надворешно на складиште на податоци. Сепак, јас податоци се
се користи „внатрешно“ во рамките на компанијата – од маркетинг, продажба, итн.
Друга аномалија, за која нема да се дискутира, е онаа на податоци надворешни
Друг извонреден тип на податоци што може да се најде во податок
складиштето е складиште со постојани детали. Овие предизвикуваат
треба трајно да се складира i податоци на едно ниво
детално од етички или правни причини. Ако некоја компанија прикажува i
поврзани работници со опасните материи има потреба од податоци
детални и трајни. Доколку една компанија произведува производ кој
вклучува јавна безбедност, какви делови од авион има
потребата да се податоци постојан детален, како и ако фирма
направи опасни договори.
Компанијата не може да си дозволи да ги превиди одредените причини
во текот на следните неколку години, во случај на тужба, отповикување, а
оспорен градежен дефект и сл. изложеност на компанијата
може да биде голема. Како резултат на тоа постои единствен тип на податоци
познат како трајни податоци за детали.
РЕЗИМЕ
Un складиште на податоци тоа е објектно ориентирана, интегрирана, варијанта на
време, збирка на податоци неиспарливи во поддршка на потребите на
управна одлука. Секоја од истакнатите карактеристики на
un складиште на податоци има свои импликации. Плус има четири
нивоа на податоци del складиште на податоци:
▪ Стари детали
▪ Тековни детали
▪ Дати малку сумирано
▪ Дати високо сумирани
Метаподатоците се исто така важен дел од складиште на податоци.
АПСТРАКТ
Концептот на складирање на податоци неодамна примено
многу внимание и стана тренд на 90-тите.Т.е
поради способноста на а складиште на податоци да се надмине
ограничувања на системите за поддршка на управувањето како што се i
системи за поддршка на одлуки (DSS) и информациски системи
директори (EIS).
Иако концептот на складиште на податоци изгледа ветувачки,
спроведување i складиште на податоци може да биде проблематично бидејќи
на процесите на складирање од големи размери. И покрај тоа
комплексноста на проектите за складирање податоци, многу добавувачи
и консултанти кои акции податоци тие го тврдат тоа
складирањето на податоци не претставува проблем.
Сепак, на почетокот на овој истражувачки проект, речиси ниту еден
беше спроведено независно, ригорозно и систематско истражување. Од
Следствено, тешко е да се каже што всушност се случува
во индустријата кога градат складиште на податоци.
Оваа студија ја истражуваше практиката на складирање на податоци
современици што има за цел да развие побогато разбирање
на австралиската практика. Прегледот на литературата го обезбеди
контекст и основа за емпириско проучување.
Постојат голем број на резултати од ова истражување. Прво
место, оваа студија ги откри активностите што се случија
во текот на развојот на складиште на податоци. Во многу области, т.е податоци се собраа
ја потврди практиката објавена во литературата. Второ
сајт, прашања и проблеми кои можат да влијаат на
развој на складиште на податоци беа идентификувани со оваа студија.
Конечно, придобивките добиени од австралиските организации поврзани со
употребата на складиште на податоци се откриени.
Поглавје 1
Истражувачки контекст
Концептот на складирање податоци доби широко распространето признание
изложеност и се претвори во нов тренд во
90-ти (McFadden 1996, TDWI 1996, Shah and Milstein 1997,
Шенкс и сор. 1997, Екерсон 1998, Аделман и Оутс 2000). Тоа е
може да се види од се поголемиот број написи за податоците
складирање во трговски публикации (Little и Gibson 1999).
Многу статии (види, на пример, Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett and King 1996, Graham et al. 1996 година,
Сакагучи и Фролик 1996 година, Алварез 1997 година, Брусел 1997 година, Кларк
1997, McCarthy 1997, O' Donnell 1997, Edwards 1998, TDWI
1999) објавија значителни придобивки кои произлегуваат од организациите
кои спроведуваат i складиште на податоци. Тие ја поддржаа нивната теорија
со анегдотски докази за успешни имплементации, високиот принос
за бројките за инвестиции (ROI) и, исто така, обезбедување насоки
референца или методологии за развој на складиште на податоци
(Шенкс и сор. 1997, Седон и Бенџамин 1998, Литл и Гибсон
1999). Во екстремен случај, Греам и сор. (1996) имаат
пријави просечен принос на тригодишна инвестиција од 401%.
Сепак, голем дел од актуелната литература го занемари
комплексноста вклучени во преземањето на вакви проекти. Проектите на
складиште на податоци тие се вообичаено сложени и големи и
затоа тие подразбираат голема веројатност за неуспех ако не се
внимателно контролирани (Шах и Милштајн 1997, Екерсон 1997,
Фоли 1997б, Цимер 1997, Борт 1998, Гибс и Клајмер 1998, Рао
1998). Тие бараат огромни количини и човечки и ресурси
Финансиски и, време и напор да ги изградат (Хил 1998, Крофтс 1998). На
типично време и потребните финансиски средства се соодветно
околу две години и два или три милиони долари (Braly 1995, Foley
1997б, Борт 1998, Хамфрис и сор. 1999). Овие времиња и средства
од финансиските институции се бара да контролираат и консолидираат многу аспекти
разлики во складирањето податоци (Cafasso 1995, Hill 1998). На страна
на хардверски и софтверски размислувања, други функции, кои се разликуваат
од екстракција на податоци на процесите на вчитување на податоци, Од
капацитет на меморија за управување со ажурирања и мета податоци податоци
за обука на корисниците, мора да се земе предвид.
Во времето кога започна овој истражувачки проект, имаше многу малку
академско истражување спроведено во областа на складирање податоци,
особено во Австралија. Ова беше очигледно од недостатокот на предмети
објавени на складирање на податоци од весници или други списи
академици од тоа време. Многу од академските списи
достапни го опишаа американското искуство. Недостатокот на
академски истражувања во областа SL складирање на податоци предизвика на
повик за ригорозни истражувања и емпириски студии (McFadden 1996,
Шенкс и сор. 1997, Литл и Гибсон 1999). Конкретно, студиите
на истражување за процесот на имплементација на складиште на податоци
треба да се спроведат за да се прошири знаењето
општи во врска со спроведувањето на складиште на податоци e
ќе послужи како основа за идна истражувачка студија (Шенкс ед
други. 1997, Литл и Гибсон 1999).
Затоа, целта на оваа студија е да проучи што всушност
Тоа се случува кога организациите одржуваат и користат податоци
магацин во Австралија. Поточно, оваа студија ќе вклучи
анализа на цел развоен процес на а складиште на податоци,
почнувајќи од иницирање и планирање преку дизајнирање и
имплементација и последователна употреба во рамките на организациите
австралиски. Покрај тоа, студијата исто така ќе придонесе за тековната практика
идентификување области каде што практиката може дополнително да се развива
подобрени и неефикасностите и ризиците може да се минимизираат или
избегнувајте. Понатаму, ќе послужи како основа за други студии за складиште на податоци in
Австралија и ќе го пополнат јазот што моментно постои во литературата.
Истражувачки прашања
Целта на ова истражување е да ги проучи вклучените активности
во спроведувањето на складиште на податоци и нивната употреба од
австралиски организации. Конкретно, елементите се изучуваат
Во врска со планирањето на проектот, развојот,
работење, употреба и вклучени ризици. Значи прашањето
од ова истражување е:
„Каква е досегашната практика складиште на податоци во Австралија?"
За ефикасно да се одговори на овој проблем, а
одреден број на помошни истражувачки прашања. Поточно, три
идентификувани се подпрашања од литературата, што е
претставено во поглавје 2, за да го води овој истражувачки проект:
Како се спроведуваат i складиште на податоци од страна на организациите
Австралијанец? Со какви проблеми наидовте?
Кои се искусните придобивки?
При одговарањето на овие прашања, користен е цртеж
истражувачко истражување кое користи анкета. Како учам
истражувачки, одговорите на горенаведените прашања не се целосни
(Шенкс и сор. 1993, Денскомб 1998). Во овој случај, тоа е
потребна е триангулација за да се подобрат одговорите на овие
барања. Сепак, истрагата ќе обезбеди цврста основа за
идната работа што ги испитува овие прашања. Детален
дискусија за оправдување и дизајн на методот на истражување
е претставено во поглавје 3.
Структура на истражувачкиот проект
Овој истражувачки проект е поделен на два дела: контекстуална студија
на концептот на складирање на податоци и емпириско истражување (види
слика 1.1), од кои секоја е дискутирана подолу.
I дел: Контекстуална студија
Првиот дел од истражувањето се состоеше во преиспитување на
актуелна литература за различни видови складирање на податоци, вклучувајќи i
системи за поддршка на одлуки (DSS), информациски системи
извршен (EIS), студиите на случај на складиште на податоци и концептите на датум
магацин. Понатаму, резултатите од форумите складиште на податоци и богови
групи за состаноци за експерти и професионалци што ги спроведува групата на
Истражувањето на Monash DSS, придонесе за оваа фаза од студијата
кој беше наменет за добивање информации за практикувањето на податоците
магацин и да се идентификуваат ризиците кои се вклучени во нивното усвојување.
Во овој период на контекстуално проучување, разбирање
на проблематичната област е воспоставена за да се обезбеди знаење за
основа за последователни емпириски испитувања. Сепак, ова
тоа беше тековен процес додека се одвиваше студијата
Истражување.
Дел II: Емпириско истражување
Релативно новиот концепт на складирање на податоци, пр
во Австралија, создаде потреба да се спроведе истрага за
добијте широка слика за искуството на користење. Ова
дел беше извршен откако доменот на проблемот беше
е воспоставена преку обемен преглед на литература. Концепт
на складирање на податоци формирана во фазата на контекстуална студија е
беше искористен како влез за почетниот прашалник на оваа студија.
По ова, прашалникот беше испитан. Вие сте експерти за состаноци
магацин учествуваше во тестот. Целта на тестот
Почетниот прашалник требаше да се провери за комплетност и точност
некои прашања. Врз основа на резултатите од тестот, прашалникот е
е изменета и изменетата верзија е испратена до
учесниците во анкетата. Прашалниците вратени тогаш беа
анализирани за и податоци во табели, дијаграми и други формати. НА
резултатите од анализата на податоци формираат инстант фотографија на
пракса за складирање податоци во Австралија.
ПРЕГЛЕД НА СКЛАДИРАЊЕ НА ПОДАТОЦИ
Концептот на складирање податоци еволуираше со подобрувања
на компјутерската технологија.
Таа е насочена кон надминување на проблемите со кои се соочуваат групи на
поддршка за апликации како што е систем за поддршка на одлуки (DSS) д
Извршен информациски систем (EIS).
Во минатото главната пречка на овие апликации беше
неможноста на овие апликации да обезбедат a база на податоци
неопходни за анализа.
Ова главно е предизвикано од природата на работата
управување. Интересите на раководството на компанијата варираат
постојано во зависност од третираната област. Затоа јас податоци
основните за овие апликации мора да бидат способни да
брзо се менуваат во зависност од делот што треба да се третира.
Ова значи дека јас податоци мора да бидат достапни во форма
адекватни за потребните анализи. Всушност, групите за поддршка на
на апликациите им беше многу тешко во минатото да соберат ед
да се интегрира податоци од сложени и разновидни извори.
Остатокот од овој дел претставува преглед на концептот
складирање на податоци и се занимава со тоа како на складиште на податоци може да го надмине
Проблеми со групата за поддршка на апликации.
Терминот „Складиште на податоци“ беше издаден од Вилијам Инмон во 1990 година.
Неговата често цитирана дефиниција го гледа Складиште на податоци како
собирање на податоци субјектно ориентирана, интегрирана, нестабилна и променлива
со текот на времето, како поддршка на одлуките на раководството.
Користејќи ја оваа дефиниција, Инмон нагласува дека т.е податоци жители
во складиште на податоци мора да ги поседува следните 4
карактеристики:
▪ Субјектно ориентирано
▪ Интегриран
▪ Неиспарливи
▪ Променлива со текот на времето
Под субјектно ориентиран Инмон значи дека т.е податоци во датумот
магацин во најголемите организациски области кои биле
дефинирани во моделот податоци. На пример сите податоци во врска со и клиенти
се содржани во предметната област КОРИСНИЦИ. Исто и сите
податоци кои се однесуваат на производите се содржани во предметната област
ПРОИЗВОДИ.
Под Интегриран Инмон значи дека i податоци кои доаѓаат од различни
се комбинираат и складираат платформи, системи и локации
едно место. Последователно податоци слично мора да се трансформира
во конзистентни формати за да можат да се додаваат и споредуваат
лесно.
На пример, машкиот и женскиот пол се претставени
со буквите M и F во еден систем, а со 1 и 0 во друг. За
да ги интегрираат на вистински начин, мора еден или двата формати
да се трансформираат така што двата формати се исти. Во ова
во случај би можеле да го смениме M во 1 и F во 0 или обратно. Ориентирана кон
предмет и Интегриран укажуваат дека на складиште на податоци тој е дизајниран за
обезбедуваат функционална и трансверзална визија на податоци настрана
на компанијата.
Под Non-volatile тој мисли дека i податоци во складиште на податоци остануваат
доследно и ажурирање на податоци не е потребно. Наместо тоа, секој
промена во податоци оригиналите се додаваат на база на податоци на датумот
магацин. Тоа значи дека историскиот деи податоци е содржан во
складиште на податоци.
За променливи со време Инмон покажува дека i податоци во складиште на податоци
секогаш содржи индикатори за време на ei податоци нормално
премине одреден временски хоризонт. На пример а
складиште на податоци може да содржи 5 години историски вредности на клиенти Dal
1993 до 1997. Достапноста на историјата и временската серија
на податоци ви овозможува да ги анализирате трендовите.
Un складиште на податоци може да си ги собере своите податоци од системите
OLTP;од потекло податоци надвор од организацијата и/или од други специјалисти
фаќање системски проекти податоци.
I податоци екстрактите можат да поминат низ процес на чистење, во
овој случај јас податоци тие се трансформираат и интегрираат пред да бидат
складирани во база на податоци del складиште на податоци. Тогаш јас податоци
жителите во рамките на база на податоци del складиште на податоци се ставаат на располагање
до алатките за пристап и обновување на крајниот корисник. Користење на
овие алатки крајниот корисник може да пристапи до интегрираниот приказ
на организацијата на податоци.
I податоци жителите во рамките на база на податоци del складиште на податоци се
складирани и во детали и во формати на резиме.
Нивото на резиме може да зависи од природата на податоци. На податоци
детално може да се состои од податоци струја д податоци историчари
I податоци авторските права не се вклучени во складиште на податоци додека јас податоци
во складиште на податоци се ажурираат.
Покрај складирањето на i податоци самите себе, а складиште на податоци пуò анче
складирајте различен тип на дато наречен МЕТА ПОДАТОЦИ кои
опишете i податоци жителите во неговиот база на податоци.
Постојат два вида метаподатоци: развојни метаподатоци и развојни метаподатоци
анализи.
Развојните метаподатоци се користат за управување и автоматизирање на
процеси на екстракција, чистење, мапирање и вчитување податоци во
складиште на податоци.
Информациите содржани во метаподатоците за развој може да содржат
детали за оперативните системи, детали за елементите што треба да се извлечат, на
модел податоци del складиште на податоци и правилата на компанијата за
пренамена на податоци.
Вториот тип на метаподатоци, познат како аналитички метаподатоци
му овозможува на крајниот корисник да ја истражува содржината на податоците
магацин за да го пронајдете податоци достапни и што значат во смисла
јасни и нетехнички.
Затоа, аналитичките метаподатоци функционираат како мост помеѓу податоците
магацин и апликации за крајни корисници. Овие метаподатоци може
содржи бизнис модел, описи на податоци дописници
на бизнис моделот, однапред дефинирани прашања и извештаи,
информации за најавувања на корисници и индекс.
Метаподатоците за анализа и развој мора да се комбинираат во едно
интегриран метаподатоци за да функционира правилно.
За жал, многу од постоечките алатки имаат свои
метаподатоци и во моментов нема постоечки стандарди кои
им овозможи на алатките за складирање податоци да ги интегрираат овие
метаподатоци. За да се поправи оваа ситуација многу трговци на
главните алатки за складирање податоци формираа Мета податоци
Советот кој подоцна стана Коалиција Мета податоци.
Целта на оваа коалиција е да изгради збир на метаподатоци
стандард кој овозможува различни алатки за складирање податоци да
конвертирај метаподатоци
Нивните напори резултираа со раѓање на Мета
Спецификација за размена на податоци (MDIS) која ќе овозможи размена
информации помеѓу архивите на Microsoft и поврзаните датотеки MDIS.
Постоењето на податоци и сумирани/индексирани и детални дава
на корисникот можност за извршување на дупчалка давење
(дупчење) ајде податоци индексирани на детални и обратно.
Постоењето на податоци деталните истории овозможува создавање на
анализа на трендот со текот на времето. Дополнително метаподатоците за анализа може
да се користи како директориум на база на податоци del складиште на податоци по
им помогне на крајните корисници да го лоцираат i податоци неопходни
Во споредба со OLTP системите, со нивната способност за поддршка
анализа на податоци и известување, на складиште на податоци се гледа како систем
посоодветно за информациски процеси како што се изработка и
одговарајте на прашања и изработувајте извештаи. Следниот дел
детално ќе ги истакне разликите на двата системи.
СКЛАДИШТЕ НА ПОДАТОЦИ ПРОТИВ ОЛТП СИСТЕМИТЕ
Многу од информациските системи во рамките на организациите
Тие се наменети за поддршка на секојдневните операции. Овие
системи познати како OLTP SYSTEMS, фаќаат трансакции
постојано се ажурира секојдневно.
I податоци во рамките на овие системи тие често се менуваат, додаваат или
избришани. На пример, адресата на клиентот едвај се менува
тој се движи од едно на друго место. Во овој случај новата адреса
ќе се регистрираат со менување на полето за адреса на база на податоци.
Главната цел на овие системи е да ги намалат трошоците
трансакции и во исто време го намалува времето на обработка.
Примерите на OLTP системи вклучуваат критични дејства како што е пишувањето
нарачки сметководство, платен список, фактури, производство, тој услуги клиенти.
За разлика од OLTP системите, кои беа креирани по процес
врз основа на трансакции и настани, т.е складиште на податоци тие беа создадени
да обезбеди поддршка на процесите засновани на аналитика на податоци и горе
процеси на одлучување.
Ова обично се постигнува со интегрирање на i податоци од различни системи
OLTP и надворешен во еден „контејнер“. податоци,како што беше дискутирано
во претходниот дел.
Модел на процес на складирање податоци на Monash
Моделот на процесот за складиште на податоци Монаш беше развиен од
истражувачите од Истражувачката група Монаш ДСС, се базира на
литератури на складиште на податоци, за искуството во поддршката на
развој на системи полиња, на дискусии со продавачите на
апликации за употреба на складиште на податоци, на група експерти
во употреба на складиште на податоци.
Фазите се: Почеток, планирање, развој и работење
Објаснувања. Дијаграмот ја објаснува итеративната природа или
еволутивен развој на а складиште на податоци процес со користење
двонасочни стрелки поставени помеѓу различните фази. Во ова
„Итеративен“ и „еволутивен“ контекст значат дека, во секоја од нив
чекор од процесот, може да се направат активности за имплементација
секогаш пропагирајте наназад до претходната фаза. Ова е
поради природата на проектот а складиште на податоци во кои
дополнителни барања се појавуваат во секое време
на крајниот корисник. На пример, за време на развојната фаза на a
процес на складиште на податоци, еден го бара крајниот корисник
нова димензија или предметна област, која не припаѓа на
оригиналниот план, ова мора да се додаде во системот. Ова
предизвикува промена во проектот. Резултатот е дека тимот на
дизајнот мора да ги промени барањата на досега креираните документи
за време на фазата на дизајнирање. Во многу случаи, моменталната состојба на
проектот мора да се врати во фазата на дизајнирање каде
новото барање мора да се додаде и документира. Корисникот
конечниот мора да може да ја види конкретната документација што е разгледана ei
промени кои беа направени во развојната фаза. На крајот на
овој развојен циклус проектот мора да добие големи повратни информации од
двата тима, развојниот тим и корисничкиот тим. НА
повратните информации потоа повторно се користат за подобрување на иден проект.
Планирање на капацитети
Dw имаат тенденција да бидат многу големи по големина и да растат
многу брзо (Best 1995, Rudin 1997a) следејќи го
количина на податоци истории кои ги задржуваат од нивното времетраење. Таму
растот може да биде предизвикан и од податоци дополнителни ставки побарани од
корисниците да ја зголемат вредноста на податоци што веќе го имаат. Од
следствено, барањата за складирање за податоци може
да бидат значително подобрени (Eckerson 1997). Така е
од суштинско значење за да се обезбеди, со спроведување на планирање на
капацитет, со кој системот што треба да се изгради може да расте
раст на потребите (Best 1995, LaPlante 1996, Lang 1997,
Екерсон 1997, Рудин 1997а, Фоли 1997а).
При планирањето за приспособливост на dw, мора да се знае
очекуван раст на големината на залихите, видови прашања
најверојатно ќе се изврши и бројот на поддржани крајни корисници (Најдобро
1995, Рудин 1997б, Фоли 1997а). Изградете скалабилни апликации
бара комбинација од технологии и техники за скалабилни сервери
на дизајнирање скалабилни апликации (Best 1995, Rudin 1997b.
И двете се неопходни при креирање на апликација
исклучително скалабилни. Скалабилните серверски технологии можат
направете го лесно и корисно додавање складирање, меморија и
Процесорот без деградирачки перформанси (Lang 1997, Telephony 1997).
Постојат две главни технологии за скалабилни сервери: пресметување
симетрична повеќекратна (SMP) и масивна обработка
паралелно (MPP) ) (IDC 1997, Humphries et al. 1999). Сервер
SMP обично има повеќе процесори кои споделуваат една меморија,
магистрален систем и други ресурси (IDC 1997, Humphries et al. 1999).
Може да се додадат дополнителни процесори за зголемување
неа моќ пресметковни. Друг метод за зголемување на
моќ компјутерската моќ на SMP серверот е да се комбинираат многубројни
SMP машини. Оваа техника е позната како кластерирање (Хамфрис
et al. 1999). MPP серверот, од друга страна, има повеќе процесори секој
со сопствена меморија, магистрален систем и други ресурси (IDC 1997,
Хемфрис и сор. 1999). Секој процесор се нарекува јазол. А
зголемување на моќ може да се постигне пресметковно
додавање дополнителни јазли на MPP серверите (Хамфрис и сор.
1999).
Слабоста на SMP серверите се премногу влезно-излезни операции
(I/O) може да го затрупа магистралниот систем (IDC 1997). Ова
проблемот не се јавува кај MPP серверите бидејќи секој
процесорот има сопствен магистрален систем. Меѓутоа, меѓусебните врски
помеѓу секој јазол тие се генерално многу побавни од магистралниот систем
на ЗМП. Дополнително, MPP серверите можат да додадат слој
дополнителна сложеност за развивачите на апликации (IDC
1997). Така, може да се влијае на изборот помеѓу SMP и MPP серверите
од многу фактори, вклучувајќи ја сложеноста на прашањата, односот
цена/перформанси, потребниот капацитет за третман, на
спречени dw апликации и зголемувањето на големината на база на податоци
од dw и во бројот на крајни корисници.
Бројни скалабилни техники за дизајнирање апликации
може да се користи во планирањето на капацитетот. Еден
користи различни периоди за известување како денови, недели, месеци и години.
Имајќи различни периоди за известување, на база на податоци може да се подели на
парчиња лесно се групираат (Inmon et al. 1997). Друг
техника е да се користат збирни табели кои се конструирани
сумирање податоци da податоци детално. Па јас податоци резимеа се повеќе
компактен отколку детален, што бара помалку мемориски простор.
Значи податоци на детали може да се чуваат во диск
поевтино складирање, што заштедува уште повеќе складирање.
Иако користењето резиме табели може да заштеди простор
меморија, тие бараат многу напор за да бидат ажурирани и во тек
во согласност со комерцијалните потреби. Сепак, оваа техника е
широко се користи и често се користи во врска со техниката
претходно (Најдобар 1995, Инмон 1996а, Чаудури и Дајал
1997).
Дефинирање Складиште на податоци Техничка
Архитектури Дефиниција на техники
dw архитектури
Раните прифаќачи на складирање на податоци првенствено зачнати
централизирана имплементација на dw каде што сите на податоци, вклучени
i податоци надворешни, беа интегрирани во еден,
физичко складирање (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Главната предност на овој пристап е тоа што крајните корисници
Јас сум во можност да пристапам до погледот на претприемачка скала
(преглед на целата компанија) dei податоци организациски (Овум 1998). Друга
предност е што нуди стандардизација на податоци преку
организацијата, што значи дека има само една верзија или
дефиниција за секоја терминологија што се користи во депозитот dw
(складиште) метаподатоци (Flanagan and Safdie 1997, Ovum 1998). На
недостаток на овој пристап, од друга страна, е тоа што е скап и тежок
да се изгради (Фланаган и Сафди 1997, Овум 1998, Инмон и сор.
1998). Не долго по архитектурата за складирање податоци
централизираното стана популарно, концептот на екстракција еволуираше
од најмалите подмножества на податоци за поддршка на потребите на
специфични апликации (Varney 1996, IDC 1997, Berson and Smith
1997, паун 1998). Овие мали системи се изведени од повеќе
голема складиште на податоци централизиран. Тие се нарекуваат датум
зависни одделенски магацини или зависни податочни магацини.
Зависната податочна архитектура е позната како
тристепена архитектура каде што првото ниво се состои од податоците
централизиран магацин, вториот се состои од магацини податоци
одделенски и третиот се состои од пристап до податоци и од алатките на
анализа (Demarest 1994, Inmon et al. 1997).
Податочните маркети обично се градат по складиште на податоци
централизирана е изградена за да се задоволат потребите на
специфични единици (White 1995, Varney 1996).
Податоците ги чуваат податоци многу релевантни во врска со деталите
единство (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
Предноста на овој метод е тоа што нема да има дато не
интегриран и дека и податоци тие ќе бидат помалку излишни во рамките на податоците
марти од сите податоци доаѓаат од магацин податоци интегриран.
Друга предност е тоа што ќе има малку врски помеѓу секоја од нив
маргини на податоци и сродни извори податоци бидејќи секој податочен март има само
извор на податоци. Плус со оваа архитектура на место, корисниците
финалето сè уште може да пристапи до прегледот на податоци
корпоративни организации. Овој метод е познат како
метод од горе надолу, во кој по податоците се градат маргините на податоци
магацин (паун 1998, Гоф 1998).
Зголемување на потребата да се покажат резултати рано, некои
организациите почнаа да градат независни податоци
(Фланаган и Сафди 1997, Вајт 2000). Во овој случај, податоците маршираат
го земаат своето податоци директно од основите на податоци OLTP а не од
централизирано и интегрирано складирање, со што се елиминира потребата за
имаат централно складирање на локацијата.
Секој податочен март бара најмалку една врска до неговите извори
di податоци. Еден недостаток да има повеќе врски за секој датум
март е дека, во споредба со двете претходни архитектури, на
прекумерно изобилство на податоци значително се зголемува.
Секој податочен март мора да ги складира сите податоци побарано локално за
немаат ефект врз OLTP системите. Ова предизвикува дека и податоци
тие се складирани во различни податочни марки (Inmon et al. 1997).
Друг недостаток на оваа архитектура е тоа што води кон
создавање на сложени меѓусебни врски помеѓу податочните марки и нивните
извори на податоци кои тешко се спроведуваат и контролираат (Инмон ед
други. 1997).
Друг недостаток е тоа што крајните корисници не можат да напојуваат
пристап до прегледот на информациите за компанијата како i податоци
од различните податоци не се интегрирани (Ovum 1998).
Уште еден недостаток е тоа што може да има повеќе од еден
дефиниција за секоја терминологија што се користи во податоците што ги генерира
недоследности на податоци во организацијата (Овум 1998).
И покрај недостатоците дискутирани погоре, независните податоци маршираат
тие сè уште го привлекуваат интересот на многу организации (IDC 1997).
Еден фактор што ги прави привлечни е тоа што се развиваат побрзо
и бараат помалку време и ресурси (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Соодветно на тоа, тие главно служат
како тест проекти кои можат да се користат за идентификување
брзо придобивките и/или несовршеностите во проектот (Parsaye
1995, Braly 1995, Newing 1996). Во овој случај, делот од
имплементацијата во пилот-проектот мора да биде мала, но важна
за организацијата (Newing 1996, Mansell-Lewis 1996).
Со испитување на прототипот, крајните корисници и администрацијата можат
одлучи дали да го продолжи или запре проектот (Фланаган и Сафди
1997).
Ако одлуката треба да продолжи, податоците се маршираат за други сектори
тие треба да се градат едно по едно. Постојат две опции за
крајните корисници врз основа на нивните потреби во изградбата на податоци
независни матри: интегрирани/федерирани и неинтегрирани (Овум
1998)
Во првиот метод, секој нов податочен март треба да се изгради
врз основа на тековните податоци и модел податоци се користи
од фирмата (Varney 1996, Berson and Smith 1997, Peacock 1998).
Потребата да се користи моделот податоци на компанијата го прави неопходно
осигурајте се дека има само една дефиниција за секоја терминологија
се користи преку податоци марти, ова е исто така да се осигура дека податоците
Различни маркети може да се спојат за да се даде преглед на
корпоративни информации (Бреснахан 1996). Овој метод е
се нарекува од долу-нагоре и е најдобро кога има ограничување на
финансиски средства и време (Flanagan и Safdie 1997, Ovum 1998,
паун 1998, Гоф 1998). Во вториот метод, податоците маршираат
изградена може само да ги задоволи потребите на одредена единица.
Варијанта на федеративниот податочен март е складиште на податоци дистрибуирани
во кој база на податоци централниот сервер среден софтвер се користи за приклучување на многу
податоци марти во едно складиште на податоци дистрибуирани (White 1995). Во
овој случај, т.е податоци компаниите се дистрибуирани во неколку податоци.
Барањата на крајниот корисник се препраќаат до база на податоци
среден софтвер на серверскиот центар, кој ги извлекува сите податоци барани од податоците
мартира и ги враќа резултатите на апликациите на крајните корисници. Ова
метод обезбедува деловни информации до крајните корисници. Сепак,
Проблемите на податочните маркети сè уште не се елиминирани
независна. Постои уште една архитектура која може да се користи која е
јавете се на складиште на податоци виртуелен (White 1995). Сепак, ова
архитектурата, која е опишана на слика 2.9, не е архитектура
на складирање податоци реално бидејќи не го поместува товарот
од OLTP системи до складиште на податоци (Demarest 1994).
Всушност, барањата на податоци од крајните корисници преминале на
OLTP системи кои враќаат резултати по обработката
барања на корисниците. Иако оваа архитектура им овозможува на корисниците
конечни за генерирање извештаи и формулирање барања, не може да обезбеди i
податоци историски и преглед на информации за компанијата како и податоци
од различните OLTP системи не се интегрирани. Значи, овој
архитектурата не може да ја задоволи анализата на податоци комплекс како што се
пример прогнози.
Избор на апликации за пристап и пристап
обновување на податоци
Целта на изградбата на А складиште на податоци е да се пренесе
информации до крајните корисници (Inmon et al 1997, Poe 1996,
McFadden 1996, Shanks et al 1997, Hammergren 1998); еден или
повеќекратен пристап и апликации за обновување податоци мора да се обезбеди. До
Денес, постои широк спектар на овие апликации од кои корисникот може да избере
изберете (Hammergren 1998, Humphries et al. 1999). На
избраните апликации го одредуваат успехот на напорите
на складирање податоци во организација бидејќи на
апликациите се највидливиот дел од складиште на податоци на корисникот
финале (Inmon et al. 1997, Poe 1996). За да успее состанок
магацин, мора да бидат способни да ги поддржат активностите за анализа на податоци
на крајниот корисник (Poe 1996, Seddon and Benjamin 1998, Eckerson
1999). Значи, „нивото“ на она што го сака крајниот корисник мора да биде
идентификувани (Poe 1996, Mattison 1996, Inmon et al 1997,
Хамфрис и други 1999).
Општо земено, крајните корисници можат да се групираат во три
категории: извршни корисници, деловни аналитичари и моќни корисници (По
1996, Хамфрис и сор., 1999). Потребни се извршните корисници
лесен пристап до претходно дефинирани групи на извештаи (Хамфрис ед
други 1999). Овие извештаи може лесно да се постигнат со
навигација во менито (Poe 1996). Плус, извештаите треба
презентираат информации користејќи графички приказ
како што се табели и шаблони за брз транспорт
информации (Humphries et al. 1999). Бизнис аналитичари, кои не
тие може да имаат технички можности да развијат односи од
нула сами по себе, тие треба да бидат способни да ги менуваат тековните односи со
ги задоволуваат нивните специфични потреби (Poe 1996, Humphries et al
1999). Моќните корисници, од друга страна, се тип на крајни корисници кои
имаат можност да генерираат и пишуваат барања и извештаи од
нула (Poe 1996, Humphries et al. 1999). Тие се оние кои
развиваат извештаи за други типови на корисници (Poe 1996, Humphries
и други 1999).
Откако ќе се утврди, мора да се направат барањата на крајниот корисник
избор на апликации за пристап и обновување податоци меѓу сите
оние што се достапни (Poe 1996, Inmon et al. 1997).
Пристап до податоци а алатките за пронаоѓање можат да бидат
класифицирани во 4 типа: OLAP алатка, EIS/DSS алатка, алатка за пребарување и
алатки за известување и податоци за рударство.
Алатките OLAP им овозможуваат на корисниците да креираат ад хок прашања, како и
оние направени на база на податоци del складиште на податоци. Плус овие производи
им овозможи на корисниците да дупчат од податоци општо за оние
детално.
Алатките EIS/DSS обезбедуваат извршно известување како анализа „што ако“.
и пристап до извештаи организирани од менито. Извештаите мора да бидат
предефинирани и споени со менија за полесна навигација.
Алатките за пребарување и известување им овозможуваат на корисниците да произведуваат извештаи
предефинирани и конкретни.
Алатките за ископување податоци се користат за да се идентификуваат врските кои
може да фрли ново светло на заборавените операции во податоци del
складиште на податоци.
Покрај оптимизирањето на барањата на секој тип на корисник, т.е
Избраните алатки мора да бидат интуитивни, ефикасни и лесни за употреба.
Тие исто така мора да бидат компатибилни со други делови од архитектурата д
способни да работат со постоечки системи. Исто така, се предлага да
изберете алатки за пристап до податоци и пребарување со цени и перформанси
разумно. Други критериуми што треба да се земат предвид вклучуваат посветеност на
продавачот на алатката во поддршката на нивниот производ и развојот на истиот
истото ќе има во идните изданија. За да се обезбеди ангажман на корисниците
во користењето на складиштето на податоци, развојниот тим го вклучува
корисници во процесот на избор на алатки. Во овој случај
треба да се изврши практична проценка на корисникот.
За да се подобри вредноста на складиштето на податоци, тимот за развој може
исто така обезбедуваат веб-пристап до нивните складишта на податоци. А
Веб-овозможениот склад за податоци им овозможува на корисниците пристап до податоци
од оддалечени места или додека патувате. Дополнителни информации може
да се обезбедат по пониски трошоци преку намалување на трошоците
на обука.
2.4.3 Складиште на податоци Фаза на работа
Оваа фаза се состои од три активности: Дефинирање на стратегии за датум
освежување, контрола на активностите на складиштето на податоци и управување со
безбедност на складиштето на податоци.
Дефиниција на стратегии за освежување на податоците
По првичното вчитување, т.е податоци во база на податоци на складиштето на податоци
мора периодично да се освежува за да се репродуцира
направени промени на податоци оригинали. Затоа мора да одлучиме
кога да се освежи, колку често
освежи и како да се освежи податоци. Се предлага да се направи
освежи деи податоци кога системот може да биде офлајн. Таму
Стапката на освежување ја одредува развојниот тим базиран
на барањата на корисниците. Постојат два пристапа за освежување на
складиште на податоци: целосно освежување и континуирано вчитување на
промени.
Првиот пристап, целосно освежување, бара повторно вчитување
Сите податоци од нула. Ова значи дека сите податоци потребна мора
да бидат извлечени, исчистени, трансформирани и интегрирани во секое освежување. Ова
пристапот треба колку што е можно да се избегнува бидејќи
Тоа бара многу време и ресурси.
Алтернативен пристап е постојано да се вчитува i
промени. Ова додава i податоци кои се сменети
од последниот циклус на освежување на складиштето на податоци. Идентификацијата на
нови или изменети записи значително го намалуваат износот на
податоци кои мора да се пропагираат во складиштето на податоци во секоја од нив
ажурирање бидејќи само овие податоци ќе се додаде на база на податоци
на складиштето на податоци.
Постојат најмалку 5 пристапи кои може да се користат за повлекување
i податоци нови или изменети. За да се добие ефикасна стратегија
освежи деи податоци мешавина од овие пристапи може да биде корисна
ги зема сите промени во системот.
Првиот пристап, кој користи временски ознаки, претпоставува дека тоа доаѓа
доделен на сите податоци изменета и ажурирана временска ознака така
за да може лесно да ги идентификува сите податоци изменета и нова.
Овој пристап, сепак, не е широко користен во повеќето
дел од денешните оперативни системи.
Вториот пристап е да се користи делта датотека генерирана од
апликација која содржи само промени направени во податоци.
Користењето на оваа датотека исто така го засилува циклусот на ажурирање.
Сепак, дури и овој метод не е користен кај многумина
апликации.
Третиот пристап е да се скенира датотека за евиденција, која
во основа содржи слични информации како делта-датотеката. Единственото
разликата е во тоа што е креирана датотека за евиденција за процесот на обновување и
може да биде тешко да се разбере.
Четвртиот пристап е да се измени кодот на апликацијата.
Сепак најголемиот дел од кодот на апликацијата е стар и
кревка; затоа оваа техника треба да се избегнува.
Последниот пристап е да се споредат податоци извори со датотеката
главни богови податоци.
Контрола на активностите на складиштето на податоци
Откако складиштето на податоци ќе биде пуштено на корисниците, тоа е
неопходно да се следи со текот на времето. Во овој случај, администраторот
на складиштето на податоци може да вработи една или повеќе алатки за управување и
контрола за следење на употребата на складиштето на податоци. Особено
може да се соберат информации за луѓето и времето
до кој пристапуваат до складиштето на податоци. Ајде податоци може да се создадат култури
профил на извршената работа што може да се користи како влез
при имплементирање на корисничко наплата. Поврат на наплата
им овозможува на корисниците да бидат информирани за трошоците за обработка на
складиште на податоци.
Понатаму, контролата на складиштето на податоци може да се користи и за
идентификувајте ги типовите на барања, нивната големина, бројот на барања по
ден, време на одговор на барањето, досегнати сектори и количина
di податоци обработени. Друга цел на вршење на проверка на
складиште на податоци е да се идентификуваат податоци кои не се во употреба. Овие податоци
тие може да се отстранат од складиштето на податоци за да се подобри времето
на одговорот за извршување на барањето и следење на растот на
податоци кои престојуваат во рамките на база на податоци на складиштето на податоци.
Управување со безбедноста на складиштето на податоци
Складиште на податоци содржи податоци интегрирана, критична, чувствителна што
може лесно да се стигне. Поради оваа причина би требало
да бидат заштитени од неовластени корисници. Еден начин да
спроведување на безбедноста е да се користи функцијата del DBMS
за доделување различни привилегии на различни типови на корисници. Во ова
начин, мора да се одржува профил за секој тип на корисник
пристап. Друг начин да го обезбедите вашиот склад за податоци е да го шифрирате
како што пишува во база на податоци на складиштето на податоци. Пристап до
податоци и алатките за пронаоѓање мора да го дешифрираат податоци пред поднесување i
резултати за корисниците.
2.4.4 Складиште на податоци Фаза на распоредување
Тоа е последната фаза во циклусот на имплементација на складиштето на податоци. На
активностите што треба да се спроведат во оваа фаза вклучуваат обука на
корисниците да го користат складиштето на податоци и да креираат прегледи
на складиштето на податоци.
Обука на корисници
Прво треба да се направи обука на корисниците
на пристап до податоци на складиштето на податоци и употребата на алатки
пронаоѓање. Општо земено, сесиите треба да започнат со
воведот во концептот на складирање на податоци, ал
содржината на складиштето на податоци, аи мета податоци и основните карактеристики
на алатките. Потоа, понапредните корисници исто така би можеле да го проучуваат
физички табели и кориснички карактеристики на пристап до податоци и алатки
пронаоѓање.
Постојат многу пристапи за обука на корисници. Еден од
ова вклучува избор на многу корисници или аналитичари избрани од А
група на корисници, врз основа на нивното лидерство и способност
комуникација. Овие се обучени во личен капацитет на
се што треба да знаат за да се запознаат со
систем. Откако ќе заврши обуката, тие се враќаат на својата работа и
почнуваат да ги учат другите корисници како да го користат системот. На
врз основа на она што го научиле, другите корисници можат да започнат
истражете го складиштето на податоци.
Друг пристап е да се обучат многу корисници за истото
време, како да одите на курс во училница. Овој метод
Погоден е кога има многу корисници кои треба да бидат обучени
во исто време. Друг метод е да тренирате
секој корисник поединечно, еден по еден. Овој метод е
погоден кога има малку корисници.
Целта на обуката на корисниците е да ве запознае
со пристап до податоци и алатките за пронаоѓање како и содржината на
складиште на податоци. Сепак, некои корисници може да се преоптоварат
според количината на информации дадени за време на сесијата
обука. Значи, одреден број работи треба да се направат
тековна поддршка и сесии за освежување за да одговорите
на конкретни прашања. Во некои случаи се формира група
корисниците да обезбедат ваков тип на поддршка.
Собирање повратни информации
Откако складиштето на податоци ќе биде отворено, корисниците можат
користете i податоци кои престојуваат во складиштето на податоци за различни намени.
Најчесто, аналитичарите или корисниците користат i податоци во
складиште на податоци за:
1 Идентификувајте ги трендовите на компанијата
2 Анализирајте ги профилите за купување на клиенти
3 Поделете i клиенти ед јас
4 Обезбедете ги најдобрите услуги на клиенти – приспособете ги услугите
5 Формулирајте стратегии маркетинг
6 Обезбедете конкурентни понуди за анализи на трошоците и помош
контрола на
7 Поддржете го стратегиското одлучување
8 Идентификувајте можности да се истакнете
9 Подобрете го квалитетот на тековните деловни процеси
10 Проверете ја добивката
Следејќи ја насоката за развој на складиштето на податоци, тие би можеле
Спроведете серија прегледи на системот за да добиете повратни информации
и од тимот за развој и од заедницата на
крајните корисници.
Добиените резултати може да се земат предвид за
следниот циклус на развој.
Бидејќи складиштето на податоци има растечки пристап,
од суштинско значење е да се учи од успесите и грешките на претходните
случувања.
2.5 Резиме
Во ова поглавје беа дискутирани пристапите присутни во
литература. Во делот 1 беше дискутиран концептот на
складиште на податоци и неговата улога во науката за одлучување. Во
дел 2 главните разлики помеѓу
складиште на податоци и OLTP системи. Во делот 3 разговаравме за
Модел на складиште на податоци Monash што беше користен
во делот 4 за да се опишат активностите вклучени во процесот
развој на складиште на податоци, на кои овие тези не се засновани
ригорозни истражувања. Она што се случува во реалноста може да биде
многу различно од она што го известува литературата, сепак овие
резултатите може да се искористат за да се создаде основен багаж кој
нагласи концептот на складиште на податоци за ова истражување.
Поглавје 3
Методи на истражување и дизајн
Ова поглавје се занимава со методите на истражување и дизајн за
оваа студија. Првиот дел покажува генерички приказ на методите
на истражувања достапни за пронаоѓање информации, згора на тоа
се дискутираат критериумите за избор на најдобриот метод за еден
одредена студија. Два методи потоа се дискутирани во дел 2
избрани со само поставените критериуми; од овие ќе бидат избрани и
донесе еден со причините наведени во делот 3 каде што се
се објаснуваат и причините за исклучувањето на другиот критериум. Таму
во делот 4 е претставен дизајнот на истражувањето, а во делот 5 е претставен
заклучоци.
3.1 Истражување во информациски системи
Истражувањето во информациските системи не е едноставно ограничено
на технолошката област, но исто така мора да се прошири за да вклучи
цели во однос на однесувањето и организацијата.
Ова го должиме на тезите на различни дисциплини кои се движат од
општествени науки до природни; тоа доведува до потреба од а
одреден спектар на истражувачки методи кои вклучуваат квантитативни методи
а квалитативните да се користат за информациски системи.
Сите достапни методи на истражување се важни, всушност неколку
истражувачи како што се Џенкинс (1985), Нунмајкер и др. (1991) и Галиерс
(1992) тврдат дека не постои специфичен универзален метод
да спроведува истражување во различни области на информациски системи; Навистина
метод може да биде погоден за одредено истражување, но не
за другите. Ова ни ја носи потребата да избереме метод кој
е погоден за нашиот конкретен истражувачки проект: за ова
избор Бенбасат и сор. (1987) наведуваат дека треба да се земат предвид
природата и целта на истражувањето.
3.1.1 Природа на истражувањето
Различни методи врз основа на природата на истражувањето можат да бидат
класифицирани во три традиции надалеку познати во науката
на информации: позитивистички, интерпретативни и критички истражувања.
3.1.1.1 Позитивистичко истражување
Позитивистичкото истражување е познато и како научна студија или
емпириски. Се обидува да: „објасни и предвиди што ќе се случи во
општествениот свет со гледање на законитостите и причинско-последичните односи
меѓу елементите што го сочинуваат“ (Шенкс и сор. 1993).
Позитивистичкото истражување се карактеризира и со повторливост,
поедноставувања и побивања. Понатаму, позитивистичките истражувања признаваат
постоењето на априори односи меѓу појавите што се проучуваат.
Според Galliers (1992) таксономијата е метод на истражување
вклучени во позитивистичката парадигма, која сепак не е ограничена на ова,
всушност има лабораториски експерименти, теренски експерименти,
студии на случај, докази за теорема, предвидувања и симулации.
Користејќи ги овие методи истражувачите признаваат дека феномените
изучува може да се набљудува објективно и ригорозно.
3.1.1.2 Интерпретативно истражување
Интерпретативно истражување, кое често се нарекува феноменологија или
антипозитивизмот е опишан од Нојман (1994) како „анализа
систематски на општественото значење на дејството преку директно и
детално набљудување на луѓето во природни ситуации, со цел
да се дојде до разбирање и толкување на тоа како на
луѓето го создаваат и одржуваат својот социјален свет“. Студии
интерпретативните методи ја отфрлаат претпоставката дека набљудуваните појави
може да се набљудува објективно. Всушност тие се базирани
на субјективни толкувања. Понатаму, толкувачките истражувачи не го прават тоа
им наметнуваат априори значења на појавите што ги проучуваат.
Овој метод вклучува субјективни/аргументирани студии, дејствија на
истражување, описни/интерпретативни студии, идни истражувања и игри
улога. Во прилог на овие истраги и студии на случај може да биде
вклучени во овој пристап бидејќи се однесуваат на студиите на
поединци или организации во сложени ситуации
на реалниот свет.
3.1.1.3 Критичко истражување
Критичкото истражување е најмалку познат пристап во науките
социјална, но неодамна доби внимание од истражувачите
во областа на информациските системи. Филозофската претпоставка дека на
општествената реалност е историски произведена и репродуцирана од луѓето,
како и општествените системи со нивните акции и интеракции. Нивните
способноста, сепак, е посредувана од одредена доза на обѕир
социјални, културни и политички.
Исто како и интерпретативното истражување, критичкото истражување тврди дека
Позитивистичкото истражување нема никаква врска со општествениот контекст и го игнорира
неговото влијание врз човековите постапки.
Критичкото истражување, од друга страна, ги критикува интерпретативните истражувања за
бидете премногу субјективни и затоа што нема за цел да помогне
луѓето да си го подобрат животот. Најголемата разлика помеѓу
критичкото истражување и другите два пристапа е неговата евалуативна димензија.
Додека објективноста на позитивистичката и интерпретативната традиција е за
предвиди или објасни статус кво или општествена реалност, критичко истражување
има за цел критички да ја процени и трансформира основната општествена реалност
студио.
Критичките истражувачи обично се противат на статус кво за да
отстранување на социјалните разлики и подобрување на социјалните услови. Таму
критичкото истражување има посветеност на процесен поглед на
феномен од интерес и, според тоа, вообичаено е надолжен.
Примери за методи на истражување се долгорочните историски студии и
етнографски студии. Критичко истражување, сепак, не беше
широко користен во истражувањето на информациските системи
3.1.2 Цел на истражувањето
Заедно со природата на пребарувањето, може да се користи и неговата цел
да го води истражувачот при изборот на одреден метод
истражување. Целта на еден истражувачки проект е тесно поврзана
на позицијата на пребарувањето во однос на циклусот на пребарување што се состои од
три фази: градење теорија, тестирање на теорија и усовршување на теоријата
теорија. Значи, врз основа на моментумот во однос на циклусот на пребарување, a
истражувачки проект може да има објаснувачка, описна, цел
истражувачки или предвидувачки.
3.1.2.1 Истражувачко истражување
Истражувачкото истражување е насочено кон истражување на тема
тотално нови и формулираат истражувачки прашања и хипотези
иднината. Овој тип на истражување се користи во изградбата на
теорија за да се добијат првични референци во нова област.
Вообичаено, се користат квалитативни методи на истражување, како што се случаите
на проучување или феноменолошки студии.
Сепак, можно е да се применат и квантитативни техники како што се
истражувачки истраги или експерименти.
3.1.3.3 Описно истражување
Описното истражување е насочено кон анализа и опишување во голем дел
детализираат одредена ситуација или организациска практика. Ова
е соодветен за градење теорија и може да се користи и за
потврди или оспори хипотези. Описно истражување обично
вклучува употреба на мерења и примероци. Најпогодни методи на истражување
вклучуваат истраги и анализи на претходници.
3.1.2.3 Објаснувачко истражување
Објаснувачкото истражување се обидува да објасни зошто работите се случуваат.
Таа е изградена на факти кои се веќе проучени и се обидува да ги најде
причините за овие факти.
Така, објаснувачкото истражување обично се гради на истражување
истражувачки или описен и е помошен за тестирање и рафинирање
теориите. Објаснувачкото истражување вообичаено користи студии на случај
или методи на истражување засновани на анкети.
3.1.2.4 Превентивно истражување
Превентивното истражување има за цел да предвиди настани и однесувања
под опсервација кои се проучуваат (Маршал и Росман
1995). Предвидувањето е стандарден научен тест за вистината.
Овој тип на истражување генерално користи анкети или анализи на
податоци историчари. (Јин 1989)
Горенаведената дискусија покажува дека постојат голем број на
можни методи на истражување кои можат да се користат во студија
особено. Сепак, мора да постои специфичен метод кој е посоодветен
на други за одреден тип на истражувачки проект. (Галиери
1987, Јин 1989, Де Ваус 1991). Секој истражувач, значи, има
треба внимателно да се проценат силните и слабите страни на
различни методи, за да се дојде до усвојување на најсоодветниот метод на истражување д
компатибилен со истражувачкиот проект. (Џенкинс 1985, Перван и Клас
1992, Бономија 1985, Јин 1989, Химилтон и Ајвс 1992).
3.2. Можни методи на истражување
Целта на овој проект беше да се проучи искуството во
Австралиските организации со и податоци складирани со еден
свилупо ди складиште на податоци. Дато кој, во моментов, постои еден
недостаток на истражување во областа на складирање податоци во Австралија,
овој истражувачки проект се уште е во теоретска фаза на циклусот
истражување и има истражувачка цел. Истражување на искуството во
Австралиски организации усвојуваат складирање податоци
бара толкување на реалното општество. Следствено, на
следи филозофската претпоставка во основата на истражувачкиот проект
традиционалното толкување.
По ригорозно испитување на достапните методи, тие беа идентификувани
два можни истражувачки методи: анкети и студии на случај
(студии на случај), кои можат да се користат за истражување
истражувачки (Шенкс и сор. 1993). Галиерс (1992) тврди дека
соодветноста на овие два методи за оваа конкретна студија во
неговата ревидирана таксономија велејќи дека тие се погодни за градба
теоретски. Следните два потсекции го разгледуваат секој метод во
детали
3.2.1 Истражувачки метод на истражување
Истражувачкиот метод на истражување потекнува од античкиот метод на
попис. Пописот се состои од собирање информации од
цела популација. Овој метод е скап и непрактичен
особено ако населението е големо. Значи, во споредба со
попис, анкетата вообичаено е фокусирана на
собира информации за мал број или примерок од
претставници на населението (Fowler 1988, Neuman 1994). А
примерокот ја одразува популацијата од која е извлечен, со различни
нивоа на точност, според структурата на примерокот, на
големината и користениот метод на селекција (Fowler 1988, Babbie
1982, Нојман 1994).
Методот на истрага е дефиниран како „слики од практики,
ситуации или погледи во одреден момент во времето, преземени со користење
прашалници или интервјуа, од кои може да се извлечат заклучоци
направено“ (Галиерс 1992:153) [инстант фотографија од практики,
ситуации или погледи во одреден момент во времето, преземени со користење
прашалници или интервјуа, од кои може да се извлечат заклучоци]. На
истрагите се занимаваат со собирање информации за одредени аспекти
на студијата, од страна на одреден број учесници, правејќи
прашања (Fowler 1988). Дури и овие прашалници и интервјуа, кои
вклучуваат телефонски и структурирани интервјуа лице в лице,
се техниките на собирање на податоци најчесто се користи во
истраги (Blalock 1970, Nachmias and Nachmias 1976, Fowler
1988), може да се користат набљудувања и анализи (Гејбл
1994). Од сите овие методи на собирање на податоци, употребата на
прашалникот е најпопуларната техника, бидејќи осигурува дека i податоци
собраните се структурирани и форматирани, и затоа го олеснува
класификација на информации (Hwang 1987, de Vaus 1991).
Кога се анализира и податоци, стратегијата за истрага често го користи
квантитативни техники, како што е статистичка анализа, но тие можат да бидат
се користат и квалитативни техники (Galliers 1992, Pervan
и Клас 1992, Гејбл 1994). Нормално, т.е податоци собрани се
се користи за анализа на дистрибуции и модели на асоцијации
(Фаулер 1988).
Иако анкетите се генерално соодветни за истражување
кои се занимаваат со прашањето „што?“ (што) или од него
кои произлегуваат, како што се „колку“ и „колку“, тие
може да се постави преку прашањето „зошто“ (Sonquist и
Dunkelberg 1977, Јин 1989). Според Sonquist и Dunkelberg
(1977), истражувачката истрага има за цел тешки хипотези, програма на
евалуација, опишување на населението и развивање модели на
човечкото однесување. Дополнително, може да се користат и анкети
да проучува одредено мислење на населението, услови,
мислења, карактеристики, очекувања, па дури и минато однесување
или присутен (Neuman 1994).
Истражувањата му овозможуваат на истражувачот да ги открие односите помеѓу
населението и резултатите се вообичаено погенерички од
други методи (Sonquist и Dunkelberg 1977, Gable 1994). На
анкетите им овозможуваат на истражувачите да покријат географска област
пошироко и да допре до многу декларатори (Blalock 1970,
Sonquist и Dunkelberg 1977, Hwang and Lin 1987, Gable 1994,
Нојман 1994). Конечно, анкетите можат да дадат информации
кои не се достапни на друго место или во форма потребна за анализите
(Фаулер 1988).
Меѓутоа, постојат некои ограничувања во спроведувањето на анкетата. Еден
недостаток е тоа што истражувачот не може да добие многу информации
во однос на предметот што се проучува. Ова се должи на фактот дека на
истрагите се вршат само во одредено време и затоа,
има ограничен број на варијабли и луѓе што може истражувачот
студија (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Друг недостаток е што може да биде спроведувањето на анкета
многу скапо во однос на време и ресурси, особено ако
вклучува интервјуа лице в лице (Fowler 1988).
3.2.2. Истражувачки метод на истражување
Истражувачкиот метод на истражување вклучува длабинско проучување на
одредена ситуација во нејзиниот реален контекст во а
дефиниран временски период, без никаква интервенција од страна на
истражувач (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Главно овој метод се користи за опишување на односите помеѓу
променливите кои се проучуваат во одредена ситуација
(Галиерс 1992). Истрагите може да вклучуваат поединечни случаи или
повеќекратно, во зависност од анализираниот феномен (Franz and Robey 1987,
Ајзенхард 1989, Јин 1989).
Истражувачкиот метод на истражување е дефиниран како „истражување
емпириска студија која проучува современ феномен во рамките на
релативен реален контекст, користејќи повеќе извори собрани од еден или
повеќе ентитети како што се луѓе, групи или организации“ (Јин 1989).
Не постои јасна поделба помеѓу феноменот и неговиот контекст д
нема контрола или експериментална манипулација со променливите (Јин
1989, Бенбасат и други 1987).
Постојат различни техники за собирање на податоци дека можат
да се вработат во методот на истрага, кои вклучуваат
директни набљудувања, прегледи на архивски записи, прашалници,
преглед на документација и структурирани интервјуа. Имајќи
разновиден спектар на техники на берба податоци, истраги
им овозможи на истражувачите да се справат со двете податоци квалитативно тоа
количини во исто време (Bonoma 1985, Eisenhardt 1989, Yin
1989, Гејбл 1994). Како што е случајот со методот на анкета, а
истражувачкиот истражувач делува како набљудувач или истражувач и не
како активен учесник во организацијата што се проучува.
Бенбасат и други (1987) тврдат дека методот на истражување е
особено погоден за истражување на градење теорија, што
започнете со истражувачко прашање и продолжете со обука
на теорија во текот на процесот на собирање податоци. Битието
погоден и за сцената
за градење теорија, Франц и Роби (1987) сугерираат дека
За комплексот може да се користи и методот на истрага
теорија фаза. Во овој случај, врз основа на собраните докази, еден
дадена теорија или хипотеза е потврдена или побиена. Плус, истрагата е
исто така погоден за истражување кое се занимава со прашања „како“ или „како“.
„Зошто“ (Јин 1989).
Во споредба со другите методи, анкетите му овозможуваат на истражувачот да
фатете ги суштинските информации подетално (Галиер
1992, Shanks et al 1993). Понатаму, истрагите дозволуваат
истражувач да ја разбере природата и сложеноста на изучуваните процеси
(Benbasat et al. 1987).
Постојат четири главни недостатоци поврзани со методот
истрага. Првиот е недостатокот на контролирани одбитоци. Таму
субјективноста на истражувачот може да ги промени резултатите и заклучоците
на студијата (Јин 1989). Вториот недостаток е недостатокот на
контролирано набљудување. За разлика од експерименталните методи, на
истражувачкиот истражувач не може да ги контролира изучуваните феномени
како што се испитуваат во нивниот природен контекст (Гејбл 1994). На
третиот недостаток е недостатокот на повторливост. Ова се должи на фактот
дека истражувачот веројатно нема да ги набљудува истите настани и
не може да ги потврди резултатите од одредена студија (Lee 1989).
Конечно, како последица на нереплицирањето, тоа е тешко
генерализирајте ги резултатите добиени од едно или повеќе испитувања (Galliers
1992, Shanks et al 1993). Сите овие проблеми, сепак, не
се несовладливи и можат, всушност, да се минимизираат со
истражувач кој применува соодветни активности (Lee 1989).
3.3. Оправдајте ја методологијата на истражување
усвоен
Од двата можни истражувачки методи за оваа студија, методот на
истрагата се смета за најпогодна. Тоа на истрагата е
беше отфрлен по внимателно разгледување на релевантните
заслуги и слабости. Практичноста или несоодветноста на секоја од нив
методот за оваа студија е дискутиран подолу.
3.3.1. Несоодветност на методот на истражување
на истрагата
Методот на истражување бара длабинска студија за еден
одредена ситуација во една или повеќе организации за а
временски период (Eisenhardt 1989). Во овој случај, периодот може
ја надминува временската рамка дадена за оваа студија. Друга
причина за неусвојување на методот на анкета е тоа што резултатите
тие можат да страдаат од недостаток на строгост (Јин 1989). Субјективност
на истражувачот може да влијае на резултатите и заклучоците. Друга
Причината е што овој метод е посоодветен за истражување на прашања
од типот „како“ или „зошто“ (Јин 1989), додека истражувачкото прашање
за оваа студија е од типот „што“. Последно, но не и најмалку важно
Поважно, тешко е да се генерализираат наодите од само еден или
неколку истражувања (Galliers 1992, Shanks et al 1993). На база на
ова рационално објаснување, методот на истражување на истражување не е
беше избрана затоа што беше несоодветна за оваа студија.
3.3.2. Погодност на методот за пребарување на
истрага
Кога беше спроведено ова истражување, практиката на складирање на податоци
не беше широко усвоен од
австралиски организации. Значи, немаше многу информации
во однос на нивното спроведување во рамките на
австралиски организации. Дојдоа достапните информации
од организации кои имплементирале или користеле податоци
магацин. Во овој случај најмногу е методот на анкетно истражување
погоден затоа што ви овозможува да добиете информации што не се
достапни на друго место или во форма потребна за анализа (Fowler 1988).
Дополнително, методот на истражување на анкетата му овозможува на истражувачот да
добие добар увид во практиките, ситуациите или
видено во одредено време (Galliers 1992, Denscombe 1998).
Беше потребен целосен поглед за да се зголеми
Знаење за австралиското искуство со складирање податоци.
Повторно, Sonquist и Dunkelberg (1977) наведуваат дека резултатите од
Анкетното истражување е поопшто од другите методи.
3.4. Дизајн за истражување на истражувањето
Истрагата за практиката на складирање податоци беше спроведена во 1999 година.

Целната популација ја сочинуваа организации
Австралијците заинтересирани за студии за складирање податоци, како што беа
веројатно веќе се информирани за и податоци што ги складираат и,
затоа, може да обезбеди корисни информации за оваа студија. Таму
целната популација беше идентификувана со првично истражување на
сите австралиски членови на „Институтот за складирање податоци“ (Tdwiaap).
Овој дел го разгледува дизајнот на фазата на истражување
емпириски докази за оваа студија.
3.4.1. Техника на берба податоци
Од трите техники кои вообичаено се користат во анкетното истражување
(т.е. поштенски прашалник, телефонско интервју и интервју
лични) (Nachmias 1976, Fowler 1988, de Vaus 1991), за
оваа студија го усвои прашалникот по пошта. Првиот
причина за усвојување на второто е што може да се постигне а
географски дисперзирана популација (Blalock 1970, Nachmias e
Nachmias 1976, Hwang and Lin 1987, de Vaus 1991, Gable 1994).
Второ, поштенскиот прашалник е погоден за учесниците
високо образовани (Fowler 1988). Прашалникот за пошта за ова
студијата беше упатена до спонзорите на проектот за складирање податоци,
директори и/или проект-менаџери. Трето, прашалниците се далеку
пошта се погодни кога имате безбедна листа на
адреси (Салант и Дилман 1994). TDWI, во овој случај, еден
доверливо здружение за складирање податоци го обезбеди списокот со адреси
од нејзините австралиски членови. Друга предност на прашалникот
преку пошта наспроти телефонски прашалник или интервјуа
лично е тоа што им овозможува на регистрантите да одговорат повеќе
точност, особено кога регистрантите треба да се консултираат
белешки или дискутирајте за прашања со други луѓе (Фаулер
1988).
Потенцијален недостаток може да биде времето потребно за
спроведете прашалници по пошта. Нормално, прашалник е далеку
поштата се спроведува во оваа низа: праќајте писма, чекајте
одговори и испрати потврда (Fowler 1988, Bainbridge 1989).
Така, вкупното време може да биде подолго од времето потребно за
лични интервјуа или за телефонски интервјуа. Меѓутоа, на
вкупното време може да се знае однапред (Fowler 1988,
Денскомб 1998). Времето поминато во спроведување на интервјуа
личните податоци не можат да се знаат однапред бидејќи тие се разликуваат од
едно интервју со друго (Fowler 1988). Телефонски интервјуа
може да биде побрз од поштенските прашалници и
лични интервјуа, но може да имаат висока стапка на исчезнати
одговор поради недостапноста на некои луѓе (Fowler 1988).
Дополнително, телефонските интервјуа обично се ограничени на списоци на
релативно кратки прашања (Bainbridge 1989).
Друга слабост на прашалникот за пошта е високата стапка на
недостаток на одговор (Fowler 1988, Bainbridge 1989, Neuman
1994). Сепак, преземени се контрамерки, здружување
оваа студија со доверлива институција во областа на податоците
складирање (т.е. TDWI) (Bainbridge 1989, Neuman 1994), на
кој испраќа две писма за потсетување до оние кои не одговориле
(Fowler 1988, Neuman 1994) и исто така вклучува писмо
додаток кој ја објаснува целта на студијата (Neuman 1994).
3.4.2. Единица за анализа
Целта на оваа студија е да се добијат информации за
имплементацијата на складирање на податоци и негова употреба
во рамките на австралиските организации. Целната популација
е составена од сите австралиски организации кои имаат
имплементирани, или спроведуваат, т.е складиште на податоци. Во
потоа се регистрираат поединечните организации. Прашалникот
беше испратен по пошта до организации заинтересирани за посвојување
di складиште на податоци. Овој метод осигурува дека информациите
собраните доаѓаат од најсоодветните ресурси на секоја организација
учесник.
3.4.3. Примерок за истражување
„Поштенската листа“ на учесници во анкетата е добиена од
TDWI. Од оваа листа, 3000 австралиски организации
беа избрани како основа за земање мостри. А
дополнително писмо го објаснува проектот и целта на истрагата,
заедно со лист со одговори и однапред платен плик за
испрати назад пополнетиот прашалник беа испратени до примерокот.
Од 3000 организации, 198 се согласија да учествуваат во
проучување. Се очекуваше толку мал број одговори дато il
голем број австралиски организации кои тогаш ги имаа
ја прифатија или ја прифаќаа стратегијата за датум
складирање во рамките на нивните организации. Значи, на
Целната популација за оваа студија се состои од само 198
организации.
3.4.4. Содржина на прашалникот
Структурата на прашалникот беше заснована на моделот на датум
Складирање Монаш (дискутирано претходно во дел 2.3). На
содржината на прашалникот беше заснована на анализа на
литература претставена во поглавје 2. Копија од прашалникот
може да се најдат испратени до учесниците во анкетата
во Додаток B. Прашалникот се состои од шест делови, кои
следат фазите на моделот што се дискутираше. Следниве шест параграфи
тие накратко ја сумираат содржината на секој дел.
Дел А: Основни информации за организацијата
Овој дел содржи прашања поврзани со профилот на
организации кои учествуваат. Плус, некои од прашањата се
кои се однесуваат на состојбата на проектот за складирање на податоци
учесник. Доверливи информации како вашето име
на организацијата не беа откриени во анализата на анкетата.
Дел Б: Почеток
Прашањата во овој дел се поврзани со почетната активност
складирање на податоци. Колку долго се поставуваа прашањата
се однесува на иницијаторите на проектот, гарантите, вештините и знаењата
барања, целите на развојот на складирање на податоци и на
очекувањата на крајните корисници.
Дел В: Дизајн
Овој дел содржи прашања поврзани со активностите на
планирање на складиште на податоци. Конкретно, прашањата се
наведете за обемот на извршување, времетраењето на проектот, трошоците
на проектот и анализата на трошоци/придобивки.
Дел Г: Развој
Во делот за развој има прашања кои се однесуваат на активностите на
развој на складиште на податоци: збирка на кориснички барања
конечни, изворите на податоци, логичкиот модел на податоци, прототипи, на
планирање на капацитетите, технички архитектури и избор на
алатки за развој на складирање податоци.
Дел Е: Операција
Оперативни прашања поврзани со операција ед
до растежливоста на складиште на податоци, како се развива во
следната фаза на развој. Таму квалитетот на податоците, стратегиите на
освежи деи податоци, грануларноста на податоци, приспособливост на податоците
магацин и безбедносните проблеми на складиште на податоци тие беа помеѓу
видовите на поставени прашања.
Дел F: Развој
Овој дел содржи прашања поврзани со користењето податоци
магацин од крајните корисници. Истражувачот беше заинтересиран
на целта и корисноста на складиште на податоци, преглед и стратегии
усвоена обука и стратегија за контрола на податоците
усвоен магацин.
3.4.5. Стапка на одговор
Иако анкетите по пошта се критикуваат дека имаат стапка на
слаб одзив, преземени се мерки за зголемување на
стапка на принос (како што беше дискутирано претходно делумно
3.4.1). Терминот „стапка на одговор“ се однесува на процентот на
луѓе во одреден примерок од анкетата кои одговараат на
прашалник (Denscombe 1998). Се користеше следново
формула за пресметување на стапката на одговор за оваа студија:
Број на луѓе кои одговориле
Стапка на одговор =
—————————————————————————— X 100
Вкупен број на испратени прашалници
3.4.6. Пилот тест
Пред да се испрати прашалникот до примерокот, прашањата се
беше испитан со спроведување на пилот-тестови, како што предложи Лак
и Рубин (1987), Џексон (1988) и де Ваус (1991). Целта на
пилот тестови е да се откријат сите непријатни, двосмислени и изрази
прашања кои се тешки за толкување, за разјаснување
употребени дефиниции и термини и да се идентификува приближното време
потребно е да се пополни прашалникот (Warwick и Lininger 1975,
Џексон 1988, Салант и Дилман 1994). Пилот тестовите беа
се спроведува со избирање на предмети со слични карактеристики на оние
од завршните предмети, како што е предложено Дејвис е Cosenza (1993). Во
оваа студија, шест професионалци за складирање податоци беа
избрани како пилот субјекти. По секој пилот тест, тие се
направени се потребните корекции. Од спроведените пилот тестови, т.е
учесниците помогнаа во преобликувањето и ресетирањето на
конечна верзија на прашалникот.
3.4.7. Методи на анализа Од Дати
I податоци на истрагата собрани од прашалниците со затворени прашања се
беа анализирани со помош на статистички софтверски пакет
наречен SPSS. Многу од одговорите беа анализирани
користејќи описна статистика. Одреден број на прашалници
се вратија нецелосни. Овие беа третирани со поголема
внимание за да бидете сигурни дека јас податоци исчезнати не беа еден
последица на грешки во внесувањето податоци, но зошто прашањата не
биле погодни за пријавувачот, или декларирачот одлучил да не
одговори на едно или повеќе конкретни прашања. Овие одговори
исчезнатите биле игнорирани при анализата податоци и тие беа
шифрирани како „- 9“ за да се обезбеди нивно исклучување од процесот
анализи.
При подготовката на прашалникот, прашањата беа затворени
претходно кодирани со доделување број на секоја опција. Бројот
потоа се користеше за подготовка на и податоци за време на анализата
(Денскомб 1998, Сапсфорд и Јуп 1996). На пример, имаше
шест опции наведени во прашање 1 од делот Б: совет
одбор, виш извршен директор, оддел за ИТ, единица
на бизнис, консултанти и многу повеќе. Во досието на податоци на SPSS, е
беше генерирана променлива за да се означи „иницијаторот на проектот“,
со шест ознаки за вредност: „1“ за „одбор на директори“, „2“
за „извршната власт на високо ниво“ и така натаму. Употребата на Ликертиновата скала
во некои од затворените прашања дозволи и
идентификација која не бара напор со оглед на употребата на вредностите
соодветните броеви внесени во SPSS. За прашања со
неисцрпни одговори, кои меѓусебно не се исклучуваат,
секоја опција беше третирана како една променлива со две
ознаки за вредности: „1“ за „означено“ и „2“ за „неозначено“.
Прашањата со отворен тип беа третирани поинаку од прашањата
затворена. Одговорите на овие прашања не се внесени
SPSS. Наместо тоа, тие беа анализирани рачно. Употребата на ова
типот на прашања ви овозможува да стекнете информации за идеите
слободно изразени и личните искуства на испитаниците
(Bainbridge 1989, Denscombe 1998). Каде што е можно, тоа е направено
категоризација на одговорите.
За анализа на податоци, се користат едноставни методи за статистичка анализа,
како што се фреквенцијата на одговорите, средната вредност, стандардната девијација
средна и медијана (Argyros 1996, Denscombe 1998).
Гама тестот беше ефикасен за добивање квантитативни мерења
на асоцијациите меѓу податоци редни (Норусис 1983, Аргироус 1996).
Овие тестови беа соодветни бидејќи употребените редни ваги не беа
тие имаа многу категории и можеа да бидат прикажани во табела
(Норусис 1983).
3.5 Сомарио
Во ова поглавје, методологијата на истражување и на
дизајни усвоени за оваа студија.
Избор на најсоодветен метод на истражување за а
презема одредена студија
разгледување на голем број правила, вклучувајќи ја природата и видот
на истражувањето, како и заслугите и слабостите на секое можно
метод (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987,
јин 1989 година, Хамилтон и Ајвс 1992 година, Галиерс 1992 година, Нојман 1994 година). Прикажи
недостатокот на постоечко знаење и теорија за тоа
на усвојување складирање податоци во Австралија, оваа студија од
истражувањето бара интерпретативен истражувачки метод со вештина
истражувачки за истражување на искуствата на организациите
австралиски. Избраниот метод на истражување е избран за
собираат информации во врска со усвојувањето на концептот за датум
складирање од страна на австралиски организации. А
Како техника за собирање беше избран поштенски прашалник податоци. На
оправдувања за методот на истражување и техниката на собирање податоци
избраните ќе бидат дадени во ова поглавје. Исто така беше
презентираше дискусија за единицата за анализа, примерокот
користени, процентите на одговори, содржината на прашалникот, на
пред-тест на прашалникот и методот на анализа на податоци.

Проектирање на Складиште на податоци:
Комбинирање на односи со ентитети и димензионално моделирање
ИЗВАДОК
Складирање i податоци Тоа е главно актуелно прашање за многумина
организации. Клучен проблем во развојот
на складирање на податоци тоа е негов дизајн.
Дизајнот мора да поддржува откривање на концепти во податоците
складиште до наследство систем и други извори на податоци а исто така и еден
лесно разбирање и ефикасност во имплементацијата на податоците
магацин.
Голем дел од литературата за складирање на податоци се препорачува
употребата на моделирање на односи со ентитети или димензионално моделирање за
претставуваат дизајн на складиште на податоци.
Во овој труд покажуваме како и двете
репрезентациите може да се комбинираат во еден пристап за
цртање на складиште на податоци. Пристапот што се користи е систематски
испитуван во студија на случај и е идентификуван во голем број на
важни импликации со професионалци.
СКЛАДИРАЊЕ НА ПОДАТОЦИ
Un складиште на податоци обично се дефинира како „субјектно ориентирана,
интегрирано, временски варијанти и нестабилно собирање на податоци како поддршка
на одлуките на менаџментот“ (Инмон и Хакаторн, 1994).
Предметно ориентирано и интегрирано укажува дека на складиште на податоци è
дизајнирани да ги преминат функционалните граници на наследените системи за
нудат интегрирана перспектива на податоци.
Временската варијанта влијае на историската или временски сериската природа на податоци in
un складиште на податоци, што овозможува да се анализираат трендовите.
Неиспарливите укажуваат на тоа дека складиште на податоци тоа не е континуирано
ажурирано како а база на податоци на OLTP. Наместо тоа, тој е ажуриран
периодично, со податоци кои доаѓаат од внатрешни и надворешни извори. На
складиште на податоци тој е специјално дизајниран за истражување
наместо за интегритетот на ажурирањата и перформансите на
операции.
Идејата за складирање на i податоци не е ново, тоа беше една од целите
на управување со податоци од шеесеттите (The Martin, 1982).
I складиште на податоци ја нудат инфраструктурата податоци за управување
системи за поддршка. Системите за поддршка на управувањето вклучуваат одлука
системи за поддршка (DSS) и извршни информациски системи (EIS).
DSS е компјутерски базиран информациски систем што е
дизајниран да го подобри процесот и следствено на зафатот
човечка одлука. EIS е типично систем за испорака на
податоци што им овозможува на деловните директори лесно да пристапат до погледот
на податоци.
Општата архитектура на А складиште на податоци ја истакнува улогата на
складиште на податоци во менаџмент поддршка. Покрај понудата
инфраструктурата податоци за EIS и DSS, ал складиште на податоци можно е
пристапете до него директно преку прашања. НА податоци вклучени во датум
магацин се засноваат на анализа на барањата за информации
управување и се добиени од три извори: внатрешни наследни системи,
системи за собирање податоци за специјална намена и надворешни извори на податоци. НА
податоци во внатрешните наследени системи тие често се непотребни,
неконзистентни, низок квалитет и складирани во повеќе формати
па тие треба да се усогласат и исчистат пред да можете да ги вчитате во
складиште на податоци (Инмон, 1992; Мекфејден, 1996). НА податоци од
од системи за складирање податоци ад хок и од извори податоци
надворешните често се користат за зголемување (ажурирање, замена) i
податоци од наследните системи.
Постојат многу убедливи причини да се развие а складиште на податоци,
кои вклучуваат подобро донесување одлуки преку употреба
ефективни повеќе информации (Ives 1995), поддршка за фокус
на целосниот бизнис (Греам 1996), и намалувањето на трошоците на
обезбедување на податоци за EIS и DSS (Graham 1996, McFadden
1996).
Една неодамнешна емпириска студија покажа, во просек, враќање на
инвестиции за и складиште на податоци за 401% по три години (Греам,
1996). Меѓутоа, другите емпириски студии на складиште на податоци имаат
откриле значителни проблеми, вклучително и тешкотии во мерењето на ед
доделување бенефиции, немање јасна цел, потценување
целта и сложеноста на процесот на складирање i податоци, Во
особено во однос на изворите и чистотата на податоци.
Складирање i податоци може да се смета како решение
на проблемот со управувањето со податоци помеѓу организациите. Таму
манипулација со податоци како социјален ресурс остана еден од
клучни прашања во управувањето со информациските системи низ
светот за многу години (Brancheau et al. 1996, Galliers et al. 1994,
Нидерман и сор. 1990, Перван 1993).
Популарен пристап за управување податоци во осумдесетите беше
развивање на модел податоци социјални. Модел податоци социјален беше
дизајниран да понуди стабилна основа за развој на нови системи
апликации д база на податоци и обнова и интегрирање на наследството
системи (Браншо и сор.
1989 година, Гудхју и сор. 1988:1992, Ким и Еверест 1994).
Сепак, има многу проблеми со овој пристап, во
особено, сложеноста и цената на секоја задача и долгото време
се бара да има опипливи резултати (Beynon-Davies 1994, Earl
1993 година, Гудхју и сор. 1992, Periasamy 1994, Shanks 1997).
Il складиште на податоци тоа е посебна база на податоци што коегзистира со наследените
бази на податоци наместо нивна замена. Затоа ви овозможува да
го насочуваат управувањето на податоци и избегнувајте скапа реконструкција
на наследните системи.
ПОСТОЈНИ ПРИСТАПИ КОН ДИЗАЈН НА ПОДАТОЦИ
СКУШЕН
Процесот на градење и усовршување а складиште на податоци
треба да се сфати повеќе како еволутивен процес отколку како а
животниот циклус на развој на традиционалните системи (Десио, 1995, Шенкс,
О'Донел и Арнот 1997а). Постојат многу процеси кои се вклучени во а
проект на складиште на податоци како што се иницијализација, планирање;
информации добиени од барањата побарани од менаџерите на компаниите;
извори, трансформации, чистење на податоци и синхронизација од наследство
системи и други извори на податоци; системи за испорака во развој;
следење на складиште на податоци; и бесмисленост на процесот
еволутивна и конструкција на а складиште на податоци (Смрди, О'Донел
и Arnott 1997б). Во ова списание се фокусираме на тоа како
цртај i податоци складирани во контекст на овие други процеси.
Постојат голем број на пристапи предложени за архитектура на податоци
магацин во литературата (Inmon 1994, Ives 1995, Kimball 1994
Мекфејден 1996). Секоја од овие методологии има краток преглед
преглед со анализа на нивните силни и слаби страни.
Inmon's (1994) Пристап за Складиште на податоци
дизајн
Инмон (1994) предложи четири итеративни чекори за цртање податоци
магацин (види слика 2). Првиот чекор е да дизајнирате шаблон
податоци социјални да се разбере како јас податоци може да се интегрираат
низ функционалните области во рамките на една организација
делење i податоци складирајте во области. Модел податоци тоа е направено за
да складира податоци кои се однесуваат на донесување одлуки, вклучувајќи податоци
историчари, и вклучени податоци изведена и собрана. Вториот чекор е
идентификувајте ги предметните области за имплементација. Овие се базирани
на приоритети утврдени од одредена организација. Третиот
чекорот вклучува цртање a база на податоци за предметната област, пози
посветете особено внимание на вклучување соодветни нивоа на грануларност.
Инмон препорачува користење на моделот ентитети и врски. Четврто
чекор е да се идентификуваат изворните системи податоци бара и развива
процеси на трансформација за снимање, чистење и форматирање i податоци.
Јаките страни на пристапот на Инмон се дека моделот податоци социјални
нуди основа за интеграција на податоци во рамките на организацијата
и поддржува планирање за итеративен развој на податоци
магацин. Неговите недостатоци се тешкотијата и трошоците за цртање
модел податоци социјални, тешкотијата во разбирањето на моделите на ентитети и
релациите што се користат во двата модели, тоа податоци социјални и тоа на податоци
складирани по предметна област и соодветноста на податоци del
цртање на складиште на податоци за реализација на база на податоци
релациски но не и за база на податоци повеќедимензионални.
Ајвс (1995) Пристап кон Складиште на податоци
дизајн
Ајвс (1995) предлага пристап од четири чекори за дизајнирање а
информациски систем за кој смета дека е применлив за дизајнирање на податоци
магацин (види слика 3). Пристапот е многу заснован на
Информатичко инженерство за развој на информациски системи
(Мартин 1990). Првиот чекор е да се одредат целите, факторите
критични и успешни и клучни индикатори за успешност. НА
клучните деловни процеси и потребните информации се
моделирани да не одведат до модел податоци социјални. Вториот чекор
вклучува развој на дефинирачка архитектура податоци
складирани по области, база на податоци di складиште на податоци, компонентите
на технологијата што се бара, збир на организациска поддршка
потребни за спроведување и работа со складиште на податоци. Третиот
чекорот вклучува избор на потребни софтверски пакети и алатки.
Четвртиот чекор е детално проектирање и изградба на
складиште на податоци. Ајвс забележува дека складирањето податоци тој е врзан човек
итеративен процес.
Силата на пристапот на Ајвс е употребата на специфични техники за
се утврди барањата за информации, употребата на структурирани
процес за поддршка на интеграцијата на складиште на податоци,
соодветен избор на хардвер и софтвер и употреба на повеќе
техники на претставување за складиште на податоци. Неговите недостатоци
тие се својствени за сложеноста. Други вклучуваат тешкотии во
развиваат многу нивоа на база на податоци во складиште на податоци in
разумни времиња и трошоци.
Kimball's (1994) Пристап кон Складиште на податоци
дизајн
Кимбал (1994) предложи пет итеративни чекори за цртање податоци
магацин (види слика 4). Неговиот пристап е особено
посветен на дизајнот на само еден складиште на податоци и за употребата на модели
димензионални во предност на модели на ентитети и односи. Кимбал
анализирајте ги тие димензионални модели бидејќи ми е полесно да ги разберам
бизнис директори се занимава, тоа е поефикасно кога се занимаваат
комплексни консултации, и дизајнот на база на податоци физички е повеќе
ефикасен (Kimball 1994). Кимбал препознава дека развојот на а
складиште на податоци тоа е итеративно, и тоа складиште на податоци разделени можат
да се интегрираат преку поделбата во табели со димензии
заеднички.
Првиот чекор е да се идентификува одредена предметна област што треба да биде
усовршени. Вториот и третиот чекор се однесуваат на обликувањето
димензионални. Во вториот чекор мерењата ги идентификуваат работите на
интерес за предметната област и групирани во табела со факти.
На пример, во предметна област на продажба мерките на интерес
може да го вклучи износот на продадените предмети и доларот
како продажна валута. Третиот чекор вклучува идентификување
димензии кои се начините на кои тие можат да се групираат i
факти. Во предметната област на продажба, релевантни димензии
може да вклучува ставка, локација и временски период. Таму
Табелата со факти има клуч од повеќе делови за поврзување со секој
на табели со димензии и обично содржи многу број
полн со факти. Спротивно на тоа, табелите со димензии содржат
описни информации за димензиите и другите атрибути кои
може да се користи за групирање на факти. Табела со факти д
димензиите поврзани со предлогот го формираат она што се нарекува еден
модел на ѕвезда поради неговата форма. Четвртиот чекор вклучува
изградбата на А база на податоци повеќедимензионален за да го усоврши
шема на ѕвезди. Последниот чекор е да се идентификуваат изворните системи податоци
потребни и развиваат процеси на трансформација за стекнување, чистење
и формат i податоци.
Јаките страни на пристапот на Кимбал вклучуваат употреба на модели
димензионални да претставуваат i податоци складирани кои го прават
лесен за разбирање и води кон ефикасен физички дизајн. А
димензионален модел кој исто така лесно ги користи и двете
системи на база на податоци релациона може да се усоврши или системи
база на податоци повеќедимензионални. Неговите недостатоци вклучуваат недостаток
на некои техники за олеснување на планирањето или интегрирањето на
многу модели на ѕвезди во една складиште на податоци и
тешкотија во дизајнирањето од екстремната денормализирана структура во a
димензионален модел a податоци во системот на наследство.
McFadden's (1996) Пристап кон податоците
Дизајн на складиште
McFadden (1996) предлага пристап од пет чекори кон
нацртајте а складиште на податоци (види слика 5).
Неговиот пристап се заснова на синтеза на идеи од литературата
и е фокусиран на дизајнот на само еден складиште на податоци. Првиот
чекорот вклучува анализа на барањата. Иако спецификите
техниките не се пропишани, белешките на Мекфаден го идентификуваат
ентитет податоци спецификации и нивните атрибути, а се однесува на читателите на Вотсон
и Frolick (1993) за зафаќање на барањата.
Во вториот чекор, е дизајниран модел за односи со ентитетите
складиште на податоци а потоа потврдени од деловните лидери. Третиот
чекор вклучува одредување на мапирањето од наследниот систем
и надворешни извори на складиште на податоци. Четвртиот чекор вклучува
процеси во развој, распоредување и синхронизација на податоци во
складиште на податоци. Во последниот чекор, системот се испорачува
развиен со посебен акцент на корисничкиот интерфејс.
Мекфејден истакнува дека процесот на цртање е генерално
итеративен.
Јаките страни на пристапот на Мекфејден укажуваат на учеството
од страна на деловните лидери во одредувањето на барањата и исто така
важноста на ресурсите податоци, нивно чистење и собирање. Таа
пропустите се однесуваат на немањето процес за делење a
одличен проект од складиште на податоци во многу интегрирани фази, и на
тешкотии во разбирањето на моделите на ентитет и односи кои се користат при дизајнирањето на
складиште на податоци.

0/5 (0 критики)

Дознајте повеќе од Онлајн веб агенција

Претплатете се за да ги добивате најновите написи по е-пошта.

admin Извршен директор

👍Онлајн веб агенција | Веб агенција експерт за дигитален маркетинг и оптимизација. Web Agency Online е веб-агенција. За Agenzia Web Online успехот во дигиталната трансформација се заснова на темелите на Iron SEO верзија 3. Специјалитети: Системска интеграција, Интеграција на апликации за претпријатија, Архитектура ориентирана кон услуги, Cloud Computing, складиште на податоци, деловна интелигенција, големи податоци, портали, интранет, веб-апликација Дизајн и управување со релациони и повеќедимензионални бази на податоци Дизајнирање интерфејси за дигитални медиуми: употребливост и графика. Онлајн веб-агенција им ги нуди на компаниите следните услуги: -SEO на Google, Amazon, Bing, Yandex; -Веб аналитика: Google Analytics, Google Tag Manager, Yandex Metrica; -Кориснички конверзии: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM на Google, Bing, Amazon Ads; - Маркетинг на социјални медиуми (Фејсбук, Линкедин, Јутјуб, Инстаграм).

Видете целосна био

Дигитални Маркетинг База на податоци DBMS Складиште на податоци податоци науката онлајн Реклама Информатичка технологија Веб-агенција Рекламна агенција Маркетинг

Сподели:

Ми се допаѓа:

Дознајте повеќе од Онлајн веб агенција