https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

Складиштење података и ЕРП | ЦЕНТРАЛНА АРХИВА ПОДАТАКА: ИСТОРИЈА И ЕВОЛУЦИЈА

АРХИВ ДАТА ЦЕНТРАЛНИ: ИСТОРИЈА И ЕВОЛУЦИЈЕ

Две доминантне теме корпоративне технологије 90-их су
државе и складиште података и ЕРП. Дуго времена ова два моћна
актуелни су били делови корпоративне ИТ без икаквих проблема
раскрснице. Било је скоро као да су материја и анти-материја. Али
раст обе појаве неминовно је довео до једног
њихов пресек. Данас се компаније суочавају са проблемом
шта радити са ЕРП е складиште података. Овај чланак ће илустровати
који су проблеми и како их компаније решавају.
НА ПОЧЕТКУ…
У почетку је постојао складиште података. Складиште података је рођен за
супротставити апликационом систему за обраду трансакција.
У првим данима памћење на подаци суђено је
само контрапункт апликацијама за компјутерску обраду
трансакције. Али данас постоје много софистициранији погледи
од чега а складиште података. У данашњем свету,
складиште података умеће се унутар структуре која може бити
под називом Фабрика корпоративних информација.
ФАБРИКА КОРПОРАТИВНИХ ИНФОРМАЦИЈА
(ЦИФ)
Фабрика корпоративних информација има архитектонске компоненте
стандард: ниво трансформације и интеграције кода
који интегрише и подаци Док сам подаци крећу се из окружења на
примена према животној средини складиште података од компаније; а
складиште података компаније у којој је подаци
детаљни и интегрисани историчари. Тхе складиште података предузећа служи као
темељ на коме се могу градити сви остали делови
животне средине складиште података; складиште оперативних података (ОДС).
ОДС је хибридна структура која садржи неке аспекте података
складиште и други аспекти ОЛТП окружења; база података, где и
Различита одељења могу имати сопствену верзију података
складиште; а складиште података истраживања у којој и
„Филозофи“ компаније могу да поднесу своје упите
72 сата без штетног утицаја на складиште података; и сећање
близу линије, где подаци стари и подаци масовни детаљ може бити
јефтино ускладиштена.
ГДЕ СЕ КОМБИНУЈЕ ЕРП СА
ФАБРИКА КОРПОРАТИВНИХ ИНФОРМАЦИЈА
ЕРП се спаја са Фабриком корпоративних информација на два места.
Прво као основна апликација (основна) која обезбеђује и
подаци пријаве на складиште података. У овом случају и подаци,
генерисан као нуспроизвод процеса трансакције,
су интегрисани и учитани у складиште података од компаније. Тхе
друга тачка споја између ЕРП-а и ЦИФ-а и ОДС-а. У ствари, многи
окружења ЕРП се користи као класични ОДС.
У случају да се ЕРП користи као основна апликација, он
исти ЕРП се такође може користити у ЦИФ-у као ОДС. Ин
У сваком случају, ако се ЕРП користи у обе улоге, постоји
мора постојати јасна разлика између два ентитета. Другим речима,
када ЕРП игра улогу основне апликације и ОДС,
две архитектонске целине морају бити различите. Ако самац
имплементација ЕРП-а покушава да испуни обе улоге
у исто време ће неизбежно бити проблема у
пројектовање и имплементација ове структуре.
ОДВОЈЕНЕ ОДСКЕ И ОСНОВНЕ ПРИМЕНЕ
Постоји много разлога који доводе до цепања компоненти
архитектонски. Можда најелоквентније питање за раздвајање
различите компоненте архитектуре је да свака компонента
архитектуре има свој поглед. Основна апликација служи
за другачију сврху од оне за ОДС. Покушајте да се преклапате
основни поглед апликације на свет ОДС-а или обрнуто
То није прави начин рада.
Сходно томе, први проблем ЕРП-а у ЦИФ-у је проблем
проверите да ли постоји разлика између основне линије и апликација
ОДС.
МОДЕЛИ ПОДАТАКА У КОМПАНИЈИ
ФАБРИКА ИНФОРМАЦИЈА
Да би се постигла кохезија између различитих компоненти
архитектуре ЦИФ-а, мора постојати модел подаци. Ја
модели на подаци Они служе као веза између различитих компоненти
архитектуре као што су основне апликације и ОДС. ТХЕ
модели на подаци постати „интелектуална мапа пута“ да се
право значење из различитих архитектонских компоненти ЦИФ-а.
Идући руку под руку са овим појмом, идеја је да треба
бити сјајан и јединствен модел подаци. Наравно да мора
бити узор подаци за сваку од компоненти и такође тамо
то мора бити разуман пут који повезује различите моделе.
Свака компонента архитектуре – ОДС, основне апликације,
складиште података компаније и тако даље.. – треба своје
модел оф подаци. И зато мора постојати прецизна дефиниција
попут ових модела подаци међусобно се повезују.
МОВЕ И ДАТА ЕРП-а у подацима
ВАРЕХОУСЕ
Ако порекло на подаци је основна апликација и/или ОДС, када
ЕРП уметци и подаци у складиште података, ово уметање мора
јављају на најнижем нивоу „грануларности“. Рецап ор
једноставно агрегат и подаци како излазе
из ЕРП основне апликације или из ЕРП ОДС није
права ствар коју треба урадити. ТХЕ подаци детаљи су потребни у подацима
магацин да чини основу процеса ДСС. Такве подаци
они ће на много начина бити преобликовани помоћу база података и истраживања
дел складиште података.
Пресељење оф подаци из основног окружења апликације
ЕРП-а на окружење складиште података компаније је направљен у а
разумно опуштен начин. Та промена се дешава после тога
приближно 24 сата од ажурирања или креирања у ЕРП-у. Чињеница о
имају „лењи“ покрет од подаци у складиште података
компаније дозвољава подаци који долазе из ЕРП-а на „депозит“.
Једном сам подаци се чувају у основној апликацији,
онда можете безбедно да померите подаци ЕРП-а
у послу. Још један циљ достижан захваљујући покрету
„лењи“ богови подаци је јасно разграничење између оперативних процеса и
ДСС. Са „брзим” покретом подаци линија раздвајања
између ДСС-а и оперативног остаје нејасно.
Ил мовименто деи подаци од ОДС ЕРП до складиште података
компаније се врши периодично, обично
недељно или месечно. У овом случају кретање од
подаци заснива се на потреби „чишћења” старих подаци историчари.
Наравно, ОДС садржи и подаци који су много новији
поштовање за подаци историчари су пронашли у складиште података.
Пресељење оф подаци у складиште података то се скоро никада не ради
„на велико” (на велепродајни начин). Копирајте табелу
из ЕРП окружења до складиште података то нема смисла. Један приступ
много реалније је кретање одабраних јединица подаци.
Само подаци који су се променили од последњег ажурирања података
магацин су они које треба преместити у податке
складиште. Један од начина да сазнате које подаци они су модификовани
пошто је последње ажурирање да се погледају временске ознаке подаци
налази у ЕРП окружењу. Дизајнер бира све измене
који су се појавили од последњег ажурирања. Други приступ
је коришћење техника стицања промена подаци. Са
Ове технике анализирају дневнике и траке дневника како би
одредити које подаци мора бити премештен из ЕРП окружења у
То од складиште података. Ове технике су најбоље у
колико дневника и трака дневника може да се прочита из ЕРП датотека
без даљих ефеката на друге ЕРП ресурсе.
ДРУГЕ КОМПЛИКАЦИЈЕ
Један од проблема са ЕРП-ом у ЦИФ-у је оно што се дешава другима
извори апликација или аи подаци ОДС којима морају да допринесу
складиште података али нису део ЕРП окружења. С обзиром на
затворена природа ЕРП-а, посебно САП-а, покушај да се интегрише
кључеви из спољних извора подаци са и подаци који долазе из ЕРП-а у
време за кретање и подаци у складиште података, то је велики изазов.
И које су тачно вероватноће да и подаци апликација или
ОДС изван ЕРП окружења биће интегрисани у податке
складиште? Шансе су заправо веома високе.
ФИНД ДАТА ИСТОРИЈСКИ ОД ЕРП
Још један проблем са и подаци ЕРП-а је резултат
из потребе да се има подаци историчари у оквиру складиште података.
Обично је складиште података потребе подаци историчари. И
ЕРП технологија их обично не чува подаци
историјски, бар не до те мере да је то неопходно у подацима
складиште. Када је велика количина подаци историчари почињу да
бити додат у ЕРП окружење, то окружење мора бити
Поспремлљено. На пример, претпоставимо да је а складиште података мора
бити оптерећен са пет година од подаци историјски док ЕРП задржава
највише шест месеци ових подаци. Све док је компанија задовољна са
прикупити сет од подаци историчари како време пролази,
онда нема проблема у коришћењу ЕРП-а као извора за
складиште података. Али када је складиште података морам да идем
назад у време и узети богове подаци историчари који то нису били
претходно прикупљено и сачувано од стране ЕРП-а, затим ЕРП окружење
постаје неефикасна.
ЕРП И МЕТАДАТА
Још једно разматрање о ЕРП е складиште података је ли то
о постојећим метаподацима у ЕРП окружењу. Као и метаподаци
прећи из ЕРП окружења у ИТ окружење складиште података,
метаподаци се морају премештати на исти начин. Штавише, и
метаподаци морају бити трансформисани у формату и структури
захтева инфраструктура складиште података. Постоји велики
разлика између оперативних метаподатака и ДСС метаподатака. Метаподаци
оперативни су првенствено за програмера и за
програмер. ДСС метаподаци су првенствено за корисника
финале. Постојећи метаподаци у ЕРП апликацијама или ОДС-овима
морају се преобратити и ова конверзија није увек лака
и директно.
ИЗВОРИ ЕРП ПОДАТАКА
Ако се ЕРП користи као добављач за подаци за складиште података ci
потребно је да буде чврст интерфејс који се креће и подаци из околине
ЕРП за животну средину складиште података. Интерфејс мора:
▪ бити лак за употребу
▪ дозволи приступ подаци ЕРП-а
▪ узети значење подаци који ће бити премештени
у складиште података
▪ знати ограничења ЕРП-а која могу настати у
када подаци ЕРП-а:
▪ референтни интегритет
▪ хијерархијски односи
▪ имплицитне логичке релације
▪ конвенција о примени
▪ све структуре подаци подржан од стране ЕРП-а, и тако даље…
▪ бити ефикасан у приступу подаци, обезбеђујући:
▪ директно кретање подаци
▪ стицање промене подаци
▪ подршка благовременом приступу подаци
▪ разумеју формат подаци, и тако даље…
ИНТЕРФЕЈС СА САП-ом
Интерфејс може бити два типа, домаћи или комерцијални.
Неки од главних трговачких интерфејса укључују:
▪ САС
▪ Примс Солутионс
▪ Д2к, и тако даље…
ВИШЕ ЕРП ТЕХНОЛОГИЈА
Третирање ЕРП окружења као да је једна технологија је а
Велика грешка. Постоји много ЕРП технологија, од којих свака има своју
снаге. Најпознатији продавци на тржишту су:
▪ САП
▪ Орацле Финанциалс
▪ ПеоплеСофт
▪ ЈД Едвардс
▪ Баан
SAP
САП је највећи и најкомплетнији ЕРП софтвер. Апликације
САП-а укључују многе врсте апликација у многим областима. САП има
репутација бића:
▪ веома велики
▪ веома тешко и скупо за имплементацију
▪ потребно је много људи и консултаната
имплементиран
▪ захтева специјализоване људе за имплементацију
▪ потребно је много времена за имплементацију
Поред тога, САП има репутацију да складишти своје подаци врло
пажљиво, што отежава приступ њима
особа ван САП области. САП-ова снага је постојање
способан да ухвати и ускладишти велику количину подаци.
Недавно је САП најавио своју намеру да продужи
његове примене на складиште података. Има много предности и недостатака
у коришћењу САП-а као добављача складиште података.
Предност је што је САП већ инсталиран и што је већина
консултанти већ познају САП.
Недостаци САП-а као добављача складиште података су
многи: САП нема искуства у свету складиште података
Ако је САП добављач складиште података, потребно је "изнети"
i подаци од САП до складиште података. Дата САП-ов рекорд
затвореног система, мало је вероватно да ће бити лако ући у САП
то (???). Постоји много наслеђених окружења која покрећу САП,
као што су ИМС, ВСАМ, АДАБАС, ОРАЦЛЕ, ДБ2 и тако даље.
САП инсистира на приступу „који није измишљен овде“. САП то не жели
сарађивати са другим добављачима да бисте користили или креирали складиште података.
САП инсистира на томе да сам генерише сав свој софтвер.
Иако је САП велика и моћна компанија, чињеница је да
покушај да се препише технологија ЕЛТ, ОЛАП, администрације
систем, па чак и основни код дбмс то је једноставно лудо.
Уместо да заузме кооперативни став са добављачима
di складиште података дугогодишњи, САП је следио приступ који
они „знају боље“. Овакав став успорава успех
САП може имати у области складиште података.
САП-ово одбијање да дозволи приступ спољним добављачима
брзо и љубазно према њима подаци. Сама суштина коришћења
un складиште података је лак приступ подаци. Цела прича о САП-у је
засновано на отежавању приступа подаци.
САП-ов недостатак искуства у раду са великим количинама подаци;
у области складиште података постоје томови подаци никад виђено од тада
САП и за управљање овим великим количинама подаци морате имати један
одговарајућу технологију. САП очигледно није обавештен о томе
технолошка баријера која постоји за улазак у поље података
магацин.
САП-ова корпоративна култура: САП је створио посао
у добијању и подаци из система. Али да бисте то урадили морате имати
другачији менталитет. Традиционално, софтверске компаније које су
добри у уносу података у окружење нису били добри у
добијање података да иду у другом правцу. Ако САП може да уради ово
свитцх ће бити прва компанија која ће то учинити.
Укратко, упитно је да ли компанија треба да бира
САП као добављач складиште података. Постоје веома озбиљни ризици
с једне стране и врло мало награда с друге стране. Али постоји још један
разлог који обесхрабрује избор САП-а као добављача података
складиште. Јер свака компанија треба да има исти датум
складиште свих осталих компанија? Тхе складиште података то је срце
конкурентске предности. Када би свака компанија усвојила исто
складиште података било би тешко, мада не и немогуће,
остварити конкурентску предност. Чини се да САП мисли да а
складиште података може се посматрати као колачић а то је а
још један знак њиховог менталитета апликације „добијте податке“.
у”.
Ниједан други ЕРП добављач није тако доминантан као САП.
Несумњиво ће бити компанија које ће пратити САП-ов пут
за њихове складиште података али по свој прилици ови датуми
САП складишта ће бити велика, скупа и захтевна
време за њихово стварање.
Ова окружења укључују такве активности као што су обрада благајника банке,
процеси резервација авио-компанија, жалбени процеси
осигурање и тако даље. Трансакциони систем је био ефикаснији,
очигледнија је била потреба за раздвајањем између оперативног и процесног
ДСС (Систем за подршку одлучивању). Међутим, са системима ресурса
људски и лични, никада се не суочите са великим количинама
трансакције. И, наравно, када се човек запосли
или напусти компанију ово је запис о трансакцији.
Али у односу на друге системе, системе људских ресурса и
лични људи једноставно немају много трансакција. Стога, у
људских ресурса и кадровских система није сасвим очигледно да постоји
треба ДатаВарехоусе. На много начина ови системи
представљају спајање система ДСС.
Али постоји још један фактор који морате узети у обзир ако морате
урадите са складиштем података и ПеоплеСофт-ом. У многим срединама, тј подаци
људских и личних ресурса су секундарни у односу на посао
шеф компаније. Већина компанија спроводи
производња, продаја, пружање услуга и тако даље. ТХЕ
Системи људских ресурса и кадрови су обично секундарни (или од
подршка) главној пословној линији компаније. Дакле, јесте
двосмислено и незгодно складиште података одвојено за
подршка људским и личним ресурсима.
ПеоплеСофт се у том погледу веома разликује од САП-а. Са САП-ом јесте
обавезно да постоји а складиште података. Са ПеоплеСофт, није
онда тако јасно. Складиште података је опционо уз ПеоплеСофт.
Најбоља ствар која се може рећи за подаци ПеоплеСофт је тај податак
складиште се може користити за архивирање подаци се односе
стари људски и лични ресурси. Други разлог за
коју компанија жели да користи а складиште података a
штета за ПеоплеСофт окружење је омогућавање приступа и
слободан приступ алатима за анализу, аи подаци би ПеоплеСофт. Али
Поред ових разлога, могу постојати случајеви када је боље да то не чините
имају складиште података за подаци ПеоплеСофт.
Укратко
Постоји много идеја у вези са конструкцијом података
складиште унутар ЕРП софтвера.
Неки од њих су:
▪ Има смисла имати а складиште података који личи на било који
друго у индустрији?
▪ Колико је флексибилан ЕРП складиште података софтвер?
▪ ЕРП складиште података софтвер може да обради обим од
подаци који се налази у аскладиште података арена"?
▪ Шта је евиденција праћења коју ЕРП добављач ради
суочен са лаким и јефтиним, у смислу времена, аи подаци? (Шта
је рекорд ЕРП добављача у испоруци јефтиних, на
време, лако приступити подацима?)
▪ Како разумете архитектуру ДСС-а и
„фабрика корпоративних информација“ од стране ЕРП добављача?
▪ ЕРП добављачи разумеју како да постигну подаци алл'интерно
животне средине, али и разумети како их извозити?
▪ Колико су отворени алати ЕРП добављача до данас
складиштење?
Сва ова разматрања морају се узети у обзир приликом одређивања
где ставити складиште података који ће угостити и подаци ЕРП-а и др
подаци. Уопштено говорећи, осим ако не постоји убедљив разлог за то
урадите другачије, препоручује се изградња складиште података напоље
из окружења добављача ЕРП-а.
ЦАПИТОЛО 1
Преглед БИ организације
Кључне тачке:
Репозиторијуми информација раде обрнуто
на архитектуру пословне интелигенције (БИ):
Корпоративна култура и ИТ могу ограничити успех у
изградња БИ организација.
Технологија више није ограничавајући фактор за БИ организације. Тхе
проблем за архитекте и планере пројеката није да ли
технологија постоји, али ако могу ефикасно да имплементирају
доступна технологија.
За многе компаније а складиште података то је мало више од магацина
пасив који дистрибуира и подаци корисницима којима је то потребно. ТХЕ подаци
извлаче се из изворних система и насељавају у циљне структуре
di складиште података. Ја подаци такође се могу очистити са свим
богатство. Међутим, не додаје се ни додатна вредност
прикупио подаци током овог процеса.
У суштини, пасивни Дв, у најбољем случају, доноси
само ја подаци чиста и оперативна за корисничка удружења. тамо
стварање информација и аналитичко разумевање зависе
у потпуности од стране корисника. Процијените да ли је ДВ (Складиште података) је
успех је субјективан. Ако судимо о успеху на
способност ефикасног прикупљања, интеграције и чишћења и подаци
корпоративни на предвидљивој основи, онда да, ДВ је успех.
С друге стране, ако погледамо наплату, консолидацију и гле
експлоатацију информација организације у целини, затим
ДВ је неуспех. ДВ пружа малу или никакву вредност
информације. Као резултат тога, корисници су приморани да се сналазе,
стварајући тако силосе за информације. Ово поглавље представља
потпуну визију да сумира архитектуру БИ (Бусинесс
Интелигенција) компаније. Почнимо са описом БИ е
онда ћемо прећи на дискусије о дизајну и
развијање информација, за разлику од једноставног пружања и подаци
корисницима. Дискусије се затим фокусирају на израчунавање
вредност ваших БИ напора. Закључујемо дефинисањем како ИБМ
одговара БИ архитектонским захтевима ваше организације.
Опис архитектуре
БИ организација
Сада су моћни информациони системи оријентисани на трансакције
уобичајена појава у сваком великом подухвату, како они ниво
ефективно игралиште за корпорације широм света.
Међутим, да бисмо остали конкурентни, сада су потребни системи аналитички
оријентисан ка који може револуционисати способност компаније поновним откривањем ед
користећи информације које већ имају. Ови системи
аналитика произилази из разумевања из богатства подаци
доступан. БИ може побољшати перформансе свих информација
од компаније. Компаније могу побољшати односе између купаца
добављачи, побољшати профит производа и услуга, генер
нове и боље понуде, контролишу свој ризик и између многих других
зарада драматично смањује трошкове. Са БИ твојим
компанија коначно почиње да користи информације о купцима
као конкурентско добро захваљујући апликацијама које имају за циљ
тржиште.
Имати прави посао значи имати коначне одговоре
кључна питања као што су:
▪ Који од наших клијенти они нас терају да зарађујемо више, или ми
да ли праве губитак?
▪ Где живе наши најбољи клијенти у односу на продавница/
складиште које често посећују?
▪ Који од наших производа и услуга се може продати више
ефективно и коме?
▪ Који производи се могу најефикасније продати и коме?
▪ Која продајна кампања је најуспешнија и зашто?
▪ Који су канали продаје најефикаснији за које производе?
▪ Како можемо побољшати односе са нашим најбољим људима клијенти?
Већина компанија има подаци грубо одговорити
ова питања.
Оперативни системи генеришу велике количине производа, од
купца и од подаци тржиште са продајних места, резервација,
од стране корисничког сервиса и система техничке подршке. Изазов је
извући и искористити ове информације.
Многе компаније профитирају само од малих делова својих подаци
за стратешке анализе.
I подаци преостали, често у комбинацији са и подаци који произилазе из спољних извора као што су
„извештаји владе” и друге купљене информације су једно
рудник злата који само чека да буде истражен, нпр подаци девоно
бити префињен само у вашем информационом контексту
организација.
Ово знање се може применити на различите начине, варијације
од дизајнирања укупне корпоративне стратегије до
лична комуникација са добављачима, преко цалл центара,
фактурисање, Интернет и друге тачке. Данашње пословно окружење диктира
да ДВ и сродна БИ решења еволуирају даље
извођење традиционалних структура подаци као што су ја подаци нормализован на
атомског нивоа и „фарме звезда/коцка“.
Оно што је потребно да останемо конкурентни је спој
традиционалне и напредне технологије у настојању да подрже а
огроман аналитички пејзаж.
Да закључимо, опште окружење мора да унапреди знање
компаније у целини, обезбеђујући да предузете радње
као последица спроведених анализа су корисне тако да свако може
корист.
На пример, рецимо да класификујете своје клијенти у категоријама
висок или низак ризик.
Ако су ове информације генерисане из екстрахованог модела или
друга средства, морају се ставити у Дв и учинити доступним
било ко, помоћу било ког алата за приступ, као што је и
статичке извештаје, табеле, табеле или аналитичку обраду у
линија (ОЛАП).
Међутим, тренутно је много оваквих информација
остати у силосима подаци појединаца или одељења које генеришу
анализа. Организација, као целина, има малу или никакву видљивост
за разумевање. Само мешање ове врсте садржаја
информације у вашој компанији ДВ можете елиминисати силосе
информације и подигните своје ДВ окружење.
Постоје две велике препреке за развој организације
оф тхе БИ.
Прво, имамо проблем саме организације
релевантне дисциплине.
Чак и ако не можемо да помогнемо у промени политике
организације, можемо помоћи у разумевању компоненти
БИ организација, њена архитектура и како
ИБМ технологија олакшава његов развој.
Друга препрека коју треба превазићи је недостатак технологије
интегрисано и познавање методе која подсећа на цео простор
БИ за разлику од само мале компоненте.
ИБМ се мири са променама у технологији
од интегрисаних. Ваша је одговорност да обезбедите дизајн
самосвестан. Ова архитектура се мора развијати са
технологија изабрана за интеграцију без ограничења, или барем са
технологија која се придржава отворених стандарда. Штавише, твој
Менаџмент компаније мора да обезбеди да предузеће Би
спроводи по програму и да то не дозволи
развој информационих силоса који произилазе из самопослуживања
агенде или циљеве.
Ово не значи да БИ окружење није осетљиво
реаговати на различите потребе и захтеве различитих корисника; уместо тога, то значи
да је спровођење тих индивидуалних потреба и захтева
урађено за добробит целе БИ организације.
Опис архитектуре БИ организације може
може се наћи на страни 9 на слици 1.1. Архитектура демонстрира
богат спој технологија и техника.
Са традиционалног погледа, архитектура укључује следеће компоненте
оф варехоусе
Атомски слој (Атомски слој).
Ово је темељ, срце целог Дв-а, а самим тим и од
стратешко извештавање.
I подаци похрањени овде задржаће историјски интегритет, извештаји о
подаци и укључују изведене метрике, као и да буду чисти,
интегрисани и ускладиштени коришћењем екстрахујућих модела.
Сва накнадна употреба ових подаци а сродне информације су
произилази из ове структуре. Ово је одличан извор за
екстракција од подаци и за извештаје са структурираним СКЛ упитима
Оперативно складиште за подаци или извештај на основу
подаци(Складиште оперативних података (ОДС) или извештавање
база података.)
Ово је објекат од подаци посебно дизајниран за
техничко извештавање.
I подаци ускладиштени и пријављени преко ових структура могу коначно
пропагирати у складиште преко зоне организације (инсценација
подручје), где би се могао користити за стратешку сигнализацију.
Стагинг ареа.
Прва станица за већину подаци намењен животној средини
складиште је простор организације.
Овде ја подаци су интегрисани, очишћени и трансформисани у подаци корисно то
ће попунити структуру складишта
Датум мартс.
Овај део архитектуре представља структуру од подаци коришћен
посебно за ОЛАП. Присуство датамарта, ако и подаци су
ускладиштене у преклапајућим звездастим шемама подаци
вишедимензионални у релационом окружењу, или у ормарима за досије
di подаци поверљиво које користи одређена ОЛАП технологија, као што је
ДБ2 ОЛАП сервер, није релевантан.
Једино ограничење је то што архитектура олакшава употребу подаци
вишедимензионални.
Архитектура такође укључује критичне БИ технологије и технике
који се разликују као:
Просторна анализа
Свемир је налет информација за аналитичара и
је кључно за потпуно решавање. Свемир може
представљају податке о људима који живе на одређеном месту
локацију, као и информације о томе где се та локација налази
физички у поређењу са остатком света.
Да бисте извршили ову анализу, морате почети тако што ћете повезати своје
информације о координатама географске ширине и дужине. Значи оно
се назива „геокодирање“ и мора бити део екстракције,
трансформација, и процес учитавања (ЕТЛ) на нивоу
атомски вашег складишта.
Претрага података.
Екстракција од подаци омогућава нашим компанијама да расту
нумеро ди клијенти, да предвиди трендове продаје и омогући
управљање односима са и клијенти (ЦРМ), између осталих иницијатива
БИ.
Екстракција од подаци стога мора бити интегрисан са структурама
подаци Двхоусе-а и подржан од стране процеса складиштења за
обезбеђују како ефективно тако и ефикасно коришћење технологије и
сродне технике.
Као што је наведено у БИ архитектури, атомски ниво
Двхоусе, као и датамартс, је одличан извор подаци
за екстракцију. Те исте структуре такође морају бити
прималаца резултата екстракције како би се осигурала доступност да
највећа публика.(најшира публика).
Агенти.
Постоје различити „агенти“ који испитују купца за сваку тачку као, нпр
оперативни системи компаније и исти дв. Ови агенти могу
бити напредне неуронске мреже обучене да уче о њима
трендови сваке тачке, као што је будућа потражња производа заснована
о унапређењу продаје, моторима заснованим на правилима на које треба реаговати
un дато сплет околности или чак једноставни агенти који
пријављују изузетке „врхунским руководиоцима“. Ови процеси да
присутни генерално у реалном времену и стога морају
бити уско повезан са њиховим кретањем подаци.
Све ове структуре подаци, технологије и технике гарантују
да нећете провести ноћ стварајући организацију
ваш БИ.
Ова активност ће се развијати у постепеним, малим корацима
бодова.
Сваки корак је независан пројектни напор и о њему се извештава
као итерација у вашој ДВ или БИ иницијативи. Итерације
може укључити имплементацију нових технологија, за
почните са новим техникама, додајући нове структуре подаци ,
лоадинг и подаци допунски, или уз проширење анализе
ваше окружење. О овом параграфу се више говори
дубље у поглављу 3.
Поред традиционалних структура ДВ и БИ алата постоје и друге
функције ваше БИ организације за које морате
дизајн, као што су:
Додирне тачке купаца (додир купца
бодова).
Као и код сваке модерне организације, постоји низ
додирне тачке купаца које указују на то како имати искуство
позитивно за твоје клијенти. Постоје традиционални канали као што су и
трговци, оператери централа, директна пошта, мултимедија и штампа
оглашавање, као и најактуелнији канали као што су е-пошта и веб, тј подаци
морају се набавити производи са неком тачком додира,
транспортују, чисте, обрађују и потом насељавају у објекте подаци од
БИ.
Басес оф подаци оперативна и корисничка удружења (Оператионал
базе података и корисничке заједнице).
На крају контактних тачака клијенти налазе се темељи подаци
апликација компаније и заједница корисника. ТХЕ подаци постојећи
су подаци традиционално које се мора спојити и спојити са подаци који
тече од контактних тачака да би се задовољиле неопходне
информације.
Аналитичари. (Аналитичари)
Примарни корисник БИ окружења је аналитичар. Он је тај који
користи од тренутног вађења подаци оперативан, интегрисан са
различити извори подаци , допуњен функцијама као што је аналитика
географске (геокодирање) и представљене у БИ технологијама које
омогућавају вам екстраховање, ОЛАП, напредно СКЛ извештавање и анализу
географске. Примарни интерфејс за аналитичара за окружење
извештава БИ портал.
Међутим, аналитичар није једини који има користи од архитектуре
БИ.
Руководиоци, велика удружења корисника, па чак и чланови, добављачи и и
клијенти требало би да пронађу предности у пословној пословној делатности.
Повратна петља за напајање.
БИ архитектура је окружење за учење. Принцип
карактеристика развоја је да омогући упорне структуре од подаци
да се ажурира коришћењем коришћене БИ технологије и кроз акције
подухвата корисника. Пример је процена
купац (бодовање купаца).
Ако одељење продаје спроводи модел рударства
резултата корисника у погледу коришћења нове услуге, затим
Одељење продаје не би требало да буде једина група корисника
службе.
Уместо тога, модел екстракције треба да се изведе као део
природни ток података унутар компаније и резултати купаца
треба да постане саставни део информационог контекста о
складиште, видљиво свим корисницима. Би-бИ-центрични ИБМ Суите
укључујући ДБ2 УДБ, ДБ2 ОЛАП сервер укључује већину
део важних технолошких компоненти, дефинисаних на слици
КСНУМКС.
Користимо архитектуру како је приказана на овој слици из књиге до
дајте нам ниво континуитета и покажите како сваки производ
из ИБМ-а одговара општем обрасцу БИ.
Пружање информативног садржаја (Пружање
информативни садржај)
Дизајнирање, развој и имплементација вашег БИ окружења је
тешка операција. Дизајн мора да обухвати обоје
тренутне и будуће пословне захтеве. Дизајн архитектуре
мора бити потпуна да би укључила све пронађене закључке
током фазе пројектовања. Егзекуција мора да остане
посвећени једној сврси: развоју БИ архитектуре
како је формално представљено на цртежу и на основу захтева од
Бизнис.
Посебно је тешко тврдити да ће дисциплина осигурати
релативног успеха.
Ово је једноставно јер не развијате читаво БИ окружење
изненада, али се ради у малим корацима током времена.
Међутим, идентификовање БИ компоненти ваше архитектуре јесте
важно из два разлога: Ви ћете водити све наредне одлуке
архитектонске технике.
Бићете у могућности да свесно планирате одређену употребу технологије
иако можда нећете добити понављање које вам је потребно
технологије неколико месеци.
Довољно разумевање ваших пословних захтева ће утицати на врсту
производа које ћете набавити за своју архитектуру.
Дизајн и развој ваше архитектуре осигурава
да је ваше складиште
није случајан догађај, већ „добро осмишљен“,
пажљиво конструисан оглас opera уметности као мозаик од
мешовита технологија.
Дизајнирајте информациони садржај
Сво почетно планирање мора се фокусирати и идентификовати
главне БИ компоненте које ће бити потребне окружењу
опште сада и у будућности.
Познавање пословних захтева је важно.
Чак и пре него што почне сво конвенционално планирање,
планер пројекта често може да идентификује један или два
компонента одмах.
Баланс компоненти које могу бити потребне за
Међутим, ваша архитектура се не може лако пронаћи.
Током фазе пројектовања главни део архитектуре
повезује сесију развоја апликације (ЈАД) за претрагу
да идентификује пословне захтеве.
Понекад се ови захтеви могу поверити алатима
упите и извештавање.
На пример, корисници наводе да ако желе да аутоматизују
тренутно извештај мора да се генерише ручно интеграцијом
два струјна односа и сабирање прорачуна изведених из
комбинација подаци.
Иако је овај захтев једноставан, он дефинише одређене
функционалност функције коју морате укључити када
купите алате за извештавање за своју организацију.
Дизајнер такође мора следити додатне захтеве за
добити потпуну слику. Корисници желе да се претплате на
овај извештај?
Подскупови извештаја се генеришу и шаљу путем е-поште разним
корисници? Да ли желе да виде овај извештај на порталу компаније?
Сви ови захтеви су део једноставне потребе да
замените ручни извештај на захтев корисника. Корист
од ових врста захтева је да сви, корисници и дизајнери, имају
разумевање концепта извештаја.
Међутим, постоје и друге врсте послова које треба да планирамо.
Када су пословни захтеви наведени у облику
Пословна стратешка питања, лако је за стручног дизајнера
Разлучите захтеве мере/чињенице и димензије.
Слика 1.2 илуструје мерне и димензионалне компоненте а
Пословни проблем.
Ако ЈАД корисници не знају како да декларишу своје захтеве
у виду пословног проблема дизајнер ће често обезбедити
неколико примера за прескакање и почетак сесије прикупљања
захтевима.
Стручни дизајнер може помоћи корисницима да разумеју не само
стратешку трговину, али и како је формирати.
Приступ прикупљања захтева је разматран у поглављу 3; За
сада само желимо да укажемо на потребу дизајна за све
врсте БИ захтева
Стратешки пословни проблем је, а не само услов
Бизнис, али и дизајнерски траг. Ако морате да одговорите
на вишедимензионално питање, онда морате да запамтите,
презент и подаци димензионални, и ако треба да запамтите
подаци вишедимензионални, морате одлучити какву технологију или
технику коју ћете користити.
Да ли имплементирате резервисану шему коцкасте звезде или обоје?
Као што видите, чак и једноставан пословни проблем
може значајно утицати на дизајн. Међутим
Ови типови пословних захтева су у најмању руку уобичајени и разумљиви
од дизајнера и планера са пројектним искуством.
Било је довољно дебате о технологијама и подршци
ОЛАП и доступан је широк спектар решења. До сада
поменули смо потребу да се једноставно извештавање споји са и
захтеве пословне димензије и како ти захтеви
утичу на техничке архитектонске одлуке.
Али који су то захтеви који се не разумеју лако
од стране корисника или од стране ДВ тима? Да ли ће вам икада требати аналитика
просторна (аналисис спатиали)?
Рударски модели подаци они ће бити неопходан део вашег
будућност? Ко зна?
Важно је напоменути да ове врсте технологија нису баш
познате заједнице општих корисника и чланова тима
Дв, делимично, ово би се могло десити јер они обично
третирају неки интерни или технички стручњаци треће стране. То је
екстремни случај проблема које ове врсте технологија стварају. Селф
корисници не могу описати пословне захтеве нити их уоквирити
да би се дале смернице дизајнерима, ови могу
остати непримећен или, још горе, једноставно игнорисан.
Проблем постаје када дизајнер и програмер то не чине
може препознати примену једног од ових напредних али
критичне технологије.
Као што смо често чули да дизајнери кажу, „па, зато што
зар то не оставимо на страну док не добијемо ову другу ствар?
„Да ли их заиста занимају приоритети или их једноставно избегавају
захтеве које не разумеју? Највероватније је то последња хипотеза.
Рецимо да је ваш продајни тим саопштио захтев
пословања, као што је приказано на слици 1.3, као што видите,
захтев је уоквирен у облику пословног проблема. тамо
разлика између овог проблема и типичног димензионалног проблема је
Удаљеност. У овом случају, продајни тим жели да зна,
на месечном нивоу укупна продаја од производа, складишта и
клијенти који живе у кругу од 5 миља од складишта где су
они купују.
Нажалост, дизајнери или архитекте једноставно могу
игнорисати просторну компоненту говорећи: „ми имамо купца, тј
производ и и подаци депозита. Држимо дистанцу до
друга итерација.
"Погрешан одговор. Ова врста пословног проблема се тиче
БИ у потпуности. Представља дубље разумевање
наше пословање и снажан аналитички простор за наше аналитичаре.
БИ је изван једноставног упита или стандардног извештавања, или
чак и ОЛАП. То не значи да ове технологије не раде
они су важни за ваш БИ, али сами по себи не представљају
БИ окружење.
Дизајн за информациони контекст
(Дизајн информативног садржаја)
Сада када смо идентификовали пословне захтеве који се истичу
разне основне компоненте морају бити укључене у цртеж
опште архитектонске. Неке од компоненти БИ су део
наших почетних напора, док неки неће бити спроведени за
неколико месеци.
Међутим, сви познати захтеви се одражавају у дизајну тако да
када треба да применимо одређену технологију, ми јесмо
спремите се да то урадите. Нешто о пројекту ће одражавати мисао
традизионале.
На пример, слика 1.1, на почетку поглавља, приказује податке
март који чува и подаци димензионални.
Овај сет од подаци се користи за подршку каснијој употреби
подаци димензионалне димензије вођене Пословним питањима која
идентификовали смо. Како су додатни документи
генерисани, као што је развој дизајна подаци, ми
почећемо да формализујемо како ја подаци шире се у околини.
Утврдили смо потребу да заступамо и подаци тако
димензионално, поделивши их (према специфичним потребама
утврђено) на продајним местима.
Следеће питање на које треба одговорити је: како ће се они градити
ове базе података?
Да ли правите звезде да подрже коцке, или само коцке, или само звезде?
(или праве коцке, или праве звезде). Генеришите архитектуру података
зависне трговине које захтевају атомски слој за све подаци
да ли стекнете? Дозволите независним продавницама података да прибаве и подаци
директно из оперативних система?
Коју Цубе технологију ћете покушати да стандардизујете?
Имате огромне количине богова подаци потребно за димензиону анализу
или су вам потребне коцке ваше националне продајне снаге на једном
недељно или обоје? Направите моћну ставку
као што је ДБ2 ОЛАП сервер за финансије или Цогнос коцке
ПоверПлаи за вашу продајну организацију или обоје?
Ово су велике архитектонске дизајнерске одлуке које
ће утицати на ваше БИ окружење од сада па надаље. Да,
установили сте потребу за ОЛАП-ом. Сада како ћете то извести
врста технике и технологије?
Како неке од најнапреднијих технологија утичу на ваше
цртежи? Претпостављамо да сте идентификовали потребу
простор у вашој организацији. Сада морате да се сетите
питања архитектонског цртежа чак и ако су непланирана
изводе свемирске компоненте неколико месеци. Архитекта мора
дизајнирајте данас на основу онога што је потребно. Предвидите потребу за
просторну анализу која генерише, складишти, изводи и обезбеђује
приступ подаци просторне. Ово заузврат треба да служи као
ограничење у погледу врсте технологије и спецификација
софтверску платформу коју тренутно можете размотрити. За
на пример систем управе база података односни
(РДБМС) које изводите за свој атомски слој мора имати
доступно је робусно просторно проширење. Ово би утврдило
максималне перформансе при коришћењу геометрије и објеката
простор у вашим аналитичким апликацијама. Ако ваш РДБМС не ради
могу да поднесу и подаци (просторно-центрично) интерно, тако да ћете морати
стабилире уна база података (просторно-центрични) спољашњи. Ово компликује
управљање проблемима и компромитује ваш укупни учинак,
да не спомињем додатне проблеме који су створени за ваше
ДБА, јер вероватно имају минимално разумевање
од основа на подаци просторне такође. С друге стране, ако ваш мотор
РДМБС управља свим просторним компонентама и сродним
оптимизатор је свестан посебних потреба (нпр.
индексирање) просторних објеката, онда ваши ДБА могу да рукују њима
брзо управљајте проблемима и можете их подићи
престазиони.
Поред тога, потребно је да прилагодите област за извођење и слој
атомско окружење које укључује чишћење адресе (а
кључни елемент просторне анализе), као и следеће
уштеда свемирских објеката. Сукцесија издања
цртање се наставља сада када смо увели појам чишћења
адреса. Као прво, ова апликација ће диктирати врсту
софтвер потребан за ваш ЕТЛ напор.
Потребни су вам производи као што је Триллиум да бисте добили адресу
цлеан, или ЕТЛ провајдера кога одаберете да обезбедите
функционалност?
За сада је важно да цените ниво дизајна
мора бити завршен пре него што почнете да изводите своје
окружење (магацин). Горе наведени примери би требало
демонстрирати мноштво дизајнерских одлука које морају уследити
идентификацију било ког посебног пословног захтева. Ако се уради
Тачно, ове дизајнерске одлуке напредују
међузависност између физичких структура вашег окружења,
избор коришћене технологије и ток пропагације
информациони садржај. Без ове конвенционалне архитектуре
БИ, ваша организација ће бити предмет мешавине
хаотичне постојеће технологије, у најбољем случају, уједињене на неки начин
није прецизно да обезбеди привидну стабилност.
Одржавајте информативни садржај
Доношење вредности информација вашој организацији је
веома тешка операција. Без довољно разумевања
и искуство, или адекватно планирање и цртање, чак и
бољи тимови би пропали. С друге стране, ако имате велику
интуиција и детаљно планирање али без дисциплине за
извршење, само сте потрошили новац и време
јер је твој труд осуђен на пропаст. Порука би требала
будите јасни: ако вам недостаје један или више ових
вештине, разумевање/искуство или планирање/цртање или
дисциплина имплементације, то ће довести до паралисања или
уништи зграду БИ организације.
Да ли је ваш тим довољно припремљен? Неко је на твом
БИ тим који разуме огроман доступни аналитички пејзаж
у БИ окружењима, у потребним техникама и технологијама
да изврши тај пејзаж? Има неко у твом тиму
који може препознати разлику у примени између напредних
статичко извештавање и ОЛАП, или разлике између РОЛАП-а и ОЛАП-а? Један од
чланови вашег тима јасно препознају начин на
екстракт и како то може утицати на складиште или како
Може ли складиште да одржи перформансе рударства? Члан
тима разуме вредност подаци простор или технологија
на основу агента? Да ли имате некога ко цени јединствену апликацију
ЕТЛ алата наспрам брокерске технологије
порука? Ако га немате, набавите га. БИ је много више
велики део нормализованог атомског слоја, ОЛАП-а, шема а
звезда и ОДС.
Имајте разумевања и искуства да препознате захтеве
БИ и њихових решења је од суштинског значаја за вашу способност да
правилно формализовати потребе корисника и дизајн
и имплементирају њихова решења. Ако ваша корисничка заједница има
тешкоћа у описивању захтева, то је задатак тима
магацин обезбедити то разумевање. Али ако тим од
складиште
не препознаје специфичну примену БИ – на пример податке
рударење - онда то није најбоља ствар коју БИ окружења раде
често се ограничавају на то да буду пасивни депозити. Међутим, занемарите ове
технологије не умањује њихов значај и ефекат који имају
о настанку могућности ваше пословне интелигенције
организацију, као и информациону структуру коју дизајнирате
да промовише.
Планирање мора укључити појам цртежа, ур
оба захтевају компетентну особу. Плус, планирање
захтева тимску филозофију и посматрање
стандарда. На пример, ако је ваша компанија основала а
стандардну платформу или је идентификовао одређени РДБМС који ви
желимо да стандардизујемо преко платформе, то је на нама
сви у тиму се придржавају тих стандарда. Генерално један
тим излаже потребу за нормализацијом (кориснику
заједница), али сам тим није вољан да се придружи
стандарди успостављени иу другим областима у компанији или можда чак у
сличне компаније. Не само да је ово лицемерно, већ и осигурава да компанија није
способан је да искористи постојеће ресурсе и инвестиције. То не значи
да не постоје ситуације које гарантују платформу или а
нестандардизована технологија; међутим, складишта напори
треба да љубоморно штите стандарде предузећа до
да пословни захтеви не налажу другачије.
Трећа кључна компонента потребна за изградњу БИ
организација је дисциплина.
Зависи свеукупно, подједнако од појединаца и околине.
Планери пројеката, спонзори, архитекте и корисници морају да цене
дисциплина неопходна за изградњу информационе структуре предузећа.
Дизајнери морају усмерити своје дизајнерске напоре на такав начин да
завршити друге неопходне напоре у друштву.
На пример, рецимо да ваша компанија гради а
ЕРП апликација која има компоненту складишта.
Дакле, одговорност ЕРП дизајнера је да сарађују са
тим магацинског окружења да се не такмичи или
дуплирати већ започети посао.
Дисциплина је такође тема о којој треба водити рачуна
од стране целе организације и обично се оснива и поверава а
извршни ниво.
Да ли су менаџери спремни да се придржавају осмишљеног приступа? А
приступ који обећава стварање информационог садржаја који ће
крај ће донети вредност свим областима пословања, али можда
Да ли компромитује појединачне или ресорне агенде? Запамтите изреку
„Размишљати о свему важније је од размишљања само о једној ствари.
Ова изрека важи за БИ организације.
Нажалост, многа складишта концентришу своје напоре
покушава да циља и донесе вредност одређеном одељењу или
специфичне кориснике, без обзира на организацију у
Генерал. Претпоставимо да менаџер тражи помоћ од тима
васхоусе. Тим се јавља послом који је трајао 90 дана који
укључује не само испоруку захтева за обавештавање дефинисаних од
менаџер али осигурава да све подаци базе се мешају у слој
атомски пре него што се уведе у технологију коцке
предлог.
Овај инжењерски додатак обезбеђује да се предузимање
васхоусе ће имати користи од подаци неопходно за управника.
Међутим, извршна власт је разговарала са спољним консултантским фирмама да
су предложили сличну апликацију са испоруком за мање од 4
недеље.
Под претпоставком да је интерни тим за бунар компетентан,
менаџер има избор. Ко може да подржи дисциплину
додатни инжењеринг потребан за повећање имовине
информативан посао или можете изабрати да креирате своје
решење брзо. Чини се да је последњи заиста изабран
пречесто и служи само за креирање контејнера информација о
који користи само неколицини или појединцу.
Краткорочни и дугорочни циљеви
Архитекте и пројектанти морају формализовати а
дугорочну визију укупне архитектуре и планове за
расту у БИ организацији. Ова комбинација од
краткорочни добитак и дугорочно планирање
представљају две стране БИ напора. Краткорочни профит
рок је аспект БИ који је повезан са итерацијама
ваше складиште.
На ово се фокусирају планери, архитекте и спонзори
испуњавају специфичне пословне захтеве. На овом нивоу је
граде се физичке структуре, купује се технологија и
имплементирају се технике. Они уопште нису створени да се њима баве
специфичне захтеве дефинисане од стране одређених корисничких заједница.
Све је урађено како би се испунили специфични дефинисани захтеви
из одређене заједнице.
Дугорочно планирање је, међутим, други аспект
оф БИ. То су планови и пројекти обезбедили
изграђене било које физичке структуре, одабране технологије и
реализоване технике направљене са погледом према предузећу. И тхе
дугорочно планирање које обезбеђује кохезију
неопходно да би се осигурало да пословне користи пристигну свима
пронађене краткорочне добити.
Оправдајте свој БИ напор
Un складиште података сама по себи нема инхерентну вредност. У другим
речи, не постоји инхерентна вредност међу технологијама
технике складиштења и имплементације.
Вредност сваког складишног напора налази се у акцијама
врши пратећи окружење и садржај складишта
информативно култивисано током времена. Ово је критична тачка за разумевање
пре него што икада покушате да процените вредност било које иницијативе
вхерехоусе.
Пречесто, архитекте и дизајнери покушавају да примене вредност на
физичко-техничке компоненте складишта када је у ствари вредност
заснива се на пословним процесима на које позитивно утиче
складиште и добро стечене информације.
У томе лежи изазов успостављања БИ: Како оправдавате инвестицију?
Ако сама кућа нема суштинску вредност, дизајнери од
пројекат мора да истражи, дефинише и формализује користи
постижу они појединци који ће користити складиште за
побољшати специфичне пословне процесе или вредност од
заштићене информације или обоје.
Да закомпликује ствар, било који пословни процес
погођени напорима у складишту могли би пружити користи
„значајно“ или „мало“. Значајне предности пружају а
опипљива метрика за мерење поврата улагања (РОИ) – нпр
На пример, окретање инвентара додатно време током периода
специфичне или за ниже трошкове испоруке по пошиљци. То је више
Тешко је дефинисати мале предности, као што је бољи приступ
информације, у смислу опипљиве вредности.
Повежите свој пројекат да бисте сазнали више о
Пословни захтеви
Пречесто, дизајнери пројекта покушавају да повежу вредност
складишта са аморфним циљевима компаније. Изјављујући то
„Вредност складишта је заснована на нашој способности да
задовољити стратешке захтеве” отварамо
говор. Али само то није довољно да се утврди да ли
улагање у залихе има смисла. Боље је повезати понављања
складишта са специфичним и познатим пословним захтевима.
Меасуринг РОИ
Израчунавање РОИ у складишту може бити
посебно тешко. Посебно је тешко ако предност
принцип одређеног понављања је нешто неопипљиво или
лако измерити. Студија је показала да корисници перципирају
две главне предности БИ иницијатива:
▪ Створите способност доношења одлука
▪ Креирајте приступ информацијама
Ове бенефиције су меке (или благе) користи. Лако је то видети
како можемо израчунати РОИ на основу тврдог потенцијала (или
веће) као што је смањење трошкова транспорта али како
да ли меримо способност доношења бољих одлука?
Ово је дефинитивно изазов за дизајнере пројеката када
покушавају да убеде компанију да инвестира у одређену
складиштење напора. Повећање продаје или смањење трошкова
оне више нису централне теме које покрећу БИ окружење.
Уместо тога, гледате пословне захтеве за приступ
најбоље да информације тако да одређено одељење може
доноси брже одлуке. Ово су стратешки покретачи а
који су подједнако важни за пословање али су
двосмисленији и тежи за карактеризацију у опипљивој метрици.
У овом случају, израчунавање РОИ може бити погрешно, ако не и ирелевантно.
Дизајнери пројекта морају бити у стању да покажу вредност
опипљиво за руководиоце да одлуче да ли да инвестирају у
примењује се одређено понављање. Међутим, нећемо предлагати нову
метод за израчунавање РОИ, нити ћемо износити било какве аргументе за или
против тога.
Постоји много доступних чланака и књига који говоре о основама за
израчунајте РОИ. Постоје посебни предлози вредности као вредност
о инвестирању (ВОИ), које нуде групе као што је Гартнер, што можете
истраживати. Уместо тога, фокусираћемо се на кључне аспекте било ког
РОИ или други предлози вредности које треба да размотрите.
Примена РОИ
Изван аргумента „тврде“ користи у односу на „меке“ користи
у вези са БИ напорима постоје и друга питања која треба размотрити
када применимо РОИ. На пример:
Припишите превише уштеде напорима ДВ-а који ће доћи
у сваком случају
Рецимо да је ваша компанија кренула од архитектуре
маинфраме у дистрибуирано УНИКС окружење. Тако било
уштеде које се из тог напора могу (а не морају) остварити
не треба приписивати искључиво, ако уопште (?), на
магацин.
Не рачунати све је скупо. И има много ствари које треба урадити
узети у обзир. Размотрите следећу листу:
▪ Почетни трошкови, укључујући изводљивост.
▪ Трошкови наменског хардвера са повезаним складиштем е
цомуницазиони
▪ Трошкови софтвера, укључујући управљање подаци и проширења
клијент/сервер, ЕТЛ софтвер, ДСС технологије, алати
апликације за визуелизацију, програмирање и проток
софтвер за рад и праћење, .
▪ Трошкови пројектовања структуре подаци, са реализацијом, и
оптимизација
▪ Трошкови развоја софтвера директно повезани са трудом
BI
▪ Трошкови кућне подршке, укључујући оптимизацију
перформансе, укључујући контролу верзија софтвера и
операције помоћи
Примените РОИ „Биг-Банг“.
Стварање складишта као јединствен и гигантски напор
сигурно неће успети, па израчунајте и РОИ за иницијативу
великог предузећа Понуда је изненађујућа, и то да дизајнери
настављају са слабим покушајима да се процени вредност целине
напор.
Зато што дизајнери покушавају да дају новчану вредност
на пословну иницијативу ако је то опште познато и прихваћено
Да ли је тешко проценити одређена понављања? Како је могуће? Није
могуће уз неколико изузетака. Не ради то.
Сада када смо установили шта не треба радити приликом израчунавања
РОИ, овде постоје неке тачке које ће нам помоћи у дефинисању
поуздан процес за процену вредности ваших БИ напора.
Добијање консензуса о РОИ. Без обзира на твоје
избор технике за процену вредности ваших БИ напора, мора
буде договорено од стране свих страна, укључујући дизајнере пројекта,
спонзори и руководиоци компаније.
Смањите РОИ на делове који се могу идентификовати. Неопходан корак ка
разумно израчунавање РОИ је фокусирање тог прорачуна на а
конкретан пројекат. Ово вам онда омогућава да процените вредност
на основу специфичних пословних захтева који су испуњени
Дефинишите трошкове. Као што је поменуто, морају бити бројни трошкови
разматрати. Штавише, трошкови морају укључивати не само повезане трошкове
на појединачну итерацију али и на повезане трошкове
да обезбеди усаглашеност са стандардима компаније.
Дефинишите бенефиције. Јасно повезивање РОИ са захтевима
конкретна предузећа, требало би да будемо у могућности да идентификујемо
предности које ће довести до задовољења захтева.
Смањите трошкове и користи у непосредној добити. То је пут
најбоље је да своје процене заснивате на нето садашњој вредности
(НПВ) за разлику од покушаја предвиђања будуће вредности у
будућа зарада.
Смањите време поделе РОИ на минимум. И'
добро документовано током дугог временског периода који је коришћен у вашем
РОИ.
Користите више од једне формуле за повраћај улагања. Постоје бројне методе за
Предвиђање повраћаја улагања и требало би да планирате да ли ћете користити један или
плус, укључујући нето садашњу вредност, унутрашњу брзину приноса
(ИРР) и опоравак.
Дефинишите поновљив процес. Ово је кључно за израчунавање
било коју дугорочну вредност. Требало би да буде документовано а
један поновљиви процес за све подсеквенце пројекта а
пратити.
Наведени проблеми су најчешћи проблеми које дефинишу стручњаци
околине бунара. Инсистирање на страни руководства
испоручити РОИ „Биг-Банг” је веома збуњујуће. Ако започнете све
ваше прорачуне повраћаја улагања тако што ћете их смањити на препознатљиве и опипљиве делове, имате
добра прилика за процену тачне вредности РОИ.
Питања у вези са повраћајем улагања
Шта год да су ваше предности, меке или тврде, можете их користити
нека основна питања за одређивање њихове вредности. До
пример користећи једноставан систем скалирања, од 1 до 10, ви
можете пратити утицај било ког напора користећи следеће
доманде:
▪ Како бисте оценили разумевање подаци прате овај
пројекат ваше компаније?
▪ Како бисте проценили побољшања процеса као резултат
Овај пројекат?
▪ Како бисте сада измерили утицај нових увида и закључака
доступна овом итерацијом
▪ Какав је био утицај нових рачунарских окружења е
извођење као резултат наученог?
Ако је одговора на ова питања мало, могуће је да
компанија није вредна улагања. Питања са високим
бодовни поен до значајног повећања вредности и треба
служе као водичи за даљу истрагу.
На пример, висок резултат за побољшања процеса
требало би да наведе дизајнере да испитају какви су процеси
је побољшан. Можда ћете открити да неке или све добитке добијете
они су опипљиви и стога се може лако добити новчана вредност
примењена.
Извлачење максимума из прве итерације
складиште
Највећи резултат вашег пословног напора је често у
првих неколико итерација. Ови први напори традиционално
успоставити што кориснији информативни садржај за јавност и
успоставља помоћ технолошке основе за наредне
БИ апликације.
Обично сваки следећи низ подаци пројекта
складишта доносе све мање додатне вредности предузећу
Генерал. Ово је посебно тачно ако не понављате
додаје нове теме или не задовољава потребе нове
заједница корисника.
Ова карактеристика складиштења важи и за батерије
расте од подаци историчари. Како накнадни напори захтевају више
подаци и како више подаци се временом уливају у магацин, највећи део
подаци постаје мање релевантан за коришћену анализу. Ове подаци су
често називају подаци успаване и увек их је скупо чувати јер
скоро да се не користе.
Шта ово значи за спонзоре пројекта? У суштини, тј
Рани спонзори деле више о томе колико кошта инвестиција.
Ово је примарно јер су они подстицај за оснивање слоја
широко технолошко окружење и магацински ресурси,
укључујући органске.
Али ови први кораци доносе највећу вредност и самим тим дизајнерима
пројекти често морају да оправдају улагање.
Пројекти урађени након ваше БИ иницијативе могу имати трошкове
инфериорни (у поређењу са првим) и директни, али доносе мању вредност
компанији.
И власници организација треба да почну да разматрају
бацити нагомилавање од подаци и мање релевантне технологије.
Дата Мининг: Екстракција Дати
Бројне архитектонске компоненте захтевају варијације
технологије и технике рударења података—
на пример, различити „агенти“ за испитивање тачака интересовања
клијенти, оперативним системима компаније и за сам дв. Ове
агенти могу бити напредне неуронске мреже обучене
лонац трендови, као што су будућа потражња производа заснована на
унапређење продаје; мотори засновани на правилима за
реаговати на сет дато околности, на пример, дијагноза
медицинске препоруке и препоруке за лечење; или чак једноставни агенти
са улогом пријављивања изузетака вишим менаџерима (врх
руководиоци). Генерално, ови процеси екстракције подаци si
верификовати у реалном времену; стога морају бити уједињени
потпуно са кретањем од подаци стесси.
Онлине аналитичка обрада
Онлине Аналитицс
Способност сечења, коцке, котрљања, бушења
и изврши анализу
шта ако је у оквиру, циљ комплета
ИБМ технологија. На пример, функције аналитичке обраде
онлине (ОЛАП) постоји за ДБ2 који доноси димензионалну анализу у
мотор оф база података исти .
Функције додају димензионални услужни програм у СКЛ док
они користе све предности природног дела ДБ2. Други
пример ОЛАП интеграције је алат за екстракцију, ДБ2
ОЛАП анализатор сервера. Ова технологија омогућава коцке од
ДБ2 ОЛАП сервер да буде брз и аутоматски
анализира да се идентификују и известе вредности од подаци необично или неочекивано
кроз коцку пословном аналитичару. И коначно, функције
ДВ центар обезбеђује средства за архитекте да провере, међу
остале ствари, профил коцке ДБ2 ОЛАП сервера као део
природна природа ЕТЛ процеса.
Просторна анализа Просторна анализа
Простор представља половину аналитичких сидара (водова).
неопходно за панораму
аналитички широк (време представља другу половину). Атомски ниво
(атомски ниво) складишта, приказаног на слици 1.1,
укључује темеље и за време и за простор. Снимци
Анализа временског сидра за информације о времену и адреси
анкер анализе из свемира. Временске ознаке
они спроводе анализу на време, а информације о правцу воде
анализа по простору. На дијаграму је приказан процес геокодирања
претварање адреса у тачке на мапи или тачке у простору
тако да појмови као што су растојање и изнутра/споља могу бити
користи се у анализи – спроведеној на атомском нивоу и просторној анализи
који се ставља на располагање аналитичару. ИБМ обезбеђује проширења
простор, развијен са Институтом за истраживање система заштите животне средине (ЕСРИ),
al база података ДБ2 тако да просторни објекти могу бити
чува као нормалан део база података релациони. ДБ2
Спатиал Ектендери, такође пружају све СКЛ екстензије за
искористити просторну анализу. На пример, СКЛ екстензије из
питање о
растојање између адреса или да ли је тачка унутар или ван области
дефинисани полигонални, су аналитички стандард са просторним
Ектендерс. Погледајте поглавље 16 за више информација.
База података-Резидент Тоолс Тоолс База података-
Ресидент
ДБ2 има много БИ резидентних СКЛ функција које помажу
у акцији анализе. Ови укључују:
▪ Рекурзивне функције за обављање анализе, као што је „пронађи
све могуће путање лета од Сан Франциско a ЦА".
▪ Аналитичке функције за рангирање, кумулативне функције, коцка
и збирни пакети за олакшавање задатака који се обично дешавају
само са ОЛАП технологијом, они су сада природни део
мотор оф база података
▪ Могућност креирања табела које садрже резултате
Продавци од база података лидери комбинују више од БИ способности
у база података стессо.
Главни добављачи база података мешају се више од
БИ функционалност у база података стессо.
Ово обезбеђује боље перформансе и више опција за трчање за ваше
БИ решења.
Дискутоване су карактеристике и функције ДБ2 В8
детаљно у следећим поглављима:
Основе техничке архитектуре и управљања подацима
(поглавље 5)
▪ ДБ2 БИ основе (поглавље 6)
▪ ДБ2 материјализоване табеле упита
Табеле) (поглавље 7)
▪ ДБ2 ОЛАП функције (поглавље 13)
▪ ДБ2 Енханцед БИ карактеристике и функције (Енханцед БИ
Карактеристике и функције) (поглавље 15)
Поједностављени систем испоруке података
Систем испоруке од подаци упрошћено
Архитектура приказана на слици 1.1 укључује бројне
структуре подаци физички. Једно је складиште подаци оперативни.
Генерално, ОДС је објектно оријентисан,
интегрисане и актуелне. Да ли бисте направили ОДС за подршку, нпр
на пример, продајна канцеларија. Продаја ОДС би допунила подаци
долази из бројних различитих система, али би само задржао, нпр
на пример, данашње трансакције. ОДС се може ажурирати
чак и много пута дневно. Истовремено, процеси
они гурају подаци интегрисан у друге апликације. Ова структура је
посебно дизајниран за интеграцију подаци струјни и динамички е
би био вероватан кандидат за подршку аналитици у реалном времену,
како обезбедити агенте услуга клијенти информације о продаји
тренутне трендове купца издвајањем информација о тренду продаје
из самог магацина. Друга структура приказана на слици 1.1 је
формални статус за дв. Не само да је ово место за
извршење неопходне интеграције, квалитет подациИ
трансформације подаци залиха ускоро, али је такође
поуздано и привремено складиште за подаци одговори на то
може се користити у аналитици у реалном времену. Ако одлучите да
користите ОДС или сценску зону, један
од најбољих алата за попуњавање ових структура подаци употреба
различити оперативни извори је хетерогени дистрибуирани упит ДБ2.
Ова могућност је обезбеђена опционом функцијом ДБ2
под називом ДБ2 Релатионал Цоннецт (само упит) и кроз ДБ2
ДатаЈоинер (посебан производ који испоручује апликацију,
уметање, ажурирање и могућност брисања а
Хетерогени дистрибуирани РДБМС).
Ова технологија омогућава архитектима да подаци везати подаци di
производња са аналитичким процесима. Не само да технологија може
прилагодити практично било ком од захтева за репликацију који
могли би се појавити са аналитиком у реалном времену, али то
Такође се могу повезати са широким спектром база подаци више
популаран, укључујући ДБ2, Орацле, Сибасе, СКЛ Сервер,
Информик и други. ДБ2 ДатаЈоинер се може користити за попуњавање
структура подаци формално као ОДС или чак сто
стално заступљен у складишту предвиђеном за рестаурацију
брзо за тренутна ажурирања или за продају. наравно,
ове исте структуре подаци може се попунити помоћу
још једна важна технологија дизајнирана за репликацију подаци, ИБМ
ДатаПропагатор Релатионал. (ДатаПропагатор је посебан производ
за централне системе. ДБ2 УНИКС, Линук, Виндовс и ОС/2 укључују
услуге репликације подаци као стандардна карактеристика).
Друга метода за кретање подаци оперишући около
за предузећа је иначе интегратор пословних апликација
познат као посредник порука.Ово
Јединствена технологија омогућава ненадмашну контролу за центрирање
(циљање) и померите се подаци око предузећа. ИБМ има посредника
најраспрострањеније поруке, МКСериес, или варијације
производа који укључује захтеве за е-цоммерце, ИБМ
ВебСпхере МК.
За више дискусије о томе како искористити МК за подршку а
magazzino e un ambiente BI, visitare веб страница del libro. Per ora, è
довољно је рећи да је ова технологија одлично средство за
ухвати и трансформише (користећи МКСериес Интегратор) подаци
центрирани (циљани) оператери ангажовани за БИ решења. тамо
МК технологија је интегрисана и упакована у УДБ В8, који
значи да се редовима порука сада може управљати
као да су ДБ2 табеле. Концепт заваривања од
поруке у реду чекања и универзум од база података релациони је усмерен
ка моћном окружењу испоруке од подаци.
Зеро-Латенци Нулто кашњење
Крајњи стратешки циљ за ИБМ је анализа нулте латенције (нулте латенције).
Како је дефинисано од
Гартнер, БИ систем мора бити у стању да закључи, асимилује
и пружа информације за аналитичаре на захтев. Изазов,
наравно, ради се о томе како се мешати подаци актуелно и у реалном времену
са неопходним историјским информацијама, као што су и подаци сродни модел(и).
тенденција, или извучено разумевање, као оцртавање
купац
Такве информације укључују, на пример, идентификацију клијенти ad
висок или низак ризик или који производи и клијенти купиће много
вероватно ако већ имају сира у колицима
аквизиције.
Добијање нулте латенције заправо зависи од два
основни механизми:
▪ Потпуна унија подаци који се анализирају са
успостављене технике и алати које је креирао БИ
▪ Систем испоруке подаци ефикасно да то осигура
анализа у реалном времену је заиста доступна
Ови предуслови за нулту латенцију се не разликују од ова два
циљеве које је успоставио ИБМ и описане горе.
Блиско парење од подаци је део програма
беспрекорна интеграција коју је организовао ИБМ. И створи систем
испоруке оф подаци ефикасан у потпуности зависи од
доступна технологија која поједностављује процес испоруке
подаци. Као резултат тога, два од три ИБМ-ова циља су критична
да би трећи. ИБМ свесно развија своје
технологија за осигурање нулте латенције је реалност за кориснике
складишних напора.
Резиме / Синтеза
БИ организација обезбеђује мапу пута за
створите своје окружење
итеративно. Мора бити прилагођен тако да одражава потребе
ваш посао, садашњи и будући. Без архитектонске визије
широк, складишта понављања су мало више од
насумичне имплементације централног складишта које мало чине
створити широко, информативно предузеће.
Прва препрека за менаџере пројеката је како да оправдају
улагања неопходна за развој БИ организације.
Иако је прорачун РОИ остао главна подршка за
магацинских достигнућа, постаје све теже да
тачно предвидети. Ово је довело до других метода за
утврђивање да ли вреди свог новца. Тхе
вредност на инвестицији2 (ВОИ), на пример, је набављена
као решење.
То је задужено за архитекте из подаци и планери пројеката
намерно генеришу и пружају информације удружењима
корисника, а не само да им пружи услугу подаци. Има
огромна разлика између то двоје. Информација је нешто што човек ради
разлика у процесима доношења одлука и ефективности; релативно, тј
подаци они су градивни блокови за извођење тих информација.
Чак и ако сам критичан према извору подаци за решавање захтева
комерцијално, БИ окружење треба да има већу улогу
у креирању информативног садржаја. Морамо узети
додатне мере за чишћење, интеграцију, трансформацију или
иначе креирају информативни садржај према коме се
корисници могу да предузму акцију и зато морамо да се уверимо да они
акције и одлуке, где су разумне, су подржане
у БИ окружењу. Ако оставимо складиште само да служи подаци,
гарантовано је да ће асоцијације корисника креирати садржај
информације потребне за предузимање акције. Ово осигурава да њихова
заједница ће моћи да доноси боље одлуке, али предузеће
пати од недостатка знања које су користили.
Дата да архитекте и пројектанти покрећу пројекте
специфичне за БИ окружење, они остају одговорни предузећу
надугачко и нашироко. Једноставан пример ове две карактеристике
лица итерација БИ налази се у извору подаци. Све
подаци примљени за конкретне комерцијалне захтеве морају бити
насељен у првом атомском слоју. Ово обезбеђује развој
имовине корпоративних информација, као и управљање, усмеравање
Захтеви специфични за корисника дефинисани у итерацији.

В хатиса Д ата В арехоусе ?
Складиште података то је срце архитектуре информационих система
од 1990. и подржава информационе процесе нудећи солидну
интегрисана платформа подаци историчари узети као основу за наредне
анализе. ТХЕ складиште података нуде лакоћу интеграције у а
свет апликационих система који нису међусобно компатибилни. Датум
складиште је еволуирало у тренд. Складиште података
организују и чувају и подаци неопходна за информационе процесе е
аналитичке засноване на дугој историјској временској перспективи. Све
ово подразумева значајну и сталну посвећеност изградњи и
у одржавању складиште података.
Дакле, шта је а складиште података? складиште података и:
▪ предметно оријентисан
▪ интегрисани систем
▪ варијантно време
▪ непостојан (не може се избрисати)
збирка од подаци користи се за подршку менаџерским одлукама у
имплементација процеса.
I подаци уметнут у складиште података настају у већини
случајеви из оперативних окружења. Тхе складиште података то чини један
складишна јединица, физички одвојена од остатка
систем, који садржи подаци претходно трансформисан од
апликације које раде на информацијама које потичу из окружења
оперативни.
Дословна дефиниција а складиште података заслужује детаљну студију
објашњење јер постоје важне мотивације и значења
подлоге које описују карактеристике складишта.
ПРЕДМЕТНА ОРИЈЕНТАЦИЈА ОРИЈЕНТАЦИЈА
ТЕМАТСКИ
Прва карактеристика а складиште података јесте да је оријентисан ка
главни играчи у компанији. Водич кроз суђења
подаци то је у супротности са класичнијим методом који пружа
оријентација апликација ка процесима и функцијама,
метод који углавном дели већина
старији системи управљања.
Оперативни свет је дизајниран око апликација и функција
као што су зајмови, штедња, банковне картице и поверење за институцију
финансијским. Свет дв је организован око тема
принципи као што су купац, продавац, производ и посао.
Усклађивање око тема утиче на дизајн и
о реализацији подаци налази у дв. Што је још важније,
главна тема утиче на најважнији део
кључна структура.
На свет апликације утиче и дизајн података
на основу дизајна процеса. Свет од
дв је фокусиран искључиво на моделирање подаци е сул
цртеж на база података. Дизајн процеса (у његовом облику
класична) није део дв окружења.
Разлике између избора процеса/функције и примене
избор по предмету откривају се и као разлике у садржају
од подаци на детаљном нивоу. ТХЕ подаци од дв не укључују и подаци који
неће се користити за ДСС процес док апликације
оперативно оријентисан подаци садрже и подаци да задовољи
одмах функционални/обрадни захтеви који могу о
мање користи од аналитичара ДСС.
Још један важан начин на који су оперативно оријентисане апликације
ai подаци разликују од подаци од дв је у извештајима деи подаци. Ја подаци
оперативни одржавају континуирану везу између две или више табела
на основу пословног правила које је активно. ТХЕ подаци би дв
они обухватају спектар времена и односи који се налазе у дв су
многи. Многа правила трговања (и сходно томе, многа
извештаји о подаци ) су заступљени у магацину од подаци између два о
више табела.
(За детаљно објашњење како су односи између подаци су
обрађено у ДВ-у, позивамо се на техничку тему о томе
питање.)
Ни из једне друге перспективе осим из перспективе разлике
фундаментално између избора функционалне/процесне примене и
избор предмета, већа је разлика између система
оперативни еи подаци и ДВ.
ИНТЕГРАЦИЈА ИНТЕГРАЦИЈА
Најважнији аспект дв окружења је да и подаци нашао
у оквиру дв лако се интегришу. УВЕК. ВИТХОУТ
ИЗУЗЕТЦИ. Сама суштина дв окружења је да и подаци
садржани у границама складишта су интегрисани.
Интеграција се открива на много различитих начина – у конвенцијама
идентификован конзистентан, у мерењу конзистентних варијабли, у
кодификоване структуре које се састоје од физичких атрибута подаци
доследно, и тако даље.
Током година дизајнери различитих апликација су то чинили
поседовање многих одлука о томе како апликација треба
бити развијени. Индивидуални стил и дизајнерске одлуке
од дизајнерских апликација откривају се на сто начина: у
разлике кодирања, кључна структура, физичке карактеристике,
идентификацију конвенција и тако даље. Колективни капацитет многих
Дизајнери апликација креирају недоследне апликације
легендарно је. Слика 3 приказује неке од више разлика
важно у начину на који су апликације дизајниране.
Кодирање: Кодирање:
Дизајнери апликација су изабрали кодирање поља –
пол- на различите начине. Дизајнер представља секс као
"м" и "ф". Други дизајнер представља секс као "1"
и „0“. Други дизајнер представља секс као "к" и
„и”. Други дизајнер представља секс као „мушки“ и
"Женско". Није битно како секс улази у ДВ. Њих"
и "Ф" су вероватно добри као и сви
репрезентација.
Оно што је важно је да из ког год порекла потиче поље секса,
то поље стиже у ДВ у доследном интегрисаном стању. Од
последица када се поље учита у ДВ из
апликација у којој је представљена у формату
“М” и “Ф”, тј подаци мора се конвертовати у ДВ формат.
Меасуремент оф Аттрибутес: Меасуремент оф
Атрибути:
Дизајнери апликације су одлучили да измере цевовод
на разне начине у току
Неколико година. Дизајнер чува подаци цевовода у
центиметара. Други дизајнер апликација чува подаци
цевовода у инчима. Још један дизајнер од
продавнице апликација и подаци цевовода у милионима кубних стопа
у секунди. А други дизајнер чува информације о
цевовода у погледу дворишта. Шта год да је извор, када
информације о гасоводу стижу у ДВ то мора бити
мерено на исти начин.
Према индикацијама на слици 3, питања интеграције
утичу на скоро сваки аспект пројекта – карактеристике
физички богови подаци, дилема да постоји више од једног извора подациу
питање недоследних идентификованих узорака, формата подаци
недоследно, и тако даље.
Без обзира на тему дизајна, резултат је исти -
i подаци мора бити сачуван у ДВ у једнини е
глобално прихватљив начин чак и када оперативни системи од
дно чувају другачије и подаци.
Када аналитичар ДСС-а погледа ДВ, циљ аналитичара
требало би да буде експлоатација подаци који се налазе у магацину,
а не на питање о кредибилитету или доследности
подаци.
ВРЕМЕНСКА ВАРИЈАНЦИЈА
Све подаци у ДВ су тачни до одређеног тренутка.
Ова основна карактеристика подаци у ДВ се веома разликује од оних подаци
налази у радном окружењу. ТХЕ подаци оперативног окружења су
прецизно као у тренутку приступа. Другим речима,
у оперативном окружењу када се приступи диску подаци, Али такође
сачекајте док не прикаже прецизне вредности као у тренутку приступа.
Зашто ја подаци у ДВ су прецизни као у неком тренутку у
време (тј. не „тренутно”), каже се да и подаци пронађено у ДВ
оне су „временске варијације“.
Временска варијација од подаци од стране ДВ се помиње на бројне начине.
Најједноставнији начин је да и подаци од ДВ представљају подаци а
дуг временски хоризонт - пет до десет година. Хоризонт
временски оквир представљен за оперативно окружење је много краћи
▪ од данашњих тренутних вредности до шездесет деведесет
Апликације које морају добро да раде и које треба да буду
доступан за обраду трансакција мора донети
минимална количина од подаци ако признају било какав степен
флексибилност. Дакле, оперативне апликације имају хоризонт
кратак временски оквир, као тема дизајна
аудио апликације.
Други начин на који се 'временска варијанса' појављује у ДВ је у
кључна структура. Свака кључна структура у ДВ садржи,
имплицитно или експлицитно, елемент времена, као нпр
дан, недеља, месец итд. Елемент времена је скоро увек ту
на дну спојеног кључа који се налази у ДВ. У овим
приликама, елемент времена ће постојати имплицитно, попут случајности
где се цео фајл дуплира на крају месеца или тромесечја.
Трећи начин на који се приказује временска варијација је да и подаци дел
ДВ, чим се правилно региструје, не може
ажуриран. ТХЕ подаци ДВ су, за све практичне сврхе, дугачке
серија снимака. Наравно ако су снимци
снимљени погрешно, онда снимци могу бити
модификовано. Али под претпоставком да су снимци направљени
исправно, они се не мењају чим су направљени. У неким
случајевима може бити неетично или чак неважеће да снимци у
ДВ су модификовани. ТХЕ подаци оперативан, прецизан као у
моменту пријаве, могу се ажурирати како дође
потреба.
НОН-ВОЛАТИЛЕ
Четврта важна карактеристика ДВ-а је да је неиспарљив.
Ажурирања, уметања, брисања и модификације се врше
редовно за оперативна окружења запис по запис. Али
основна манипулација подаци који су потребни у ДВ је много више
једноставан. Постоје само две врсте операција које се дешавају у
ДВ – почетно учитавање подаци и приступ подаци. Не постоји
нема ажурирања подаци (у општем смислу
ажурирање) у ДВ као нормална операција обраде.
Постоје неке веома снажне последице ове разлике
основа између оперативне обраде и ДВ обраде. На нивоу
по дизајну, потреба да се буде опрезан у надоградњи
абнормално није фактор у ДВ-у, од ажурирања подаци није
спроведена. То значи да на нивоу физичког дизајна,
могу се узети слободе да се оптимизује приступ подаци,
посебно у обради тематике стандардизације и
физичка денормализација. Још једна последица једноставности
операција ДВ-а је у основној технологији која се користи за
покрените ДВ окружење. Морате да подржавате ажурирања
запис по запис у линији (као што је често случај са
оперативна обрада) захтева се технологија да има неке
веома сложене основе под привидном једноставношћу.
Технологија која подржава резервне копије и опоравак, трансакције
и интегритета подаци а откривање и отклањање стања застоја је
прилично сложен и није потребан за обраду ДВ.
Карактеристике ДВ, дизајнерска оријентација,
интеграцију подаци унутар ДВ, временска варијанса и једноставност
оф манагемент оф подаци, све води у окружење које је веома, веома
другачије од класичног оперативног окружења. Извор скоро свих
подаци ДВ су радно окружење. Примамљиво је размишљати
да постоји велики вишак подаци између две средине.
У ствари, први утисак који многи људи имају је тај
велика редундантност од подаци између оперативног окружења и окружења од
ДВ. Такво тумачење је површно и показује га
недостатак разумевања шта се дешава у ДВ.
У ствари, постоји минимум вишка подаци између оперативног окружења
и подаци оф тхе ДВ. Хајде да размотримо следеће:
▪ И подаци они се филтрирају дато који прелази из оперативног окружења
на ДВ окружење. Многи подаци никада не пролазе напоље
из оперативног окружења. Осим што и подаци који су неопходни за
ДСС обрада налази свој правац у окружењу
▪ временски хоризонт од подаци веома се разликује од средине
другоме. ТХЕ подаци у радном окружењу су веома свеже. ТХЕ подаци
у ДВ су много старији. Само из перспективе
временског хоризонта, постоји врло мало преклапања
између радног окружења и ДВ.
▪ ДВ садржи подаци сажетака који се никада не налазе
у окружењу
▪ И подаци претрпе темељну трансформацију из
тренутак када прелазе на слику 3 то највише илуструје
Део подаци значајно су промењени у стању
да се изабере и премести у ДВ. Другим речима,
већина подаци је физички модификован и
радикално како се премешта у ДВ. Са становишта
интеграције нису исти подаци који бораве
у радном окружењу.
У светлу ових фактора, редундантност од подаци између две средине је
редак догађај, што доводи до мање од 1% редундантности између ова два
окружења.
СТРУКТУРА СКЛАДИШТА
ДВ имају јасну структуру. Постоје различити нивои сажетка и
детаљ који разграничава ДВ.
Различите компоненте ДВ-а су:
▪ Метаподаци
▪ Дати актуелни детаљи
▪ Дати старих детаља
▪ Дати мало сажето
▪ Дати високо сажето
Далеко главна брига је за подаци детаља
струје. То је главна брига јер:
▪ И подаци актуелни детаљи одражавају најновије догађаје,
који су увек од великог интересовања и
▪ и подаци актуелних детаља су обимни јер је
ускладиштени на најнижем нивоу грануларности е
▪ и подаци Актуелни детаљи се скоро увек чувају на
складиште на диску, коме је брзо приступити, али скупо и
сложен из
I подаци детаља што су старији подаци који се чувају на
нека сећања на маса. Има приступ спорадично и јесте
ускладиштено на нивоу детаља компатибилном са подаци деттаглиати
струје. Иако није обавезно чувати на медијуму од
алтернативно складиштење, због велике запремине подаци уједињени са
спорадични приступ од подаци, меморијска подршка за подаци di
Старији детаљи се обично не чувају на диску.
I подаци сажето благо су подаци који се дестилују са дна
ниво детаља који се налази на тренутном нивоу детаља. Ово
ДВ ниво се скоро увек чува на диску. ТХЕ
проблеми дизајна који се јављају код архитекте подаци
у изградњи овог нивоа ДВ су:
▪ Коју јединицу времена представља горњи сажетак
▪ Који садржаји, атрибути ће мало резимирати
Садржај подаци
Следећи ниво подаци пронађено у ДВ је оно од подаци високо
резимеа. ТХЕ подаци високо сажети су компактни и лаки
приступачан. ТХЕ подаци понекад се налазе веома сажети
у ДВ окружењу иу другим случајевима и подаци високо сумирани су
налази изван непосредних зидова технологије у којој се налази ДВ.
(у сваком случају, тј подаци високо сумирани су део ДВ
без обзира где и подаци физички су смештени).
Коначна компонента ДВ-а су метаподаци. У многим аспектима
метаподаци се налазе у другој димензији од других подаци
ДВ, јер метаподаци не садрже никакве дато директно
преузето из оперативног окружења. Метаподаци имају посебну улогу нпр
веома важно у ДВ. Метаподаци се користе као:
▪ именик који помаже аналитичару ДСС-а да лоцира
садржај ДВ,
▪ водич за мапирање подаци о томе како ја подаци су били
трансформисан из оперативног окружења у ДВ окружење,
▪ водич за алгоритме који се користе за сумирање између подаци di
тренутни детаљ еи подаци мало сажето, тј подаци високо
резимеи,
Метаподаци играју много већу улогу у ДВ окружењу
него што су икада имали у оперативном окружењу
СТАРИ МЕДИУМ ЗА СКЛАДИШТЕЊЕ ДЕТАЉА
Магнетна трака се може користити за чување такве врсте
подаци. У ствари, постоји широк избор алата за складиштење који
треба их сматрати за очување старих подаци di
детаљ.
У зависности од обима подаци, учесталост приступа, цена
алата и врсте приступа потпуно је вероватно
да ће другим алатима бити потребан стари ниво детаља
у ДВ.
ТОК ПОДАТАКА
Постоји нормалан и предвидљив ток од подаци унутар ДВ.
I подаци улазе у ДВ из радног окружења. (НАПОМЕНА: постоје
неки веома интересантни изузеци од овог правила. Међутим, скоро
све подаци унесите ДВ из оперативног окружења). Дата да ја подаци
улазе у ДВ из радног окружења, он се трансформише као што је био
описано раније. Под условом уласка у ДВ, тј подаци улазе у
тренутни ниво детаља, као што је приказано. Тамо се налази и користи се
док се не деси један од три догађаја:
▪ је пречишћен,
▪ је сажет, и/или
▪ је
Застарели процес унутар ДВ се помера и подаци актуелни детаљи
a подаци старих детаља, на основу старости од подаци. Процес
сажетак користи детаље о подаци израчунати и подаци
благо сажети и високо сумирани нивои подаци. Постоје
неки изузеци приказаног тока (о томе ће бити речи касније).
Међутим, обично, за огромну већину подаци нашао
унутар ДВ, ток од подаци то је као што је приказано.
КОРИШЋЕЊЕ СКЛАДИШТА ПОДАТАКА
Није изненађујуће да су различити нивои подаци у оквиру ДВ не
добијају различите нивое употребе. По правилу, што је виши ниво
резиме, плус и подаци користе се.
Многе употребе се јављају у подаци високо сажети, док стари
подаци детаља се скоро никада не користе. Постоји добар разлог у
померити организацију на парадигму коришћења ресурса. Што више има
резиме и подаци, брже и ефикасније је доћи до подаци. ако
un продавница откријте да обавља много обраде на нивоу детаља ДВ,
затим одговарајућу велику количину машинских ресурса
се конзумира. У интересу свих је да се кривично гони
како у високом степену сажимања што пре.
За многе радње користио је ДСС аналитичар у окружењу пре ДВ
подаци на нивоу детаља. У многим аспектима долазак на подаци деттаглиати
подсећа на сигурносно ћебе, чак и када су доступни
други нивои сажетка. Једна од делатности арх подаци è
одвикнути корисника ДСС од сталне употребе подаци на највишем нивоу
ниска детаљност. Постоје два разлога
архитекте од подаци:
▪ инсталирање система повраћаја плаћања, где крајњи корисник плаћа
потрошени ресурси е
▪ који указују на то да време одговора може бити веома добро
добијено када се понашање са и подаци на високом је нивоу
резимеа, док лоше време одговора долази од
понашање од подаци на ниском нивоу
ОСТАЛИ РАЗМАТРАЊА
Постоје и нека друга разматрања изградње и управљања
ДВ.
Прво разматрање је индекс. ТХЕ подаци на највишим нивоима
резиме се може слободно индексирати, док и подаци
на нижим нивоима детаља они су гломазни колико могу бити
штедљиво индексирано. Из истог токена, тј подаци на високим нивоима
детаљ се може релативно лако реновирати,
док је обим од подаци на нижим нивоима је толико велика да и подаци не
могу се лако реновирати. Сходно томе, модел
од подаци а формални рад који је урадио дизајн представљају
основа за ДВ примењена скоро искључиво на ниво
детаљ струја. Другим речима, активности моделирања
подаци не примењују се на нивое сумирања, у скоро сваком случају.
Још једно структурално разматрање је оно о подподели
подаци би ДВ.
Подела се може извршити на два нивоа – на нивоу дбмс и ал
ниво апликације. У дивизији на нивоу дбмс, дбмс è
обавештава о одељењима и сходно томе их прати. У случају
подела на нивоу апликације, само је програмер
обавештен о поделама и њиховој одговорности
управа је препуштена њему
Испод нивоа дбмс, доста посла се обавља аутоматски. Постоји
много нефлексибилности повезане са аутоматском администрацијом
дивизије. У случају подела на нивоу апликације од подаци дел
складиште података, много посла тежи програмеру, али
крајњи резултат је флексибилност у администрацији подаци у датуму
складиште
АЛТРЕ АНОМАЛИЕ
Док су компоненте складиште података Они раде како је описано
за скоро све подаци, постоје неки корисни изузеци који морају
расправљати. Изузетак је онај од подаци јавни резимеи
(јавни збирни подаци). Су подаци резимеа који су били
израчунати из складиште података али их друштво користи. ТХЕ подаци
Јавни резимеи се чувају и њима се управља у складиште података,
иако су као што је претходно поменуто израчунате. ТХЕ
рачуновође раде на изради ових тромесечних подаци попут
приходи, тромесечни расходи, тромесечни профит и тако даље. Рад
које раде рачуновође је екстерно за складиште података. Међутим, ја подаци су
користи „интерно” унутар компаније – од маркетинг, продаја итд.
Још једна аномалија, о којој неће бити речи, је она од подаци естерни.
Још једна изузетна врста подаци који се могу наћи у датој
складиште је оно трајних детаљних података. Ови узрокују
потреба да се трајно чува и подаци на једном нивоу
детаљно из етичких или правних разлога. Ако компанија излаже и
повезаних радника са опасним материјама постоји потреба за подаци
детаљно и трајно. Ако предузеће производи производ који
укључује јавну безбедност, који делови авиона, постоје
Потреба за подаци детаљан стални, као и ако фирма
склапа опасне уговоре.
Друштво не може себи дозволити да превиди детаље јер
у наредних неколико година, у случају тужбе, опозива, а
спорни грађевински недостатак и др. изложеност компаније
могло би бити велико. Као резултат, постоји јединствена врста подаци
познат као трајни детаљни подаци.
САЖЕТАК
Un складиште података је објектно оријентисана, интегрисана, варијанта
време, збирка од подаци непостојан за подршку потребама
одлука управе. Свака од истакнутих функција
un складиште података има своје импликације. Плус има четири
нивоа подаци дел складиште података:
▪ Стари детаљ
▪ Тренутни детаљ
▪ Дати благо рекапитулирано
▪ Дати високо сажето
Метаподаци су такође важан део складиште података.
АПСТРАКТАН
Концепт складиштења подаци недавно примљена
много пажње и постао је тренд 90-их.Ово је
због капацитета а складиште података да их савлада
ограничења система подршке администрацији као што су и
системи за подршку одлучивању (ДСС) и информациони системи
извршни (ЕИС).
Чак и ако концепт о складиште података изгледа обећавајуће,
имплементирати и складиште података може бити проблематично због
великих складишних процеса. Упркос
сложеност складишних пројеката подаци, многи добављачи
и консултанти за складиштење подаци они то тврде
складиштење подаци струја не изазива никакве проблеме.
Међутим, на почетку овог истраживачког пројекта, готово ниједан
спроведена су независна, ригорозна и систематска истраживања. Од
Сходно томе, тешко је рећи шта се заиста дешава
у индустрији када се граде складиште података.
Ова студија је истраживала праксу складиштења подаци
савременика који има за циљ да развије богатије разумевање
аустралијске праксе. Анализа литературе пружила је
контекст и основа за емпиријско проучавање.
Постоје бројни налази из овог истраживања. Први
месту, ова студија је открила активности које су се десиле
током развоја складиште података. У многим областима, тј подаци окупљени
потврдила пракса о којој се говори у литератури. Друго
сајт, проблеми и проблеми који могу утицати на
развијање складиште података идентификовани су овом студијом.
Коначно, користи стечене од аустралијских организација повезаних са
употреба складиште података откривени су.
Поглавље 1
Контекст истраживања
Концепт складиштења података добио је широко признање
изложености и претворио се у тренд у настајању у
90-е (МцФадден 1996, ТДВИ 1996, Схах и Милстеин 1997,
Сханкс ет ал. 1997, Ецкерсон 1998, Аделман и Оатес 2000). То је
види се из све већег броја чланака о подацима
складиштење у трговачким публикацијама (Литтле и Гибсон 1999).
Многи чланци (видети, на пример, Фисхер 1995, Хацкатхорн 1995,
Моррис 1995а, Брамблетт и Кинг 1996, Грахам ет ал. 1996,
Сакагучи и Фролик 1996, Алварез 1997, Брусел 1997, Кларк
1997, МцЦартхи 1997, О' Доннелл 1997, Едвардс 1998, ТДВИ
1999) су пријавили значајне користи које произлазе из организација
који имплементирају и складиште података. Они су подржавали своју теорију
уз анегдотске доказе о успешним имплементацијама, висок принос
о бројкама улагања (РОИ) и, такође, пружању смерница
референце или методологије за развој складиште података
(Сханкс ет ал. 1997, Седдон и Бењамин 1998, Литтле и Гибсон
1999). У екстремном случају, Грахам ет ал. (1996) имају
пријавио просечан повраћај трогодишње инвестиције од 401%.
Велики део садашње литературе је, међутим, занемарио
сложености укључених у предузимање таквих пројеката. Пројекти оф
складиште података обично су сложени и великих размера и
стога имплицирају велику вероватноћу неуспеха ако нису
пажљиво контролисан (Схах и Милстеин 1997, Ецкерсон 1997,
Фолеи 1997б, Зиммер 1997, Борт 1998, Гиббс и Цлимер 1998, Рао
1998). Они захтевају огромне количине људи и ресурса
финансијски и, време и труд за њихову изградњу (Хилл 1998, Црофс 1998). Тхе
типично време и потребна финансијска средства су респективно
око две године и два или три милиона долара (Брали 1995, Фолеи
1997б, Борт 1998, Хумпхриес ет ал. 1999). Ова времена и средства
од финансијских институција се захтева да контролишу и консолидују многе аспекте
разлике у складиштењу података (Цафассо 1995, Хилл 1998). На страни
хардверских и софтверских разматрања, друге функције, које се разликују
од вађења на подаци на процесе утовара подаци, фром
меморијски капацитет за управљање ажурирањима и мета подацима подаци
за обуку корисника, мора се узети у обзир.
У време када је овај истраживачки пројекат започео, било је врло мало
академска истраживања спроведена у области складиштења података,
посебно у Аустралији. То је било видљиво из несташице предмета
објављено о складиштењу података у новинама или другим списима
академици тог времена. Многи од академских списа
доступан је описао искуство САД. Недостатак
академска истраживања у области сл складиштења података изазвала су
позива на ригорозна истраживања и емпиријска истраживања (МцФадден 1996,
Сханкс ет ал. 1997, Литтле и Гибсон 1999). Конкретно, студије
истраживања о процесу имплементације складиште података
треба спровести како би се проширило знање
опште у погледу спровођења складиште података e
послужиће као основа за будућу истраживачку студију (Сханкс ед
други. 1997, Литтле и Гибсон 1999).
Стога је сврха ове студије да се проучи шта заправо
То се дешава када организације одржавају и користе податке
складиште у Аустралији. Конкретно, ова студија ће укључити
анализу читавог процеса развоја а складиште података,
почев од иницијације и планирања преко пројектовања и
имплементацију и накнадну употребу унутар организација
аустралијски. Поред тога, студија ће такође допринети тренутној пракси
идентификовање области у којима се пракса може даље развијати
побољшати и неефикасност и ризици се могу минимизирати или
избегавати. Штавише, послужиће као основа за друге студије о складиште података in
Аустралији и попуниће празнину која тренутно постоји у литератури.
Истраживачка питања
Циљ овог истраживања је проучавање укључених активности
у спровођењу складиште података и њихово коришћење од
аустралијске организације. Посебно се проучавају елементи
у вези са планирањем, развојем,
рад, коришћење и укључени ризици. Дакле питање
овог истраживања је:
„Каква је садашња пракса складиште података у Аустралији?"
Да бисте ефикасно одговорили на овај проблем, а
одређени број помоћних истраживачких питања. Конкретно, три
из литературе су идентификована потпитања која је
представљено у поглављу 2, да води овај истраживачки пројекат:
Како се спроводе и складиште података по организацијама
Аустралијанац? На које проблеме сте се сусрели?
Које су предности доживљене?
У одговору на ова питања коришћен је цртеж
истраживачко истраживање које користи анкету. Како учим
истраживачки, одговори на горња питања нису потпуни
(Сханкс ет ал. 1993, Денсцомбе 1998). У овом случају јесте
триангулација је потребна да би се побољшали одговори на њих
захтева. Међутим, истрага ће пружити чврсту основу за
будући рад који испитује ова питања. Један детаљан
дискусија о оправданости и дизајну метода истраживања
представљено је у поглављу 3.
Структура истраживачког пројекта
Овај истраживачки пројекат је подељен на два дела: контекстуалну студију
концепта складиштења података и емпиријског истраживања (види
слика 1.1), од којих је сваки размотрен у наставку.
Део И: Контекстуална студија
Први део истраживања састојао се у преиспитивању
актуелна литература о различитим врстама складиштења података укључујући и
системи за подршку одлучивању (ДСС), информациони системи
екецутиве (ЕИС), студије случаја складиште података и појмови датума
складиште. Штавише, резултати форума складиште података и
групе састанака за стручњаке и професионалце које спроводи група
Истраживање Монасх ДСС, допринело је овој фази студије
који је био намењен добијању информација о пракси података
складиште и да се идентификују ризици који су укључени у њихово усвајање.
Током овог периода контекстуалног проучавања, разумевања
проблематичног подручја је успостављено да пружи знање о
основа за накнадна емпиријска истраживања. Међутим, ово
то је био процес који је трајао док се студија одвијала
истраживања.
ИИ део: Емпиријска истраживања
Релативно нови концепт складиштења података, посебно
у Аустралији, створио потребу за спровођењем анкете за
добити ширу слику о искуству коришћења. Ово
део је спроведен када је проблемски домен био
установљено је опсежним прегледом литературе. Концепт
складишта података формираног током фазе контекстуалног проучавања је
је коришћен као инпут за почетни упитник ове студије.
Након овога, упитник је испитан. Ви сте експерти за састанке
складиште учествовало у тестирању. Сврха теста
Првобитни упитник је требало да провери комплетност и тачност
нека питања. На основу резултата тестирања упитник је
је измењено и измењена верзија је послата на
учесници анкете. Упитници враћени тада су били
анализирано за и подаци у табелама, дијаграмима и другим форматима. ТХЕ
резултати анализе подаци формирају тренутну фотографију
пракса складиштења података у Аустралији.
ПРЕГЛЕД СКЛАДИШТА ПОДАТАКА
Концепт складиштења података је еволуирао са побољшањима
компјутерске технологије.
Она је усмерена на превазилажење проблема са којима се сусрећу групе
подршка апликацијама као што је систем за подршку одлучивању (ДСС) е
Извршни информациони систем (ЕИС).
У прошлости је главна препрека ових апликација била
немогућност ових апликација да обезбеде а база података
неопходна за анализу.
Ово је углавном узроковано природом посла
менаџмент. Интереси менаџмента компаније су различити
стално у зависности од третиране површине. Стога и подаци
фундаментално за ове апликације мора бити у стању да
брзо мењати у зависности од дела који се третира.
То значи да и подаци морају бити доступни у форми
адекватан за потребне анализе. У ствари, групе подршке од
апликацијама је у прошлости било веома тешко прикупити ед
интеграција подаци из сложених и разноврсних извора.
Остатак овог одељка представља преглед концепта
складиштење података и бави се како складиште података може да превазиђе
Проблеми са групом за подршку апликацијама.
Израз „Складиште података” је објавио Виллиам Инмон 1990. године.
Његова често цитирана дефиниција види Складиште података како
колекција подаци предметно оријентисан, интегрисан, непроменљив и променљив
током времена, као подршка одлукама управљања.
Користећи ову дефиницију Инмон истиче да и подаци ресиденти
у а складиште података мора имати следеће 4
Карактеристике:
▪ Предметно оријентисан
▪ Интегрисан
▪ Неиспарљив
▪ Променљиво током времена
Под предметно оријентисаним Инмон подразумева да и подаци у датуму
складиште у највећим организационим областима које су биле
дефинисане у моделу подаци. На пример све подаци у вези и клијенти
садржани су у предметној области КОРИСНИЦИ. Исто тако све
подаци који се односе на производе садржани су у предметној области
ПРОИЗВОДИ.
Под Интегратед Инмон подразумева да и подаци који долазе из различитих
платформе, системи и локације се комбинују и чувају у
једно место. Последично подаци слично се мора трансформисати
у доследним форматима тако да се могу додавати и поредити
лако.
На пример, представљени су мушки и женски род
словима М и Ф у једном систему, а са 1 и 0 у другом. За
да их интегришу на прави начин, један или оба формата морају
трансформисати тако да су два формата иста. У ово
случају можемо променити М у 1 и Ф у 0 или обрнуто. Оријентисан ка
предмет и Интегрисани указују да је складиште података дизајниран је за
пружају функционалну и трансверзалну визију подаци на страну
од компаније.
Под Непроменљивим подразумева да и подаци у складиште података остају
доследан и ажуриран подаци није потребно. Уместо тога, сваки
променити у подаци оригинали се додају у база података датума
складиште. То значи да историјски деи подаци садржан је у
складиште података.
За променљиве са временом Инмон указује да и подаци у складиште података
увек садрже еи индикаторе времена подаци нормално
прећи одређени временски хоризонт. На пример а
складиште података може садржати 5 година историјских вредности клијенти Дал
1993. до 1997. Доступност историје и временске серије
од подаци омогућава вам да анализирате трендове.
Un складиште података може сакупити своје подаци од система
ОЛТП;од порекла подаци екстерно у односу на организацију и/или од стране других стручњака
хватање системских пројеката подаци.
I подаци екстракти могу проћи кроз процес чишћења, у
овај случај и подаци трансформишу се и интегришу пре него што буду
ускладиштено у база података дел складиште података. Онда сам ја подаци
становника у оквиру база података дел складиште података стављају се на располагање
за приступ крајњем кориснику и алате за опоравак. Користећи
овим алатима крајњи корисник може приступити интегрисаном приказу
организације подаци.
I подаци становника у оквиру база података дел складиште података су
похрањене иу детаљима иу резименим форматима.
Ниво сажетка може зависити од природе подаци. Ја подаци
детаљан може се састојати од подаци струја е подаци историчари
I подаци ауторске накнаде нису укључене у складиште података до и подаци
у складиште података се ажурирају.
Поред чувања и подаци себе, а складиште података такође може
складишти другу врсту дато под називом МЕТАДАТА који
описати и подаци становника у његовом база података.
Постоје две врсте метаподатака: развојни метаподаци и развојни метаподаци
анализе.
Развојни метаподаци се користе за управљање и аутоматизацију
процеси екстракције, чишћења, мапирања и утовара подаци у
складиште података.
Информације садржане у метаподацима развоја могу да садрже
детаљи оперативних система, детаљи о елементима за издвајање,
шаблон подаци дел складиште података и правила компаније за
конверзија од подаци.
Други тип метаподатака, познат као метаподаци аналитике
омогућава крајњем кориснику да истражује садржај података
складиште за проналажење подаци доступни и шта они значе у терминима
јасне и нетехничке.
Стога метаподаци аналитике функционишу као мост између података
магацинске и апликације за крајње кориснике. Ови метаподаци могу
садрже пословни модел, описе подаци дописници
пословном моделу, унапред дефинисаним упитима и извештајима,
информације за пријављивање корисника и индекс.
Метаподаци анализе и развоја морају бити комбиновани у један
интегрисани садржај метаподатака да би исправно функционисао.
Нажалост, многи од постојећих алата имају своје
метаподатака и тренутно не постоје постојећи стандарди који
омогућавају алатима за складиштење података да их интегришу
метаподаци. Да би поправили ову ситуацију многи трговци
главни алати за складиштење података су формирали Мета Дата
Савет који је касније постао Мета Дата Цоалитион.
Сврха ове коалиције је да изгради скуп метаподатака
стандард који омогућава различитим алатима за складиштење података да
претворити метаподатке
Њихови напори су резултирали рођењем Мете
Спецификација за размену података (МДИС) која ће омогућити размену
информација између Мицрософт архива и повезаних МДИС датотека.
Постојање од подаци и сумирани/индексирани и детаљни дати
корисник могућност да изврши БУШЕЊЕ УДАЉЕЊА
(бушење) хајде подаци индексирано на детаљне и обрнуто.
Постојање од подаци детаљне историје омогућава стварање
анализа тренда током времена. Поред тога, метаподаци анализе могу
користити као именик база података дел складиште података на
помоћи крајњим корисницима да лоцирају и подаци неопходно.
У поређењу са ОЛТП системима, са њиховом способношћу подршке
анализа подаци и извештавање, складиште података посматра се као систем
прикладније за информационе процесе као што су прављење и
одговарати на упите и правити извештаје. Следећи одељак
ће детаљно истаћи разлике ова два система.
СКЛАДИШТЕ ПОДАТАКА ПРОТИВ ОЛТП СИСТЕМА
Многи информациони системи унутар организација
Они су намењени за подршку свакодневним операцијама. Ове
системи познати као ОЛТП СИСТЕМИ, хватају трансакције
свакодневно се ажурира.
I подаци у оквиру ових система често се модификују, додају или
избрисан. На пример, адреса клијента се једва мења
сели се са једног места на друго. У овом случају нова адреса
биће регистровани изменом поља адресе база података.
Главни циљ ових система је смањење трошкова
трансакције и истовремено скратити време обраде.
Примери ОЛТП система укључују критичне радње као што је писање
рачуноводство налога, обрачун зарада, фактуре, производња, АИ услуге клијенти.
За разлику од ОЛТП система који су креирани по процесу
на основу трансакција и догађаја, тј складиште података створени су
да пружи подршку процесима заснованим на аналитици подаци и горе
процеси одлучивања.
Ово се обично постиже интеграцијом и подаци из разних система
ОЛТП и екстерни у једном „контејнеру“. подаци,као што је објашњено
у претходном одељку.
Монасх модел процеса складиштења података
Модел процеса за складиште података Монаш је развио
истраживачи из Монасх ДСС Ресеарцх Гроуп, заснива се на
литературе оф складиште података, о искуству у подршци
развој системских области, о дискусијама са добављачима
апликације за употребу на складиште података, на групи стручњака
у употреби од складиште података.
Фазе су: почетак, планирање, развој и операције
Објашњења. Дијаграм објашњава итеративну природу или
еволутивни развој а складиште података процес користећи
двосмерне стрелице постављене између различитих фаза. У ово
„итеративни“ и „еволутивни“ контекст значе да на сваком
корак процеса, активности имплементације се могу обавити
увек пропагирати уназад до претходне фазе. Ово је
због природе пројекта а складиште података нел куале
додатни захтеви се јављају у било ком тренутку
крајњег корисника. На пример, током фазе развоја а
процес складиште података, један је захтеван од стране крајњег корисника
нову димензију или предметну област, која није припадала
оригинални план, ово се мора додати систему. Ово
изазива промену пројекта. Резултат је да тим од
дизајн мора да промени захтеве до сада креираних докумената
током фазе пројектовања. У многим случајевима, тренутно стање
пројекат мора да се врати у фазу пројектовања где
нови захтев мора бити додат и документован. Корисник
финал мора бити у могућности да види конкретну документацију која се прегледа еи
промене које су извршене у фази развоја. На крају
Овај развојни циклус пројекат мора да добије одличне повратне информације
оба тима, развојни тим и кориснички тим. ТХЕ
повратне информације се затим поново користе за побољшање будућег пројекта.
Планирање капацитета
Дв имају тенденцију да буду веома велике величине и расту
врло брзо (Бест 1995, Рудин 1997а) након
Износ подаци историје које задржавају од свог трајања. тамо
раст такође може бити узрокован подаци додатне ставке које захтева
корисника да повећају вредност подаци које већ имају. Од
сходно томе, захтеви за складиштење за подаци моћи
бити значајно побољшани (Ецкерсон 1997). Дакле то је
неопходно обезбедити, спровођењем планирања од
капацитет, са којим систем који се гради може расти
раст потреба (Бест 1995, ЛаПланте 1996, Ланг 1997,
Ецкерсон 1997, Рудин 1997а, Фолеи 1997а).
У планирању дв скалабилности, мора се знати
очекивани раст величине залиха, врсте питања
који ће вероватно бити спроведен и број подржаних крајњих корисника (најбољи
1995, Рудин 1997б, Фолеи 1997а). Направите скалабилне апликације
захтева комбинацију скалабилних серверских технологија и техника
пројектовања скалабилних апликација (Бест 1995, Рудин 1997б.
Оба су неопходна приликом креирања апликације
изузетно скалабилан. Скалабилне серверске технологије могу
чине лаким и корисним додавање складишта, меморије и
ЦПУ без деградирања перформанси (Ланг 1997, Телепхони 1997).
Постоје две главне скалабилне серверске технологије: рачунарство
симетрични вишеструки (СМП) и масивна обрада
паралелно (МПП) ) (ИДЦ 1997, Хумпхриес ет ал. 1999). Сервер
СМП обично има више процесора који деле једну меморију,
систем аутобуса и други ресурси (ИДЦ 1997, Хумпхриес ет ал. 1999).
Processori supplementari possono essere aggiunti per aumentare
ла суа снага рачунски. Још један метод за повећање
снага computazionale del server SMP, è combinare numerose
macchine SMP. Questa tecnica è nota come clustering (Humphries
et al. 1999). Un server MPP, d’altra parte, ha più processori ognuno
con una propria memoria, sistema bus e altre risorse (IDC 1997,
Humphries et al. 1999). Ogni processore è chiamato nodo. Un
повећање у снага може се постићи рачунски
aggiungendo nodi supplementari ai server MPP (Humphries et al.
КСНУМКС).
Una debolezza dei server SMP è che troppe operazioni input-output
(I/O) possono congestionare il sistema bus (IDC 1997). Questo
problema non si verifica all’interno dei server MPP poiché ogni
processore ha il proprio sistema di bus. Tuttavia, le interconnessioni
fra ogni nodo generalmente sono molto più lente del sistema bus
dei SMP. Inoltre, i server MPP possono aggiungere un livello
supplementare di complessità agli sviluppatori di applicazioni (IDC
1997). Così, la scelta tra server SMP e MPP può essere influenzata
da molti fattori, tra cui la complessità delle domande, il rapporto
prezzo/prestazioni, la capacità di trattamento richiesta, le
applicazioni dw prevenute e l’aumento in dimensione dei база података
дв и у броју крајњих корисника.
Numerose tecniche di progettazione di applicazione scalabile
possono essere impiegate nella pianificazione della capacità. Uno
utilizza vari periodi di notifica come giorni, settimane, mesi e anni.
Avendo vari periodi di notifica, il база података può essere diviso in
pezzi raggruppati maneggevolmente (Inmon et al. 1997). Un’altra
tecnica è utilizzare tabelle riepilogative che sono costruite
riassumendo подаци da подаци детаљан. Па сам подаци riassunti sono più
compatti del dettagliato, il quale richiede meno spazio di memoria.
Дакле подаци di dettaglio possono essere archiviati in un’unità di
memorizzazione meno cara, la quale salva ancora più deposito.
Benché utilizzare tabelle riepilogative possa salvare spazio di
memoria, essi richiedono molto sforzo per mantenerli aggiornati e in
linea con le necessità commerciali. Tuttavia, questa tecnica è
ampiamente utilizzata e spesso utilizzata insieme alla tecnica
precedente(Best 1995, Inmon 1996a, Chauduri and Dayal
КСНУМКС).
Дефинисање Складиште података Технички
Architectures Definizione delle tecniche di
architetture di dw
Iniziali adottanti di data warehousing concepivano principalmente
un’implementazione centralizzata del dw in cui tutti i подаци, укључено
i подаци спољне, биле су интегрисане у једну,
физичко складиштење (Инмон 1996а, Бреснахан 1996, Пеацоцк 1998).
Il vantaggio principale di questo approccio è che gli utenti finali
sono in grado di accedere alla vista su scala imprenditoriale
(enterprise-wide view) dei подаци organizzativi (Ovum 1998). Un altro
vantaggio è che offre standardizzazione di подаци кроз
l’organizzazione, che significa che c’è solo una versione o
definizione per ogni terminologia utilizzata nel dw deposito
(reposity) metadata (Flanagan and Safdie 1997, Ovum 1998). Lo
svantaggio di questo approccio, d’altra parte, è che è caro e difficile
da costruire (Flanagan and Safdie 1997, Ovum 1998, Inmon et al.
1998). Non molto dopo che l’architettura d’immagazzinamento подаци
centralizzata divenne popolare, si evolse il concetto di estrazione
dei sottoinsiemi più piccoli dei подаци per sostenere i bisogni di
applicazioni specifiche (Varney 1996, IDC 1997, Berson e Smith
1997, peacock 1998). Questi piccoli sistemi sono derivati dal più
велики складиште података centralizzato. Sono denominati data
warehouse dipartimentali dipendenti o data marts dipendenti.
L’architettura del data mart dipendente è conosciuta come
architettura tre-tiered in cui la prima fila consiste del data
warehouse centralizzato, la seconda consiste dei depositi di подаци
одељењски а трећи се састоји од приступа до подаци e dai tools di
analisi (Demarest 1994, Inmon ed altri. 1997).
Сатови података се обично граде након складиште података
centralizzato è stato costruito per rispondere alle esigenze delle
specifiche unità(White 1995, Varney 1996).
Маркети са подацима чувају подаци molto rilevanti relativi a particolari
unità (Inmon ed altri. 1997, Inmon ed altri. 1998, IA 1998).
Предност ове методе је у томе што неће бити дато не
integrato e che i подаци saranno meno ridondanti all’interno dei data
marts poiché tutti i подаци долазе из магацина подаци интегрисани.
Un altro vantaggio è che ci saranno pochi collegamenti fra ogni
data mart e le relative fonti di подаци perché ogni data mart ha soltanto
una fonte di подаци. In più con questa architettura sul posto, gli utenti
finali possono ancora accedere alla panoramica dei подаци
organizzativi aziendali. Questo metodo è conosciuto come il
metodo top-down, in cui i data marts sono costruiti dopo il data
warehouse (peacock 1998, Goff 1998).
Aumentando la necessità di mostrare presto i risultati, alcune
organizzazioni hanno cominciato costruire data marts indipendenti
(Flanagan e Safdie 1997, White 2000). In questo caso, i data marts
prendono i loro подаци директно из основа подаци OLTP e non dal
deposito centralizzato e integrato, eliminando così l’esigenza di
avere il deposito centrale sul posto.
Ogni data mart richiede almeno un collegamento alle relative fonti
di подаци. Uno svantaggio di avere collegamenti multipli per ogni data
mart è che, confrontato alle due architetture precedenti, la
sovrabbondanza di подаци значајно повећава.
Свака база података мора да складишти све подаци richiesti localmente per
non avere effetto sui sistemi di OLTP. Questo provoca che i подаци
sono immagazzinati in differenti data marts (Inmon ed altri. 1997).
Un altro svantaggio di questa architettura è che conduce alla
creazione di complesse interconnessioni fra i data marts e le loro
fonti di подаци che sono difficili da effettuare e controllare (Inmon ed
altri. 1997).
Un altro svantaggio è che gli utenti finali non possono potere
accedere alla panoramica delle informazioni aziendali poiché i подаци
различита тржишта података нису интегрисана (Овум 1998).
Ancora un altro svantaggio è che potrebbe esistere più di una
definizione per ogni terminologia usata nei data marts che genera
inconsistenze di подаци у организацији (Овум 1998).
Malgrado gli svantaggi discussi sopra, i data marts indipendenti
attraggono ancora l’interesse di molte organizzazioni (IDC 1997).
Un fattore che li rende attraenti è che sono più rapidi da sviluppare
e richiedono meno tempo e risorse (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Di conseguenza, servono principalmente
come progetti-prova che possono essere usati per identificare
rapidamente i benefici e/o le imperfezioni nel progetto (Parsaye
1995, Braly 1995, Newing 1996). In questo caso, la parte da
implementare nel progetto pilota deve essere piccola ma importante
per l’organizzazione (Newing 1996, Mansell-Lewis 1996).
Esaminando il prototipo, gli utenti finali e l’amministrazione possono
decidere se continuare o fermare il progetto (Flanagan e Safdie
КСНУМКС).
Se la decisione è di continuare, i data marts per altri settori
dovrebbero essere costruiti una alla volta. Ci sono due opzioni per
gli utenti finali basate sui loro bisogni nella costruzione dei data
matrs indipendenti: integrated/federated ed unintegrated (Ovum
КСНУМКС)
Nel primo metodo, ogni nuovo data mart dovrebbe essere costruito
basandosi sui data marts attuali e sul modello подаци utilizzato
dall’impresa (Varney 1996, Berson e Smith 1997, Peacock 1998).
La necessità di usare il modello подаци dell’impresa fa si che bisogna
accertarsi che esista soltanto una definizione per ogni terminologia
usata attraverso i data marts, questo anche per accertarsi che data
marts differenti possano essere uniti per dare una panoramica delle
informazioni aziendali (Bresnahan 1996). Questo metodo è
denominato il bottom-up ed è il migliore quando c’è un vincolo sui
mezzi finanziari e sul tempo (Flanagan e Safdie 1997, Ovum 1998,
peacock 1998, Goff 1998). Nel secondo metodo, i data marts
costruiti possono soddisfare soltanto i bisogni di un’unità specifica.
Una variante del federated data mart è il складиште података distribuito
у којој је база података middleware hub server è utilizzato per unire molti
data marts in un singolo deposito di подаци distribuito (White 1995). In
questo caso, i подаци aziendali sono distribuiti in parecchi data marts.
Le richieste dell’utente finale sono trasmesse al база података
сервер хуб миддлеваре, који издваја све подаци richiesti dai data
marts e ritorna i risultati alle applicazioni dell’utente finale. Questo
metodo fornisce le informazioni aziendali agli utenti finali. Tuttavia,
ancora non vengono eliminati i problemi dei data marts
indipendenti. C’è un’altra architettura che può essere usata che è
chiamata il складиште података virtuale (White 1995). Tuttavia, questa
architettura, che è descritta nella figura 2.9, non è un’architettura
d’immagazzinamento di подаци reali poiché non sposta il caricamento
dai sistemi OLTP al складиште података (Демарест 1994).
У ствари, захтеви од подаци dagli utenti finali sono passate sopra ai
sistemi di OLTP che restituiscono i risultati dopo l’elaborazione delle
richieste di utente. Anche se questa architettura permette agli utenti
finali di generare i rapporti e formulare le richieste, non può fornire i
подаци историјски и преглед информација о компанији као и подаци
dai differenti sistemi di OLTP non sono integrati. Quindi, questa
architettura non può soddisfare l’analisi di подаци complessa quale ad
esempio previsioni.
Selezione dell’applicativi di accesso e di
recupero dei подаци
Сврха изградње а складиште података è di trasmettere
informazioni agli utenti finali (Inmon ed altri 1997, Poe 1996,
McFadden 1996, Shanks ed altri 1997, Hammergren 1998); uno o
più applicativi di accesso e recupero подаци devono essere forniti. Ad
oggi, esiste un’ampia varietà di questi applicativi tra cui l’utente può
scegliere (Hammergren 1998, Humphries ed altri 1999). Gli
applicativi selezionati determinano il successo dello sforzo
d’immagazzinamento di подаци in un’organizzazione perché gli
applicativi sono la parte più visibile del складиште података all’utente
finale (Inmon ed altri 1997, Poe 1996). Per aver successo un data
warehouse, deve potere sostenere le attività di analisi dei подаци
dell’utente finale (Poe 1996, Seddon e Benjamin 1998, Eckerson
1999). Quindi il “livello” di ciò che l’utente finale vuole deve essere
identificato (Poe 1996, Mattison 1996, Inmon ed altri 1997,
Humphries ed altri 1999).
In generale, gli utenti finali possono essere raggruppati in tre
categorie: executive users, business analysts e power user (Poe
1996, Humphries ed altri 1999). Gli executive users necessitano di
un facile accesso ad insiemi predefiniti di rapporti (Humphries ed
altri 1999). Questi rapporti possono essere raggiunti facilmente con
la navigazione dei menu (Poe 1996). In più, i rapporti dovrebbero
presentare le informazioni usando la rappresentazione grafica
come le tabelle ed i modelli per trasportare rapidamente le
informazioni (Humphries ed altri 1999). I business analyst, che non
possono avere le possibilità tecniche per sviluppare i rapporti da
zero da soli, necessitano di potere modificare i rapporti attuali per
soddisfare i loro bisogni specifici (Poe 1996, Humphries ed altri
1999). I power user, d’altra parte, sono il tipo di utilizzatori finali che
hanno la capacità di generare e scrivere le richieste ed i rapporti da
zero (Poe 1996, Humphries ed altri 1999). Sono quelli che
sviluppano i rapporti per gli altri tipi di utenti (Poe 1996, Humphries
ed altri 1999).
Una volta determinati i requisiti dell’utente finale deve essere fatta
una selezione degli applicativi di accesso e recupero подаци tra tutti
quelli disponibili (Poe 1996, Inmon ed altri 1997).
Приступ подаци e gli strumenti di retrieval possono essere
classificati in 4 tipi: OLAP tool, EIS/DSS tool, tool di query e
reporting e tool di data mining.
I tool OLAP permettono agli utenti di creare query ad hoc così come
quelle fatte sul база података дел складиште података. Inoltre questi prodotti
consentono agli utenti di fare drill-down dai подаци generali a quelli
dettagliati.
I tool EIS/DSS forniscono reporting esecutivi come analisi “what if”
e accessi ai reports organizzati a menu. I report devono essere
predefiniti e uniti ai menu per una navigazione più facile.
I tool di query e reporting permettono agli utenti di produrre report
predefiniti e specifici.
I tool di data mining sono usati per identificare relazioni che
potrebbero fare nuova luce sulle operazioni dimenticate nei подаци дел
datawarehouse.
Accanto all’ottimizzazione dei requisiti di ogni tipologia di utenti, i
tool selezionati devono essere intuitivi, efficienti e di facile utilizzo.
Inoltre devono essere compatibili con le altre parti dell’architettura e
in grado di lavorare con i sistemi esistenti. È inoltre suggerito di
scegliere data access e tool di retrieval con prezzi e performance
ragionevoli. Altri criteri da considerare includono l’impegno del
venditore del tool nel sostenere il loro prodotto e gli sviluppi che lo
stesso avrà nelle future release. Per garantire l’impegno degli utenti
nell’utilizzo del datawarehouse, il team di sviluppo coinvolge gli
utenti nel processo della selezione del tool. In questo caso
dovrebbe essere effettuata una valutazione pratica dell’utente.
Per migliorare il valore del datawarehouse il team di sviluppo può
fornire anche un accesso web ai loro datawarehouse. Un
datawarehouse web-enabled permette agli utenti di accedere ai подаци
са удаљених места или током путовања. Додатне информације могу
essere fornite a costi più bassi mediante una diminuzione dei costi
ди тренинг.
2.4.3 Складиште података Операциона фаза
Questa fase consiste di tre attività: definizione di strategie di data
refresh, controllo delle attività del datawarehouse e gestione della
sicurezza del datawarehouse.
Дефинисање стратегија освежавања података
Након почетног учитавања, тј подаци у база података del datawarehouse
devono essere refreshati periodicamente per riprodurre i
cambiamenti effettuati sui подаци originali. Bisogna quindi decidere
quando fare il refresh, ogni quanto tempo deve essere schedulato il
refresh e come eseguire il refresh dei подаци. Viene suggerito di fare il
refresh dei подаци quando il sistema può essere messo off- line. La
frequenza del refresh è determinata dal team di sviluppo basandosi
sui requisiti degli utenti. Ci sono due approcci per fare il refresh del
datawarehouse: il refresh completo e il caricamento continuo dei
Промене.
Il primo approccio, il refresh completo, richiede il ricaricamento di
све подаци од нуле. То значи да све подаци richiesti devono
essere estratti, puliti, trasformati ed integrati in ogni refresh. Questo
approccio dovrebbe essere, per quanto possibile, evitato perché
richiede molto tempo e risorse.
Un approccio alternativo è quello di caricare continuamente i
cambiamenti. Questo aggiunge i подаци che sono stati cambiati
dall’ultimo ciclo di refresh del datawarehouse. L’identificazione di
records nuovi o modificati riduce significativamente la quantità di
подаци che devono essere propagati al datawarehouse in ogni
aggiornamento poiché solo questi подаци биће додат у база података
складишта података.
Ci sono almeno 5 approcci che possono essere usati per prelevare
i подаци nuovi o modificati. Per ottenere un’efficiente strategia di
refresh dei подаци può essere utile un misto di questi approcci che
preleva tutti i cambiamenti nel sistema.
Il primo approccio, che usa i timestamp, suppone che viene
assegnato a tutti i подаци modificati e aggiornati un timestamp in modo
da potere identificare facilmente tutti i подаци modificati e nuovi.
Questo approccio, però, non è stato molto usato nella maggior
parte degli odierni sistemi operativi.
Il secondo approccio è quello di usare un delta file generato da
un’applicazione che contiene soltanto i cambiamenti fatti ai подаци.
Коришћење ове датотеке такође појачава циклус ажурирања.
Tuttavia, anche questo metodo, non è stato usato in molte
applicazioni.
Il terzo approccio è quello di fare uno scan su un file di log, che
fondamentalmente contiene informazioni simili al delta file. L’unica
differenza è che un log file è creato per il processo di recovery e
può essere difficile da capire.
Il quarto approccio è quello di modificare il codice dell’applicazione.
Tuttavia la maggior parte del codice delle applicazioni è vecchio e
fragile; perciò questa tecnica dovrebbe essere evitata.
Последњи приступ је упоређивање подаци sorgenti con il file
principale dei подаци.
Контрола активности складишта података
Una volta che il datawarehouse è stato rilasciato agli utenti, è
necessario monitorarlo nel tempo. In questo caso, l’amministratore
del datawarehouse può impiegare uno o più tool di gestione e
controllo per monitorare l’uso del datawarehouse. In particolare
possono essere raccolte informazioni sulle persone e sul tempo in
cui accedono al datawarehouse. Dai подаци raccolti può essere creato
un profilo del lavoro effettuato che può essere usato come input
nell’implementazione del chargeback dell’utente. Il Chargeback
permette agli utenti di essere informati sul costo di elaborazione del
datawarehouse.
Inoltre, il controllo del datawarehouse può anche essere usato per
identificare i tipi di query, la loro grandezza, il numero di query al
giorno, i tempi di reazione alla query, i settori raggiunti e la quantità
di подаци processati. Un altro scopo di fare il controllo del
datawarehouse è identificare i подаци који нису у употреби. Ове подаци
могу се уклонити из складишта података ради побољшања времена
одговора на извршење упита и прати раст
подаци који бораве у оквиру база података складишта података.
Управљање безбедношћу складишта података
Складиште података садржи подаци integrati, critici, sensibili che
possono essere raggiunti facilmente. Per questo motivo dovrebbe
essere protetto dagli utenti non autorizzati. Un modo per
implementare la sicurezza è quello di usare la funzione del ДБМС
per assegnare i diversi privilegi ai diversi tipi di utenti. In questo
modo, deve essere mantenuto per ogni tipo di utenti un profilo di
accesso. Un altro modo per assicurare il datawarehouse è cifrarlo
come è scritto nella база података складишта података. Приступ
подаци а алати за проналажење морају дешифровати подаци prima di presentare i
risultati agli utenti.
2.4.4 Складиште података Фаза имплементације
È l’ultima fase nel ciclo di implementazione del datawarehouse. Le
attività da effettuare in questa fase includono l’addestramento degli
utenti per utilizzare il datawarehouse e la realizzazione di reviews
складишта података.
Обука корисника
L’addestramento degli utenti dovrebbe essere fatto prima
dell’accesso ai подаци del datawarehouse e dell’uso dei tool di
retrieval. Generalmente, le sessioni dovrebbero iniziare con
l’introduzione al concetto dell’immagazzinamento di подаци, то
contenuto del datawarehouse, ai meta подаци ed alle features di base
dei tool. Poi, gli utenti più avanzati potrebbero inoltre studiare le
tabelle fisiche e le features degli utenti dei data access e dei tool di
проналажење.
Ci sono molti approcci per fare l’addestramento degli utenti. Uno di
questi prevede una selezione di molti utenti o analisti scelti da un
insieme di utenti, basandosi sulla loro leadership e abilità di
comunicazione. Questi vengono addestrati a titolo personale su
tutto quello che devono sapere per prendere confidenza con il
sistema. Finito l’addestramento, questi ritornano al loro lavoro e
iniziano a insegnare agli altri utenti come utilizzare il sistema. Sulla
base di quanto hanno imparato, gli altri utenti possono iniziare ad
esplorare il datawarehouse.
Un altro approccio è quello di addestrare molti utenti nello stesso
tempo, come se si stesse facendo un corso in aula. Questo metodo
è adatto quando ci sono molti utenti che devono essere addestrati
allo stesso tempo. Un altro metodo ancora è quello di addestrare
individualmente ogni utente, ad uno ad uno. Questo metodo è
adatto quando ci sono pochi utenti.
Lo scopo dell’addestramento degli utenti è quello di familiarizzare
con l’accesso ai подаци e i tool di retrieval così come i contenuti del
datawarehouse. Tuttavia, alcuni utenti possono essere sopraffatti
dalla quantità di informazioni fornita durante la sessione di
addestramento. Quindi devono essere fatte un certo numero di
sessioni di aggiornamento l’assistenza continua e per rispondere
alle domande specifiche. In alcuni casi viene formato un gruppo di
utenti per fornire questo tipo di supporto.
Прикупљање повратних информација
Una volta che il datawarehouse è stato rolled out, gli utenti possono
usare i подаци che risiedono nel datawarehouse per vari scopi.
Principalmente, gli analisti o gli utenti utilizzano i подаци у
datawarehouse per:
1 Identificare le tendenze dell’azienda
2 Analizzare i profili d’acquisto dei клијенти
3 Suddividere i клијенти и
4 Fornire i servizi migliori ai клијенти – прилагодите услуге
5 Formulare strategie di маркетинг
6 Effettuare preventivi competitivi per cost analyses e help
контрола
7 Supportare decision-making strategiche
8 Identificare occasioni per emergere
9 Migliorare la qualità degli attuali business process
10 Controllare il profitto
Seguendo la direzione di sviluppo del datawarehouse, si potrebbero
condurre una serie di revisioni al sistema per ottenere dei feddback
sia da parte del team di sviluppo che da parte della comunità degli
utenti finali.
I risultati ottenuti possono essere presi in considerazione per il
prossimo ciclo di sviluppo.
Dal momento che il datawarehouse ha un approccio incrementale,
è fondamentale imparare dai successi e dagli errori dei precedenti
sviluppi.
2.5 Резиме
In questo capitolo sono stati discussi gli approcci presenti in
letteratura. Nella sezione 1 è stato discusso il concetto di
datawarehouse e il suo ruolo nella scienza delle decisioni. Nella
sezione 2 sono state descritte le principali differenze tra
datawarehouse e sistemi OLTP. Nella sezione 3 si è discusso il
modello di datawarehouse secondo Monash che è stato utilizzato
nella sezione 4 per descrivere le attività coinvolte nel processo di
sviluppo di un datawarehouse, queste tesi non sono state basate su
una ricerca rigorosa. Quello che succede nella realtà può essere
molto diverso da quello che riporta la letteratura, tuttavia questi
risultati possono essere utilizzati per creare un bagaglio di base che
sottolinei il concetto di datawarehouse per questa ricerca.
Поглавље 3
Методе истраживања и пројектовања
Questo capitolo si occupa dei metodi di ricerca e progettazione per
questo studio. La prima parte mostra una vista generica dei metodi
di ricerca disponibili per il reperimento dell’informazione, inoltre
vengono discussi i criteri per selezionare il miglior metodo per uno
studio particolare. Nella sezione 2 vengono poi discussi due metodi
selezionati con i criteri appena esposti; di questi ne verrà scelto ed
adottato uno con le motivazioni esposte nella sezione 3 dove sono
anche esposte le motivazioni per l’esclusione dell’altro criterio. La
sezione 4 presenta il progetto della ricerca e la sezione 5 le
conclusioni.
3.1 Истраживање информационих система
La ricerca nei sistemi informativi non si limita semplicemente
all’ambito tecnologico ma deve essere anche estesa per includere
fini riguardanti il comportamento e l’organizzazione.
Questo lo dobbiamo alle tesi di varie discipline che vanno dalle
scienze sociali a quelle naturali; questo porta alla necessità di un
certo spettro di metodi di ricerca che coinvolgono metodi quantitativi
e qualitativi da utilizzare per i sistemi informativi.
Tutti i metodi di ricerca disponibili sono importanti, infatti svariati
ricercatori come Jenkins (1985), Nunamaker et al. (1991), e Galliers
(1992) sostengono che non esista un metodo specifico universale
per condurre ricerche nei vari campi dei sistemi informativi; infatti
un metodo può essere adatto per una particolare ricerca ma non
per altre. Questo ci porta la necessità di selezionare un metodo che
sia adatto alla nostro particolare progetto di ricerca: per questa
scelta Benbasat et al. (1987) affermano che si debbano considerare
la natura e il fine della ricerca.
3.1.1 Природа истраживања
I vari metodi basati sulla natura della ricerca possono essere
classificati in tre tradizioni ampiamente conosciuti nella scienza
dell’informazione: positivista, interpretativa e ricerca critica.
3.1.1.1 Позитивистичко истраживање
La ricerca positivista è anche conosciuta come studio scientifico o
empirico. Essa cerca di: “spiegare e prevedere cosa succederà nel
mondo sociale guardando alle regolarità e alle relazioni causaeffetto
tra gli elementi che lo costituiscono” (Shanks et al 1993).
La ricerca positivista è inoltre caratterizzata da ripetibilità ,
semplificazioni e confutazioni. Inoltre la ricerca positivista ammette
l’esistenza di relazioni a priori tra i fenomeni studiati.
Secondo Galliers(1992) la tassonomia è un metodo di ricerca
incluso nel paradigma positivista, che però non è limitato a questa,
infatti sussistono esperimenti di laboratorio, esperimenti sul campo,
casi di studio, dimostrazioni di teoremi, previsioni e simulazioni.
Utilizzando questi metodi i ricercatori ammettono che i fenomeni
studiati possano essere osservati oggettivamente e rigorosamente.
3.1.1.2 Интерпретативно истраживање
La ricerca interpretativa, che è spesso chiamata fenomenologia o
anti-positivismo viene descritta da Neuman (1994) come “l’analisi
sistematica del significato sociale dell’azione attraverso la diretta e
dettagliata osservazione delle persone in situazioni naturali, al fine
di arrivare alla comprensione e all’interpretazione di come le
persone creano e mantengono il loro mondo sociale”. Gli studi
interpretative rifiutano l’assunzione che i fenomeni osservati
possano essere osservati oggettivamente. Infatti essi sono basati
su interpretazioni soggettive. Inoltre i ricercatori interpretativi non
impongono significati a priori ai fenomeni che studiano.
Questo metodo comprende studi soggettivo/argomentativi, azioni di
ricerca, studi descrittivo/interpretativi, ricerche future e giochi di
ruolo. In aggiunta a questi indagini e casi di studio possono essere
inclusi in questo approccio in quanto essi concernono gli studi degli
individui o delle organizzazioni all’interno di complesse situazioni
стварног света.
3.1.1.3 Критичко истраживање
La ricerca critica è l’approccio meno conosciuto nelle scienze
sociali ma di recente ha ricevuto l’attenzione dei ricercatori
nell’ambito dei sistemi informativi. L’assunzione filosofica che la
realtà sociale è storicamente prodotta e riprodotta dalle persone,
così come i sistemi sociali con le loro azioni ed interazioni. La loro
abilità, comunque, è mediata da un certo numero di considerazione
sociali, culturali e politiche.
Cosi come la ricerca interpretativa, quella critica sostiene che la
ricerca positivista non c’entra con il contesto sociale ed ignora la
sua influenza sulle azioni umane.
La ricerca critica, d’altra parte, critica la ricerca interpretativa per
essere troppo soggettiva e perché non si propone di aiutare le
persone a migliorare le proprie vite. La più grossa differenza tra la
ricerca critica e gli altri due approcci è la sua dimensione valutativa.
Mentre l’oggettività delle tradizioni positivista ed interpretativa, è per
predire o spiegare lo status quo o la realtà sociale, la ricerca critica
punta a valutare criticamente e trasformare la realtà sociale sotto
студио.
I ricercatori critici solitamente si oppongono allo status quo al fine di
rimuovere le differenze sociali e migliorare le condizioni sociali. La
ricerca critica ha un impegno ad una vista processuale dei
fenomeni di interesse e, pertanto, è normalmente longitudinale.
Esempi di metodi di ricerca sono gli studi storici a lungo termine e
gli studi etnografici. La ricerca critica, tuttavia, non è stata
ampiamente usata nella ricerca dei sistemi d’informazione
3.1.2 Сврха истраживања
Assieme alla natura della ricerca, il suo scopo può essere utilizzato
per guidare il ricercatore nella selezione di un particolare metodo di
ricerca. Lo scopo di un progetto di ricerca è strettamente correlato
alla posizione della ricerca rispetto al ciclo di ricerca che consiste di
tre fasi: costruzione della teoria, test della teoria e affinamento della
teoria. Così, basandosi sul momento rispetto al ciclo di ricerca, un
progetto di ricerca può avere un fine di spiegazione, descrittivo, di
esplorazione oppure predittivo.
3.1.2.1 Истраживачка истраживања
La ricerca esplorativa è finalizzata nell’investigare un argomento
totalmente nuovo e formulare domande e ipotesi per la ricerca
futura. Questo tipo di ricerca è utilizzato nella costruzione della
teoria per ottenere dei riferimenti iniziali in una nuova area.
Normalmente si utilizzano metodi di ricerca qualitativa, come i casi
di studio o gli studi fenomenonologici.
Tuttavia è anche possibile impiegare tecniche quantitative come
indagini esplorative od esperimenti.
3.1.3.3 Дескриптивно истраживање
La ricerca descrittiva è finalizzata ad analizzare e descrivere in gran
dettaglio una particolare situazione o pratica organizzativa. Questa
è appropriata per costruire teorie e può essere anche usata per
confermare o contestare ipotesi. La ricerca descrittiva solitamente
comprende l’uso di misure e campioni. I metodi di ricerca più adatti
comprendono indagini e analisi di antecedenti.
3.1.2.3 Експланаторно истраживање
La ricerca esplicativa cerca di spiegare perché succedono le cose.
Essa è costruita su fatti che sono già stati studiati e cerca di trovare
i perché di tali fatti.
Quindi la ricerca esplicativa è normalmente costruita sulla ricerca
esplorativa o descrittiva ed è accessoria al fine di testare ed affinare
le teorie. La ricerca esplicativa normalmente impiega casi di studio
o metodi di ricerca basati sulle indagini.
3.1.2.4 Превентивно истраживање
La ricerca preventiva punta a predire gli eventi e i comportamenti
sotto osservazione che si stanno studiando (Marshall and Rossman
1995). La previsione è il test scientifico standard della verità.
Questo tipo di ricerca generalmente impiega indagini o analisi dei
подаци историчари. (Јин 1989)
La suddetta discussione dimostra che c’è un certo numero di
possibili metodi di ricerca che possono essere usati in uno studio
particolare. Tuttavia, ci deve essere un metodo specifico più adatto
degli altri per un tipo particolare di progetto di ricerca. (Galliers
1987, Yin 1989, De Vaus 1991). Ogni ricercatore, quindi, ha
bisogno di valutare con attenzione i punti di forza e le debolezze di
vari metodi, per arrivare ad adottare il metodo di ricerca più adatto e
compatibile col progetto di ricerca. (Jenkins 1985, Pervan e Klass
1992, Bonomia 1985, Yin 1989, Himilton and Ives 1992).
3.2. Могуће методе истраживања
L’obiettivo di questo progetto era studiare l’esperienza nelle
organizzazioni australiane con i подаци immagazzinati con uno
свилуппо ди складиште података. Дата che, attualmente, c’è una
mancanza di ricerca nell’area di data warehousing in Australia,
questo progetto di ricerca è ancora nella fase teorica del ciclo di
ricerca ed ha uno scopo esplorativo. Esplorando l’esperienza nelle
organizzazioni australiane che adottano il data warehousing
richiede l’interpretazione della società reale. Di conseguenza, il
l’assunzione filosofica alla base del progetto di ricerca segue
l’interpretazione tradizionale.
Dopo un rigoroso esame dei metodi disponibili, sono stati identificati
due possibili metodi di ricerca: indagini (surveys) e casi di studio
(case studies), che possono essere usati per una ricerca
esplorativa (Shanks et al. 1993). Galliers (1992) sostiene che
l’idoneità di questi due metodi per questo particolare studio nella
sua tassonomia rivisitata dicendo che sono adatti per la costruzione
teorica. Le seguenti due sottosezioni discutono ogni metodo in
детаљ.
3.2.1 Метода истраживања анкете
Il metodo di ricerca d’indagine proviene dall’antico metodo del
censimento. Un censimento consta nel collezionare informazioni da
un’intera popolazione. Questo metodo è costoso e poco pratico, in
particolare se la popolazione è elevata. Quindi, rispetto al
censimento, una indagine normalmente è concentrata sul
collezionare informazioni per un piccolo numero, o campione, dei
rappresentanti della popolazione (Fowler 1988, Neuman 1994). Un
campione riflette la popolazione da cui è disegnato, con differenti
livelli di accuratezza, secondo la struttura del campione, la
dimensione e il metodo di selezione utilizzato (Fowler 1988, Babbie
1982, Neuman 1994).
Il metodo d’indagine è definito come “snapshots of practices,
situations or views at a particular point in time, undertaken using
questionnaires or interviews, from which inferences may be
made” (Galliers 1992:153) [fotografia istentanea delle pratiche,
situazioni o viste in particolare punto temporale, intrapreso usando
questionari o interviste, da cui possono essere fatte inferenze]. Le
indagini si occupano della raccolta di informazioni su alcuni aspetti
dello studio, da un certo numero di partecipanti, facendo delle
domande (Fowler 1988). Anche questi questionari e interviste, che
includono le interviste faccia a faccia al telefono e quelle strutturate,
sono le tecniche di collezione di подаци più comuni impiegate nelle
indagini (Blalock 1970, Nachmias and Nachmias 1976, Fowler
1988), possono essere utilizzate osservazioni ed analisi (Gable
1994). Di tutti questi metodi di collezione dei подаци, употреба
questionario è la tecnica più popolare, poiché assicura che i подаци
collezionati siano strutturati e formattati, e quindi facilita la
classificazione delle informazioni (Hwang 1987, de Vaus 1991).
Приликом анализе и подаци, una strategia d’indagine impiega spesso le
tecniche quantitative, come l’analisi statistica, ma possono essere
impiegate anche tecniche qualitative (Galliers 1992, Pervan
и Класс 1992, Габле 1994). Нормално, тј подаци raccolti sono
usati per analizzare le distribuzioni e i modelli delle associazioni
(Fowler 1988).
Anche se le indagini sono generalmente appropriate per ricerche
che si occupano della domanda ‘che cosa?’ (what) o da essa
derivanti, quali ‘quanto’(how much) e ‘quant’è’ (how many), esse
possono essere poste tramite la domanda ‘perché’ (Sonquist and
Dunkelberg 1977, Yin 1989). Secondo Sonquist e Dunkelberg
(1977), l’indagine di ricerca punta ad ipotesi difficili, programme di
valutazione, descrivendo la popolazione e sviluppando modelli del
comportamento umano. Inoltre, le indagini possono essere usate
per studiare un’opinione certa della popolazione, condizioni,
opinioni, caratteristiche, aspettative e anche comportamenti passati
o presenti(Neuman 1994).
Le indagini permettono al ricercatore di scoprire i rapporti tra la
popolazione ed i risultato sono normalmente più generici rispetto ad
altri metodi (Sonquist and Dunkelberg 1977, Gable 1994). Le
indagini permettono ai ricercatori di riguardare una zona geografica
più larga e di raggiungere tantissimi dichiaranti (Blalock 1970,
Sonquist and Dunkelberg 1977, Hwang and Lin 1987, Gable 1994,
Neuman 1994). Infine, le indagini possono fornire le informazioni
che non sono disponibili altrove o nella forma richiesta per le analisi
(Fowler 1988).
Ci sono, tuttavia, alcune limitazioni nell’eseguire un’indagine. Uno
svantaggio è che il ricercatore non può ottenere molte informazioni
a riguardo dell’oggetto studiato. Questo è dovuto al fatto che le
indagini sono eseguite soltanto in un momento particolare e, quindi,
c’è un numero limitato di variabili e di persone che il ricercatore può
studiare (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Un altro svantaggio è quello che esegue un’indagine può essere
molto costoso in termini di tempo e risorse, particolarmente se
coinvolge le interviste faccia a faccia (Fowler 1988).
3.2.2. Метод истраживања упита
Il metodo di ricerca di inchiesta coinvolge lo studio approfondito su
una particolare situazione all’interno del relativo contesto reale in un
periodo di tempo definito, senza alcun intervento da parte del
ricercatore (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Principalmente questo metodo è usato per descrivere i rapporti fra
le variabili che si stanno studiando in una situazione particolare
(Galliers 1992). Le inchieste possono coinvolgere singoli casi o
multipli, a seconda del fenomeno analizzato (Franz e Robey 1987,
Eisenhardt 1989, Yin 1989).
Il metodo di ricerca di inchiesta è definito come “un’inchiesta
empirica che studia un fenomeno contemporaneo all’interno del
relativo contesto reale, usando le fonti multiple raccolte da una o
più entità quali la gente, i gruppi, o le organizzazioni” (Yin 1989).
Non c’è netta separazione fra il fenomeno ed il relativo contesto e
non c’è controllo o manipolazione sperimentale delle variabili (Yin
1989, Benbasat ed altri 1987).
Постоји низ техника за сакупљање подаци цхе поссоно
essere impiegate nel metodo di inchiesta, che includono le
osservazioni dirette, revisioni di record di archivi, questionari,
revisione della documentazione ed interviste strutturate. Avendo
una gamma varia di tecniche della raccolta di подаци, le inchieste
permettono ai ricercatori di occuparsi sia dei подаци qualitativi che
quantitativi allo stesso tempo (Bonoma 1985, Eisenhardt 1989, Yin
1989, Gable 1994). Com’è il caso con il metodo di indagine, un
ricercatore di inchiesta funge da osservatore o ricercatore e non
come partecipante attivo all’organizzazione allo studio.
Benbasat ed altri (1987) asseriscono che il metodo di inchiesta è
particolarmente adatto per la costruzione della teoria di ricerca, che
comincia con una domanda di ricerca e continua con la formazione
теорије током процеса прикупљања подаци. Бити
adatto anche per la fase
della costruzione di teoria, Franz e Robey (1987) suggeriscono che
il metodo di inchiesta può anche essere utilizzato per la complessa
fase di teoria. In questo caso, basandosi sulle prove raccolte, una
data teoria o ipotesi viene verificata o confutata. In più, l’inchiesta è
anche adatta per ricerca che si occupa delle domande ‘come’ o
‘perché’ (Yin 1989).
Rispetto ad altri metodi, le inchieste permettono al ricercatore di
catturare le informazioni essenziali più nel particolare (Galliers
1992, Shanks ed altri 1993). Inoltre, le inchieste permettono al
ricercatore di capire la natura e la complessità dei processi studiati
(Benbasat ed altri 1987).
Ci sono quattro svantaggi principali connessi con il metodo di
inchiesta. Il primo è la mancanza di deduzioni controllate. La
soggettività del ricercatore può alterare i risultati e le conclusioni
dello studio (Yin 1989). Il secondo svantaggio è la mancanza di
osservazione controllata. A differenza dei metodi sperimentali, il
ricercatore di inchiesta non può controllare i fenomeni studiati
poiché sono esaminati nel loro contesto naturale (Gable 1994). Il
terzo svantaggio è la mancanza di replicabilità. Ciò è dovuto al fatto
che il ricercatore ha poca probabilità di osservare gli stessi eventi, e
non può verificare i risultati di un particolare studio (Lee 1989).
Infine, come conseguenza della non replicabilità, è difficile
generalizzare i risultati ottenuti da una o più inchieste (Galliers
1992, Shanks ed altri 1993). Tutti questi problemi, tuttavia, non
sono insormontabili e possono, infatti, essere minimizzati dal
ricercatore applicando azioni appropriate (Lee 1989).
3.3. Образложите методологију истраживања
усвојени
Dai due metodi di ricerca possibili per questo studio, il metodo di
indagine è considerato come il più adatto. Quello di inchiesta è
stato scartato in seguito ad un attenta considerazione dei relativi
meriti e debolezze. La convenienza o l’inappropriatezza di ogni
metodo per questo studio è discussa in seguito.
3.3.1. Неприкладност методе истраживања
истраге
Il metodo di inchiesta richiede lo studio approfondito circa una
situazione particolare all’interno di una o più organizzazioni per un
periodo di tempo (Eisenhardt 1989). In questo caso, il periodo può
eccedere la struttura di tempo data per questo studio. Un altro
motivo per non adottare il metodo di inchiesta è che i risultati
possono soffrire da mancanza di rigore (Yin 1989). La soggettività
del ricercatore può influenzare i risultati e le conclusioni. Un altro
motivo è che questo metodo è più adatto a ricerche su domande
del tipo ‘come’ o ‘perché’ (Yin 1989), mentre la domanda di ricerca
per questo studio è del tipo ‘che cosa’. Infine, ma non meno
importante, è difficile generalizzare i risultati da appena una o
poche inchieste (Galliers 1992, Shanks ed altri 1993). Sulla base di
questa spiegazione razionale, il metodo di ricerca di inchiesta non è
stato scelto poiché inadatto per questo studio.
3.3.2. Погодност метода претраживања
истрага
Quando questa ricerca è stata condotta, la pratica di datawarehousing
non era stata ampiamente adottata dalle
organizzazioni australiane. Quindi, non c’erano molte informazioni
per quanto riguarda la loro implementazione all’interno delle
organizzazioni australiane. Le informazioni disponibili provenivano
dalle organizzazioni che avevano implementato o utilizzato un data
warehouse. In questo caso, il metodo di ricerca di indagine è il più
adatto poiché permette di ottenere le informazioni che non sono
disponibili altrove o nella forma richiesta per analisi (Fowler 1988).
In più, il metodo di ricerca di indagine permette al ricercatore di
ottenere una buona visione delle pratiche, delle situazioni, o delle
viste in un determinato momento (Galliers 1992, Denscombe 1998).
Una veduta d’insieme era stata richiesta per aumentare la
conoscenza circa l’esperienza australiana di data warehousing.
Ancora, Sonquist e Dunkelberg (1977) dichiarano che i risultati di
ricerca di indagine sono più generali di altri metodi.
3.4. Дизајн истраживања истраживања
L’indagine circa la pratica di data warehousing è stata eseguita nel 1999.

La popolazione obiettivo era formata da organizzazioni
australiane interessate agli studi di data warehousing, poiché erano
probabilmente già informati circa i подаци che immagazzinano e,
pertanto, potrebbe fornire le informazioni utili per questo studio. La
popolazione obiettivo è stata identificata con un’indagine iniziale di
tutti i membri australiani del ‘The Data Warehousing Institute’ (Tdwiaap).
Questa sezione discute il disegno della fase di ricerca
empirica di questo studio.
3.4.1. Техника жетве подаци
Dalle tre tecniche usate comunemente nella ricerca di indagine
(cioè questionario via posta, intervista del telefono ed intervista
personale) (Nachmias 1976, Fowler 1988, de Vaus 1991), per
questo studio è stato adottato il questionario via posta. Il primo
motivo per l’adozione di quest’ultimo è che può raggiungere una
popolazione sparsa geograficamente (Blalock 1970, Nachmias e
Nachmias 1976, Hwang e Lin 1987, de Vaus 1991, Gable 1994).
Secondariamente, il questionario via posta è adatto a partecipanti
altamente istruiti (Fowler 1988). Il questionario via posta per questo
studio è stato indirizzato ai project sponsors del data warehousing,
direttori e/o responsabili di progetto. In terzo luogo, i questionari via
posta sono adatti quando si ha a disposizione una lista sicura di
indirizzi (Salant e Dilman 1994). TDWI, in questo caso, una
associazione fidata di data warehousing ha fornito la lista di indirizzi
dei relativi membri australiani. Un altro vantaggio del questionario
via posta rispetto al questionario via telefono o alle interviste
personali è che permette ai dichiaranti di rispondere con maggior
esattezza, particolarmente quando i dichiaranti devono consultare
le annotazioni o discutere le domande con altra gente (Fowler
КСНУМКС).
Uno svantaggio potenziale può essere il tempo richiesto per
condurre i questionari via posta. Normalmente, un questionario via
posta è condotto in questa sequenza: spedire le lettere, aspettare le
risposte e mandare la conferma(Fowler 1988, Bainbridge 1989).
Quindi, il tempo totale può essere più lungo del tempo richiesto per
le interviste personali o per le interviste al telefono. Tuttavia, il
tempo totale può essere conosciuto in anticipo (Fowler 1988,
Denscombe 1998). Il tempo speso per condurre le interviste
personali non può essere conosciuto in anticipo poiché varia da
un’intervista all’altra (Fowler 1988). Le interviste telefoniche
possono essere più rapide dei questionari via posta e delle
interviste personali ma possono avere un alto tasso di mancanza di
risposta dovuto all’indisponibilità di alcune persone (Fowler 1988).
In più, le interviste telefoniche sono limitate generalmente a liste di
domande relativamente corte (Bainbridge 1989).
Un’altra debolezza di un questionario via posta è l’alto tasso di
mancanza di risposta (Fowler 1988, Bainbridge 1989, Neuman
1994). Tuttavia, sono state prese delle contromisure, associando
questo studio con un’istituzione fidata nel campo del data
warehousing (cioè TDWI) (Bainbridge 1989, Neuman 1994), la
quale trasmette due lettere di sollecito ai chi non ha risposto
(Fowler 1988, Neuman 1994) ed include inoltre una lettera
aggiuntiva che spiega lo scopo dello studio (Neuman 1994).
3.4.2. Јединица анализе
Lo scopo di questo studio è ottenere le informazioni circa
l’implementazione del data warehousing e l’utilizzo dello stesso
all’interno delle organizzazioni australiane. La popolazione obiettivo
è costituita da tutte le organizzazioni australiane che hanno
implementato, o stanno implementando, i складиште података. у
seguito vengono intestate le singole organizzazioni. Il questionario
via posta è stato spedito alle organizzazioni interessate all’adozione
di складиште података. Questo metodo garantisce che le informazioni
raccolte provengano dalle risorse più adatte di ogni organizzazione
partecipante.
3.4.3. Узорак анкете
La “mailing list” dei partecipanti all’indagine è stata ottenuta da
TDWI. A partire da questa lista, 3000 organizzazioni australiane
sono state selezionate come base per il campionamento. Una
lettera di aggiuntiva spiegava il progetto e lo scopo dell’indagine,
insieme ad una scheda per le risposte e una busta prepagata per
rinviare il questionario compilato sono state inviate al campione.
Delle 3000 organizzazioni, 198 hanno accettato di partecipare allo
studio. Era previsto un così piccolo numero di risposte дато il
grande numero di organizzazioni australiane che allora avevano
abbracciato o stavano abbracciando la strategia di data
warehousing all’interno delle loro organizzazioni. Quindi, la
popolazione obiettivo per questo studio consiste di sole 198
organizzazioni.
3.4.4. Садржај упитника
La struttura del questionario è stata basata sul modello di data
warehousing Monash (discusso precedentemente nella parte 2.3). Il
contenuto del questionario è stato basato sull’analisi della
letteratura presentata nel capitolo 2. Una copia del questionario
spedito ai partecipanti all’indagine può essere trovata
nell’appendice B. Il questionario è composto da sei sezioni, che
seguono le fasi del modello trattato. I seguenti sei paragrafi
brevemente ricapitolano il contenuto di ogni sezione.
Одељак А: Основне информације о организацији
Questa sezione contiene le domande relative al profilo delle
organizzazioni partecipanti. In più, alcune delle domande sono
relative alla condizione del progetto di data warehousing del
partecipante. Le informazioni confidenziali quale il nome
dell’organizzazione non sono state rivelate nell’analisi di indagine.
Одељак Б: Почетак
Le domande in questa sezione sono relative all’attività di inizio di
data warehousing. Le domande sono state fatte per quanto
riguarda gli iniziatori di progetto, garanti, abilità e conoscenza
richieste, gli obiettivi dello sviluppo di data warehousing e le
aspettative degli utilizzatori finali.
Одељак Ц: Дизајн
Questa sezione contiene le domande relative alle attività di
pianificazione del складиште података. In particolare, le domande sono
state circa la portata di esecuzione, la durata del progetto, il costo
del progetto e l’analisi di costi/benefici.
Одељак Д: Развој
Nella sezione di sviluppo ci sono le domande relative alle attività di
развијање складиште података: raccolta di requisiti dell’utilizzatore
finale, le fonti di подаци, логички модел подаци, prototipi, la
pianificazione di capienza, architetture tecniche e selezione dei
tools di sviluppo del data warehousing.
Одељак Е: Операција
Domande di funzionamento relative al funzionamento ed
all’estensibilità del складиште података, come si evolve nella
successiva fase di sviluppo. La квалитета података, le strategie di
refresh dei подаци, грануларност подаци, scalabilità del data
warehouse ed i problemi di sicurezza del складиште података erano fra
le tipologie di domande fatte.
Одељак Ф: Развој
Questa sezione contiene le domande relative all’utilizzo del data
warehouse da parte degli utenti finali. Il ricercatore era interessato
allo scopo e all’utilità del складиште података, la revisione e le strategie
di addestramento adottati e la strategia di controllo del data
warehouse adottata.
3.4.5. Стопа Одговора
Anche se le indagini via posta sono criticate per avere un tasso di
risposta basso, sono state adottate delle misure per aumentare il
tasso di rendimento (come discusso precedentemente nella parte
3.4.1). Il termine ‘tasso di risposta’ si riferisce alla percentuale di
persone in un campione particolare di indagine che risponde al
questionario (Denscombe 1998). E’ stata utilizzata la seguente
formula per calcolare il tasso di risposta per questo studio:
Број људи који су одговорили
Tasso di risposta =
——————————————————————————– X 100
Numero totale di questionari spediti
3.4.6. Тест-пилот
Prima che il questionario sia spedito al campione, le domande sono
state esaminate effettuando le prove pilota, come suggerito da Luck
e Rubin (1987), Jackson (1988) e de Vaus (1991). Lo scopo delle
prove pilota è di rivelare tutte le espressioni scomode, ambigue e
domande di difficile interpretazione, per chiarire qualunque
definizioni e termini usati e per identificare il tempo approssimativo
richiesto per compilare il questionario (Warwick e Lininger 1975,
Jackson 1988, Salant e Dilman 1994). Le prove pilota sono state
effettuate selezionando soggetti con caratteristiche simili a quelle
dei soggetti finali, come suggerito Davis e Козенца (КСНУМКС). Ин
questo studio, sei professionisti di data warehousing sono stati
selezionati come i soggetti pilota. Dopo ogni prova pilota, sono
state fatte le correzioni necessarie. Dalle prove pilota effettuate, i
partecipanti hanno contribuito a rimodellare e reimpostar la
versione definitiva del questionario.
3.4.7. Методе анализе Би Дати
I подаци di indagine raccolti dai questionari a domanda chiusa sono
stati analizzati usando un pacchetto di programmi statistico
denominato SPSS. Molte delle risposte sono state analizzate
usando le statistiche descrittive. Un certo numero di questionari
sono ritornati incompleti. Questi sono stati trattati con maggiore
attenzione per accertarsi che i подаци mancanti non fossero una
conseguenza degli errori di data entry, ma perché le domande non
erano adatte per il dichiarante, o il dichiarante ha deciso non
rispondere ad una o più domande specifiche. Queste risposte
mancanti sono state ignorate durante l’analisi dei подаци e sono state
codificate come ‘- 9’ per accertare la loro esclusione dal processo di
анализе.
Nel preparare il questionario, le domande chiuse sono state
precodificate assegnando un numero ad ogni opzione. Il numero
allora è stato usato per preparare i подаци durante l’analisi
(Denscombe 1998, Sapsford e Jupp 1996). Per esempio, c’erano
sei opzioni elencate nella domanda 1 della sezione B: consiglio
d’amministrazione, esecutivo ad alto livello, dipartimento IT , unità
di affari, i consulenti ed altro. Nello schedario di подаци di SPSS, è
stata generata una variabile per indicare ‘l’iniziatore di progetto’,
con sei etichette di valore: ‘1’ per il ‘consiglio d’amministrazione’, ‘2’
per ‘l’esecutivo ad alto livello’ e così via. L’uso della scala di Likertin
in alcune delle domande chiuse inoltre ha permesso
un’identificazione che non richiede sforzo visto l’utilizzo dei valori
numerici corrispondenti inseriti in SPSS. Per le domande con le
risposte non esaustive, che non erano reciprocamente esclusive,
ogni opzione è stata trattata come una singola variabile con due
etichette di valore: ‘1 ‘ per ‘segnata’ e ‘2 ‘ per ‘non segnata’.
Le domande aperte sono state trattate diversamente dalle domande
chiuse. Le risposte a queste domande non sono state inserite in
SPSS. Al contrario, sono state analizzate a mano. L’uso di questo
tipo di domande permette di acquisire informazioni circa le idee
liberamente espresse e le esperienze personali nei dichiaranti
(Bainbridge 1989, Denscombe 1998). Dove possibile, è stata fatta
una categorizzazione delle risposte.
За анализу подаци, sono usati metodi di semplice analisi statistica,
come la frequenza delle risposte, la media, la scarto quadratico
medio e la mediana (Argyrous 1996, Denscombe 1998).
Il Gamma test era performante per ottenere misure quantitative
delle associazioni tra подаци ordinali (Norusis 1983, Argyrous 1996).
Questi test erano appropriati perché le scale ordinali usate non
avevano molte categorie e potevano essere mostrate in una tabella
(Norusis 1983).
3.5 Соммарио
In questo capitolo, sono stati discussi la metodologia di ricerca e il
design adottati per questo studio.
La selezione del più appropriato metodo di ricerca per un
particolare studio prende in
considerazione un certo numero di regole, inclusa la natura e il tipo
della ricerca, così come i meriti e le debolezze di ogni possibile
metodo(Jenkins 1985, Benbasat et al. 1097,Galliers e Land 1987,
yin 1989, Hamilton e ives 1992, Galliers 1992, neuman 1994). Vista
la mancanza di conoscenza e teoria esistenti a proposito
dell’adozione di data warehousing in Australia, questo studio di
ricerca richiede un metodo di ricerca interpretativo con una abilità
esplorativa per esplorare le esperienze delle organizzazioni
australiane. Il metodo di ricerca prescelto è stato selezionato per
raccogliere informazioni riguardanti l’adozione del concetto di data
ware-housing da parte delle organizzazioni australiane. Un
questionario postale è stato scelto come tecnica di raccolta подаци.
giustificazioni per il metodo di ricerca e la tecnica di raccolta подаци
selezionati saranno fornite in questo capitolo. Inoltre è stata
presentata una discussione sull’unità di analisi,il campione
utilizzato, le percentuali di risposte, il contenuto del questionario, il
pre test del questionario e il metdo di analisi dei подаци.

Дизајн а Складиште података:
Комбиновање односа ентитета и димензионалног моделирања
АПСТРАКТ
Чување и подаци è un problema attuale importante per molte
organizzazioni. Un problema chiave nello sviluppo
dell’immagazzinamento dei подаци то је његов дизајн.
Il disegno deve sostenere il rilevamento di concetti nel data
warehouse a legacy system e le altre fonti di подаци ed anche una
facile comprensione ed efficienza nell’implementazione di data
магацин.
Велики део литературе о складиштењу подаци препоручује се
l’uso di entity relationship modelling or dimensional modelling per
rappresentare il disegno di складиште података.
In questo giornale noi mostriamo come entrambe le
rappresentazioni possono essere combinate in un approccio per il
disegno di складиште података. Приступ који се користи је систематичан
esaminato in un caso di studio ed è identificato in un numero di
importanti implicazioni con professionisti.
СКЛАДИШТЕЊЕ ПОДАТАКА
Un складиште података di solito è definito come un “subject-oriented,
integrated, time-variant, and nonvolatile collection of data in support
of management’s decisions” (Inmon and Hackathorn, 1994).
Subject-oriented and integrated indica che il складиште података è
progettato per attraversare i confini funzionali dei legaci system per
offrire una prospettiva integrata dei подаци.
Временска варијанта утиче на историјску природу или природу временске серије подаци in
un складиште података, la quale abilita trend per essere analizzati.
Non-volatile indica che il складиште података non è continuamente
aggiornato come un база података di OLTP. Piuttosto è aggiornato
periodicamente, con подаци који долазе из унутрашњих и екстерних извора. Тхе
складиште података specificatamente è disegnato per la ricerca
piuttosto che per l’integrità degli aggiornamenti e le prestazioni delle
operazioni.
Идеја о чувању и подаци non è nuova, è stato uno degli scopi
оф манагемент оф подаци од шездесетих година (Тхе Мартин, 1982).
I складиште података нуде инфраструктуру подаци per management
support systems. Management support systems includono decision
support systems (DSS) and executive information systems (EIS).
Un DSS è un sistema di informazioni computer-based che è
progettato per migliorare il processo e di conseguenza la presa di
decisione umana. Un EIS è tipicamente un sistema di consegna di
подаци che abilita dirigenti d’azienda ad accedere facilmente alla vista
од подаци.
Општа архитектура а складиште података истиче улогу
складиште података nel supporto alla gestione. Oltre ad offrire
инфраструктуру подаци за ЕИС и ДСС, ал складиште података је могуће
accedervi direttamente attraverso le query. I подаци inclusi in un data
warehouse si basano su un’analisi dei requisiti di informazioni di
gestione e sono ottenuti da tre fonti: internal legacy systems,
special purpose data capture systems and external data sources. I
подаци negli internal legacy systems sono frequentemente ridondanti,
inconsistenti, di bassa qualità, e immagazzinati in diversi formati
quindi devono essere riconciliati e puliti prima di poterli caricare nel
складиште података (Инмон, 1992; МцФадден, 1996). ТХЕ подаци provenienti
da sistemi di immagazzinamento подаци ад хоц и из извора подаци
екстерни се често користе за повећање (ажурирање, замену) и
подаци из застарелих система.
Постоји много убедљивих разлога за развој а складиште података,
che includono una migliore presa di decisione attraverso l’uso
effettivo di più informazioni (Ives 1995), il supporto per un focus
sugli affari completi (Graham 1996), e la riduzione in costi di
provvedimento di подаци per EIS e DSS (Graham 1996, McFadden
КСНУМКС).
Un recente studio empirico ha scoperto, in media, un ritorno degli
investimenti per i складиште података del 401% dopo tre anni (Graham,
1996). Comunque, gli altri studi empirici di складиште података имати
trovato significanti problemi incluso la difficoltà nel misurare ed
assegnare benefici, mancanza di un scopo chiaro, sottovalutando lo
scopo e la complessità del processo di immagazzinare i подациу
particolare quanto riguarda le fonti e la pulizia dei подаци.
Чување и подаци può essere considerato come una soluzione
al problema di gestione dei подаци fra le organizzazioni. La
manipolazione dei подаци come risorsa sociale è rimasto uno dei
problemi chiave nella gestione di sistemi di informazioni in tutto il
mondo per molti anni (Brancheau et al. 1996, Galliers et al. 1994,
Niederman et al. 1990, Pervan 1993).
Популаран приступ управљању подаци negli anni ottanta era
lo sviluppo di un modello подаци друштвеним. Модел подаци sociale fu
pensato per offrire una base stabile per lo sviluppo di nuovi sistemi
applicativi e база података e la ricostruzione e l’integrazione di legacy
systems (Brancheau et al.
1989, Goodhue et al. 1988:1992, Kim and Everest 1994).
Comunque, ci sono molti problemi con questo approccio, in
particolare, la complessità e il costo di ogni task, ed il lungo tempo
richiesto per avere risultati tangibili (Beynon-Davies 1994, Earl
1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997).
Il складиште података è un databse separato che co-esiste coi legacy
databases piuttosto che sostituirli. Esso perciò consente di
indirizzare la gestione dei подаци ed evitare la costosa ricostruzione
dei legacy systems.
ПОСТОЈЕЋИ ПРИСТУПИ ДИЗАЈНУ ПОДАТАКА
ВАРЕХОУСЕ
Процес изградње и усавршавања а складиште података
va compreso più come un processo evolutivo piuttosto che un
lifecycle di sviluppo di sistemi tradizionali (Десио, 1995, Shanks,
O’Donnell and Arnott 1997a ). Ci sono molti processi coinvolti in un
пројекат оф складиште података come inizializzazione, pianificazione;
informazioni acquisite dai requisiti chieste ai dirigenti d’azienda;
fonti, trasformazioni, pulizia dei подаци e di sincronizzazione da legacy
systems e le altre fonti di подаци; sistemi di consegna in sviluppo;
monitoraggio dei складиште података; e insensatezza del processo
evolutivo e di costruzione di un складиште података (Stinchi, O’Donnell
ed Arnott 1997b). In questo giornale, noi focalizziamo su come
disegnare i подаци immagazzinati nel contesto di questi altri processi.
Ci sono un numero di approcci proposti per l’architettura dei data
warehouse nella letteratura (Inmon 1994, Ives 1995, Kimball 1994
McFadden 1996). Ognuna di queste metodologie ha una breve
rassegna con un’analisi dei loro punti di forza e non.
Инмонов (1994) приступ за Складиште података
Дизајн
Inmon (1994) propose quattro passi iterativi per disegnare un data
warehouse (veda Figura 2). Il primo passo è progettare un modello
подаци друштвени да разуме како ја подаци possono essere integrati
attraverso aree funzionali all’interno di un’organizzazione
suddividendo i подаци складиште у областима. Модел подаци створено је за
за чување подаци који се односе на доношење одлука, укључујући подаци
историчари, а међу њима подаци dedotti ed aggregati. Il secondo passo è
identificare aree soggette per la realizzazione. Questi sono basati
su priorità determinate da una particolare organizzazione. Il terzo
passo comporta il disegno di un база података per l’area soggetta, pone
particolare attenzione a includere appropriati livelli di granularità.
Inmon raccomanda di usare il modello entità e relazioni. Il quarto
passo è identificare sistemi di fonti подаци richiesti e sviluppare
processi di trasformazione per acquisire, pulire e formattare i подаци.
Предности Инмоновог приступа су у томе што модел подаци друштвени
offre la base per l’integrazione di подаци all’interno dell’organizzazione
e pianificazione di supporti per lo sviluppo iterativo di data
warehouse. Le sue pecche sono la difficoltà e il costo nel disegnare
ил моделло подаци sociale, la difficoltà nel capire modelli di entità e
relazioni usati in ambo i modelli, quello подаци друштвених и то од подаци
ускладиштене по предметној области и прикладност подаци дел
disegno di складиште података за реализацију база података
релациони али не и за база података вишедимензионални.
Ивесов (1995) приступ Складиште података
Дизајн
Ives (1995) propone un approccio di quattro passi per disegnare un
sistema informativo che lui ritiene applicabile al disegno di un data
warehouse (veda Figura 3). L’approccio è molto basato sull’
Information Engineering per lo sviluppo di sistemi di informazioni
(Martin 1990). Il primo passo è determinare gli obiettivi, i fattori
critici e di successo e gli indicatori chiave delle prestazioni. I
processi chiave di business e le informazioni necessarie sono
modellate per condurci ad un modello подаци sociale. Il secondo passo
comporta lo sviluppo di un architettura che definisce подаци
ускладиштена по областима, база података di складиште података, i componenti
di tecnologia che sono richiesti, l’insieme di supporto organizzativo
richiesto per implementare ed operare con складиште података. Il terzo
passo include la selezione di pacchetti software e attrezzi richiesti.
Il quarto passo è il disegno particolareggiato e la costruzione del
складиште података. Ајвс примећује да чување подаци è un vincolato
processo iterativo.
La forza dell’approccio di Ives sono l’uso di specifiche tecniche per
determinare i requisiti d’informazione, l’uso di uno strutturato
processo per sostenere l’integrazione dei складиште података,
l’opportuna selezione hardware e software, e l’uso di molteplici
tecniche di rappresentazione per il складиште података. Le sue pecche
sono inerenti alla complessità. Altre includono la difficoltà nello
sviluppare molti livelli di база података унутар складиште података in
tempi e costi ragionevoli.
Кимбаллов (1994) приступ Складиште података
Дизајн
Kimball (1994) propose cinque passi iterativi per disegnare un data
warehouse (vedi Figuri 4). Il suo approccio è particolarmente
dedicato sul disegno di un solo складиште података e sull’uso di modelli
dimensionali in preferenza a modelli di entità e relazioni. Kimball
analizza quei modelli dimensionali perché è più facile capire per i
dirigenti d’azienda gli affari, è più efficiente quando si trattano
consultazioni complesse, e il disegno di база података fisico è più
efficiente (Kimball 1994). Kimball riconosce che lo sviluppo di un
складиште података то је итеративно, и то складиште података separati possono
essere integrati attraverso la ripartizione in tavole di dimensioni
заједнички.
Il primo passo è identificare la particolare area soggetto per essere
perfezionato. Il secondo e terzo passo concernono modellatura
dimensionale. Nel secondo passo le misure identificano cose di
interesse nell’area soggetto e raggruppate in una tabella dei fatti.
Per esempio, in un’area di soggetto di vendite le misure di interesse
potrebbero includere l’ammontare di articoli venduto ed il dollaro
come valuta di vendite. Il terzo passo comporta l’identificazione di
dimensioni che sono i modi nei quali possono essere raggruppati i
fatti. In un’area di soggetto di vendite, dimensioni attinenti
potrebbero includere articolo, ubicazione e tempo periodo. La
tabella dei fatti ha una chiave multi- part per collegarla ad ognuna
delle tabelle di dimensione e tipicamente contiene un numero molto
grande di fatti. In contrasto, tavole di dimensione contengono
descrittive informazioni sulle dimensioni e gli altri attributi che
possono essere usati per raggruppare i fatti. La tabella dei fatti e
dimensioni associata proposta forma quello che è chiamato uno
schema a stella a causa della sua forma. Il quarto passo comporta
la costruzione di un база података multidimensionale per perfezionare lo
schema della stella. Il passo finale è identificare sistemi di fonti подаци
richiesti e sviluppare processi di trasformazione per acquisire, pulire
e formattare i подаци.
Le forze dell’approccio di Kimball includono l’uso di modelli
dimensionali per rappresentare i подаци immagazzinati che lo rendono
facile da capire e conduce ad un disegno fisico efficiente. Un
modello dimensionale che usa prontamente anche entrambi i
системи база података релациони могу бити усавршени или системи
база података multidimensionali. Le sue pecche includono la mancanza
di alcune tecniche per facilitare la pianificazione o l’integrazione di
molti schemi della stella all’interno di un складиште података и
difficoltà di progettare dall’estrema struttura denormalizzata in un
modello dimensionale a подаци у систему наслеђа.
МцФадден-ов (1996) приступ подацима
Дизајн складишта
McFadden (1996) propone un approccio di cinque passi per
disegnare un складиште података (види слику 5).
Il suo approccio è basato su una sintesi delle idee dalla letteratura
ed è focalizzato sul disegno di un solo складиште података. Први
passo comporta un’analisi dei requisiti. Anche se le specifiche
tecniche non sono prescritte, le note di McFadden identificano le
ентитета подаци specifiche ed i loro attributi, e si riferisce ai lettori Watson
e Frolick (1993) per l’acquisizione dei requisiti.
У другом кораку, дизајниран је модел односа ентитета
складиште података e poi convalidato dai dirigenti d’azienda. Il terzo
passo comprende la determinazione del mapping da legacy system
e fonti esterne di складиште података. Il quarto passo comporta
processi in sviluppo, la distribuzione e sincronizzazione di подаци у
складиште података. Nel passo finale, la consegna del sistema è
sviluppata con particolare enfasi su un’interfaccia utente.
McFadden fa notare che il processo di disegno è generalmente
iterativo.
Le forze dell’approccio di McFadden puntano sulla partecipazione
da parte dei dirigenti d’azienda nel determinare i requisiti ed anche
l’importanza delle risorse подаци, la loro pulizia e raccolta. Le sue
pecche riguardano la mancanza di un processo per suddividere un
grande progetto di складиште података у многим интегрисаним фазама, и
потешкоће у разумевању ентитета и модела односа који се користе у дизајну
складиште података.

0/5 (0 рецензија)

Сазнајте више од Онлине веб агенције

Претплатите се да примате најновије чланке путем е-поште.

Администратор Direktor

👍Веб агенција на мрежи | Стручњак за веб агенције за дигитални маркетинг и СЕО. Веб Агенци Онлине је веб агенција. За Агензиа Веб Онлине успех у дигиталној трансформацији заснива се на основама Ирон СЕО верзије 3. Специјалитети: системска интеграција, интеграција пословних апликација, сервисно оријентисана архитектура, рачунарство у облаку, складиште података, пословна интелигенција, велики подаци, портали, интранети, веб апликација Дизајн и управљање релационим и вишедимензионалним базама података Дизајнирање интерфејса за дигиталне медије: употребљивост и графика. Онлине веб агенција нуди компанијама следеће услуге: -СЕО на Гоогле, Амазон, Бинг, Иандек; -Веб аналитика: Гоогле аналитика, Гоогле Таг Манагер, Иандек Метрица; -Конверзије корисника: Гоогле Аналитицс, Мицрософт Цларити, Иандек Метрица; -СЕМ на Гоогле, Бинг, Амазон Адс; - Маркетинг на друштвеним мрежама (Фацебоок, Линкедин, Иоутубе, Инстаграм).

Погледајте пуну биографију

Дигитални маркетинг База података ДБМС Складиште података podaci Наука Оглашавање путем интернета Информационе технологије Веб Агенци Рекламна агенција Marketing

Подели:

Волим:

Сазнајте више од Онлине веб агенције