fbpx

Складиштење података и планирање ресурса предузећа | ДВХ и ЕРП

АРХИВ ДАТА ЦЕНТРАЛ: ИСТОРИЈА ЕД ЕВОЛУЦИЈЕ

Две доминантне теме корпоративне технологије 90-их биле су и складиште података и ЕРП. Дуго времена су ове две моћне струје биле делови корпоративне ИТ без икаквих раскрсница. Било је скоро као да су материја и анти-материја. Али раст оба феномена неминовно је довео до њиховог укрштања. Данас се компаније суочавају са проблемом шта да раде са ЕРП и складиште података. Овај чланак ће описати који су проблеми и како их компаније решавају.

НА ПОЧЕТКУ…

У почетку је постојао складиште података. Складиште података је креиран да би се супротставио систему апликација за обраду трансакција. У првим данима памћење на подаци требало је да буде само контрапункт апликацијама за обраду трансакција. Али данас постоје много софистициранији ставови о томе шта а складиште података. У данашњем свету, складиште података умеће се у структуру која се може назвати Фабрика корпоративних информација.

ФАБРИКА КОРПОРАТИВНИХ ИНФОРМАЦИЈА (ЦИФ)

Фабрика корпоративних информација има стандардне архитектонске компоненте: ниво трансформације и интеграције кода који интегрише подаци Док сам подаци крећу се из окружења апликације ка окружењу од складиште података од компаније; а складиште података компаније у којој је подаци детаљни и интегрисани историчари. Тхе складиште података компаније служи као основа на којој се могу градити сви остали делови животне средине складиште података; складиште оперативних података (ОДС). ОДС је хибридна структура која садржи неке аспекте складиште података и други аспекти ОЛТП окружења; база података, где различита одељења могу имати сопствену верзију складиште података; а складиште података истраживања у којој „филозофи“ компаније могу да постављају своје упите 72 сата без штетног утицаја на складиште података; и меморија близу линије, у којој подаци стари и подаци велики детаљи се могу јефтино складиштити.

ГДЕ СЕ КОМБИНУЈЕ ЕРП СА ФАБРИКА КОРПОРАТИВНИХ ИНФОРМАЦИЈА

ЕРП се спаја са Фабриком корпоративних информација на два места. Прво као основна апликација (основна) која обезбеђује и подаци пријаве на складиште података. У овом случају и подаци, генерисани као нуспроизвод процеса трансакције, интегрисани су и учитани у складиште података од компаније. Друга тачка уједињења између ЕРП-а и ЦИФ-а и ОДС-а. У ствари, у многим окружењима ЕРП се користи као класични ОДС.

У случају да се ЕРП користи као основна апликација, исти ЕРП се такође може користити у ЦИФ-у као ОДС. У сваком случају, ако се ЕРП користи у обе улоге, мора постојати јасна разлика између ова два ентитета. Другим речима, када ЕРП игра улогу основне апликације и ОДС-а, два архитектонска ентитета се морају разликовати. Ако једна имплементација ЕРП-а покуша да обавља обе улоге истовремено, неизбежно ће доћи до проблема у дизајну и имплементацији те структуре.

ОДВОЈЕНЕ ОДСКЕ И ОСНОВНЕ ПРИМЕНЕ

Много је разлога који доводе до поделе архитектонских компоненти. Можда је најизразитије питање за раздвајање различитих компоненти архитектуре то што свака компонента архитектуре има свој поглед. Основна апликација служи другачијој сврси од ОДС-а. Покушајте да се преклапате

основни поглед апликације на свет ОДС-а или обрнуто није прави начин рада.

Сходно томе, први проблем ЕРП-а у ЦИФ-у је да провери да ли постоји разлика између основних апликација и ОДС-а.

МОДЕЛИ ПОДАТАКА У КОМПАНИЈИ ФАБРИКА ИНФОРМАЦИЈА

Да би се постигла кохезија између различитих компоненти ЦИФ архитектуре, мора постојати модел подаци. Модели оф подаци они служе као веза између различитих компоненти архитектуре као што су основне апликације и ОДС. Модели оф подаци они постају „интелектуална мапа пута“ да би добили право значење из различитих архитектонских компоненти ЦИФ-а.

Идући руку под руку са овим појмом, идеја је да постоји један велики и јединствени модел подаци. Очигледно да мора постојати модел подаци за сваку од компоненти, а такође мора постојати разуман пут који повезује различите моделе. Свака компонента архитектуре – ОДС, основне апликације, складиште података компаније и тако даље.. – треба свој модел подаци. И зато мора постојати прецизна дефиниција како ови модели подаци међусобно се повезују.

МОВЕ И ДАТА ЕРП-а у подацима ВАРЕХОУСЕ

Ако порекло на подаци је основна апликација и/или ОДС, када ЕРП убацује подаци у складиште података, ово уметање мора да се одвија на најнижем нивоу „грануларности“. Једноставно сумирајте или агрегирајте и подаци пошто они излазе из ЕРП основне апликације или ЕРП ОДС није права ствар. ТХЕ подаци детаљи су потребни у складиште података да чине основу процеса ДСС. Такве подаци биће преобликовано на много начина помоћу продајних места са подацима и истраживања складиште података.

Пресељење оф подаци од основног апликативног окружења ЕРП до складиште података компаније се обавља на разумно опуштен начин. Овај потез се дешава отприлике 24 сата након ажурирања или креирања у ЕРП-у. Чињеница да постоји "лењи" покрет подаци у складиште података компаније дозвољава подаци који долазе из ЕРП-а на „депозит“. Једном сам подаци се чувају у основној апликацији, онда можете безбедно да преместите подаци ЕРП-а у предузећу. Још један циљ достижан захваљујући „лењем“ покрету подаци то је јасна граница између оперативних процеса и ДСС. Са „брзим” покретом подаци линија поделе између ДСС-а и оперативног остаје нејасна.

Ил мовименто деи подаци од ОДС ЕРП до складиште података предузећа се врши периодично, обично недељно или месечно. У овом случају кретање од подаци заснива се на потреби „чишћења” старих подаци историчари. Наравно, ОДС садржи и подаци који су много новији од подаци историчари су пронашли у складиште података.

Пресељење оф подаци у складиште података готово никада се не обавља „на велико“ (на велепродајни начин). Копирајте табелу из ЕРП окружења у складиште података то нема смисла. Много реалнији приступ је померање одабраних јединица подаци. Само подаци који су се променили од последњег ажурирања складиште података они су они које треба преселити у складиште података. Један начин да сазнате које подаци су промењене од последњег ажурирања да се погледају временске ознаке подаци налази у ЕРП окружењу. Дизајнер бира све промене које су се десиле од последњег ажурирања. Други приступ је коришћење техника хватања промена подаци. Овим техникама се анализирају дневници и траке дневника како би се утврдило које подаци мора бити премештен из ЕРП окружења у окружење складиште података. Ове технике су најбоље јер се евиденције и траке дневника могу читати из ЕРП датотека без даљег утицаја на друге ЕРП ресурсе.

ДРУГЕ КОМПЛИКАЦИЈЕ

Један од проблема ЕРП-а у ЦИФ-у је шта се дешава са другим изворима апликација или са њима подаци ОДС којима морају да допринесу складиште података али нису део ЕРП окружења. С обзиром на затворену природу ЕРП-а, посебно САП-а, покушавају да интегришу кључеве из екстерних извора подаци са и подаци који долазе из ЕРП-а приликом померања подаци у складиште података, то је велики изазов. И које су тачно вероватноће да и подаци апликација или ОДС ван ЕРП окружења биће интегрисани у складиште података? Шансе су заправо веома високе.

ФИНД ДАТА ИСТОРИЈСКИ ОД ЕРП

Још један проблем са и подаци ЕРП-а је оно што произилази из потребе да се подаци историчари у оквиру складиште података. Обично тхе складиште података потребе подаци историчари. А ЕРП технологија их обично не чува подаци историјски, бар не до тачке у којој је то неопходно у складиште података. Када је велика количина подаци историја почиње да се сабира у ЕРП окружењу, то окружење треба очистити. На пример, претпоставимо да је а складиште података мора бити оптерећен са пет година од подаци историјски док ЕРП задржава највише шест месеци ових подаци. Све док је компанија задовољна прикупљањем серије подаци историчари како време пролази, онда нема проблема у коришћењу ЕРП-а као извора за складиште података. Али када је складиште података мора да се врати у прошлост и добије богове подаци историје које ЕРП није претходно прикупио и сачувао, онда ЕРП окружење постаје неефикасно.

ЕРП И МЕТАДАТА

Још једно разматрање о ЕРП е складиште података је онај о метаподацима који постоје у ЕРП окружењу. Баш као што метаподаци теку из ЕРП окружења у складиште података, метаподаци се морају премештати на исти начин. Штавише, метаподаци се морају трансформисати у формат и структуру које захтева инфраструктура складиште података. Постоји велика разлика између оперативних метаподатака и ДСС метаподатака. Оперативни метаподаци су првенствено за програмера и

програмер. ДСС метаподаци су првенствено за крајњег корисника. Постојећи метаподаци у ЕРП апликацијама или ОДС-овима треба да се конвертују, а ова конверзија није увек лака и јасна.

ИЗВОРИ ЕРП ПОДАТАКА

Ако се ЕРП користи као добављач за подаци за складиште података мора постојати чврст интерфејс који помера подаци из ЕРП окружења у окружење складиште података. Интерфејс мора:

  • ▪ бити лак за употребу
  • ▪ дозволи приступ подаци ЕРП-а
  • ▪ узети значење подаци који су пред премештањем у складиште података
  • ▪ знати ЕРП ограничења која могу настати приликом приступа подаци ЕРП-а:
  • ▪ референтни интегритет
  • ▪ хијерархијски односи
  • ▪ имплицитне логичке релације
  • ▪ конвенција о примени
  • ▪ све структуре подаци подржан од стране ЕРП-а, и тако даље…
  • ▪ бити ефикасан у приступу подаци, обезбеђујући:
  • ▪ директно кретање подаци
  • ▪ стицање промене подаци
  • ▪ подршка благовременом приступу подаци
  • ▪ разумеју формат подаци, и тако даље… ИНТЕРФЕЈС СА САП-ом Интерфејс може бити два типа, домаћи или комерцијални. Неки од главних трговачких интерфејса укључују:
  • ▪ САС
  • ▪ Примс Солутионс
  • ▪ Д2к, и тако даље… ВИШЕ ЕРП ТЕХНОЛОГИЈА Третирање ЕРП окружења као да је једна технологија је велика грешка. Постоји много ЕРП технологија, од којих свака има своје предности. Најпознатији продавци на тржишту су:
  • ▪ САП
  • ▪ Орацле Финанциалс
  • ▪ ПеоплеСофт
  • ▪ ЈД Едвардс
  • ▪ Баан SAP САП је највећи и најкомплетнији ЕРП софтвер. САП апликације укључују многе врсте апликација у многим областима. САП има репутацију да је:
  • ▪ веома велики
  • ▪ веома тешко и скупо за имплементацију
  • ▪ потребно је много људи и консултаната за имплементацију
  • ▪ захтева специјализоване људе за имплементацију
  • ▪ Потребно је много времена за имплементацију Штавише, САП има репутацију да памти своје подаци веома пажљиво, што отежава приступ некоме изван САП области. САП-ова снага је у томе што је способан да ухвати и ускладишти велику количину подаци. Недавно је САП најавио своју намеру да прошири своје апликације на складиште података. Постоји много предности и недостатака коришћења САП-а као добављача складиште података. Предност је што је САП већ инсталиран и што већина консултаната већ познаје САП.
    Недостаци САП-а као добављача складиште података има их много: САП нема искуства у свету складиште података Ако је САП добављач складиште података, потребно је „вадити“ и подаци од САП до складиште података. Дата САП-ов рекорд затвореног система, мало је вероватно да ће бити лако унети и из САП-а у њега (???). Постоје многа застарела окружења која покрећу САП, као што су ИМС, ВСАМ, АДАБАС, ОРАЦЛЕ, ДБ2 и тако даље. САП инсистира на приступу „који није измишљен овде“. САП не жели да буде партнер са другим добављачима да би користио или креирао складиште података. САП инсистира на томе да сам генерише сав свој софтвер.

Иако је САП велика и моћна компанија, покушава да преправи технологију ЕЛТ, ОЛАП, системску администрацију, па чак и основни код дбмс то је једноставно лудо. Уместо да заузме кооперативни став са добављачима складиште података Дугогодишњи САП следи приступ „они најбоље знају“. Овакав став кочи успех који би САП могао да има у овој области складиште података.
САП-ово одбијање да дозволи екстерним добављачима да брзо и грациозно приступе својим подаци. Сама суштина коришћења а складиште података је лак приступ подаци. Читава историја САП-а заснива се на отежавању приступа подаци.
САП-ов недостатак искуства у раду са великим количинама подаци; у области складиште података постоје томови подаци никада није видео САП и да управља овим великим количинама подаци морате имати одговарајућу технологију. САП очигледно није свестан ове технолошке баријере која постоји да би ушао у област складиште података.
САП-ова корпоративна култура: САП је направио посао добијања подаци из система. Али да бисте то урадили, морате имати другачији менталитет. Традиционално, софтверске компаније које су биле добре у уносу података у окружење нису биле добре у томе да подаци иду другим путем. Ако САП успе да направи ову врсту пребацивања, то ће бити прва компанија која је то учинила.

Укратко, упитно је да ли компанија треба да изабере САП за свог добављача складиште података. С једне стране постоје веома озбиљни ризици, а са друге стране врло мало награда. Али постоји још један разлог који обесхрабрује одабир САП-а као добављача складиште података. Јер свака компанија треба да има исто складиште података од свих осталих компанија? Тхе складиште података то је срце конкурентске предности. Када би свака компанија усвојила исто складиште података било би тешко, мада не и немогуће, постићи конкурентску предност. Чини се да САП мисли да а складиште података може се посматрати као колачић и то је још један знак њиховог менталитета апликација „унети податке“.

Ниједан други ЕРП добављач није тако доминантан као САП. Несумњиво ће бити компанија које ће следити САП-ов пут за свој складиште података али по свој прилици ови складиште података САП ће бити велик, скуп и дуготрајан за креирање.

Ова окружења укључују такве активности као што су обрада банковног благајника, процеси резервација авио-компанија, процеси потраживања од осигурања итд. Што је трансакциони систем био ефикаснији, то је била очигледнија потреба за раздвајањем између оперативног процеса и ДСС-а (система за подршку одлучивању). Међутим, са системима за људске ресурсе и кадрове, никада се не суочавате са великим обимом трансакција. И, наравно, када се особа запосли или напусти компанију, ово је запис о трансакцији. Али у односу на друге системе, системи људских ресурса и кадрови једноставно немају много трансакција. Стога, у системима за људске ресурсе и кадрове није сасвим очигледно да постоји потреба за ДатаВарехоусе-ом. На много начина ови системи представљају амалгамацију ДСС система.

Али постоји још један фактор који се мора узети у обзир ако се бавите складиштима података и ПеоплеСофт-ом. У многим срединама, тј подаци људских и личних ресурса су секундарни у односу на примарну делатност компаније. Већина компанија се бави производњом, продајом, пружањем услуга итд. Људски ресурси и кадровски системи су обично секундарни у односу на (или подржавају) главну линију пословања компаније. Стога је двосмислено и незгодно складиште података одвојено за људске ресурсе и кадровску подршку.

ПеоплеСофт се у том погледу веома разликује од САП-а. Код САП-а је обавезно да постоји а складиште података. Са ПеоплеСофт-ом то није тако јасно. Складиште података је опционо уз ПеоплеСофт.

Најбоља ствар која се може рећи за подаци ПеоплеСофт је то складиште података може се користити за архивирање и подаци који се односе на старе људске и личне ресурсе. Други разлог зашто би компанија желела да користи а складиште података a

штета за ПеоплеСофт окружење је омогућавање приступа и слободан приступ алатима за анализу, да подаци би ПеоплеСофт. Али осим ових разлога, могу постојати случајеви у којима је пожељно да немате складиште података подаци ПеоплеСофт.

Укратко

Постоји много идеја у вези са изградњом а складиште података у оквиру ЕРП софтвера.
Неки од њих су:

  • ▪ Има смисла имати а складиште података то је као било шта друго у индустрији?
  • ▪ Колико је флексибилан ЕРП складиште података софтвер?
  • ▪ ЕРП складиште података софтвер може да обради обим од подаци који се налази у аскладиште података арена"?
  • ▪ Шта је евиденција праћења коју ЕРП продавац ради упркос лаком и јефтином, у смислу времена, подаци? (какви су резултати ЕРП добављача у испоруци јефтиних, на време, лако доступних података?)
  • ▪ Како ЕРП добављач разуме архитектуру ДСС-а и фабрику корпоративних информација?
  • ▪ ЕРП добављачи разумеју како да постигну подаци унутар окружења, али и разумети како их извозити?
  • ▪ Колико је ЕРП продавац отворен за алате за складиштење података?
    Сва ова разматрања морају се узети у обзир при одређивању где да се стави складиште података који ће угостити и подаци ЕРП-а и др подаци. Генерално, осим ако не постоји убедљив разлог да се уради другачије, препоручује се изградња складиште података изван окружења ЕРП добављача. ЦАПИТОЛО 1 Преглед кључних тачака БИ организације:
    Репозиторијуми информација раде обрнуто од архитектуре пословне интелигенције (БИ):
    Корпоративна култура и ИТ могу ограничити успех у изградњи БИ организација.

Технологија више није ограничавајући фактор за БИ организације. Питање за архитекте и планере пројеката није да ли технологија постоји, већ да ли они могу ефикасно да имплементирају доступну технологију.

За многе компаније а складиште података то је мало више од пасивног депозита који дистрибуира подаци корисницима којима је то потребно. ТХЕ подаци они се извлаче из изворних система и насељавају у циљне структуре складиште података. Ја подаци могу се и чистити уз мало среће. Међутим, никаква додатна вредност се не додаје нити прикупља подаци током овог процеса.

У суштини, пасивни Дв, у најбољем случају, обезбеђује само и подаци чиста и оперативна за корисничка удружења. Креирање информација и аналитичко разумевање су у потпуности на корисницима. Процијените да ли је ДВ (Складиште података) је успех субјективан. Ако успех проценимо на основу способности ефикасног прикупљања, интеграције и чишћења подаци корпоративни на предвидљивој основи, онда да, ДВ је успех. С друге стране, ако посматрамо прикупљање, консолидацију и експлоатацију информација од стране организације у целини, онда је ДВ промашај. ДВ пружа малу или никакву информацијску вредност. Као резултат, корисници су приморани да се сналазе, стварајући тако силосе за информације. Ово поглавље представља свеобухватан поглед на резиме БИ (Бусинесс Интеллигенце) архитектуре компаније. Почињемо са описом БИ, а затим прелазимо на дискусије о дизајну и развоју информација, за разлику од једноставног пружања информација. подаци корисницима. Дискусије се затим фокусирају на израчунавање вредности ваших БИ напора. Закључујемо тако што ћемо дефинисати како ИБМ испуњава БИ архитектонске захтеве ваше организације.

Опис архитектуре БИ организација

Моћни информациони системи оријентисани на трансакције су сада уобичајени у сваком великом предузећу, ефективно изједначујући услове за корпорације широм света.

Међутим, да би остала конкурентна, сада су потребни аналитички оријентисани системи који могу да револуционишу способност компаније да поново открије и користи информације које већ поседују. Ови аналитички системи произилазе из разумевања богатства подаци доступан. БИ може побољшати перформансе у целом предузећу. Компаније могу побољшати односе између купаца и добављача, побољшати профитабилност производа и услуга, генерисати нове и боље понуде, контролисати ризик и између многих других добитака драматично смањити трошкове. Са БИ ваша компанија коначно почиње да користи информације о клијентима као конкурентску предност захваљујући апликацијама које имају тржишне циљеве.

Имати праве пословне алате значи имати коначне одговоре на кључна питања као што су:

  • ▪ Који од наших клијенти да ли нас терају да зарађујемо више, или нас терају да губимо новац?
  • ▪ Где живе наши најбољи клијенти у односу на продавница/ складиште које често посећују?
  • ▪ Који од наших производа и услуга се може најефикасније продати и коме?
  • ▪ Који производи се могу најефикасније продати и коме?
  • ▪ Која продајна кампања је најуспешнија и зашто?
  • ▪ Који су канали продаје најефикаснији за које производе?
  • ▪ Како можемо побољшати односе са нашим најбољим људима клијенти? Већина компанија има подаци грубе начине да се одговори на ова питања.
    Оперативни системи генеришу велике количине производа, купаца и подаци тржиште од продајних места, резервација, корисничких услуга и система техничке подршке. Изазов је издвојити и искористити ове информације. Многе компаније профитирају само од малих делова својих подаци за стратешке анализе.
    I подаци преостали, често у комбинацији са и подаци изведен из спољних извора као што су владини извештаји и друге купљене информације, је рудник злата који само чека да буде истражен, и подаци само их треба прецизирати у оквиру информационог контекста ваше организације.

Ово знање се може применити на неколико начина, почев од дизајнирања укупне корпоративне стратегије до личне комуникације са добављачима, преко цалл центара, фактурисања, Интернет и друге тачке. Данашње пословно окружење налаже да ДВ и сродна БИ решења еволуирају даље од вођења традиционалних пословних структура. подаци као што су ја подаци нормализован на атомском нивоу и „фарме звезда/коцка“.

Оно што је потребно да бисмо остали конкурентни је фузија традиционалних и напредних технологија у настојању да се подржи огроман аналитички пејзаж.
Да закључимо, опште окружење мора да унапреди знање компаније у целини, обезбеђујући да акције предузете као резултат спроведених анализа буду корисне како би сви имали користи.

На пример, рецимо да класификујете своје клијенти у категорије високог или ниског ризика.
Ако се ове информације генеришу помоћу алата за издвајање модела или на неки други начин, оне морају да се ставе у ДВ и да буду доступне свима, помоћу било ког алата за приступ, као што су статички извештаји, табеле, табеле или онлајн аналитичка обрада (ОЛАП) .

Међутим, тренутно велики део ове врсте информација остаје у силосима подаци појединаца или одељења која генеришу анализу. Организација, као целина, има мало или нимало видљивости за разумевање. Само мешањем овог типа информационог садржаја у ваш пословни ДВ можете елиминисати силосе информација и унапредити своје ДВ окружење.
Постоје две велике препреке за развој БИ организације.
Прво, имамо проблем саме организације и њене дисциплине.
Иако не можемо помоћи у променама организационих политика, можемо помоћи у разумевању компоненти БИ организације, њене архитектуре и начина на који ИБМ технологија олакшава њен развој.
Друга препрека коју треба превазићи је недостатак интегрисане технологије и знања о методи која се односи на цео БИ простор за разлику од само мале компоненте.

ИБМ се суочава са променама у технологији интеграције. Ваша је одговорност да обезбедите промишљен дизајн. Ова архитектура мора бити развијена помоћу технологије одабране за неограничену интеграцију, или у најмању руку, са технологијом која се придржава отворених стандарда. Штавише, менаџмент ваше компаније мора да обезбеди да се БИ подухват спроводи према плану и да не дозволи развој силоса информација који произилазе из сопствених планова или циљева.
Ово не значи да БИ окружење није осетљиво на реаговање на различите потребе и захтеве различитих корисника; уместо тога, то значи да се имплементација тих индивидуалних потреба и захтева врши у корист целе БИ организације.
Опис архитектуре БИ организације може се наћи на страни 9 на слици 1.1 Архитектура показује богату мешавину технологија и техника.
Са традиционалног погледа, архитектура укључује следеће компоненте складишта

Атомски слој (Атомски слој).

Ово је темељ, срце целог ДВ-а, а самим тим и стратешког извештавања.
I подаци похрањени овде задржаће историјски интегритет, извештаји о подаци и укључују изведене метрике, као и да се чисте, интегришу и чувају коришћењем екстракције модела.
Сва накнадна употреба ових подаци а повезане информације су изведене из ове структуре. Ово је одличан извор за рударство подаци и за извештаје са структурираним СКЛ упитима

Оперативно складиште за подаци или извештај на основу подаци(Складиште оперативних података (ОДС) или извештавање база података.)

Ово је објекат од подаци посебно дизајниран за техничко извештавање.

I подаци ускладиштене и пријављене изнад ових структура могу коначно да се пропагирају у складиште преко сценског простора, где би се могле користити за стратешку сигнализацију.

Стагинг ареа.

Прва станица за већину подаци намењена складишном окружењу је зона организације.
Овде ја подаци су интегрисани, очишћени и трансформисани у подаци профита који ће попунити структуру складишта

Датум мартс.

Овај део архитектуре представља структуру од подаци користи се посебно за ОЛАП. Присуство датамарта, ако и подаци се чувају у преклапајућим звездастим шемама подаци вишедимензионални у релационом окружењу, или у фајловима подаци Поверљиво које користи одређена ОЛАП технологија, као што је ДБ2 ОЛАП сервер, није релевантно.

Једино ограничење је то што архитектура олакшава употребу подаци вишедимензионални.
Архитектура такође укључује критичне Би технологије и технике које се истичу као:

Просторна анализа

Простор је за аналитичара неочекивана информација и кључна је за комплетно решавање. Простор може представљати информације о људима који живе на одређеној локацији, као и информације о томе где је та локација физички у односу на остатак света.

Да бисте извршили ову анализу, морате почети тако што ћете своје информације повезати са координатама географске ширине и дужине. Ово се назива „геокодирање“ и мора бити део процеса издвајања, трансформације и учитавања (ЕТЛ) на атомском нивоу вашег складишта.

Претрага података.

Екстракција од подаци омогућава нашим компанијама да повећају број клијенти, да предвиди трендове продаје и омогући управљање односима са клијенти (ЦРМ), између осталих БИ иницијатива.

Екстракција од подаци стога мора бити интегрисан са структурама подаци Двхоусе-а и подржан од складишних процеса како би се осигурала ефективна и ефикасна употреба релевантне технологије и техника.

Као што је назначено у БИ архитектури, атомски ниво Двхоусе-а, као и датамартс, је одличан извор подаци за екстракцију. Ти исти објекти такође морају бити примаоци резултата екстракције како би се осигурала доступност најширој публици.

Агенти.

Постоје различити „агенти“ за испитивање клијента за сваку тачку, као што су оперативни системи компаније и сами дв. Ови агенти могу бити напредне неуронске мреже обучене да уче о трендовима у свакој тачки, као што су будућа потражња за производима заснована на промоцијама продаје, мотори засновани на правилима да реагују на дато низ околности, или чак једноставни агенти који пријављују изузетке „врхунским руководиоцима“. Ови процеси се углавном дешавају у реалном времену и стога морају бити уско повезани са њиховим кретањем подаци. Све ове структуре подаци, технологије и технике гарантују да нећете провести ноћ стварајући организацију ваше БИ.

Ова активност ће се развијати у постепеним корацима, за мале тачке.
Сваки корак је независан пројектни напор и назива се итерацијом у вашој ДВ или БИ иницијативи. Итерације могу укључивати имплементацију нових технологија, почевши од нових техника, додавањем нових структура подаци , лоадинг и подаци додатно, или са проширењем анализе вашег окружења. Овај параграф је детаљније разматран у поглављу 3.

Поред традиционалних ДВ структура и БИ алата, постоје и друге функције ваше БИ организације за које треба да дизајнирате, као што су:

Додирне тачке купаца (додир купца бодова).

Као и код сваке модерне организације, постоји велики број додирних тачака купаца које указују на то како да имате позитивно искуство за своје клијенти. Постоје традиционални канали као што су продавци, оператери централа, директна пошта, мултимедијално и штампано оглашавање, као и актуелнији канали као што су е-пошта и веб, подаци производи са неком тачком контакта морају бити набављени, транспортовани, очишћени, прерађени и потом попуњени у објектима подаци оф тхе БИ.

Басес оф подаци оперативна и корисничка удружења (Оператионал

базе података и корисничке заједнице).
На крају контактних тачака клијенти налазе се темељи подаци апликација компаније и заједница корисника. ТХЕ подаци постојећи су подаци традиционално које се мора спојити и спојити са подаци које теку од контактних тачака да би задовољиле потребне информације.

Аналитичари. (Аналитичари)

Примарни корисник БИ окружења је аналитичар. Он је тај који има користи од тренутног вађења подаци оперативни, интегрисан са различитим изворима подаци , допуњен функцијама као што су географска анализа (геокодирање) и представљен у БИ технологијама које омогућавају екстракцију, ОЛАП, напредно СКЛ извештавање и географску анализу. Примарни интерфејс аналитичара за окружење за извештавање је БИ портал.

Међутим, аналитичар није једини који има користи од БИ архитектуре.
Руководиоци, велика удружења корисника, па чак и чланови, добављачи и и клијенти требало би да пронађу предности у пословној пословној делатности.

Повратна петља за напајање.

БИ архитектура је окружење за учење. Карактеристичан принцип развоја је омогућавање постојаних структура подаци да се ажурира БИ технологијом која се користи и радњама које предузима корисник. Пример је бодовање купаца.

Ако одељење продаје моделира резултате купаца за коришћење нове услуге, онда одељење продаје не би требало да буде једина група која има користи од услуге.

Уместо тога, издвајање модела треба да се изводи као природни део тока података унутар предузећа, а резултати купаца треба да постану интегрисани део контекста информација о складишту, видљив свим корисницима. Би-бИ-центриц ИБМ Суите укључујући ДБ2 УДБ, ДБ2 ОЛАП сервер укључује већину главних технолошких компоненти, дефинисаних на слици 1.1.

Користимо архитектуру каква је приказана на овој илустрацији из књиге да би нам дали ниво континуитета и показали како се сваки ИБМ производ уклапа у укупну БИ шему.

Пружање информативног садржаја (Пружање информативни садржај)

Дизајнирање, развој и имплементација вашег БИ окружења је застрашујући задатак. Дизајн мора да обухвати и тренутне и будуће пословне захтеве. Архитектонски цртеж мора бити комплетан како би укључио све закључке који се налазе у фази пројектовања. Извршење мора остати посвећено једној сврси: развоју БИ архитектуре како је формално представљена у дизајну и заснована на пословним захтевима.

Посебно је тешко тврдити да ће дисциплина осигурати релативан успех.
Ово је једноставно јер не развијате БИ окружење одједном, већ то радите у малим корацима током времена.

Међутим, идентификовање БИ компоненти ваше архитектуре је важно из два разлога: Ви ћете водити све наредне одлуке техничке архитектуре.
Бићете у могућности да свесно планирате одређену употребу технологије иако вам технологија можда неће бити потребна неколико месеци.

Разумевање ваших пословних захтева у довољној мери ће утицати на врсту производа које ћете набавити за своју архитектуру.
Дизајнирање и развој ваше архитектуре осигурава да ваше складиште јесте

није случајан догађај, већ пре пажљиво конструисан „добро осмишљен”. opera уметности као мозаика мешовите технологије.

Дизајнирајте информациони садржај

Сав почетни дизајн мора да се фокусира и идентификује кључне БИ компоненте које ће бити потребне целокупном окружењу сада и у будућности.
Познавање пословних захтева је важно.

Чак и пре него што започне било какав формални дизајн, планер пројекта често може да идентификује једну или две компоненте одмах.
Међутим, не може се лако пронаћи баланс компоненти које могу бити потребне за вашу архитектуру. Током фазе пројектовања, главни део архитектуре повезује сесију развоја апликације (ЈАД) у потрази за идентификацијом пословних захтева.

Понекад се ови захтеви могу поверити алатима за упите и извештавање.
На пример, корисници наводе да ако желе да аутоматизују тренутни извештај, морају га ручно генерисати интеграцијом два актуелна извештаја и додавањем прорачуна изведених из комбинације подаци.
Иако је овај захтев једноставан, он дефинише одређену функционалност функције коју морате да укључите када купујете алате за извештавање за своју организацију.

Дизајнер такође мора следити додатне захтеве да би добио потпуну слику. Да ли корисници желе да се претплате на овај извештај?
Да ли се подскупови извештаја генеришу и шаљу е-поштом разним корисницима? Да ли желе да виде овај извештај на порталу компаније? Сви ови захтеви су део једноставне потребе да се замени ручни извештај на захтев корисника. Предност ових врста захтева је да сви, корисници и дизајнери, разумеју концепт извештаја.

Међутим, постоје и друге врсте послова које треба да планирамо. Када се пословни захтеви изнесу у облику стратешких пословних питања, стручном дизајнеру је лако да уочи мере/чињенице и захтеве димензија.

Ако корисници ЈАД-а не знају како да изнесу своје захтеве у облику пословног проблема, дизајнер ће често пружити примере за брз почетак сесије прикупљања захтева.
Стручни дизајнер може помоћи корисницима да разумеју не само стратешко трговање, већ и како да га формирају.
Приступ прикупљања захтева је разматран у поглављу 3; за сада желимо само да укажемо на потребу дизајна за све врсте БИ захтева.

Стратешки пословни проблем није само пословни захтев, већ и траг дизајна. Ако морате да одговорите на вишедимензионално питање, онда морате да запамтите, представите и подаци димензионални, и ако треба да запамтите подаци мултидимензионално, морате одлучити коју врсту технологије или технике ћете користити.

Да ли имплементирате резервисану шему коцкасте звезде или обоје? Као што видите, чак и једноставан пословни проблем може значајно утицати на дизајн. Али ове врсте пословних захтева су уобичајене и разумљиве, барем од стране дизајнера и планера са пројектним искуством.

Било је довољно дискусија о ОЛАП технологијама и подршци, а доступан је и широк спектар решења. До сада смо споменули потребу да се једноставно извештавање споји са захтевима пословне димензије и како ови захтеви утичу на техничке архитектонске одлуке.

Али који су захтеви које корисници или Дв тим не разумеју лако? Да ли ће вам икада требати просторна анализа?
Рударски модели подаци да ли ће они бити неопходан део ваше будућности? Ко зна?

Важно је напоменути да ове врсте технологија нису добро познате заједници корисника и члановима Дв тима, делимично, то може бити зато што њима обично рукују неки интерни или технички стручњаци треће стране. То је екстремни случај проблема које стварају ове врсте технологија. Ако корисници не могу да опишу пословне захтеве или их уоквире на начин који дају смернице дизајнерима, могу остати непримећени или, још горе, једноставно игнорисани.

Проблем постаје када дизајнер и програмер не могу препознати примену једне од ових напредних, али критичних технологија.
Као што смо често чули да дизајнери кажу, „па, зашто то не оставимо по страни док не добијемо ову другу ствар? „Да ли их заиста занимају приоритети или једноставно избегавају захтеве које не разумеју? Највероватније је то последња хипотеза. Рецимо да је ваш продајни тим саопштио пословни захтев, као што је наведено на слици 1.3, као што видите, захтев је уоквирен у облику пословног проблема. Разлика између овог проблема и типичног димензионалног проблема је удаљеност. У овом случају, продајни тим жели да зна, на месечном нивоу, укупну продају производа, складишта и клијенти који живе у кругу од 5 миља од складишта у којем купују.

Нажалост, дизајнери или архитекте могу једноставно занемарити просторну компоненту говорећи: „ми имамо купца, производ и подаци депозита. Хајде да задржимо дистанцу до друге итерације.

"Погрешан одговор. Ова врста пословног проблема се односи на БИ. Представља дубље разумевање нашег пословања и снажан аналитички простор за наше аналитичаре. БИ је изван једноставног упита или стандардног извештавања, па чак и ОЛАП-а. Ово не значи да ове технологије нису важне за вашу БИ, али оне саме не представљају БИ окружење.

Дизајн за информациони контекст (Дизајн информативног садржаја)

Сада када смо идентификовали пословне захтеве који разликују различите основне компоненте, они морају бити укључени у целокупни архитектонски дизајн. Неке од БИ компоненти су део наших почетних напора, док неке неће бити имплементиране неколико месеци.

Међутим, сви познати захтеви се одражавају у дизајну, тако да када треба да имплементирамо одређену технологију, ми смо спремни да то урадимо. Нешто о пројекту ће одражавати традиционално размишљање.

Овај сет од подаци се користи за подршку каснијој употреби подаци димензионално вођени пословним проблемима које смо идентификовали. Како се генеришу додатни документи, као што је развој дизајна подаци, почећемо да формализујемо како и подаци шире се у околини. Утврдили смо потребу да заступамо и подаци на димензионални начин, деле их (према специфичним специфичним потребама) у продајне продајне просторе.

Следеће питање на које треба одговорити је: како ће се изградити ови маркети података?
Да ли правите звезде да подрже коцке, или само коцке, или само звезде? (или праве коцке, или праве звезде). Генеришите архитектуру за зависне продавнице података којима је потребан атомски слој за све подаци да ли стекнете? Дозволите независним продавницама података да прибаве и подаци директно из оперативних система?

Коју Цубе технологију ћете покушати да стандардизујете?

Имате огромне количине богова подаци потребно за димензиону анализу или су вам потребне коцке од вашег националног продајног особља на недељној бази или обоје? Да ли правите нешто тако моћно као ДБ2 ОЛАП сервер за финансије или Цогнос ПоверПлаи коцке за вашу продајну организацију или обоје? Ово су велике одлуке о архитектонском дизајну које ће од сада надаље утицати на ваше БИ окружење. Да, установили сте потребу за ОЛАП-ом. Како ћете сада применити ту врсту технике и технологије?

Како неке од најнапреднијих технологија утичу на ваше дизајне? Претпоставимо да сте идентификовали потребу за простором у вашој организацији. Сада морате да се сетите издања архитектонских цртежа чак и ако не планирате да правите просторне компоненте неколико месеци. Архитекта мора дизајнирати данас на основу онога што је потребно. Предвидите потребу за просторном аналитиком која генерише, складишти, изводи и обезбеђује приступ подаци просторне. Ово би заузврат требало да служи као ограничење у погледу врсте софтверске технологије и спецификација платформе које тренутно можете размотрити. На пример, систем администрације база података релациони слој (РДБМС) који изводите за свој атомски слој мора имати доступан робустан просторни опсег. Ово би обезбедило максималне перформансе када користите геометрију и просторне објекте у вашим аналитичким апликацијама. Ако ваш РДБМС не може да обради подаци (просторно-центрично) интерно, тако да ћете морати да успоставите а база података (просторно-центрични) спољашњи. Ово компликује управљање проблемима и компромитује ваш укупни учинак, а да не спомињемо додатне проблеме створене за ваше ДБА, пошто они вероватно имају минимално разумевање основа подаци просторне такође. С друге стране, ако ваш РДМБС механизам рукује свим просторним компонентама и његов оптимизатор је свестан посебних потреба (на пример, индексирање) просторних објеката, онда ваши ДБА могу лако да се изборе са управљањем проблемима и можете максимизирати перформансе.

Поред тога, потребно је да прилагодите област за постављање и слој атомског окружења да бисте укључили чишћење адресе (а

кључни елемент за просторну анализу), као и накнадну уштеду свемирских објеката. Низ издања цртежа наставља се сада када смо увели појам јасног правца. Као прво, ова апликација ће диктирати врсту софтвера потребног за ваш ЕТЛ напор.

Да ли су вам потребни производи као што је Триллиум да бисте му пружили чисту адресу или добављач ЕТЛ-а по вашем избору који ће обезбедити ту функционалност?
За сада је важно да цените ниво дизајна који мора бити завршен пре него што почнете да имплементирате своје складиште. Горе наведени примери треба да покажу мноштво дизајнерских одлука које морају да прате идентификацију било ког посебног пословног захтева. Ако се донесу исправно, ове дизајнерске одлуке промовишу међузависност између физичких структура вашег окружења, избора коришћене технологије и тока ширења садржаја информација. Без ове конвенционалне БИ архитектуре, ваша организација ће бити подложна хаотичној мешавини постојећих технологија, у најбољем случају лабаво спојених да би се обезбедила привидна стабилност.

Одржавајте информативни садржај

Доношење вредности информација вашој организацији је веома тежак задатак. Без довољно разумевања и искуства, или правилног планирања и дизајна, чак и најбољи тимови ће пропасти. С друге стране, ако имате одличну интуицију и детаљно планирање, али немате дисциплину за извршење, само сте узалуд потрошили новац и време јер је ваш труд осуђен на пропаст. Порука треба да буде јасна: Ако вам недостаје једна или више ових вештина, разумевања/искуства или дисциплине планирања/дизајна или имплементације, то ће осакатити или уништити зграду БИ организације.

Да ли је ваш тим довољно припремљен? Да ли у вашем БИ тиму постоји неко ко разуме огроман аналитички пејзаж доступан у БИ окружењима, као и технике и технологије потребне за одржавање тог пејзажа? Постоји ли неко у вашем тиму ко може препознати разлику између напредних апликација

статичко извештавање и ОЛАП, или разлике између РОЛАП-а и ОЛАП-а? Да ли неко од чланова вашег тима јасно препознаје како екстраховати и како би то могло да утиче на складиште или како складиште може да подржи перформансе екстракције? Члан тима разуме вредност подаци свемирска или технологија заснована на агентима? Да ли имате некога ко цени јединствену примену ЕТЛ алата у односу на технологију брокера порука? Ако га немате, набавите га. БИ је много већи од нормализованог атомског слоја, ОЛАП-а, звездастих шема и ОДС-а.

Поседовање разумевања и искуства за препознавање БИ захтева и њихових решења је од суштинског значаја за вашу способност да правилно формализујете потребе корисника и дизајнирате и имплементирате њихова решења. Ако ваша корисничка заједница има потешкоћа да опише захтеве, посао складишног тима је да обезбеди то разумевање. Али ако складишни тим

не препознаје специфичну примену БИ – на пример, рударење података – онда није најбоља ствар што су БИ окружења често ограничена на пасивна спремишта. Међутим, игнорисање ових технологија не умањује њихов значај и ефекат који имају на појаву способности пословне интелигенције ваше организације, као и на информациони пејзаж који планирате да негујете.

Планирање мора укључивати појам цртежа, а оба захтевају компетентну особу. Поред тога, пројектовање захтева филозофију тимског складишта и поштовање стандарда. На пример, ако је ваша компанија успоставила стандардну платформу или је идентификовала одређени РДБМС који желите да стандардизујете широм платформе, одговорност је на свима у тиму да се придржавају тих стандарда. Генерално, тим излаже потребу за стандардизацијом (корисничким заједницама), али сам тим није вољан да се придржава стандарда такође успостављених у другим областима у компанији или можда чак иу сличним компанијама. Не само да је ово лицемерно, већ потврђује да компанија није у стању да експлоатише постојеће ресурсе и инвестиције. То не значи да не постоје ситуације које гарантују нестандардизовану платформу или технологију; међутим, складиштење напора

требало би да љубоморно чувају стандарде предузећа све док пословни захтеви не налажу другачије.

Трећа кључна компонента потребна за изградњу БИ организације је дисциплина.
Зависи свеукупно, подједнако од појединаца и околине. Планери пројеката, спонзори, архитекте и корисници морају да цене дисциплину неопходну за изградњу информационог пејзажа компаније. Дизајнери морају да усмере своје дизајнерске напоре на такав начин да допуњују друге неопходне напоре у друштву.

На пример, рецимо да ваша компанија прави ЕРП апликацију која има компоненту складишта.
Стога је одговорност ЕРП дизајнера да сарађују са тимом за окружење складишта како се не би такмичили или дуплирали већ започети посао.

Дисциплина је такође тема којом се мора бавити цела организација и обично се успоставља и поверава извршном нивоу.
Да ли су менаџери спремни да се придржавају осмишљеног приступа? Приступ који обећава стварање информативног садржаја који ће на крају донети вредност свим областима предузећа, али можда компромитује појединачне или одељенске агенде? Сетите се изреке „Важније је размишљати о свему него само о једној ствари“. Ова изрека важи за БИ организације.

Нажалост, многа складишта фокусирају своје напоре на покушаје да циљају и донесу вредност одређеном одељењу или одређеним корисницима, без обзира на организацију у целини. Претпоставимо да извршна власт тражи помоћ од тима за буку. Тим одговара 90-дневним напором који укључује не само испоруку захтева за обавештења које дефинише менаџер, већ и осигуравање да сви подаци базе се мешају на атомском нивоу пре него што се уведу у предложену технологију коцке.
Овај инжењерски додатак осигурава да ће предузеће за буку имати користи подаци неопходно за управника.
Међутим, извршни директор је разговарао са спољним консултантским фирмама које су предложиле сличну апликацију са испоруком за мање од 4 недеље.

Под претпоставком да је тим интерног складишта компетентан, извршни директор има избор. Ко може да подржи додатну инжењерску дисциплину потребну за неговање предузећа са информационим ресурсима или може изабрати да брзо изгради сопствено решење. Чини се да се ова последња пречесто бира и служи само за стварање контејнера информација од којих користи само неколицина или појединац.

Краткорочни и дугорочни циљеви

Архитекте и пројектанти морају формализовати дугорочну визију укупне архитектуре и планова за раст у БИ организацији. Ова комбинација краткорочне добити и дугорочног планирања представља две стране БИ напора. Краткорочни добитак је аспект БИ који је повезан са итерацијама вашег складишта.

Овде се планери, архитекте и спонзори фокусирају на испуњавање специфичних комерцијалних захтева. На овом нивоу се граде физичке структуре, купује технологија и примењују технике. Они ни у ком случају нису направљени да одговоре на специфичне захтеве како их дефинишу одређене корисничке заједнице. Све се ради у циљу испуњавања специфичних захтева које дефинише одређена заједница.
Дугорочно планирање је, међутим, други аспект БИ. Овде су планови и дизајни обезбедили да се изгради било која физичка структура, одабране технологије и примењене технике направљене са погледом на предузеће. Дугорочно планирање је оно које обезбеђује кохезију потребну да би се обезбедило да пословне користи произилазе из било које пронађене краткорочне добити.

Оправдајте свој БИ напор

Un складиште података сама по себи нема инхерентну вредност. Другим речима, не постоји инхерентна вредност између технологије складиштења и техника имплементације.

Вредност сваког складишног напора се налази у радњама које се изводе као резултат складишног окружења и информационог садржаја који се култивише током времена. Ово је критична тачка коју треба разумети пре него што покушате да процените вредност било које иницијативе вхерехоусе.

Пречесто, архитекте и дизајнери покушавају да примене вредност на физичке и техничке компоненте складишта када се заправо вредност заснива на пословним процесима на које складиште и добро стечене информације позитивно утичу.

Овде лежи изазов успостављања БИ: Како оправдавате инвестицију? Ако сама зграда нема суштинску вредност, дизајнери пројекта морају да истраже, дефинишу и формализују користи које постижу они појединци који ће користити складиште за побољшање специфичних пословних процеса или вредности заштићених информација, или обоје.

Да ствари буду компликоване, сваки пословни процес на који утичу напори на складиштењу могао би да пружи „значајне“ или „мале“ користи. Значајне предности обезбеђују опипљиву метрику за мерење повраћаја улагања (РОИ) – на пример, окретање инвентара додатно време током одређеног периода или за ниже трошкове транспорта по пошиљци. Теже је дефинисати суптилне предности, као што је бољи приступ информацијама, у смислу опипљиве вредности.

Повежите свој пројекат да бисте сазнали више о Пословни захтеви

Пречесто, планери пројекта покушавају да повежу вредност складишта са аморфним циљевима предузећа. Изјавом да је „вредност складишта заснована на нашој способности да задовољимо стратешке захтеве“ отварамо дискусију на пријатан начин. Али само то није довољно да се утврди да ли улагање у залихе има смисла. Најбоље је повезати итерације складишта са специфичним, познатим пословним захтевима.

Меасуринг РОИ

Израчунавање РОИ у складишту може бити посебно тешко. Посебно је тешко ако предност

принцип одређеног понављања је нешто што није опипљиво или лако измерити. Једно истраживање је показало да корисници виде две главне предности БИ иницијатива:

  • ▪ Створите способност доношења одлука
  • ▪ Креирајте приступ информацијама
    Ове бенефиције су меке (или благе) користи. Лако је видети како можемо да израчунамо повраћај улагања на основу тешке (или велике) користи као што су смањени трошкови транспорта, али како да меримо способност доношења бољих одлука?
    Ово је дефинитивно изазов за планере пројеката када покушавају да убеде компанију да инвестира у одређени напор у складишту. Повећање продаје или смањење трошкова више нису централне теме које покрећу БИ окружење.
    Уместо тога, гледате на пословне захтеве за бољи приступ информацијама како би одређено одељење могло брже да доноси одлуке. Ово су стратешки покретачи који су подједнако важни за предузеће, али су двосмисленији и теже их је окарактерисати у опипљивој метрици. У овом случају, израчунавање РОИ може бити погрешно, ако не и ирелевантно.
    Планери пројекта морају бити у стању да покажу опипљиву вредност за руководиоце да одлуче да ли се инвестиција у одређену итерацију исплати. Међутим, нећемо предлагати нову методу за израчунавање РОИ, нити ћемо износити било какве аргументе за или против.
    Доступни су многи чланци и књиге који говоре о основама израчунавања РОИ. Постоје посебни предлози вредности као што је вредност улагања (ВОИ), које нуде групе попут Гартнера, које можете истражити. Уместо тога, фокусираћемо се на кључне аспекте било којег РОИ или других вредносних предлога које треба да узмете у обзир. Примена РОИ Осим аргумента о „тврдим“ предностима у односу на „меке“ користи повезане са БИ напорима, постоје и друга питања која треба размотрити приликом примене РОИ. На пример:

Припишите превише уштеде напорима ДВ-а који би ионако дошли
Рецимо да је ваша компанија прешла са архитектуре главног рачунала на дистрибуирано УНИКС окружење. Дакле, све уштеде које се могу (или не морају) остварити из тог напора не треба приписивати искључиво складишту, ако уопште (?).

Не рачунати све је скупо. И има много ствари које треба узети у обзир. Размотрите следећу листу:

  • ▪ Почетни трошкови, укључујући изводљивост.
  • ▪ Трошкови наменског хардвера са повезаним складиштењем и комуникацијама
  • ▪ Трошкови софтвера, укључујући управљање подаци и екстензије клијент/сервер, ЕТЛ софтвер, ДСС технологије, алати за визуелизацију, апликације за планирање и ток посла и софтвер за праћење, .
  • ▪ Трошкови пројектовања структуре подаци, са креирањем и оптимизацијом
  • ▪ Трошкови развоја софтвера директно повезани са БИ напорима
  • ▪ Трошкови подршке на лицу места, укључујући оптимизацију перформанси, укључујући контролу верзије софтвера и операције помоћи Примените РОИ „Биг-Банг“. Изградња складишта као јединственог, огромног напора осуђена је на неуспех, па чак и израчунајте РОИ за иницијативу великог предузећа. Понуда је изненађујућа, а планери и даље слабе покушавају да процене вредност целокупног труда. Зашто планери покушавају да дају новчану вредност пословној иницијативи ако је опште познато и прихваћено да је процена конкретних понављања тешка? Како је могуће? Није могуће са неколико изузетака. Не ради то. Сада када смо утврдили шта не треба да радимо приликом израчунавања повраћаја улагања, ево неколико тачака које ће нам помоћи да успоставимо поуздан процес за процену вредности ваших БИ напора.

Добијање консензуса о РОИ. Без обзира на ваш избор технике за процену вредности ваших БИ напора, са њом морају да се сложе све стране, укључујући дизајнере пројекта, спонзоре и пословне руководиоце.

Смањите РОИ на делове који се могу идентификовати. Неопходан корак ка разумном израчунавању РОИ је фокусирање тог прорачуна на одређени пројекат. Ово вам онда омогућава да процените вредност на основу специфичних пословних захтева који су испуњени

Дефинишите трошкове. Као што је поменуто, морају се узети у обзир бројни трошкови. Штавише, трошкови морају укључивати не само оне који су повезани са једном итерацијом, већ и трошкове повезане са обезбеђивањем усклађености са стандардима предузећа.

Дефинишите бенефиције. Јасним повезивањем РОИ са специфичним пословним захтевима, требало би да будемо у могућности да идентификујемо предности које ће довести до испуњавања захтева.

Смањите трошкове и користи у непосредној добити. То је најбољи начин да своје процене заснивате на нето садашњој вредности (НПВ) за разлику од покушаја да се предвиди будућа вредност у будућим зарадама.

Смањите време поделе РОИ на минимум. Добро је документован током дугог временског периода који је коришћен у вашем РОИ.

Користите више од једне формуле за повраћај улагања. Постоје бројне методе за предвиђање РОИ и требало би да планирате да ли ћете користити једну или више њих, укључујући нето садашњу вредност, интерну стопу приноса (ИРР) и отплату.

Дефинишите поновљив процес. Ово је кључно за израчунавање било које дугорочне вредности. Један процес који се може поновити треба да буде документован за све подсеквенце пројекта које следе.

Наведени проблеми су најчешћи проблеми које су дефинисали стручњаци за окружење бунара. Инсистирање менаџмента на остваривању поврата улагања „Биг-Банга“ је веома дезоријентисано. Ако све своје прорачуне повраћаја улагања започнете тако што ћете их разложити на препознатљиве, опипљиве делове, имате добре шансе да процените тачну оцену повраћаја улагања.

Питања у вези са повраћајем улагања

Какве год да су ваше предности, меке или тврде, можете користити нека основна питања да бисте утврдили њихову вредност. На пример, користећи једноставан систем скалирања, од 1 до 10, можете измерити утицај било ког напора користећи следећа питања:

  • Како бисте оценили разумевање подаци пратећи овај пројекат ваше компаније?
  • Како бисте проценили побољшања процеса као резултат овог пројекта?
  • Како бисте измерили утицај нових увида и закључака који су сада доступни овом итерацијом
  • Какав је био утицај нових и ефикасних рачунарских окружења као резултат наученог? Ако је одговора на ова питања мало, могуће је да компанија није вредна улагања. Питања са високим резултатом указују на значајне добитке у вредности и требало би да служе као водич за даљу истрагу. На пример, висок резултат за побољшања процеса би требало да наведе дизајнере да испитају како су процеси побољшани. Можда ћете открити да су неки или сви остварени добици опипљиви и да се стога може лако применити новчана вредност. Извлачење максимума из прве итерације складиште Највећи резултат напора вашег предузећа често је у првих неколико итерација. Ови рани напори традиционално успостављају најкориснији информациони садржај за јавност и помажу у успостављању технолошке основе за следеће БИ апликације. Обично сваки следећи низ подаци магацинских пројеката доносе све мању додатну вредност предузећу у целини. Ово је посебно тачно ако итерација не додаје нове теме или задовољава потребе нове корисничке заједнице.

Ова функција складиштења се такође односи на растуће хрпе подаци историчари. Како накнадни напори захтевају више подаци и како више подаци се временом уливају у магацин, највећи део подаци постаје мање релевантан за коришћену анализу. Ове подаци често се називају подаци неактивни и увек их је скупо чувати јер се скоро никада не користе.

Шта ово значи за спонзоре пројекта? У суштини, рани спонзори деле више од онога што кошта инвестиција. Ово је примарно јер су они подстицај за успостављање широког слоја технологије и ресурсног окружења у складишту, укључујући органски.

Али ови први кораци доносе највећу вредност и стога пројектанти често морају да оправдају инвестицију.
Пројекти урађени након ваше БИ иницијативе могу имати ниже (у поређењу са првим) и директне трошкове, али донети мању вредност компанији.

И власници организација треба да почну да размишљају о бацању акумулације подаци и мање релевантне технологије.

Дата Мининг: Екстракција Дати

Бројне архитектонске компоненте захтевају варијације у технологијама и техникама рударења података—
на пример, различити „агенти“ за испитивање тачака интересовања клијенти, оперативним системима компаније и за сам дв. Ови агенти могу бити напредне неуронске мреже обучене за ПОТ трендове, као што је будућа потражња за производима на основу промоције продаје; мотори засновани на правилима да реагују на скуп дато околности, на пример, медицинска дијагноза и препоруке за лечење; или чак једноставни агенти са улогом да пријаве изузетке највишим руководиоцима. Генерално, ови процеси екстракције подаци si

верификовати у реалном времену; стога морају бити потпуно уједињени са покретом од подаци стесси.

Онлине аналитичка обрада

Онлине Аналитицс

Способност сечења, коцкица, котрљања, извртања и вршења анализе
шта ако, је у оквиру опсега, фокус ИБМ-овог технолошког пакета. На пример, функције аналитичке обраде на мрежи (ОЛАП) постоје за ДБ2 које уносе димензионалну анализу у софтверски механизам. база података исти .

Функције додају димензионалну корисност СКЛ-у док користе све предности природног дела ДБ2. Други пример ОЛАП интеграције је алат за екстракцију, ДБ2 ОЛАП Сервер Анализер. Ова технологија омогућава да се коцке ДБ2 ОЛАП сервера брзо и аутоматски анализирају ради лоцирања и извештавања о вредностима вредности подаци необично или неочекивано у целој коцки пословном аналитичару. И на крају, карактеристике ДВ центра обезбеђују средство за архитекте да контролишу, између осталог, профил коцке ДБ2 ОЛАП сервера као природног дела ЕТЛ процеса.

Просторна анализа Просторна анализа

Простор представља половину аналитичких сидара (водова) потребних за панораму
аналитички широк (време представља другу половину). Атомски ниво складишта, приказан на слици 1.1, укључује и временске и просторне основе. Временске ознаке анкерирају анализе по времену и адресне информације сидреју анализе по простору. Временске ознаке врше анализу по времену, а информације о адреси спроводе анализу по простору. Дијаграм приказује геокодирање – процес претварања адреса у тачке на мапи или тачке у простору тако да се концепти као што су растојање и изнутра/споља могу користити у анализи – спроведеној на атомском нивоу и просторној анализи која је доступна аналитичар. ИБМ обезбеђује просторна проширења, развијена са Институтом за истраживање система животне средине (ЕСРИ), за база података ДБ2 тако да се просторни објекти могу чувати као нормални део база података релациони. ДБ2

Спатиал Ектендери такође обезбеђују све СКЛ екстензије да бисте искористили предности просторне анализе. На пример, СКЛ екстензије за испитивање
растојање између адреса или да ли је тачка унутар или изван дефинисане полигоналне области, аналитички су стандард са Спатиал Ектендер-ом. Погледајте поглавље 16 за више информација.

База података-Резидент Тоолс Тоолс База података-Становник

ДБ2 има много БИ резидентних СКЛ карактеристика које помажу у акцији анализе. Ови укључују:

  • Функције рекурзије за обављање анализе, као што је „проналажење свих могућих путања лета од Сан Франциско a ЦА".
  • Аналитичке функције за рангирање, кумулативне функције, коцке и збирне функције за олакшавање задатака који се обично јављају само са ОЛАП технологијом, сада су природни део машине база података
  • Могућност креирања табела које садрже резултате
    Продавци од база података лидери мешају више БИ способности у база података стессо.
    Главни добављачи база података они мешају више БИ могућности у база података стессо.
    Ово обезбеђује боље перформансе и више опција за извршење за БИ решења.
    Карактеристике и функције ДБ2 В8 су детаљно размотрене у следећим поглављима:
    Основе техничке архитектуре и управљања подацима (поглавље 5)
  • ДБ2 БИ основе (поглавље 6)
  • ДБ2 материјализоване табеле упита (поглавље 7)
  • ДБ2 ОЛАП функције (поглавље 13)
  • ДБ2 побољшане БИ карактеристике и функције (поглавље 15) Поједностављени систем испоруке података Систем испоруке од подаци упрошћено

Архитектура приказана на слици 1.1 укључује бројне структуре подаци физички. Једно је складиште подаци оперативни. Генерално, ОДС је субјектно оријентисан, интегрисан и актуелни објекат. Направили бисте ОДС за подршку, на пример, продајне канцеларије. Продаја ОДС би допунила подаци из бројних различитих система, али би задржао само, на пример, данашње трансакције. ОДС се такође може ажурирати много пута дневно. Истовремено, процеси потискују подаци интегрисан у друге апликације. Ова структура је посебно дизајнирана за интеграцију подаци актуелна и динамична и вероватно би била кандидат за подршку аналитици у реалном времену, као што је пружање услуга агентима клијенти тренутне информације о продаји купца издвајањем информација о тренду продаје из самог складишта. Друга структура приказана на слици 1.1 је формално стање за дв. Не само да је ово место за извршење неопходне интеграције, квалитет подаци, и трансформације подаци улазног магацина, али је и поуздан и привремени складишни простор за подаци реплика које би се могле користити у анализама у реалном времену. Ако одлучите да користите ОДС или сценску област, један од најбољих алата за насељавање ових структура подаци коришћење различитих оперативних извора је хетерогени дистрибуирани упит ДБ2. Ову могућност испоручује опциона ДБ2 функција која се зове ДБ2 Релатионал Цоннецт (само упит) и кроз ДБ2 ДатаЈоинер (засебан производ који испоручује могућност упита, уметања, ажурирања и брисања хетерогеним дистрибуираним РДБМС-овима).

Ова технологија омогућава архитектима да подаци везати подаци производња са аналитичким процесима. Не само да се технологија може прилагодити практично било ком од захтева за репликацијом који се могу појавити са аналитиком у реалном времену, већ се такође може повезати са широким спектром база података подаци најпопуларнији, укључујући ДБ2, Орацле, Сибасе, СКЛ Сервер, Информик и друге. ДБ2 ДатаЈоинер се може користити за попуњавање структуре подаци формално као ОДС или чак трајна табела представљена у складишту дизајнирана за брзи опоравак тренутних ажурирања или за продају. Наравно, ове исте структуре подаци може се попунити помоћу

још једна важна технологија дизајнирана за репликацију подаци, ИБМ ДатаПропагатор Релатионал. (ДатаПропагатор је посебан производ за централне системе. ДБ2 УНИКС, Линук, Виндовс и ОС/2 укључују услуге репликације података подаци као стандардна карактеристика).
Друга метода за кретање подаци који послује око предузећа је интегратор апликација за предузећа који се иначе назива брокер порука. Ова јединствена технологија омогућава ненадмашну контролу за циљање и кретање подаци око предузећа. ИБМ има најчешће коришћеног брокера порука, МКСериес, или варијацију производа која укључује захтеве е-цоммерце, ИБМ ВебСпхере МК.
За више дискусије о томе како искористити МК да подржи складиште и БИ окружење, посетите веб страница књиге. За сада је довољно рећи да је ова технологија одлично средство за снимање и трансформацију (помоћу МКСериес Интегратора) подаци центрирани (циљани) оператери ангажовани за БИ решења. МК технологија је интегрисана и упакована у УДБ В8, што значи да се редовима порука сада може управљати као да су ДБ2 табеле. Концепт заваривања порука у реду чекања и универзума база података релационе главе ка моћном окружењу испоруке од подаци.

Зеро-Латенци Нулто кашњење

Крајњи стратешки циљ за ИБМ је анализа нулте латенције. Како је дефинисано од
Гартнер, БИ систем мора бити у стању да закључи, асимилира и пружи информације аналитичарима на захтев. Изазов је, наравно, како се мешати подаци актуелно и у реалном времену са неопходним историјским информацијама, као што су и подаци повезани образац/тренд, или издвојено разумевање, као што је профилисање купаца.

Такве информације укључују, на пример, идентификацију клијенти висок или низак ризик или који производи и клијенти они ће највероватније купити ако већ имају сир у својим колицима.

Постизање нулте латенције заправо зависи од два основна механизма:

  • Потпуна унија на подаци који се анализирају утврђеним техникама и алатима које креира БИ
  • Систем испоруке од подаци ефикасан како би се осигурало да је аналитика у реалном времену заиста доступна. Ови предуслови за нулту латенцију се не разликују од два циља која је поставио ИБМ и описана горе. Блиско парење од подаци То је део ИБМ-овог програма беспрекорне интеграције. И створити систем испоруке подаци ефикасан у потпуности зависи од доступне технологије која поједностављује процес испоруке подаци. Као резултат тога, два од три ИБМ-ова циља су критична за реализацију трећег. ИБМ свесно развија своју технологију како би осигурао да нулта латенција буде реалност за напоре складишта. Резиме / Синтеза БИ организација пружа мапу пута за изградњу вашег окружења
    итеративно. Мора бити прилагођен тако да одражава потребе вашег пословања, како садашње тако и будуће. Без широке архитектонске визије, итерације складишта су нешто више од случајних имплементација централног складишта које мало доприносе стварању широког, информативног предузећа. Прва препрека за менаџере пројеката је како оправдати инвестиције потребне за развој БИ организације. Иако је прорачун повраћаја улагања остао главни ослонац имплементације складишта, постаје све теже прецизно предвидети. Ово је довело до других метода за утврђивање да ли вам новац вреди. Вредност улагања2 (ВОИ), на пример, промовише се као решење. То је задужено за архитекте из подаци а планери пројеката намерно генеришу и пружају информације корисничким удружењима, а не само да им пружају услугу подаци. Постоји огромна разлика између то двоје. Информације су нешто што чини разлику у доношењу одлука и ефективности; релативно, тј подаци они су градивни блокови за извођење тих информација.

Чак и ако сам критичан према извору подаци Да би се одговорило на пословне захтеве, БИ окружење би требало да има већу улогу у креирању информационог садржаја. Морамо да предузмемо додатне кораке да очистимо, интегришемо, трансформишемо или на други начин креирамо информациони садржај на који корисници могу да делују, а затим морамо да обезбедимо да се те акције и одлуке, где је то разумно, одразе на БИ окружење. Ако оставимо складиште да служи само подаци, осигурава се да ће корисничка удружења креирати информативни садржај потребан за предузимање акције. Ово осигурава да ће њихова заједница моћи да доноси боље одлуке, али предузеће пати од недостатка знања које су користили. Дата Како архитекте и планери пројеката покрећу специфичне пројекте у БИ окружењу, они остају одговорни предузећу у целини. Једноставан пример ове двостране карактеристике БИ итерација налази се у извору подаци. Све подаци примљени за специфичне пословне захтеве морају бити попуњени у првом атомском слоју. Ово обезбеђује развој информационог средства предузећа, као и управљање, адресирање специфичних корисничких захтева дефинисаних у итерацији.

ВхатисаДатаВарехоусе?

Складиште података он је срце архитектуре информационих система од 1990. године и подржава информационе процесе нудећи солидну интегрисану платформу подаци историјски подаци узети као основа за накнадне анализе. ТХЕ складиште података они нуде лакоћу интеграције у свету некомпатибилних апликативних система. Складиште података еволуирао је у тренд. Складиште података организују и чувају и подаци неопходне за информационе и аналитичке процесе засноване на дугој историјској временској перспективи. Све ово подразумева значајну и сталну посвећеност у изградњи и одржавању складиште података.

Дакле, шта је а складиште података? складиште података и:

  • ▪ предметно оријентисан
  • ▪ интегрисани систем
  • ▪ варијантно време
  • ▪ непостојан (не може се избрисати)

збирка од подаци користи се за подршку менаџерским одлукама у спровођењу процеса.
I подаци уметнут у складиште података у већини случајева потичу из оперативних окружења. Тхе складиште података креира га јединица за складиштење, физички одвојена од остатка система који садржи подаци претходно трансформисан апликацијама које раде на информацијама које потичу из оперативног окружења.

Дословна дефиниција а складиште података заслужује детаљно објашњење јер постоје важне мотивације и основна значења која описују карактеристике складишта.

ПРЕДМЕТНА ОРИЈЕНТАЦИЈА ОРИЈЕНТАЦИЈА ТЕМАТСКИ

Прва карактеристика а складиште података је да је оријентисан на главне играче у компанији. Водич кроз суђења подаци то је у супротности са класичнијим методом који укључује оријентацију апликација на процесе и функције, метод који углавном дели већина новијих система управљања.

Оперативни свет је дизајниран око апликација и функција као што су кредити, штедња, банковне картице и поверење за финансијску институцију. Свет дв је организован око главних субјеката као што су купац, продавац, производ и активност. Усклађивање око тема утиче на дизајн и имплементацију подаци налази у дв. Што је још важније, главна тема утиче на најважнији део кључне структуре.

На свет апликације утичу и дизајн базе података и дизајн процеса. Свет дв је фокусиран искључиво на моделинг подаци и на дизајну база података. Дизајн процеса (у свом класичном облику) није део дв окружења.

Разлике између избора апликације процеса/функције и избора предмета откривају се и као разлике у садржају подаци на детаљном нивоу. ТХЕ подаци од дв не укључују и подаци који се неће користити за ДСС процес док апликације

оперативно оријентисан подаци садрже и подаци да одмах задовољи функционалне/процесне захтеве који могу или не морају имати никакву корист за ДСС аналитичара.
Још један важан начин на који оперативно оријентисане апликације подаци разликују од подаци од дв је у извештајима деи подаци. Ја подаци операције одржавају континуирану везу између две или више табела на основу пословног правила које је активно. ТХЕ подаци од дв прелазе спектар времена и односи који се налазе у дв су многи. Многа правила трговања (и сходно томе, многи односи између подаци ) су заступљени у магацину од подаци између два или више столова.

(За детаљно објашњење како су односи између подаци се обрађују у ДВ-у, позивамо се на техничку тему о том питању.)
Из било које друге перспективе осим фундаменталне разлике између избора функционалне/процесне апликације и избора предмета, постоји ли већа разлика између оперативних система и подаци и ДВ.

ИНТЕГРАЦИЈА ИНТЕГРАЦИЈА

Најважнији аспект дв окружења је да и подаци који се налазе у дв лако се интегришу. УВЕК. БЕЗ ИЗУЗЕТКА. Сама суштина дв окружења је да и подаци садржани у границама складишта су интегрисани.

Интеграција се открива на много различитих начина – у доследним идентификованим конвенцијама, у доследном мерењу променљивих, у доследним кодираним структурама, у физичким атрибутима подаци доследно, и тако даље.

Током година, дизајнери различитих апликација су донели многе одлуке о томе како треба да се развија апликација. Стил и индивидуализоване дизајнерске одлуке дизајнерских апликација откривају се на стотину начина: у разликама у кодирању, кључној структури, физичким карактеристикама, конвенцијама идентификације итд. Колективна способност многих дизајнера апликација да креирају недоследне апликације је легендарна. Слика 3 приказује неке од најважнијих разлика у начину на који су апликације дизајниране.

Кодирање: Кодирање:

Дизајнери апликација су одабрали кодирање поља – пола – на различите начине. Дизајнер представља секс као "м" и "ф". Други дизајнер представља род као "1" и "0". Други дизајнер представља секс као "к" и "и". Други дизајнер представља секс као „мушки“ и „женски“. Није битно како секс улази у ДВ. „М“ и „Ж“ су вероватно добри као цела представа.

Оно што је важно је да из ког год порекла потиче полно поље, то поље стиже у ДВ у доследном интегрисаном стању. Сходно томе, када се поље учита у ДВ из апликације у којој је представљено у формату „М“ и „Ф“, подаци мора се конвертовати у ДВ формат.

Меасуремент оф Аттрибутес: Меасуремент оф Атрибути:

Дизајнери апликација су током година изабрали да мере цевовод на различите начине. Дизајнер чува подаци цевовода у центиметрима. Други дизајнер апликација чува подаци цевовода у инчима. Други дизајнер апликација чува подаци цевовода у милионима кубних стопа у секунди. А други дизајнер чува информације о цевоводу у смислу јарди. Шта год да је извор, када информације о цевоводу стигну у ДВ, морају се мерити на исти начин.

Према индикацијама на слици 3, питања интеграције утичу на скоро сваки аспект пројекта – физичке карактеристике подаци, дилема да постоји више од једног извора подаци, питање недоследних идентификованих узорака, формата подаци недоследно, и тако даље.

Без обзира на тему дизајна, резултат је исти – тј подаци морају бити похрањени у ДВ на јединствен и глобално прихватљив начин чак и када их основни оперативни системи чувају другачије подаци.

Када аналитичар ДСС погледа ДВ, циљ аналитичара би требало да буде да искористи подаци који се налазе у магацину,

а не на питање о кредибилитету или доследности подаци.

ВРЕМЕНСКА ВАРИЈАНЦИЈА

Све подаци у ДВ су тачни до одређеног тренутка. Ова основна карактеристика подаци у ДВ се веома разликује од оних подаци налази у радном окружењу. ТХЕ подаци оперативног окружења су прецизни као у тренутку приступа. Другим речима, у оперативном окружењу када се приступа диску подаци, очекује се да ће одражавати прецизне вредности у тренутку приступа. Јер сам ја подаци у ДВ су прецизни јер у неком тренутку (тј. не „тренутно“), каже се да сам подаци пронађене у ДВ су „временска варијанса“.
Временска варијација од подаци од стране ДВ се помиње на бројне начине.
Најједноставнији начин је да и подаци од ДВ представљају подаци у дугом временском хоризонту – пет до десет година. Временски хоризонт представљен за радно окружење је много краћи од данашњих тренутних вредности до шездесет деведесет
Апликације које морају добро функционисати и које морају бити доступне за обраду трансакција морају имати минимални износ подаци ако дозвољавају било какав степен флексибилности. Дакле, оперативне апликације имају кратак временски хоризонт, као што је тема дизајна аудио апликација.
Други начин на који се 'временска варијанса' појављује у ДВ је у кључној структури. Свака кључна структура у ДВ садржи, имплицитно или експлицитно, временски елемент, као што су дан, недеља, месец, итд. Елемент времена је скоро увек на дну спојеног кључа који се налази у ДВ. У овим приликама, временски елемент ће постојати имплицитно, као што је случај када се цео фајл дуплира на крају месеца или квартала.
Трећи начин на који се приказује временска варијација је да и подаци ДВ, када се једном исправно региструје, не може се ажурирати. ТХЕ подаци ДВ су, за све практичне сврхе, дуга серија снимака. Наравно, ако су снимци направљени погрешно, онда се снимци могу изменити. Али под претпоставком да су снимци исправно направљени, они се не мењају чим се направе. У неким

У неким случајевима може бити неетично или чак неважеће да се снимци у ДВ-у мењају. ТХЕ подаци оперативни, будући да су прецизни у тренутку приступа, могу се ажурирати по потреби.

НОН-ВОЛАТИЛЕ

Четврта важна карактеристика ДВ-а је да је неиспарљив.
Ажурирања, уметања, брисања и модификације се редовно врше у оперативним окружењима на основу евиденције по запис. Али основна манипулација подаци које су потребне у ДВ је много једноставније. Постоје само две врсте операција које се дешавају у ДВ-у – почетно учитавање подаци и приступ подаци. Нема ажурирања подаци (у општем смислу ажурирања) у ДВ као нормална операција обраде. Постоје неке веома снажне последице ове основне разлике између оперативне обраде и ДВ обраде. На нивоу дизајна, потреба да се води рачуна о аномалном ажурирању није фактор у ДВ, пошто ажурирање подаци се не спроводи. То значи да се на нивоу физичког дизајна могу узети слободе да се оптимизује приступ подаци, посебно у бављењу темама физичке нормализације и денормализације. Још једна последица једноставности ДВ операција је у основној технологији која се користи за покретање ДВ окружења. Подржавање инлине ажурирања записа по запис (као што је често случај са оперативном обрадом) захтева да технологија има веома сложену основу испод привидне једноставности.
Технологија која подржава резервне копије и опоравак, трансакције и интегритет подаци а откривање и отклањање стања застоја је прилично сложено и није неопходно за ДВ обраду. Карактеристике ДВ, оријентација дизајна, интеграција подаци унутар ДВ, временска варијација и једноставност управљања подаци, све то доводи до окружења које се веома, веома разликује од класичног оперативног окружења. Извор скоро свих подаци ДВ су радно окружење. Примамљиво је помислити да постоји велики вишак подаци између две средине.
У ствари, први утисак који многи људи имају је велики вишак подаци између оперативног окружења и окружења од

ДВ. Такво тумачење је површно и показује недостатак разумевања онога што се дешава у ДВ.
У ствари, постоји минимум вишка подаци између оперативног окружења и и подаци оф тхе ДВ. Размотрите следеће: И подаци они се филтрирају дато прелазак из радног окружења у ДВ окружење. Многи подаци никада не пролазе ван оперативног окружења. Осим што и подаци који су неопходни за обраду ДСС налазе свој правац у окружењу

▪ временски хоризонт од подаци веома се разликује од једне средине до друге. ТХЕ подаци у радном окружењу су веома свеже. ТХЕ подаци у ДВ су много старији. Само из перспективе временског хоризонта, постоји врло мало преклапања између оперативног окружења и ДВ.

▪ ДВ садржи подаци сажетак који се никада не налазе у окружењу

▪ И подаци пролазе кроз фундаменталну трансформацију док прелазе на Слика 3 то највише илуструје подаци значајно су модификовани под условом да су одабрани и премештени у ДВ. Другим речима, већина подаци физички и радикално се мења како се премешта у ДВ. Са становишта интеграције они нису исти подаци који се налазе у радном окружењу. У светлу ових фактора, редундантност од подаци између два окружења је редак догађај, што доводи до мање од 1% редундантности између два окружења. СТРУКТУРА СКЛАДИШТА ДВ имају посебну структуру. Постоје различити нивои сажетка и детаља који разграничавају ДВ.
Различите компоненте ДВ-а су:

Далеко главна брига је за подаци актуелни детаљи. То је главна брига јер:

  • I подаци актуелни детаљи одражавају најновије догађаје, који су увек од великог интересовања и
  • i подаци актуелних детаља је обимна јер се чува на најнижем нивоу грануларности и
  • i подаци Тренутни детаљи се скоро увек чувају на диск меморији, којој је брзо приступити, али је скупа и сложена за коришћење подаци детаља што су старији подаци који се чувају у некој меморији маса. Приступа му се спорадично и чува се на нивоу детаља који је компатибилан са подаци актуелни детаљи. Иако није обавезно чувати на алтернативном медијуму за складиштење, због велике запремине подаци у комбинацији са спорадичним приступом подаци, меморијска подршка за подаци старији детаљи се обично не чувају на диску. ТХЕ подаци сажето благо су подаци који су дестиловани од пронађеног ниског нивоа детаља до тренутног нивоа детаља. Овај ниво ДВ-а се скоро увек чува на диску. Проблеми дизајна са којима се суочава архитекта подаци у изградњи овог нивоа ДВ су:
  • Која је јединица времена горе наведени резиме
  • Који садржај, атрибути ће мало резимирати садржај подаци Следећи ниво подаци пронађено у ДВ је оно од подаци високо сажето. ТХЕ подаци веома сажети су компактни и лако доступни. ТХЕ подаци високо сумирани се понекад налазе у ДВ окружењу, ау другим случајевима и подаци високо сажети налазе се изван непосредних зидова технологије у којој се налази ДВ. (у сваком случају, тј подаци високо сумирани су део ДВ без обзира на то где и подаци физички су смештени). Коначна компонента ДВ-а су метаподаци. У многим аспектима метаподаци се налазе у различитој димензији од других подаци ДВ, јер метаподаци не садрже никакве дато преузети директно из оперативног окружења. Метаподаци имају посебну и веома важну улогу у ДВ. Метаподаци се користе као:
  • директоријум који помаже аналитичару ДСС-а да лоцира садржај ДВ,
  • водич за мапирање подаци о томе како ја подаци трансформисани су из оперативног окружења у ДВ окружење,
  • водич за алгоритме који се користе за сумирање између подаци актуелних детаља еи подаци мало сажето, тј подаци високо резимирано, метаподаци играју много већу улогу у ДВ окружењу него што су икада имали у оперативном окружењу СТАРИ МЕДИУМ ЗА СКЛАДИШТЕЊЕ ДЕТАЉА Магнетна трака се може користити за чување такве врсте подаци. У ствари, постоји широк избор медија за складиштење које треба узети у обзир за старо складиште подаци детаља. У зависности од обима подаци, учесталост приступа, цену алата и тип приступа, сасвим је вероватно да ће другим алатима бити потребан стари ниво детаља у ДВ. ТОК ПОДАТАКА Постоји нормалан и предвидљив ток од подаци унутар ДВ.
    I подаци улазе у ДВ из радног окружења. (НАПОМЕНА: Постоје неки веома интересантни изузеци од овог правила. Међутим, скоро сви подаци унесите ДВ из оперативног окружења). Дата да ја подаци ући у ДВ из оперативног окружења, он се трансформише како је раније описано. Под условом уласка у ДВ, тј подаци унесите тренутни ниво детаља, као што је приказано. Тамо се налази и користи се док се не догоди један од три догађаја:
  • је пречишћен,
  • је сажет, и/или ▪е Застарели процес унутар ДВ-а се помера и подаци актуелни детаљи а подаци старих детаља, на основу старости од подаци. Процес

сажетак користи детаље о подаци израчунати и подаци благо сажети и високо сумирани нивои подаци. Постоје неки изузеци од приказаног тока (о томе ће бити речи касније). Међутим, обично, за огромну већину подаци налази унутар ДВ, ток од подаци то је као што је приказано.

КОРИШЋЕЊЕ СКЛАДИШТА ПОДАТАКА

Није изненађујуће да су различити нивои подаци у оквиру ДВ не добијају различите нивое коришћења. По правилу, што је виши ниво сажимања, то је више и подаци користе се.
Многе употребе се јављају у подаци високо сажети, док стари подаци детаља се скоро никада не користе. Постоји добар разлог да се организација помери на парадигму коришћења ресурса. Више сажето и подаци, брже и ефикасније је доћи до подаци. Ако продавница открије да обавља многе процесе на нивоу детаља ДВ-а, тада се троши одговарајућа велика количина машинских ресурса. У најбољем је интересу свих да се што пре обради што је могуће већи ниво резимирања.

За многе радње користио је ДСС аналитичар у окружењу пре ДВ подаци на нивоу детаља. У многим аспектима долазак на подаци детаљан резиме личи на безбедносни покривач, чак и када су доступни други нивои сажетка. Једна од делатности арх подаци је да одвикне корисника ДСС од сталне употребе подаци на најнижем нивоу детаља. Архитекти су на располагању две мотивације подаци:

  • инсталирањем система повраћаја плаћања, где крајњи корисник плаћа утрошене ресурсе и
  • што указује да се веома добро време одзива може постићи када се понашање са и подаци је на високом нивоу сажимања, док је слабо време одговора последица понашања подаци на ниском нивоу ОСТАЛИ РАЗМАТРАЊА Постоје и нека друга разматрања изградње и управљања ДВ.
    Прво разматрање је индекс. ТХЕ подаци на вишим нивоима сажимања могу се слободно индексирати, док и подаци

на нижим нивоима детаља су толико гломазни да се штедљиво могу индексирати. Из истог токена, тј подаци на високим нивоима детаља може се релативно лако реструктурирати, док обим од подаци на нижим нивоима је толико велика да и подаци не могу се лако обновити. Сходно томе, модел подаци а формални рад који је урадио дизајн поставио је основу за ДВ примењен скоро искључиво на садашњем нивоу детаља. Другим речима, активности моделирања подаци не примењују се на нивое сумирања, у скоро сваком случају. Још једно структурално разматрање је оно о подподели подаци би ДВ.

Подела се може извршити на два нивоа – на нивоу дбмс и на нивоу апликације. У дивизији на нивоу дбмс, дбмс је обавештен о одељењима и сходно томе их контролише. У случају поделе на нивоу апликације, само програмер је обавештен о поделама и одговорност за њихову администрацију је препуштена њему

Испод нивоа дбмс, доста посла се обавља аутоматски. Много је нефлексибилности повезано са аутоматским администрирањем подела. У случају подела на нивоу апликације од подаци дел складиште података, програмера оптерећује много посла, али крајњи резултат је флексибилност у администрацији подаци у складиште података

АЛТРЕ АНОМАЛИЕ

Док су компоненте складиште података Они раде како је описано за скоро све подаци, постоје неки корисни изузеци о којима треба разговарати. Изузетак је онај од подаци јавни збирни подаци. Су подаци резимеа који су израчунати из складиште података али их друштво користи. ТХЕ подаци Јавни резимеи се чувају и њима се управља у складиште података, иако су као што је претходно поменуто израчунате. Рачуновође раде на томе да их произведу квартално подаци као што су приходи, тромесечни расходи, тромесечни профит и тако даље. Посао који обављају рачуновође је спољашњи складиште података. Међутим, ја подаци се користе „интерно” унутар компаније – од маркетинг, продаја итд. Још једна аномалија, о којој неће бити речи, је она од подаци естерни.

Још једна изузетна врста подаци који се може наћи у а складиште података је тај трајних детаљних података. Ово узрокује потребу за трајним складиштењем подаци на детаљном нивоу из етичких или правних разлога. Ако компанија излаже своје раднике опасним супстанцама, постоји потреба подаци детаљна и трајна. Ако компанија производи производ који укључује јавну безбедност, као што су делови за авионе, постоји потреба за тим подаци трајне податке, као и ако предузеће склапа опасне уговоре.

Компанија не може себи приуштити да превиди детаље јер у наредних неколико година у случају тужбе, опозива, спорног грађевинског недостатка итд. изложеност компаније би могла бити велика. Као резултат, постоји јединствена врста подаци познат као трајни детаљни подаци.

САЖЕТАК

Un складиште података је објектно оријентисана, интегрисана, временска варијанта, збирка подаци непостојан да подржи потребе администрације у доношењу одлука. Свака од истакнутих функција а складиште података има своје импликације. Поред тога, постоје четири нивоа подаци дел складиште података:

  • Стари детаљ
  • Тренутни детаљ
  • Дати благо рекапитулирано
  • Дати високо сажети метаподаци су такође важан део складиште података. АПСТРАКТАН Концепт складиштења подаци Недавно је добио велику пажњу и постао је тренд 90-их. То је због способности складиште података да се превазиђу ограничења система подршке менаџменту као што су системи за подршку одлучивању (ДСС) и извршни информациони системи (ЕИС). Чак и ако концепт о складиште података изгледа обећавајуће, имплементирати и складиште података може бити проблематично због процеса складиштења великих размера. Упркос сложености складишних пројеката подаци, многи добављачи и консултанти који залихе подаци тврде да је складиштење подаци струја не изазива никакве проблеме. Међутим, на почетку овог истраживачког пројекта готово да није спроведено независно, ригорозно и систематично истраживање. Сходно томе, тешко је рећи шта се заправо дешава у индустрији када се граде складиште података. Ова студија је истраживала праксу складиштења подаци савременици која има за циљ да развије богатије разумевање аустралијске праксе. Преглед литературе пружио је контекст и основу за емпиријску студију. Постоје бројни налази из овог истраживања. Прво, ова студија је открила активности које су настале током развоја складиште података. У многим областима, тј подаци окупљени су потврдили праксу о којој се говори у литератури. Друго, питања и проблеми који могу утицати на развој складиште података идентификовани су овом студијом. Коначно, користи које добијају аустралијске организације повезане са коришћењем складиште података откривени су.

Поглавље 1

Контекст истраживања

Концепт складиштења података је био широко распрострањен и постао је тренд у настајању 90-их (МцФадден 1996, ТДВИ 1996, Схах и Милстеин 1997, Сханкс ет ал. 1997, Ецкерсон 1998, Аделман и Оатес 2000). То се може видети из све већег броја чланака о складиштењу података у трговинским публикацијама (Литтле и Гибсон 1999). Многи чланци (видети, на пример, Фисхер 1995, Хацкатхорн 1995, Моррис 1995а, Брамблетт и Кинг 1996, Грахам ет ал. 1996, Сакагуцхи и Фролицк 1996, Алварез 1997, Броуселл 1997. Едвардс 1997, ТДВИ 1997) су пријавили значајне користи које су добиле организације које имплементирају и складиште података. Они су своју теорију подржали анегдотским доказима о успешним имплементацијама, високим цифрама поврата улагања (РОИ) и, такође, пружањем смерница или методологија за развој складиште података

(Сханкс ет ал. 1997, Седдон и Бењамин 1998, Литтле и Гибсон 1999). У екстремном случају, Грахам ет ал. (1996) су пријавили просечни принос на трогодишњу инвестицију од 401%.

Велики део тренутне литературе, међутим, занемарује сложеност која је укључена у предузимање таквих пројеката. Пројекти оф складиште података они су обично сложени и великих размера и стога носе велику вероватноћу неуспеха ако се не контролишу пажљиво (Схах и Милстеин 1997, Ецкерсон 1997, Фолеи 1997б, Зиммер 1997, Борт 1998, Гиббс и Цлимер 1998, Рао 1998). Они захтевају огромне количине и људских и финансијских ресурса, као и времена и труда за њихову изградњу (Хилл 1998, Црофс 1998). Типично потребно време и финансијска средства су отприлике две године и два до три милиона долара, респективно (Брали 1995, Фолеи 1997б, Борт 1998, Хумпхриес ет ал. 1999). Ово време и финансијска средства су потребна за контролу и консолидацију многих различитих аспеката складиштења података (Цафассо 1995, Хилл 1998). Поред хардверских и софтверских разматрања, друге функције које се разликују од екстракције подаци на процесе утовара подаци, капацитет меморије за управљање ажурирањима и мета подаци за обуку корисника, мора се узети у обзир.

У време када је овај истраживачки пројекат почео, било је врло мало академских истраживања која су спроведена у области складиштења података, посебно у Аустралији. Ово је било очигледно из недостатка објављених чланака о складиштењу података из часописа или других академских списа тог времена. Многи од доступних академских списа описали су америчко искуство. Недостатак академског истраживања у области складиштења података изазвао је позиве за ригорозна истраживања и емпиријска истраживања (МцФадден 1996, Сханкс ет ал. 1997, Литтле и Гибсон 1999). Конкретно, истраживачке студије о процесу имплементације складиште података потребно је спровести како би се проширило опште знање о примени складиште података и послужиће као основа за будућу истраживачку студију (Сханкс ет ал. 1997, Литтле и Гибсон 1999).

Стога је сврха ове студије да се проучи шта се заправо дешава када организације спроводе и користе и складиште података у Аустралији. Конкретно, ова студија ће укључити анализу читавог процеса развоја а складиште података, почевши од иницијације и планирања преко дизајна и имплементације и накнадне употребе у оквиру аустралијских организација. Поред тога, студија ће такође допринети тренутној пракси тако што ће идентификовати области у којима се пракса може даље побољшати, а неефикасност и ризици могу бити минимизирани или избегнути. Штавише, послужиће као основа за друге студије о складиште података у Аустралији и попуниће празнину која тренутно постоји у литератури.

Истраживачка питања

Циљ овог истраживања је проучавање активности укључених у реализацију складиште података и њихово коришћење од стране аустралијских организација. Посебно се проучавају елементи који се односе на планирање, развој, рад, употребу и укључене ризике. Дакле, питање овог истраживања је:

„Каква је садашња пракса складиште података у Аустралији?"

Да би се делотворно одговорило на ово питање, потребан је низ помоћних истраживачких питања. Конкретно, три потпитања су идентификована из литературе, која је представљена у поглављу 2, која би водила овај истраживачки пројекат: Како су складиште података из аустралијских организација? На које проблеме сте се сусрели?

Које су предности доживљене?
У одговору на ова питања коришћен је истраживачки дизајн који користи анкету. Као истраживачка студија, одговори на горња питања нису потпуни (Сханкс ет ал. 1993, Денсцомбе 1998). У овом случају је потребна триангулација да би се побољшали одговори на ова питања. Међутим, истрага ће пружити солидну основу за будући рад на испитивању ових питања. Детаљна дискусија о оправданости и дизајну истраживачких метода представљена је у Поглављу 3.

Структура истраживачког пројекта

Овај истраживачки пројекат је подељен на два дела: контекстуално проучавање концепта складиштења података и емпиријско истраживање (видети слику 1.1), од којих је сваки размотрен у наставку.

Део И: Контекстуална студија

Први део истраживања састојао се од прегледа постојеће литературе о различитим типовима складишта података укључујући системе за подршку одлучивању (ДСС), извршне информационе системе (ЕИС), студије случаја складиште података и концепти складиште података. Штавише, резултати форума складиште података и групе за састанке стручњака и пракси које је водио истраживачки тим Монасх ДСС, допринели су овој фази студије која је имала за циљ да стекне увид у праксу складиште података и да идентификује ризике који су повезани са њиховим усвајањем. Током овог периода контекстуалног проучавања успостављено је разумевање проблематичне области како би се обезбедило основно знање за наредна емпиријска истраживања. Међутим, ово је био стални процес током спровођења истраживачке студије.

ИИ део: Емпиријска истраживања

Релативно нови концепт складиштења података, посебно у Аустралији, створио је потребу за истраживањем како би се добила широка слика о корисничком искуству. Овај део је спроведен након што је проблемски домен установљен кроз обимни преглед литературе. Концепт складиштења података формиран током фазе контекстуалне студије коришћен је као инпут за почетни упитник ове студије. Након овога, упитник је испитан. Ви сте стручњаци за складиште података учествовао на тесту. Сврха тестирања иницијалног упитника била је да се провери комплетност и тачност питања. На основу резултата тестирања, упитник је модификован и измењена верзија је послата учесницима анкете. Враћени упитници су затим анализирани за и подаци у табелама, дијаграмима и другим форматима. ТХЕ

резултати анализе подаци они чине снимак праксе складиштења података у Аустралији.

ПРЕГЛЕД СКЛАДИШТА ПОДАТАКА

Концепт складиштења података је еволуирао са побољшањима у рачунарској технологији.
Има за циљ превазилажење проблема са којима се суочавају групе за подршку апликацијама као што су Систем за подршку одлучивању (ДСС) и Извршни информациони систем (ЕИС).

У прошлости највећа препрека ових апликација је била немогућност ових апликација да обезбеде а база података неопходна за анализу.
Ово је углавном узроковано природом посла менаџмента. Интереси менаџмента компаније стално варирају у зависности од области коју покрива. Стога и подаци суштински за ове примене морају бити у могућности да се брзо мењају у зависности од дела који се третира.
То значи да и подаци морају бити доступни у одговарајућем облику за тражене анализе. У ствари, групама за подршку апликацијама је у прошлости било веома тешко да прикупљају и интегришу подаци из сложених и разноврсних извора.

Остатак овог одељка представља преглед концепта складиштења података и разматра како складиште података може да превазиђе проблеме група за подршку апликацијама.
Израз „Складиште података” је популаризовао Вилијам Инмон 1990. Његова често цитирана дефиниција види Складиште података као збирка подаци предметно оријентисан, интегрисан, непроменљив и променљив током времена, као подршка одлукама менаџмента.

Користећи ову дефиницију Инмон истиче да и подаци настањен у а складиште података морају поседовати следеће 4 карактеристике:

  • ▪ Предметно оријентисан
  • ▪ Интегрисан
  • ▪ Неиспарљив
  • ▪ Променљиво током времена Под субјектом оријентисаним Инмон значи да и подаци у складиште података у највећим организационим областима које су

дефинисане у моделу подаци. На пример све подаци у вези и клијенти садржани су у предметној области КОРИСНИЦИ. Исто тако све подаци који се односе на производе садржани су у предметној области ПРОИЗВОДИ.

Под Интегратед Инмон подразумева да и подаци који долазе са различитих платформи, система и локација се комбинују и чувају на једном месту. Последично подаци слични морају бити трансформисани у конзистентне формате како би се лако додавали и упоређивали.
На пример, мушки и женски род су представљени словима М и Ф у једном систему, а 1 и 0 у другом. Да би их правилно интегрисали, један или оба формата морају бити трансформисана тако да два формата буду иста. У овом случају можемо променити М у 1 и Ф у 0 или обрнуто. Предметно оријентисане и Интегрисане указују да је складиште података је дизајниран да обезбеди функционалну и трансверзалну визију подаци од стране компаније.

Под Непроменљивим подразумева да и подаци у складиште података остају доследни и ажурирање подаци није потребно. Уместо тога, свака промена у подаци оригинали се додају у база података дел складиште података. То значи да историјски деи подаци садржан је у складиште података.

За променљиве са временом Инмон указује да и подаци у складиште података увек садрже еи индикаторе времена подаци обично прелазе одређени временски хоризонт. На пример а
складиште података може садржати 5 година историјских вредности клијенти од 1993. до 1997. Доступност историје и временске серије подаци омогућава вам да анализирате трендове.

Un складиште података може сакупити своје подаци из ОЛТП система; из извора подаци екстерно у односу на организацију и/или другим пројектима посебног система захвата подаци.
I подаци екстракти могу проћи кроз процес чишћења, у овом случају и подаци се трансформишу и интегришу пре складиштења у база података дел складиште података. Онда сам ја подаци

становника у оквиру база података дел складиште података су доступни крајњим корисницима за пријаву и алате за опоравак. Користећи ове алате крајњи корисник може приступити интегрисаном приказу организације подаци.

I подаци становника у оквиру база података дел складиште података чувају се како у детаљима тако иу резименим форматима.
Ниво сажетка може зависити од природе подаци. Ја подаци детаљан може се састојати од подаци струја е подаци историчари
I подаци ауторске накнаде нису укључене у складиште података до и подаци у складиште података се ажурирају.
Поред чувања и подаци себе, а складиште података такође може да складишти другу врсту дато под називом МЕТАДАТА који описују подаци становника у његовом база података.
Постоје две врсте метаподатака: развојни метаподаци и метаподаци аналитике.
Развојни метаподаци се користе за управљање и аутоматизацију процеса екстракције, чишћења, мапирања и учитавања подаци у складиште података.
Информације садржане у развојним метаподацима могу садржати детаље о оперативним системима, детаље о елементима које треба издвојити, моделу подаци дел складиште података и пословна правила за конверзију подаци.

Други тип метаподатака, познат као метаподаци аналитике, омогућава крајњем кориснику да истражује садржај складиште података да пронађем подаци доступне и њихово значење у јасним, нетехничким терминима.

Стога метаподаци аналитике функционишу као мост између складиште података и апликације за крајње кориснике. Ови метаподаци могу да садрже пословни модел, описе подаци који одговарају пословном моделу, унапред дефинисаним упитима и извештајима, информацијама за приступ корисника и индексу.

Метаподаци анализе и развоја морају бити комбиновани у јединствене интегрисане метаподатке о задржавању да би правилно функционисали.

Нажалост, многи од постојећих алата имају своје метаподатке и тренутно не постоје постојећи стандарди за то

дозволи алатима за складиштење података да интегришу ове метаподатке. Да би поправили ову ситуацију, многи трговци главним алатима за складиштење података формирали су Савет за Мета Дата који је касније постао Мета Дата Цоалитион.

Циљ ове коалиције је да изгради стандардни скуп метаподатака који омогућава различитим алатима за складиштење података да конвертују метаподатке
Њихови напори су резултирали рођењем Мета Дата Интерцханге Специфицатион (МДИС) која ће омогућити размену информација између Мицрософт архива и повезаних МДИС датотека.

Постојање од подаци и сажето/индексирано и детаљно даје кориснику могућност да изврши БУШЕЊЕ (бушење) од подаци индексирано на детаљне и обрнуто. Постојање од подаци детаљне историје омогућавају креирање анализа тренда током времена. Поред тога, метаподаци аналитике се могу користити као директоријум база података дел складиште података да помогне крајњим корисницима да лоцирају подаци неопходно.

У поређењу са ОЛТП системима, са њиховом способношћу да подрже анализу подаци и извештавање, складиште података види се као прикладнији систем за информационе процесе као што су прављење и одговарање на упите и израда извештаја. Следећи одељак ће детаљно истаћи разлике ова два система.

СКЛАДИШТЕ ПОДАТАКА ПРОТИВ ОЛТП СИСТЕМА

Многи информациони системи унутар организација су намењени за подршку свакодневним операцијама. Ови системи познати као ОЛТП СИСТЕМИ, бележе континуирано ажуриране дневне трансакције.

I подаци у оквиру ових система често се мењају, додају или бришу. На пример, адреса клијента се мења док се креће са једног места на друго. У овом случају нова адреса ће бити регистрована изменом поља за адресу база података. Главни циљ ових система је смањење трошкова трансакције и истовремено смањење времена обраде. Примери ОЛТП система укључују критичне радње као што су унос поруџбине, платни списак, фактура, производња, кориснички сервис клијенти.

За разлику од ОЛТП система, који су креирани за процесе засноване на трансакцијама и догађајима, тј складиште података створени су да пруже подршку процесима заснованим на аналитици подаци и процеси доношења одлука.

Ово се обично постиже интеграцијом и подаци из различитих ОЛТП и екстерних система у једном „контејнеру“ од подаци, као што је објашњено у претходном одељку.

Монасх модел процеса складиштења података

Модел процеса за складиште података Монасх су развили истраживачи Монасх ДСС Ресеарцх Гроуп, а заснован је на литератури складиште података, о искуству у подршци развоју системских области, о дискусијама са продавцима апликација за употребу на складиште података, о групи стручњака за употребу складиште података.

Фазе су: Иницијација, Планирање, Развој, Операције и Објашњења. Дијаграм објашњава итеративну или еволутивну природу развоја а складиште података процес користећи двосмерне стрелице постављене између различитих фаза. У овом контексту, „итеративни“ и „еволутивни“ значе да, у сваком кораку процеса, активности имплементације увек могу да се пропагирају уназад ка претходној фази. Ово је због природе пројекта складиште података у којој у сваком тренутку настају додатни захтеви крајњег корисника. На пример, током фазе развоја процеса складиште података, нову димензију или предметну област захтева крајњи корисник, која није била део првобитног плана, ово се мора додати систему. Ово изазива промену у пројекту. Резултат је да дизајнерски тим мора да промени захтеве до сада креираних докумената током фазе пројектовања. У многим случајевима, тренутно стање пројекта мора да се врати у фазу пројектовања где се нови захтев мора додати и документовати. Крајњи корисник мора бити у могућности да види конкретну документацију која је прегледана и промене које су направљене у фази развоја. На крају овог развојног циклуса пројекат мора добити одличне повратне информације и од развојног и од корисничког тима. Повратне информације се затим поново користе за побољшање будућег пројекта.

Планирање капацитета
Дв имају тенденцију да буду веома велике величине и расту веома брзо (Бест 1995, Рудин 1997а) као резултат количине подаци историје које задржавају од свог трајања. Раст такође може бити узрокован подаци додаци које корисници захтевају да повећају вредност подаци које већ имају. Сходно томе, захтеви за складиштење за подаци може бити значајно побољшана (Ецкерсон 1997). Стога је од суштинске важности осигурати, спровођењем планирања капацитета, да систем који се гради може расти како потребе расту (Бест 1995, ЛаПланте 1996, Ланг 1997, Ецкерсон 1997, Рудин 1997а, Фолеи 1997а).
У планирању скалабилности базе података, мора се знати очекивани раст величине складишта, типови упита који ће се вероватно правити и број подржаних крајњих корисника (Бест 1995, Рудин 1997б, Фолеи 1997а). Изградња скалабилних апликација захтева комбинацију скалабилних серверских технологија и скалабилних техника дизајна апликација (Бест 1995, Рудин 1997б. Обе су неопходне за изградњу високо скалабилне апликације. Скалабилне серверске технологије могу учинити лаким и корисним додавање складишта, меморије и ЦПУ-а без деградације перформанс (Ланг 1997, Телефонија 1997).

Постоје две главне скалабилне серверске технологије: симетрична вишеструка обрада (СМП) и масовно паралелна обрада (МПП) (ИДЦ 1997, Хумпхриес ет ал. 1999). СМП сервер обично има више процесора који деле меморију, системску магистралу и друге ресурсе (ИДЦ 1997, Хумпхриес ет ал. 1999). Могу се додати додатни процесори да би се повећао снага рачунски. Још један метод за повећање снага СМП сервера, је комбиновање бројних СМП машина. Ова техника је позната као груписање (Хумпхриес ет ал. 1999). МПП сервер, с друге стране, има више процесора, сваки са својом меморијом, системом магистрале и другим ресурсима (ИДЦ 1997, Хумпхриес ет ал. 1999). Сваки процесор се назива чвором. Повећање у снага може се постићи рачунски

додавањем додатних чворова МПП серверима (Хумпхриес ет ал. 1999).

Слабост СМП сервера је у томе што превише улазно-излазних (И/О) операција може загушити системску магистралу (ИДЦ 1997). Овај проблем се не јавља код МПП сервера јер сваки процесор има свој систем магистрале. Међутим, међусобне везе између сваког чвора су генерално много спорије од система СМП магистрале. Поред тога, МПП сервери могу да додају додатни ниво сложености програмерима апликација (ИДЦ 1997). Дакле, на избор између СМП и МПП сервера може утицати много фактора, укључујући сложеност апликација, однос цена/перформансе, потребан капацитет обраде, спречене дв апликације и повећање величине база података дв и у броју крајњих корисника.

У планирању капацитета могу се користити бројне скалабилне технике дизајна апликација. Користи се различите периоде обавештења као што су дани, недеље, месеци и године. Имајући различите периоде обавештења, база података може се поделити на управљиво груписане делове (Инмон ет ал. 1997). Друга техника је коришћење сумарних табела које се конструишу сумирањем подаци da подаци детаљан. Па сам подаци сажети су више компактни него детаљни, што захтева мање меморијског простора. Дакле, подаци детаља се може ускладиштити у јефтинијој јединици за складиштење, што штеди још више простора за складиштење. Иако коришћење табела са сажетком може да уштеди меморијски простор, оне захтевају много труда да би биле ажурне и у складу са пословним потребама. Међутим, ова техника се широко користи и често се користи у комбинацији са претходном техником (Бест 1995, Инмон 1996а, Цхаудури и Даиал
КСНУМКС).

Дефинисање Складиште података Техничке архитектуре Дефиниција техника дв архитектуре

Рани они који су усвојили складиштење података првенствено су замишљали централизовану имплементацију дв у којој су сви подаци, укључујући и подаци спољне, биле су интегрисане у једну,
физичко складиштење (Инмон 1996а, Бреснахан 1996, Пеацоцк 1998).

Главна предност овог приступа је у томе што крајњи корисници могу да приступе прегледу целог предузећа подаци организационе (Овум 1998). Још једна предност је што нуди стандардизацију подаци кроз организацију, што значи да постоји само једна верзија или дефиниција за сваку терминологију која се користи у дв репозиторијуму (метаподаци) (Фланаган и Сафдие 1997, Овум 1998). Недостатак овог приступа је, с друге стране, што је скуп и тежак за конструисање (Фланаган и Сафдие 1997, Овум 1998, Инмон ет ал. 1998). Недуго након архитектуре складиштења подаци централизован је постао популаран, концепт издвајања мањих подскупова еволуираног подаци да подржи потребе специфичних апликација (Варнеи 1996, ИДЦ 1997, Берсон и Смитх 1997, паун 1998). Ови мали системи су деривати већег складиште података централизована. Они су именовани складиште података зависна одељења или зависна тржишта података. Архитектура зависне базе података позната је као трослојна архитектура где се први ниво састоји од складиште података централизован, други се састоји од депозита од подаци одељењски а трећи се састоји од приступа до подаци и помоћу алата за анализу (Демарест 1994, Инмон ет ал. 1997).

Сатови података се обично граде након складиште података централизован је изграђен да задовољи потребе специфичних јединица (Вхите 1995, Варнеи 1996).
Маркети са подацима чувају подаци веома релевантно у вези са одређеним јединицама (Инмон ет ал. 1997, Инмон ет ал. 1998, ИА 1998).

Предност ове методе је у томе што неће бити дато није интегрисан и да и подаци ће бити мање сувишан у оквиру продајних објеката као и сви други подаци долазе из магацина подаци интегрисани. Још једна предност је што ће постојати мало веза између сваког тржишта података и његових извора подаци јер свако тржиште података има само један извор подаци. Осим тога, са овом архитектуром на месту, крајњи корисници и даље могу да приступе прегледу подаци

корпоративне организације. Ова метода је позната као метода одозго надоле, где се витрине података граде након складиште података (паун 1998, Гоф 1998).
Повећавајући потребу за раним показивањем резултата, неке организације су почеле да граде независне продајне мреже података (Фланаган и Сафдие 1997, Вхите 2000). У овом случају, витрине података добијају своје подаци директно из основа подаци ОЛТП а не из централизованог и интегрисаног складишта, чиме се елиминише потреба за централним складиштем на лицу места.

Свако тржиште података захтева најмање једну везу до својих извора подаци. Недостатак вишеструких веза за свако тржиште података је тај што је, у поређењу са претходне две архитектуре, превелика количина подаци значајно повећава.

Свака база података мора да складишти све подаци потребно локално да нема утицаја на ОЛТП системе. Ово узрокује да и подаци они се чувају у различитим базама података (Инмон ет ал. 1997). Још један недостатак ове архитектуре је што доводи до стварања сложених интерконекција између база података и њихових извора података. подаци које је тешко спровести и контролисати (Инмон ет ал. 1997).

Још један недостатак је што крајњи корисници не могу да приступе прегледу информација о компанији јер и подаци различита тржишта података нису интегрисана (Овум 1998).
Још један недостатак је то што може постојати више од једне дефиниције за сваку терминологију која се користи у базама података, што ствара недоследности подаци у организацији (Овум 1998).
Упркос горе наведеним недостацима, независне витрине података и даље привлаче интересовање многих организација (ИДЦ 1997). Један од фактора који их чини привлачним је да се брже развијају и захтевају мање времена и ресурса (Бреснахан 1996, Берсон и Смит 1997, Овум 1998). Сходно томе, они служе првенствено као тест пројекти који се могу користити за брзо идентификовање предности и/или несавршености у пројекту (Парсаие 1995, Брали 1995, Невинг 1996). У овом случају, део који ће бити имплементиран у пилот пројекту мора бити мали, али важан за организацију (Невинг 1996, Манселл-Левис 1996).

Испитивањем прототипа крајњи корисници и администрација могу одлучити да ли да наставе или зауставе пројекат (Фланаган и Сафдие 1997).
Ако се одлука настави, витрине података за друге индустрије треба да се граде једну по једну. Постоје две опције за крајње кориснике на основу њихових потреба у изградњи независних матрица података: интегрисана/удружена и неинтегрисана (Овум 1998)

У првом методу, свако ново тржиште података треба да буде изграђено на основу тренутних база података и модела подаци које користи компанија (Варнеи 1996, Берсон и Смитх 1997, Пеацоцк 1998). Потреба за коришћењем модела подаци компаније значи да се мора осигурати да постоји само једна дефиниција за сваку терминологију која се користи у свим базама података, а то такође треба да се осигура да се различита тржишта података могу комбиновати како би се дао преглед информација о компанији (Бреснахан 1996). Овај метод се назива одоздо према горе и најбољи је када постоји ограничење финансијских средстава и времена (Фланаган и Сафдие 1997, Овум 1998, Пеацоцк 1998, Гофф 1998). У другом методу, конструисане витрине података могу задовољити само потребе одређене јединице. Варијанта федералног тржишта података је складиште података дистрибуира у којој се база података Међуверски софтвер Хуб сервера се користи за спајање многих база података у једно спремиште подаци дистрибуира (Вхите 1995). У овом случају, тј подаци компаније су распоређене у неколико база података. Захтеви крајњих корисника се прослеђују база података сервер хуб миддлеваре, који издваја све подаци захтевају витрине података и враћа резултате апликацијама крајњих корисника. Овај метод пружа пословне информације крајњим корисницима. Међутим, проблеми независних база података још увек нису отклоњени. Постоји још једна архитектура која се може користити, а која се зове складиште података виртуелни (Вхите 1995). Међутим, ова архитектура, која је описана на слици 2.9, није архитектура за складиштење података. подаци реалан јер не премешта учитавање са ОЛТП система на складиште података (Демарест 1994).

У ствари, захтеви од подаци од крајњих корисника се прослеђују на ОЛТП системе који враћају резултате након обраде корисничких захтева. Иако ова архитектура дозвољава крајњим корисницима да генеришу извештаје и постављају захтеве, она не може да обезбеди

подаци историјски и преглед информација о компанији као и подаци из различитих ОЛТП система нису интегрисани. Дакле, ова архитектура не може задовољити анализу подаци комплекса као што су прогнозе.

Избор апликација за приступ и опоравак подаци

Сврха изградње а складиште података је преношење информација крајњим корисницима (Инмон ет ал. 1997, Пое 1996, МцФадден 1996, Сханкс ет ал. 1997, Хаммергрен 1998); једну или више апликација за приступ и опоравак подаци мора се обезбедити. До данас постоји велики избор ових апликација од којих корисник може да бира (Хаммергрен 1998, Хумпхриес ет ал. 1999). Апликације које изаберете одређују успех вашег складишног напора подаци у организацији јер су апликације највидљивији део складиште података до крајњег корисника (Инмон ет ал. 1997, Пое 1996). Да бисте били успешни а складиште података, мора бити у стању да подржи активности анализе подаци крајњег корисника (Пое 1996, Седдон и Бењамин 1998, Ецкерсон 1999). Стога „ниво“ онога што крајњи корисник жели мора бити идентификован (Пое 1996, Маттисон 1996, Инмон ет ал. 1997, Хумпхриес ет ал. 1999).

Генерално, крајњи корисници се могу груписати у три категорије: извршни корисници, пословни аналитичари и напредни корисници (Пое 1996, Хумпхриес ет ал. 1999). Извршним корисницима је потребан лак приступ унапред дефинисаним скуповима извештаја (Хумпхриес ет ал. 1999). Овим односима се може лако приступити навигацијом кроз мени (Пое 1996). Поред тога, извештаји треба да представљају информације користећи графички приказ као што су табеле и шаблони за брзо преношење информација (Хумпхриес ет ал. 1999). Пословни аналитичари, који можда немају техничке могућности да сами развијају извештаје од нуле, морају бити у могућности да модификују текуће извештаје како би задовољили своје специфичне потребе (Пое 1996, Хумпхриес ет ал. 1999). Напредни корисници, с друге стране, су тип крајњих корисника који имају могућност да генеришу и пишу захтеве и извештаје од нуле (Пое 1996, Хумпхриес ет ал. 1999). Они су ти који

они развијају извештаје за друге типове корисника (Пое 1996, Хумпхриес ет ал. 1999).

Када се одреде захтеви крајњег корисника, мора се извршити избор апликација за приступ и опоравак подаци међу свим доступним (Пое 1996, Инмон ет ал. 1997).
Приступ подаци и алати за проналажење могу се класификовати у 4 типа: ОЛАП алати, ЕИС/ДСС алати, алати за упите и извештавање и алати за рударење података.

ОЛАП алати омогућавају корисницима да креирају ад хоц упите као и оне направљене на база података дел складиште података. Поред тога, ови производи омогућавају корисницима да анализирају подаци опште до детаљних.

ЕИС/ДСС алати обезбеђују извршно извештавање као што је анализа „шта ако“ и приступ извештајима вођеним менијима. Извештаји треба да буду унапред дефинисани и спојени са менијима ради лакше навигације.
Алати за упите и извештавање омогућавају корисницима да праве унапред дефинисане и специфичне извештаје.

Алати за рударење података се користе за идентификацију односа који би могли бацити ново светло на заборављене операције у подаци складишта података.

Поред оптимизације захтева сваког типа корисника, одабрани алати морају бити интуитивни, ефикасни и лаки за коришћење. Такође треба да буду компатибилни са другим деловима архитектуре и да могу да раде са постојећим системима. Такође се препоручује да одаберете алате за приступ подацима и проналажење са разумним ценама и перформансама. Други критеријуми које треба размотрити укључују посвећеност добављача алата да подржи њихов производ и како ће се он развијати у будућим издањима. Да би се обезбедило ангажовање корисника у коришћењу складишта података, развојни тим укључује кориснике у процес избора алата. У овом случају треба извршити практичну процену корисника.

Да би побољшао вредност складишта података, развојни тим такође може да обезбеди веб приступ свом складишту података. Веб-омогућено складиште података омогућава корисницима да приступе подаци са удаљених места или током путовања. Додатне информације могу

обезбедити по нижим трошковима кроз смањење трошкова обуке.

2.4.3 Складиште података Операциона фаза

Ова фаза се састоји од три активности: дефинисања стратегија освежавања података, контроле активности складишта података и управљања безбедношћу складишта података.

Дефинисање стратегија освежавања података

Након почетног учитавања, тј подаци у база података складишта података морају периодично да се освежавају да би се репродуковале промене које су на њима извршене подаци оригинали. Стога морате одлучити када да освежите, колико често треба да се закаже освежавање и како да освежите податке подаци. Предлаже се да се освежи подаци када се систем може пребацити ван мреже. Учесталост освежавања одређује развојни тим на основу захтева корисника. Постоје два приступа освежавању складишта података: потпуно освежавање и континуирано учитавање промена.

Први приступ, потпуно освежавање, захтева поновно учитавање свих подаци од нуле. То значи да све подаци потребно мора бити екстраховано, очишћено, трансформисано и интегрисано у свако освежавање. Овај приступ треба, колико год је то могуће, избегавати јер захтева много времена и средстава.

Алтернативни приступ је непрекидно учитавање промена. Ово додаје и подаци који су промењени од последњег циклуса освежавања складишта података. Идентификовање нових или измењених записа значајно смањује количину подаци које се морају пропагирати у складиште података у сваком ажурирању јер само ове подаци биће додат у база података складишта података.

Постоји најмање 5 приступа који се могу користити за повлачење и подаци нове или модификоване. Да бисте добили ефикасну стратегију освежавања података подаци мешавина ових приступа која обухвата све промене у систему може бити корисна.

Први приступ, који користи временске ознаке, претпоставља да су сви додељени подаци уредили и ажурирали временску ознаку тако да можете лако да идентификујете све подаци измењени и нови. Овај приступ, међутим, није широко коришћен у већини данашњих оперативних система.
Други приступ је коришћење делта датотеке коју генерише апликација која садржи само промене које су направљене подаци. Коришћење ове датотеке такође појачава циклус ажурирања. Међутим, чак ни овај метод није коришћен у многим апликацијама.
Трећи приступ је скенирање датотеке евиденције, која у основи садржи информације сличне делта датотеци. Једина разлика је у томе што се датотека евиденције креира за процес опоравка и може бити тешко разумљива.
Четврти приступ је измена кода апликације. Међутим, већина кодова апликације је стара и крхка; стога ову технику треба избегавати.
Последњи приступ је упоређивање подаци извори са главним деи фајлом подаци.

Контрола активности складишта података

Једном када је складиште података пуштено корисницима, мора се пратити током времена. У овом случају, администратор складишта података може користити један или више алата за управљање и контролу за праћење коришћења складишта података. Конкретно, могу се прикупљати информације о људима и времену у којем приступају складишту података. Хајде подаци прикупљени, може се креирати профил обављеног посла који се може користити као улаз у имплементацију повраћаја средстава корисника. Поврат средстава омогућава корисницима да буду информисани о трошковима обраде складишта података.

Штавише, ревизија складишта података се такође може користити за идентификацију типова упита, њихове величине, броја упита дневно, времена реакције на упит, достигнутих сектора и количине подаци обрађене. Друга сврха ревизије складишта података је да се идентификују подаци који нису у употреби. Ове подаци могу се уклонити из складишта података ради побољшања времена

одговора на извршење упита и прати раст подаци који бораве у оквиру база података складишта података.

Управљање безбедношћу складишта података

Складиште података садржи подаци интегрисани, критични, осетљиви до којих је лако доћи. Из тог разлога треба га заштитити од неовлашћених корисника. Један од начина за имплементацију безбедности је коришћење функције дел ДБМС да додели различите привилегије различитим типовима корисника. На овај начин мора се одржавати приступни профил за сваки тип корисника. Други начин да обезбедите складиште података је да га шифрујете како је написано у база података складишта података. Приступ подаци а алати за проналажење морају дешифровати подаци пре представљања резултата корисницима.

2.4.4 Складиште података Фаза имплементације

То је последња фаза у циклусу имплементације складишта података. Активности које ће се спровести у овој фази обухватају обуку корисника за коришћење складишта података и вршење прегледа складишта података.

Обука корисника

Обуку корисника треба обавити пре приступа подаци складишта података и коришћење алата за проналажење. Генерално, сесије треба да почну уводом у концепт складиштења подаци, садржај складишта података, мета подаци и основне карактеристике алата. Затим би напреднији корисници такође могли да проучавају физичке табеле и корисничке карактеристике алата за приступ подацима и проналажење.

Постоји много приступа обуци корисника. Један од њих укључује избор великог броја корисника или аналитичара који се бирају из групе корисника, на основу њихових лидерских и комуникацијских вештина. Они су лично обучени о свему што треба да знају да би се упознали са системом. Када се обука заврши, враћају се својим пословима и почињу да подучавају друге кориснике како да користе систем. На

На основу онога што су научили, други корисници могу почети да истражују складиште података.
Други приступ је обучавање више корисника у исто време, као да похађате курс у учионици. Овај метод је погодан када постоји много корисника које треба обучити истовремено. Још један метод је обучавање сваког корисника појединачно, једног по једног. Овај метод је погодан када има мало корисника.

Сврха обуке корисника је да вас упозна са приступом подаци и алати за проналажење као и садржај складишта података. Међутим, неки корисници могу бити преоптерећени количином информација које су дате током сесије обуке. Због тога се мора обавити одређени број сесија за освежавање ради сталне помоћи и одговора на конкретна питања. У неким случајевима се формира корисничка група која пружа ову врсту подршке.

Прикупљање повратних информација

Када се складиште података уведе, корисници могу да користе и подаци који се налазе у складишту података за различите намене. Углавном аналитичари или корисници користе и подаци у складишту података за:

  1. 1 Идентификујте трендове компаније
  2. 2 Анализирајте профиле куповине клијенти
  3. 3 Подели и клијенти и
  4. 4 Пружити најбоље услуге за клијенти – прилагодите услуге
  5. 5 Формулирајте стратегије маркетинг
  6. 6 Обезбедите конкурентне понуде за анализу трошкова и помоћ у контроли
  7. 7 Подржати стратешко доношење одлука
  8. 8 Идентификујте могућности да се истакнете
  9. 9 Побољшати квалитет текућих пословних процеса
  10. 10 Проверите профит

Пратећи правац развоја складишта података, серија прегледа би се могла спровести у систему да би се добила повратна информација

како од развојног тима тако и од заједнице крајњих корисника.
Добијени резултати се могу узети у обзир за следећи развојни циклус.

Пошто складиште података има инкрементални приступ, кључно је учити из успеха и грешака претходних развоја.

2.5 Резиме

У овом поглављу разматрани су приступи присутни у литератури. У одељку 1, разматран је концепт складишта података и његова улога у науци о одлучивању. Одељак 2 описује главне разлике између складишта података и ОЛТП система. У одељку 3 расправљали смо о Монасх моделу складишта података који је коришћен у одељку 4 да опише активности укључене у процес развоја складишта података, ове тезе нису биле засноване на ригорозном истраживању. Оно што се дешава у стварности може бити веома различито од онога што извештава литература, међутим ови резултати се могу користити за стварање основне позадине која подвлачи концепт складишта података за ово истраживање.

Поглавље 3

Методе истраживања и пројектовања

Ово поглавље се бави методама истраживања и дизајна за ову студију. У првом делу дат је генерички приказ истраживачких метода доступних за проналажење информација, даље се разматрају критеријуми за избор најбоље методе за одређену студију. У одељку 2, затим се разматрају две методе изабране са управо изложеним критеријумима; од ових, један ће бити изабран и усвојен са разлозима наведеним у одељку 3 где су такође наведени разлози за искључење другог критеријума. Одељак 4 представља дизајн истраживања, а одељак 5 закључци.

3.1 Истраживање информационих система

Истраживање информационих система није само ограничено на технолошки домен, већ се мора проширити и на бихевиоралне и организационе сврхе.
То дугујемо тезама различитих дисциплина, од друштвених до природних наука; ово доводи до потребе да се за информационе системе користи одређени спектар истраживачких метода које укључују квантитативне и квалитативне методе.
Све доступне истраживачке методе су важне, заправо неколико истраживача као што су Џенкинс (1985), Нунамакер ет ал. (1991) и Галлиерс (1992) тврде да не постоји специфичан универзални метод за спровођење истраживања у различитим областима информационих система; у ствари, метода може бити погодна за одређено истраживање, али не и за друга. Ово нам доводи до потребе да изаберемо методу која је погодна за наш конкретни истраживачки пројекат: за овај избор Бенбасат ет ал. (1987) наводе да се мора узети у обзир природа и сврха истраживања.

3.1.1 Природа истраживања

Различите методе засноване на природи истраживања могу се класификовати у три традиције широко познате у информатичкој науци: позитивистичко, интерпретативно и критичко истраживање.

3.1.1.1 Позитивистичко истраживање

Позитивистичко истраживање је познато и као научна или емпиријска студија. Настоји да: „објасни и предвиди шта ће се догодити у друштвеном свету посматрајући правилности и узрочно-последичне везе између елемената који га чине” (Сханкс ет ал 1993).

Позитивистичка истраживања карактеришу и поновљивост, поједностављења и оповргавања. Штавише, позитивистичка истраживања признају постојање априорних односа између проучаваних појава.
Према Галлиерсу (1992) таксономија је истраживачка метода укључена у позитивистичку парадигму, која међутим није ограничена на ово, у ствари постоје лабораторијски експерименти, теренски експерименти, студије случаја, демонстрације теорема, предвиђања и симулације. Користећи ове методе, истраживачи признају да се проучавани феномени могу посматрати објективно и ригорозно.

3.1.1.2 Интерпретативно истраживање

Интерпретативно истраживање, које се често назива феноменологијом или антипозитивизмом, Неуман (1994) описује као „систематску анализу друштвеног значења акције кроз директно и детаљно посматрање људи у природним ситуацијама, како би се дошло до разумевања и на тумачење како људи стварају и одржавају свој друштвени свет.” Интерпретативне студије одбацују претпоставку да се посматрани феномени могу посматрати објективно. У ствари, они су засновани на субјективним тумачењима. Штавише, интерпретативни истраживачи не намећу априорна значења појавама које проучавају.

Овај метод укључује субјективне/аргументативне студије, акционо истраживање, дескриптивне/интерпретативне студије, будућа истраживања и играње улога. Поред ових анкета и студија случаја могу се укључити у овај приступ јер се тичу студија појединаца или организација у сложеним ситуацијама у стварном свету.

3.1.1.3 Критичко истраживање

Критичко испитивање је најмање познат приступ у друштвеним наукама, али је недавно добио пажњу истраживача информационих система. Филозофска претпоставка да друштвену стварност историјски производе и репродукују људи, као и друштвени системи својим акцијама и интеракцијама. Њихова способност је, међутим, посредована бројним друштвеним, културним и политичким разматрањима.

Као и интерпретативно истраживање, критичко истраживање тврди да позитивистичко истраживање нема никакве везе са друштвеним контекстом и игнорише његов утицај на људске поступке.
Критичко истраживање, с друге стране, критикује интерпретативно истраживање да је превише субјективно и да нема за циљ да помогне људима да побољшају своје животе. Највећа разлика између критичког истраживања и друга два приступа је његова евалуативна димензија. Док је објективност позитивистичке и интерпретативне традиције предвиђање или објашњење статуса куо или друштвене стварности, критичко истраживање има за циљ да критички процени и трансформише друштвену стварност која се проучава.

Критички истраживачи се обично супротстављају статусу куо како би уклонили друштвене разлике и побољшали друштвене услове. Критичко истраживање је посвећено процесном погледу на феномене од интереса и стога је нормално лонгитудинално. Примери истраживачких метода су дугорочне историјске студије и етнографске студије. Критичко истраживање, међутим, није било широко коришћено у истраживању информационих система

3.1.2 Сврха истраживања

Заједно са природом истраживања, његова сврха се може користити за усмеравање истраживача у избору одређене истраживачке методе. Сврха истраживачког пројекта је уско повезана са позицијом истраживања у односу на истраживачки циклус који се састоји од три фазе: изградња теорије, тестирање теорије и усавршавање теорије. Дакле, на основу времена истраживачког циклуса, истраживачки пројекат може имати експланаторну, дескриптивну, истраживачку или предиктивну сврху.

3.1.2.1 Истраживачка истраживања

Истраживачко истраживање има за циљ да истражи потпуно нову тему и формулише питања и хипотезе за будућа истраживања. Ова врста истраживања се користи у изградњи теорије да би се добиле иницијалне референце у новој области. Обично се користе квалитативне методе истраживања, као што су студије случаја или феноменолошке студије.

Међутим, могуће је користити и квантитативне технике као што су истраживачка истраживања или експерименти.

3.1.3.3 Дескриптивно истраживање

Дескриптивно истраживање има за циљ да анализира и детаљно опише одређену организациону ситуацију или праксу. Ово је прикладно за изградњу теорија и такође се може користити за потврђивање или оспоравање хипотеза. Дескриптивно истраживање обично укључује употребу мера и узорака. Најпогодније методе истраживања укључују анкете и анализу претходника.

3.1.2.3 Експланаторно истраживање

Експланаторно истраживање покушава да објасни зашто се ствари дешавају. Изграђен је на чињеницама које су већ проучаване и покушава да пронађе разлоге за ове чињенице.
Стога се експланаторно истраживање обично гради на истраживачком или дескриптивном истраживању и помоћно је тестирању и усавршавању теорија. Експланаторно истраживање обично користи студије случаја или истраживачке методе засноване на анкетама.

3.1.2.4 Превентивно истраживање

Превентивно истраживање има за циљ да предвиди догађаје и понашања која се посматрају која се проучавају (Марсхалл и Россман 1995). Предвиђање је стандардни научни тест истине. Ова врста истраживања углавном користи анкете или анализу подаци историчари. (Јин 1989)

Горња дискусија показује да постоји низ могућих истраживачких метода које се могу користити у одређеној студији. Међутим, мора постојати једна специфична метода која је погоднија од осталих за одређену врсту истраживачког пројекта. (Галлиерс 1987, Јин 1989, Де Ваус 1991). Сваки истраживач, стога, треба пажљиво да процени снаге и слабости различитих метода, како би усвојио најприкладнији и компатибилан истраживачки метод са истраживачким пројектом. (Јенкинс 1985, Перван и Класс 1992, Бономиа 1985, Јин 1989, Химилтон и Ивес 1992).

3.2. Могуће методе истраживања

Циљ овог пројекта је био проучавање искуства у аустралијским организацијама са и подаци похрањене са развојем од складиште података. Дата да тренутно постоји недостатак истраживања у области складиштења података у Аустралији, овај истраживачки пројекат је још увек у теоријској фази истраживачког циклуса и има истраживачку сврху. Истраживање искуства аустралијских организација које усвајају складиштење података захтева тумачење стварног друштва. Сходно томе, филозофска претпоставка која лежи у основи истраживачког пројекта следи традиционално тумачење.

Након ригорозног испитивања доступних метода, идентификоване су две могуће истраживачке методе: анкете и студије случаја, које се могу користити за истраживачко истраживање (Сханкс ет ал. 1993). Галлиерс (1992) у својој ревидираној таксономији тврди да су ове две методе погодне за ову конкретну студију говорећи да су погодне за изградњу теорије. Следећа два пододељка детаљно разматрају сваки метод.

3.2.1 Метода истраживања анкете

Метод истраживања анкете потиче од древне методе пописа. Попис се састоји од прикупљања информација од целокупне популације. Ова метода је скупа и непрактична, посебно ако је популација велика. Дакле, у поређењу са пописом, истраживање се обично фокусира на прикупљање информација за мали број, или узорак, представника становништва (Фовлер 1988, Неуман 1994). Узорак одражава популацију из које је извучен, са различитим нивоима тачности, у зависности од структуре узорка, величине и метода селекције који се користи (Фовлер 1988, Баббие 1982, Неуман 1994).

Метод истраживања се дефинише као „снимци пракси, ситуација или погледа у одређеном тренутку, направљени коришћењем упитника или интервјуа, из којих се могу закључити
направљено” (Галлиерс 1992:153) [снимак пракси, ситуација или погледа у одређеном тренутку, направљен коришћењем упитника или интервјуа, из којих се могу извести закључци]. Анкете се баве прикупљањем информација о неком аспекту студије, од одређеног броја учесника, постављањем питања (Фовлер 1988). Ови упитници и интервјуи, који укључују телефонске интервјуе лицем у лице и структуриране, такође су технике прикупљања подаци који се најчешће користе у истраживањима (Блалоцк 1970, Нацхмиас анд Нацхмиас 1976, Фовлер 1988), могу се користити запажања и анализе (Габле 1994). Од свих ових метода прикупљања подаци, употреба упитника је најпопуларнија техника, јер обезбеђује да и подаци

прикупљени су структурирани и форматирани и стога олакшавају класификацију информација (Хванг 1987, де Ваус 1991).

Приликом анализе и подаци, стратегија истраживања често користи квантитативне технике, као што је статистичка анализа, али се могу користити и квалитативне технике (Галлиерс 1992, Перван

и Класс 1992, Габле 1994). Нормално, тј подаци прикупљени се користе за анализу дистрибуција и образаца асоцијација (Фовлер 1988).

Иако су анкете генерално прикладне за истраживања која се баве питањем 'шта?' (шта) или произилазећи из тога, као што су 'колико' и 'колико', могу се поставити питањем 'зашто' (Сонкуист и Дункелберг 1977, Иин 1989). Према Сонкуисту и Дункелбергу (1977), истраживање истраживања има за циљ оспоравање хипотеза, евалуацију програма, описивање популације и развој модела људског понашања. Штавише, анкете се могу користити за проучавање мишљења одређене популације, стања, мишљења, карактеристика, очекивања, па чак и прошлих или садашњих понашања (Неуман 1994).

Анкете омогућавају истраживачу да открије односе међу популацијом и резултати су обично општији од других метода (Сонкуист и Дункелберг 1977, Габле 1994). Истраживања омогућавају истраживачима да покрију веће географско подручје и допру до многих испитаника (Блалоцк 1970, Сонкуист и Дункелберг 1977, Хванг и Лин 1987, Габле 1994, Неуман 1994). Коначно, анкете могу пружити информације које нису доступне на другом месту или у форми потребној за анализе (Фовлер 1988).

Међутим, постоје нека ограничења у спровођењу анкете. Недостатак је што истраживач не може добити много информација о предмету који се проучава. Ово је због чињенице да се истраживања спроводе само у одређено време и да, стога, постоји ограничен број варијабли и људи које истраживач може

студија (Иин 1989, де Ваус 1991, Габле 1994, Денсцомбе 1998). Још један недостатак је то што спровођење анкете може бити веома скупо у смислу времена и ресурса, посебно ако укључује интервјуе лицем у лице (Фовлер 1988).

3.2.2. Метод истраживања упита

Метод истраживања истраживања укључује дубинско проучавање одређене ситуације у њеном стварном контексту током дефинисаног временског периода, без икакве интервенције од стране истраживача (Сханкс & Ц. 1993, Еисенхардт 1989, Јенкинс 1985). Овај метод се углавном користи за описивање односа између варијабли које се проучавају у одређеној ситуацији (Галлиерс 1992). Истраге могу укључити један или више случајева, у зависности од анализираног феномена (Франз и Робеи 1987, Еисенхардт 1989, Иин 1989).

Метод истраживања истраживања је дефинисан као „емпиријско истраживање које проучава савремени феномен у његовом стварном контексту, користећи више извора прикупљених од једног или више ентитета као што су људи, групе или организације” (Иин 1989). Не постоји јасно раздвајање између феномена и његовог контекста и не постоји експериментална контрола или манипулација варијаблама (Иин 1989, Бенбасат ет ал. 1987).

Постоји низ техника за сакупљање подаци који се могу користити у методи истраживања, што укључује директна запажања, прегледе архивских записа, упитнике, преглед документације и структуриране интервјуе. Имати разнолику палету техника жетве подаци, истраживања омогућавају истраживачима да се баве и једним и другим подаци квалитативно и квантитативно у исто време (Бонома 1985, Еисенхардт 1989, Јин 1989, Габле 1994). Као што је случај са методом анкете, истраживач анкете служи као посматрач или истраживач, а не као активни учесник у организацији која се проучава.

Бенбасат и сарадници (1987) тврде да је метода истраживања посебно погодна за изградњу теорије истраживања, која почиње истраживачким питањем и наставља се образовањем.

теорије током процеса прикупљања подаци. Бити погодан и за сцену

изградње теорије, Франз и Робеи (1987) сугеришу да се метода истраживања може користити и за фазу сложене теорије. У овом случају, на основу прикупљених доказа, дата теорија или хипотеза се проверава или оповргава. Поред тога, анкета је такође погодна за истраживање које се бави питањима „како“ или „зашто“ (Иин 1989).

У поређењу са другим методама, анкете омогућавају истраживачу да сакупи битне информације детаљније (Галлиерс 1992, Сханкс ет ал. 1993). Штавише, анкете омогућавају истраживачу да разуме природу и сложеност проучаваних процеса (Бенбасат ет ал. 1987).

Постоје четири главна недостатка повезана са методом анкете. Први је недостатак контролисаних одбитака. Субјективност истраживача може да промени резултате и закључке студије (Јин 1989). Други недостатак је недостатак контролисаног посматрања. За разлику од експерименталних метода, истраживач истраживања не може да контролише проучаване феномене док се они испитују у њиховом природном контексту (Габле 1994). Трећи недостатак је недостатак репликације. То је зато што је мало вероватно да ће истраживач посматрати исте догађаје и не може да потврди резултате одређене студије (Лее 1989). Коначно, као последица непоновљивости, тешко је генерализовати резултате добијене из једног или више истраживања (Галлиерс 1992, Сханкс ет ал 1993). Сви ови проблеми, међутим, нису непремостиви и истраживач их, у ствари, може минимизирати применом одговарајућих акција (Лее 1989).

3.3. Образложите методологију истраживања усвојени

Од две могуће методе истраживања за ову студију, анкетни метод се сматра најпогоднијим. Истрага је одбачена након пажљивог разматрања релевантних

заслуге и слабости. О прикладности или неприкладности сваке методе за ову студију се говори у наставку.

3.3.1. Неприкладност методе истраживања истраге

Метод истраживања захтева дубинско проучавање одређене ситуације унутар једне или више организација током одређеног временског периода (Еисенхардт 1989). У овом случају, период може премашити временски оквир који је дат за ову студију. Други разлог зашто се метод анкетирања не прихвата је тај што резултати могу патити због недостатка строгости (Иин 1989). Субјективност истраживача може утицати на резултате и закључке. Други разлог је тај што је ова метода погоднија за истраживање питања типа 'како' или 'зашто' (Јин 1989), док је истраживачко питање за ову студију типа 'шта'. На крају, али не и најмање важно, тешко је генерализовати налазе из само једног или неколико истраживања (Галлиерс 1992, Сханкс ет ал. 1993). На основу овог образложења, метод истраживања анкете није изабран јер је био неприкладан за ову студију.

3.3.2. Погодност метода претраживања истрага

Када је ово истраживање спроведено, пракса складиштења података није била широко прихваћена од стране аустралијских организација. Дакле, није било много информација о њиховој имплементацији унутар аустралијских организација. Доступне информације су дошле од организација које су имплементирале или користиле а складиште података. У овом случају, метод анкетног истраживања је најпогоднији јер омогућава добијање информација које нису доступне другде или у форми потребној за анализу (Фовлер 1988). Поред тога, метод истраживања анкете омогућава истраживачу да стекне добар увид у праксу, ситуације или погледе у одређеном тренутку (Галлиерс 1992, Денсцомбе 1998). Потребан је преглед да би се повећало знање о искуству аустралијског складиштења података.

Надаље, Сонкуист и Дункелберг (1977) наводе да су резултати анкетног истраживања општији од других метода.

3.4. Дизајн истраживања истраживања

Истраживање о праксама складиштења података спроведено је 1999. године. Циљну популацију формирале су аустралијске организације заинтересоване за студије о складиштењу података, пошто су вероватно већ биле обавештене о подаци које чувају и стога могу пружити корисне информације за ову студију. Циљна популација је идентификована кроз иницијалну анкету свих аустралијских чланова Тхе Дата Варехоусинг Институте (Тдви-аап). Овај одељак говори о дизајну фазе емпиријског истраживања ове студије.

3.4.1. Техника жетве подаци

Од три технике које се обично користе у истраживању анкета (тј. упитник путем поште, телефонски интервју и лични интервју) (Нацхмиас 1976, Фовлер 1988, де Ваус 1991), за ову студију је усвојен упитник путем поште. Први разлог за усвајање последњег је тај што може да досегне географски распршену популацију (Блалоцк 1970, Нацхмиас анд Нацхмиас 1976, Хванг и Лин 1987, де Ваус 1991, Габле 1994). Друго, упитник путем поште је погодан за високообразоване учеснике (Фовлер 1988). Упитник поштом за ову студију био је упућен спонзорима пројекта складиштења података, директорима и/или менаџерима пројекта. Треће, упитници за пошту су прикладни када је доступна безбедна листа за слање (Салант и Дилман 1994). ТДВИ, у овом случају, удружење за складиштење података од поверења је обезбедило мејлинг листу својих аустралијских чланова. Још једна предност упитника путем поште у односу на телефонски упитник или личне интервјуе је та што омогућава испитаницима да тачније одговоре, посебно када испитаници морају да консултују белешке или разговарају о питањима са другим људима (Фовлер 1988).

Потенцијални недостатак може бити време потребно за спровођење упитника поштом. Обично се анкета путем поште спроводи овим редоследом: слање писама, чекање одговора и слање потврде (Фовлер 1988, Баинбридге 1989). Дакле, укупно време може бити дуже од времена потребног за личне интервјуе или телефонске интервјуе. Међутим, укупно време може бити познато унапред (Фовлер 1988, Денсцомбе 1998). Време проведено у вођењу личних интервјуа не може се унапред знати јер варира од интервјуа до интервјуа (Фовлер 1988). Телефонски интервјуи могу бити бржи од упитника путем поште и личних интервјуа, али могу имати високу стопу неодговора због недоступности неких људи (Фовлер 1988). Поред тога, телефонски интервјуи су генерално ограничени на релативно кратке листе питања (Баинбридге 1989).

Још једна слабост упитника путем поште је висока стопа неодговора (Фовлер 1988, Баинбридге 1989, Неуман 1994). Међутим, предузете су контрамере повезивањем ове студије са поузданом институцијом за складиштење података (тј. ТДВИ) (Баинбридге 1989, Неуман 1994), која шаље два писма подсетника онима који нису одговорили (Фовлер 1988, Неуман 1994) и такође укључује додатно писмо објашњавајући сврху студије (Неуман 1994).

3.4.2. Јединица анализе

Сврха ове студије је да добије информације о имплементацији складиштења података и његовој употреби у оквиру аустралијских организација. Циљну популацију чине све аустралијске организације које су имплементирале, или спроводе, тј складиште података. Појединачне организације се тада региструју на име. Упитник је послат поштом организацијама заинтересованим за усвајање складиште података. Овај метод осигурава да прикупљене информације потичу из најприкладнијих ресурса сваке организације која учествује.

3.4.3. Узорак анкете

„Мејлинг листа“ учесника анкете добијена је од ТДВИ. Са ове листе, 3000 аустралијских организација одабрано је као основа за узорковање. Узорку је послато додатно писмо у коме се објашњава пројекат и сврха анкете, заједно са листом за одговоре и унапред плаћеном ковертом за враћање попуњеног упитника. Од 3000 организација, 198 је пристало да учествује у студији. Очекивао се тако мали број одговора дато велики број аустралијских организација које су тада прихватиле или су прихватале стратегију складиштења података у оквиру својих организација. Дакле, циљну популацију за ову студију чини само 198 организација.

3.4.4. Садржај упитника

Структура упитника била је заснована на Монасх моделу складиштења података (о коме је већ било речи у делу 2.3). Садржај упитника заснован је на анализи литературе представљеној у поглављу 2. Примерак упитника који је послат учесницима истраживања налази се у Додатку Б. Упитник се састоји од шест делова, који прате фазе обухваћеног модела. Следећих шест пасуса укратко сумира садржај сваког одељка.

Одељак А: Основне информације о организацији
Овај одељак садржи питања која се односе на профил организација које учествују. Поред тога, нека од питања се односе на статус учесника у пројекту складиштења података. Поверљиве информације као што је назив организације нису откривене у анализи анкете.

Одељак Б: Почетак
Питања у овом одељку се односе на задатак покретања складиштења података. Постављена су питања у вези са иницијаторима пројекта, гарантима, потребним вештинама и знањима, циљевима развоја складишта података и очекивањима крајњих корисника.

Одељак Ц: Дизајн
Овај одељак садржи питања везана за активности планирања складиште података. Посебно су се постављала питања о обиму извршења, трајању пројекта, цени пројекта и анализи трошкова и користи.

Одељак Д: Развој
У одељку о развоју налазе се питања која се односе на развојне активности складиште података: збирка захтева крајњих корисника, извори подаци, логички модел подаци, прототипови, планирање капацитета, техничке архитектуре и избор алата за развој складишта података.

Одељак Е: Операција
Оперативна питања везана за рад и проширивост складиште података, како се развија у следећој фази развоја. тамо квалитета података, стратегије освежавања подаци, грануларност подаци, скалабилност од складиште података и безбедносна питања складиште података били међу врстама постављених питања.

Одељак Ф: Развој
Овај одељак садржи питања у вези са коришћењем складиште података од стране крајњих корисника. Истраживача је занимала сврха и корисност складиште података, усвојене стратегије прегледа и обуке и стратегија контроле складиште података усвојено.

3.4.5. Стопа Одговора

Иако су анкете путем поште критиковане због ниске стопе одговора, предузете су мере за повећање стопе повратка (као што је претходно објашњено у делу 3.4.1). Термин 'стопа одговора' се односи на проценат људи у одређеном узорку истраживања који одговарају на упитник (Денсцомбе 1998). За израчунавање стопе одговора за ову студију коришћена је следећа формула:

Број људи који су одговорили
Стопа одговора = —————————————————————————— Кс 100 Укупан број послатих упитника

3.4.6. Тест-пилот

Пре него што је упитник послат узорку, питања су испитана извођењем пилот тестова, како су предложили Луцк и Рубин (1987), Јацксон (1988) и де Ваус (1991). Сврха пилот тестова је да открију све незгодне, двосмислене изразе и питања која је тешко протумачити, да разјасне све коришћене дефиниције и термине и да идентификују приближно време потребно за попуњавање упитника (Варвицк и Линингер 1975, Јацксон 1988, Салант и Дилман 1994). Пилот тестови су спроведени одабиром субјеката са карактеристикама сличним онима завршних субјеката, како је предложио Давис е. Козенца (1993). У овој студији, шест стручњака за складиштење података одабрано је као пилот субјект. Након сваког пилот тестирања, вршене су неопходне корекције. Из спроведених пилот тестова, учесници су допринели преобликовању и ресетовању коначне верзије упитника.

3.4.7. Методе анализе Би Дати

I подаци анкете прикупљене из затворених упитника анализиране су помоћу статистичког програмског пакета под називом СПСС. Многи одговори су анализирани коришћењем дескриптивне статистике. Један број упитника је враћен непотпун. Они су третирани са већом пажњом како би се осигурало да и подаци нису били последица грешака у уносу података, већ зато што питања нису била прикладна за регистранта, или је регистрант одлучио да не одговори на једно или више конкретних питања. Ови недостајући одговори су игнорисани током анализе подаци и били су кодирани као '- 9' како би се осигурало њихово искључење из процеса анализе.

Приликом припреме упитника, затворена питања су унапред кодирана додељивањем броја свакој опцији. Број је затим коришћен за припрему подаци током анализе (Денсцомбе 1998, Сапсфорд и Јупп 1996). На пример, било је шест опција наведених у питању 1 одељка Б: управни одбор, виши извршни директор, ИТ одељење, пословна јединица, консултанти и остало. У досијеу од подаци СПСС-а, генерисана је променљива која означава 'иницијатора пројекта', са шест ознака вредности: '1' за 'борд директора', '2' за 'виши извршни директор' и тако даље. Употреба Ликертинове скале у неким од затворених питања такође је омогућила идентификацију без напора с обзиром на употребу одговарајућих нумеричких вредности унетих у СПСС. За питања са неисцрпним одговорима, који се међусобно не искључују, свака опција је третирана као једна варијабла са две ознаке вредности: '1' за 'означено' и '2' за 'неозначено'.

Отворена питања су третирана другачије од затворених питања. Одговори на ова питања нису унети у СПСС. Уместо тога, анализирани су ручно. Употреба ове врсте питања нам омогућава да добијемо информације о слободно израженим идејама и личним искуствима испитаника (Баинбридге 1989, Денсцомбе 1998). Тамо где је било могуће, извршена је категоризација одговора.

За анализу подаци, користе се једноставне методе статистичке анализе, као што су фреквенција одговора, средња вредност, стандардна девијација и медијана (Аргироус 1996, Денсцомбе 1998).
Гама тест је био добар за добијање квантитативних мера веза између подаци редни бројеви (Норусис 1983, Аргироус 1996). Ови тестови су били одговарајући јер коришћене редне скале нису имале много категорија и могле су бити приказане у табели (Норусис 1983).

3.5 Соммарио

У овом поглављу разматрана је методологија истраживања и дизајн који је усвојен за ову студију.

Одабир најприкладнијег истраживачког метода за одређену студију узима у обзир
разматрање низа правила, укључујући природу и врсту истраживања, као и предности и слабости сваког могућег метода (Јенкинс 1985, Бенбасат ет ал. 1097, Галлиерс анд Ланд 1987, иин 1989, Хамилтон и Ивес 1992, Галлиерс 1992, Неуман 1994). С обзиром на недостатак постојећег знања и теорије у вези са усвајањем складишта података у Аустралији, ова истраживачка студија захтева интерпретативни метод истраживања са истраживачком способношћу да се истраже искуства аустралијских организација. Одабрани метод истраживања је одабран да прикупи информације у вези са усвајањем концепта складиштења података од стране аустралијских организација. Као техника прикупљања изабран је поштански упитник подаци. Оправдања методе истраживања и технике прикупљања подаци одабрани ће бити наведени у овом поглављу. Надаље, презентована је дискусија о јединици анализе, коришћеном узорку, процентима одговора, садржају упитника, преттестирању упитника и методу анализе упитника. подаци.

Дизајн а Складиште података:

Комбиновање односа ентитета и димензионалног моделирања

АПСТРАКТ
Чување и подаци је главно актуелно питање за многе организације. Кључно питање у развоју рачунарске меморије подаци то је његов дизајн.
Дизајн мора да подржава откривање концепата у складиште података на наслеђени систем и друге изворе подаци а такође и лако разумевање и ефикасност у имплементацији складиште података.
Велики део литературе о складиштењу подаци препоручује употребу моделирања односа ентитета или димензионалног моделирања за представљање дизајна складиште података.
У овом раду показујемо како се оба приказа могу комбиновати у једном приступу цртању складиште података. Приступ који се користи је систематичан

испитан у студији случаја и идентификован је у низу важних импликација са практичарима.

СКЛАДИШТЕЊЕ ПОДАТАКА

Un складиште података обично се дефинише као „предметно оријентисана, интегрисана, временски променљива и непроменљива колекција података као подршка одлукама менаџмента“ (Инмон и Хацкатхорн, 1994). Предметно оријентисано и интегрисано указује да се складиште података је дизајниран да пређе функционалне границе Легаци система како би понудио интегрисану перспективу подаци.
Временска варијанта утиче на историјску природу или природу временске серије подаци у а складиште података, што омогућава анализу трендова. Непроменљиво означава да је складиште података не ажурира се континуирано као а база података оф ОЛТП. Уместо тога, периодично се ажурира, са подаци који долазе из унутрашњих и екстерних извора. Тхе складиште података посебно је дизајниран за претрагу, а не за ажурирање интегритета и перформанси рада.
Идеја о чувању и подаци није ново, то је била једна од сврха управљања подаци од шездесетих година (Тхе Мартин, 1982).
I складиште података нуде инфраструктуру подаци за системе подршке менаџменту. Системи за подршку менаџменту обухватају системе за подршку одлучивању (ДСС) и извршне информационе системе (ЕИС). ДСС је компјутерски заснован информациони систем који је дизајниран да побољша људско доношење одлука. ЕИС је типично систем испоруке подаци што омогућава пословним лидерима да лако приступе погледу на подаци.
Општа архитектура а складиште података истиче улогу складиште података у подршци менаџменту. Као и нуђење инфраструктуре подаци за ЕИС и ДСС, ал складиште података може се приступити директно путем упита. ТХЕ подаци укључено у а складиште података заснивају се на анализи захтева за информације о менаџменту и добијају се из три извора: интерних система наслеђа, система за прикупљање података посебне намене и екстерних извора података. ТХЕ подаци у интерним застарелим системима они су често сувишни, недоследни, лошег квалитета и ускладиштени у различитим форматима, тако да морају да буду усаглашени и очишћени пре него што се могу учитати у

складиште података (Инмон, 1992; МцФадден, 1996). ТХЕ подаци који долазе из система за складиштење подаци ад хоц и из извора подаци екстерни се често користе за повећање (ажурирање, замену) и подаци из застарелих система.

Постоји много убедљивих разлога за развој а складиште података, који укључују побољшано доношење одлука кроз ефективну употребу више информација (Ивес 1995), подршку за фокусирање на читаве послове (Грахам 1996) и смањење подаци за ЕИС и ДСС (Грахам 1996, МцФадден 1996).

Недавна емпиријска студија је показала, у просеку, повраћај улагања за складиште података за 401% након три године (Грахам, 1996). Међутим, друге емпиријске студије о складиште података открили значајне проблеме укључујући потешкоће у мерењу и додељивању бенефиција, недостатак јасне сврхе, потцењивање сврхе и сложеност процеса чувања бенефиција подаци, посебно у погледу извора и чистоће подаци. Чување и подаци може се сматрати решењем проблема управљања подаци између организација. Манипулација са подаци као друштвени ресурс остаје један од кључних проблема у управљању информационим системима широм света дуги низ година (Бранцхеау ет ал. 1996, Галлиерс ет ал. 1994, Ниедерман ет ал. 1990, Перван 1993).

Популаран приступ управљању подаци осамдесетих је то био развој модела подаци друштвеним. Модел подаци социал је дизајниран да понуди стабилну основу за развој нових апликативних система и база података и реконструкција и интеграција наслијеђених система (Бранцхеау ет ал.

1989, Гоодхуе ет ал. 1988:1992, Ким и Еверест 1994). Међутим, постоје многи проблеми са овим приступом, посебно сложеност и цена сваког задатка, као и дуго време потребно за постизање опипљивих резултата (Беинон-Давиес 1994, Еарл 1993, Гоодхуе ет ал. 1992, Периасами 1994, Сханкс 1997 ).

Il складиште података то је засебна база података која коегзистира са старим базама података уместо да их замењује. Стога вам омогућава да усмеравате управљање подаци и избегавају скупу реконструкцију застарелих система.

ПОСТОЈЕЋИ ПРИСТУПИ ДИЗАЈНУ ПОДАТАКА

ВАРЕХОУСЕ

Процес изградње и усавршавања а складиште података треба га схватити више као еволутивни процес, а не као развојни животни циклус традиционалних система (Десио, 1995, Сханкс, О'Доннелл и Арнотт 1997а). Постоји много процеса укључених у пројекат складиште података као што су иницијализација, планирање; информације добијене из захтева тражених од менаџера предузећа; извори, трансформације, чишћење подаци и синхронизацију са застарелих система и других извора подаци; системи испоруке у развоју; праћење складиште података; и бесмисленост еволутивног процеса и конструкције а складиште података (Стинцхи, О'Доннелл анд Арнотт 1997б). У овом часопису фокусирамо се на то како нацртати подаци похрањене у контексту ових других процеса. Постоји велики број предложених приступа архитектури складиште података у књижевности (Инмон 1994, Ивес 1995, Кимбалл 1994 МцФадден 1996). Свака од ових методологија има кратак преглед са анализом њихових снага и слабости.

Инмонов (1994) приступ за Складиште података Дизајн

Инмон (1994) је предложио четири итеративна корака за дизајн а складиште података (види слику 2). Први корак је дизајнирање шаблона подаци друштвени да разуме како ја подаци могу се интегрисати у функционалне области унутар организације поделом подаци складиште у областима. Модел подаци направљен је за складиштење подаци који се односе на доношење одлука, укључујући подаци историчари, а међу њима подаци одузети и агрегирани. Други корак је да се идентификују предметне области за имплементацију. Они се заснивају на приоритетима које одреди одређена организација. Трећи корак укључује цртање а база података за предметну област, обратите посебну пажњу на укључивање одговарајућих нивоа грануларности. Инмон препоручује коришћење модела ентитета и односа. Четврти корак је идентификација изворних система подаци захтевају и развијају процесе трансформације за снимање, чишћење и форматирање и подаци.

Предности Инмоновог приступа су у томе што модел подаци друштвени пружа основу за интеграцију подаци у оквиру организације и планирања подршке за итеративни развој од складиште података. Његове мане су потешкоћа и цена у дизајнирању модела подаци друштвени, тешкоћа у разумевању модела ентитета и односа који се користе у оба модела, то подаци друштвених и то од подаци ускладиштене по предметној области и прикладност подаци оф тхе дравинг оф складиште података за реализацију база података релациони али не и за база података вишедимензионални.

Ивесов (1995) приступ Складиште података Дизајн

Ивес (1995) предлаже приступ у четири корака дизајнирању информационог система за који верује да је применљив на дизајн складиште података (види слику 3). Приступ је у великој мери заснован на информационом инжењерингу за развој информационих система (Мартин 1990). Први корак је одређивање циљева, критичних фактора и фактора успеха и кључних индикатора учинка. Кључни пословни процеси и потребне информације су моделиране да нас доведу до модела подаци друштвеним. Други корак укључује развој дефинисане архитектуре подаци ускладиштена по областима, база података di складиште података, технолошке компоненте које су потребне, скуп организационе подршке потребне за имплементацију и рад складиште података. Трећи корак укључује одабир потребних софтверских пакета и алата. Четврти корак је детаљно пројектовање и изградња складиште података. Ајвс примећује да чување подаци то је ограничен итеративни процес.

Предности Ивес приступа су употреба специфичних техника за одређивање захтева за информацијама, употреба структурираног процеса који подржава интеграцију складиште података, избор одговарајућег хардвера и софтвера и коришћење више техника представљања за складиште података. Његове мане су инхерентне сложености. Други укључују потешкоће у развоју многих нивоа база података унутар складиште података у разумним роковима и трошковима.

Кимбаллов (1994) приступ Складиште података Дизајн

Кимбалл (1994) је предложио пет итеративних корака за дизајнирање а складиште података (види слике 4). Његов приступ је посебно посвећен дизајну соло складиште података и о коришћењу димензионалних модела у односу на моделе ентитета и односа. Кимбалл анализира те димензионалне моделе јер је пословним лидерима лакше да разумеју пословање, ефикасније је када се баве сложеним консултацијама и дизајном база података физички је ефикаснији (Кимбалл 1994). Кимбалл препознаје да је развој а складиште података то је итеративно, и то складиште података одвојене табеле се могу интегрисати тако што ће се поделити на табеле заједничких димензија.

Први корак је да се идентификује одређена предметна област коју треба усавршити. Други и трећи корак се тичу димензионалног моделирања. У другом кораку мере идентификују ствари од интереса у предметној области и групишу их у табелу чињеница. На пример, у области која се бави продајом, мере интереса могу укључити количину продатих артикала и долар као валуту продаје. Трећи корак укључује идентификацију димензија које су начини на које се чињенице могу груписати. У области продајног предмета, релевантне димензије могу укључивати ставку, локацију и временски период. Табела чињеница има вишеделни кључ за повезивање са сваком од табела димензија и обично садржи веома велики број чињеница. Насупрот томе, табеле димензија садрже описне информације о димензијама и другим атрибутима који се могу користити за груписање чињеница. Повезана предложена табела чињеница и димензија формира оно што се назива шема звезда због свог облика. Четврти корак укључује изградњу а база података вишедимензионални да бисте усавршили узорак звезда. Последњи корак је идентификација изворних система подаци захтевају и развијају процесе трансформације за снимање, чишћење и форматирање и подаци.

Предности Кимбалловог приступа укључују употребу димензионалних модела за представљање подаци ускладиштено што га чини лаким за разумевање и доводи до ефикасног физичког дизајна. Димензионални модел који такође лако користи оба система база података релациони могу бити усавршени или системи база података вишедимензионални. Његове мане укључују недостатак неких техника које би олакшале планирање или интеграцију многих звезданих образаца унутар а складиште података и тешкоћа пројектовања од екстремно денормализоване структуре у димензионални модел а подаци у систему наслеђа.

МцФадден-ов (1996) приступ подацима Дизајн складишта

МцФадден (1996) предлаже приступ у пет корака дизајнирању а складиште података (види слику 5).
Његов приступ је заснован на синтези идеја из литературе и фокусиран је на дизајн сингла складиште података. Први корак укључује анализу захтева. Иако техничке спецификације нису прописане, Мекфеденове белешке идентификују ентитете подаци спецификације и њихове атрибуте, и односи се на читаоце Ватсон и Фролицк (1993) за хватање захтева.
У другом кораку, дизајниран је модел односа ентитета складиште података а затим потврдили пословни лидери. Трећи корак укључује одређивање мапирања из старих система и екстерних извора складиште података. Четврти корак укључује процесе у развоју, имплементацији и синхронизацији подаци у складиште података. У последњем кораку развија се испорука система са посебним нагласком на корисничком интерфејсу. МцФадден напомиње да је процес цртања генерално итеративан.

Снаге МцФадденовог приступа указују на учешће пословних лидера у одређивању захтева, као и на важност ресурса подаци, њихово чишћење и сакупљање. Његове мане укључују недостатак процеса за разбијање великог пројекта складиште података у многим интегрисаним фазама, и

потешкоће у разумевању ентитета и модела односа који се користе у дизајну складиште података.

Не бирају нас само они који су нам блиски.

    0/5 (0 рецензија)
    0/5 (0 рецензија)
    0/5 (0 рецензија)

    Сазнајте више од Онлине веб агенције

    Претплатите се да примате најновије чланке путем е-поште.

    аутор аватар
    Администратор Direktor
    👍Веб агенција на мрежи | Стручњак за веб агенције за дигитални маркетинг и СЕО. Веб Агенци Онлине је веб агенција. За Агензиа Веб Онлине успех у дигиталној трансформацији заснива се на основама Ирон СЕО верзије 3. Специјалитети: системска интеграција, интеграција пословних апликација, сервисно оријентисана архитектура, рачунарство у облаку, складиште података, пословна интелигенција, велики подаци, портали, интранети, веб апликација Дизајн и управљање релационим и вишедимензионалним базама података Дизајнирање интерфејса за дигиталне медије: употребљивост и графика. Онлине веб агенција нуди компанијама следеће услуге: -СЕО на Гоогле, Амазон, Бинг, Иандек; -Веб аналитика: Гоогле аналитика, Гоогле Таг Манагер, Иандек Метрица; -Конверзије корисника: Гоогле Аналитицс, Мицрософт Цларити, Иандек Метрица; -СЕМ на Гоогле, Бинг, Амазон Адс; - Маркетинг на друштвеним мрежама (Фацебоок, Линкедин, Иоутубе, Инстаграм).
    Моја агилна приватност
    Овај сајт користи техничке колачиће и колачиће за профилисање. Кликом на прихватите ауторизујете све колачиће за профилисање. Кликом на одбаци или Кс, сви колачићи за профилисање се одбијају. Кликом на прилагођавање могуће је изабрати које колачиће за профилисање желите да активирате.
    Овај сајт је у складу са Законом о заштити података (ЛПД), швајцарским савезним законом од 25. септембра 2020. и ГДПР, Уредбом ЕУ 2016/679, која се односи на заштиту личних података, као и на слободно кретање таквих података.