fbpx

Склад дадзеных і планаванне рэсурсаў прадпрыемства | DWH і ERP

АРХІЎ ДАЦІ ЦЭНТРАЛЬНАЯ: ГІСТОРЫЯ РЭД ЭВАЛЮЦЫІ

Дзвюма дамінантнымі тэмамі карпаратыўных тэхналогій у 90-я гады былі i інфармацыйнае сховішча і ERP. Доўгі час гэтыя дзве магутныя плыні былі часткамі карпаратыўных ІТ, ніколі не перасякаючыся. Гэта было амаль як калі б яны былі матэрыяй і антыматэрыяй. Але рост абодвух феноменаў непазбежна прывёў да іх перасячэння. Сёння кампаніі сутыкаюцца з праблемай, што рабіць з ERP і інфармацыйнае сховішча. У гэтым артыкуле будуць апісаны праблемы і як кампаніі іх вырашаюць.

НА ПАЧАТКУ…

На пачатку было інфармацыйнае сховішча. інфармацыйнае сховішча быў створаны для процідзеяння прыкладной сістэме апрацоўкі транзакцый. У першыя дні запамінанне в дадзеныя гэта павінна было быць проста кантрапунктам прыкладанняў для апрацоўкі транзакцый. Але ў наш час існуюць значна больш выдасканаленыя погляды на тое, што а інфармацыйнае сховішча. У сучасным свеце інфармацыйнае сховішча ён устаўлены ў структуру, якую можна назваць карпаратыўнай інфармацыйнай фабрыкай.

ФАБРЫКА КАРПАРАЦЫЙНАЙ ІНФАРМАЦЫІ (CIF)

Фабрыка карпаратыўнай інфармацыі мае стандартныя архітэктурныя кампаненты: узровень трансфармацыі і інтэграцыі кода, які аб'ядноўвае дадзеныя пакуль я дадзеныя яны перамяшчаюцца з асяроддзя прымянення ў навакольнае асяроддзе інфармацыйнае сховішча кампаніі; а інфармацыйнае сховішча кампаніі, дзе знаходзіцца дадзеныя падрабязныя і комплексныя гіст. The інфармацыйнае сховішча кампаніі служыць асновай, на якой могуць будавацца ўсе астатнія часткі навакольнага асяроддзя інфармацыйнае сховішча; сховішча аператыўных даных (ODS). ODS - гэта гібрыдная структура, якая змяшчае некаторыя аспекты інфармацыйнае сховішча і іншыя аспекты асяроддзя OLTP; вітрыны дадзеных, дзе розныя аддзелы могуць мець сваю ўласную версію інфармацыйнае сховішча; а інфармацыйнае сховішча даследаванні, у якім «філосафы» кампаніі могуць адпраўляць свае запыты на працягу 72 гадзін без шкоднага ўздзеяння на інфармацыйнае сховішча; і блізкая радковая памяць, у якой дадзеныя стары і дадзеныя аб'ёмную дэталь можна танна захоўваць.

ДЗЕ ERP КАМБІНУЕЦЦА З THE ФАБРЫКА КАРПАРАЦЫЙНАЙ ІНФАРМАЦЫІ

ERP зліваецца з карпаратыўнай інфармацыйнай фабрыкай у двух месцах. Спачатку ў якасці асноўнага прыкладання (базавага ўзроўню), якое забяспечвае i дадзеныя дадатку да інфармацыйнае сховішча. У гэтым выпадку i дадзеныя, якія ствараюцца як пабочны прадукт працэсу транзакцыі, інтэгруюцца і загружаюцца ў інфармацыйнае сховішча кампаніі. Другая кропка аб'яднання паміж ERP і CIF і ODS. Фактычна, у многіх асяроддзях ERP выкарыстоўваецца як класічны ODS.

У выпадку, калі ERP выкарыстоўваецца ў якасці асноўнага прыкладання, той жа ERP можа таксама выкарыстоўвацца ў CIF у якасці ODS. У любым выпадку, калі ERP будзе выкарыстоўвацца ў абедзвюх ролях, павінна быць дакладнае адрозненне паміж двума суб'ектамі. Іншымі словамі, калі ERP гуляе ролю асноўнага прыкладання і ODS, трэба адрозніваць дзве архітэктурныя адзінкі. Калі адзіная рэалізацыя ERP спрабуе выконваць абедзве ролі адначасова, непазбежна ўзнікнуць праблемы пры распрацоўцы і рэалізацыі гэтай структуры.

АСОБНЫЯ ODS І БАЗАВЫЯ ПРЫМЕНАННІ

Ёсць шмат прычын, якія прыводзяць да падзелу архітэктурных складнікаў. Мабыць, найбольш паказальным пытаннем для падзелу розных кампанентаў архітэктуры з'яўляецца тое, што кожны кампанент архітэктуры мае свой уласны выгляд. Базавая праграма служыць іншым мэтам, чым ODS. Старайцеся перакрываць

погляд базавага прыкладання на свет ODS ці наадварот не з'яўляецца правільным спосабам працы.

Такім чынам, першая праблема ERP у CIF - праверыць, ці існуе адрозненне паміж базавымі праграмамі і ODS.

МАДЭЛІ ДАНЫХ У КАРПАРАЦЫІ ФАБРЫКА ІНФАРМАЦЫІ

Каб дасягнуць згуртаванасці паміж рознымі кампанентамі архітэктуры CIF, павінна быць мадэль дадзеныя. Мадэлі а дадзеныя яны служаць сувязным звяном паміж рознымі кампанентамі архітэктуры, такімі як базавыя прыкладанні і ODS. Мадэлі а дадзеныя яны становяцца «інтэлектуальнай дарожнай картай», каб атрымаць правільны сэнс ад розных архітэктурных кампанентаў CIF.

Ідучы рука аб руку з гэтым паняццем, ідэя заключаецца ў тым, што павінна быць адна вялікая і адзіная мадэль дадзеныя. Відавочна, што павінна быць мадэль дадзеныя для кожнага з кампанентаў, а таксама павінен быць разумны шлях, які злучае розныя мадэлі. Кожны кампанент архітэктуры - ODS, базавыя прыкладанні, інфармацыйнае сховішча кампаніі, і гэтак далей.. – патрэбна свая мадэль дадзеныя. І таму павінна быць дакладнае вызначэнне таго, як гэтыя мадэлі дадзеныя яны ўзаемадзейнічаюць адзін з адным.

РУХАЦЬ Я ДАЦІ ERP У ДАННЫХ WAREHOUSE

Калі паходжанне ст дадзеныя з'яўляецца базавым дадаткам і/або ODS, калі ERP устаўляе дадзеныя ў інфармацыйнае сховішча, гэтая ўстаўка павінна адбывацца на самым нізкім узроўні "дэталізацыі". Проста абагульніце або абагульніце i дадзеныя калі яны выходзяць з базавага прыкладання ERP або ERP ODS, гэта не тое, што трэба рабіць. THE дадзеныя неабходныя дэталі інфармацыйнае сховішча скласці аснову працэсу DSS. Такія дадзеныя будуць шмат у чым зменены дзякуючы вітрынам даных і даследаванням інфармацыйнае сховішча.

Перасоўванне дадзеныя ад асяроддзі базавых прыкладанняў ERP да інфармацыйнае сховішча кампаніі робіцца ў дастаткова расслабленай форме. Гэта перамяшчэнне адбываецца прыблізна праз 24 гадзіны пасля абнаўлення або стварэння ў ERP. Факт наяўнасці «лянівага» руху ст дадзеныя ў інфармацыйнае сховішча кампаніі дазваляе дадзеныя паступаючы з ERP на «дэпазіт». Аднойчы я дадзеныя захоўваюцца ў базавай праграме, то вы можаце смела перамяшчаць дадзеныя ERP на прадпрыемстве. Яшчэ адна мэта, дасягальная дзякуючы «лянівым» рухам дадзеныя гэта дакладнае размежаванне паміж аперацыйнымі працэсамі і DSS. З «хуткім» рухам ст дадзеныя лінія падзелу паміж DSS і аператыўнай застаецца расплывістай.

Рух а дадзеныя ад ERP ODS да інфармацыйнае сховішча кампаніі праводзіцца перыядычна, звычайна штотыдзень ці штомесяц. У гэтым выпадку рух а дадзеныя у яго аснове ляжыць неабходнасць «пачысціць» старое дадзеныя гісторыкаў. Вядома, ODS змяшчае i дадзеныя якія значна больш познія, чым дадзеныя гісторыкі знайшлі ў ст інфармацыйнае сховішча.

Перасоўванне дадзеныя ў інфармацыйнае сховішча гэта амаль ніколі не робіцца «оптам» (па-аптавіку). Скапіруйце табліцу з асяроддзя ERP у інфармацыйнае сховішча гэта не мае сэнсу. Значна больш рэалістычны падыход - перамясціць выбраныя адзінкі дадзеныя. Толькі дадзеныя якія змяніліся пасля апошняга абнаўлення інфармацыйнае сховішча менавіта яны павінны быць перанесены ў інфармацыйнае сховішча. Адзін са спосабаў даведацца, якія дадзеныя змянілася з моманту апошняга абнаўлення, каб паглядзець на часовыя пазнакі дадзеныя знойдзены ў асяроддзі ERP. Дызайнер выбірае ўсе змены, якія адбыліся з моманту апошняга абнаўлення. Іншы падыход заключаецца ў выкарыстанні метадаў фіксацыі змяненняў дадзеныя. З дапамогай гэтых метадаў аналізуюцца часопісы і журнальныя стужкі, каб вызначыць, якія з іх дадзеныя неабходна перанесці з асяроддзя ERP у асяроддзе інфармацыйнае сховішча. Гэтыя метады з'яўляюцца лепшымі, таму што журналы і журнальныя стужкі можна чытаць з файлаў ERP без дадатковага ўплыву на іншыя рэсурсы ERP.

ІНШЫЯ ЎСКЛАДНЕННІ

Адной з праблем ERP у CIF з'яўляецца тое, што адбываецца з іншымі крыніцамі прыкладанняў або з дадзеныя ODS, у які яны павінны ўнесці свой уклад інфармацыйнае сховішча але яны не з'яўляюцца часткай асяроддзя ERP. Улічваючы закрытую прыроду ERP, асабліва SAP, спрабуюць інтэграваць ключы з знешніх крыніц дадзеныя з i дадзеныя якія паступаюць з ERP пры перамяшчэнні дадзеныя ў інфармацыйнае сховішча, гэта вялікая праблема. І якая дакладна верагоднасць таго, што i дадзеныя прыкладанняў або ODS па-за межамі асяроддзя ERP будуць інтэграваныя ў інфармацыйнае сховішча? Шанцы на самай справе вельмі высокія.

ЗНАЙСЦІ ДАЦІ ГІСТАРЫЧНЫ АД ЕРП

Яшчэ адна праблема з i дадзеныя ERP - гэта тое, што вынікае з неабходнасці мець дадзеныя гісторыкаў у межах ст інфармацыйнае сховішча. Звычайна інфармацыйнае сховішча патрэбы дадзеныя гісторыкаў. І тэхналогія ERP звычайна не захоўвае іх дадзеныя гістарычны, прынамсі, не да той ступені, дзе гэта неабходна ў інфармацыйнае сховішча. Пры вялікай колькасці дадзеныя гісторыя пачынае назапашвацца ў асяроддзі ERP, гэта асяроддзе трэба ачысціць. Напрыклад, выкажам здагадку, што a інфармацыйнае сховішча павінен быць загружаны з пяці гадоў дадзеныя гістарычныя, у той час як ERP захоўвае іх максімум шэсць месяцаў дадзеныя. Пакуль кампанія задаволена зборам серыі дадзеныя гісторыкі з цягам часу, то няма ніякіх праблем у выкарыстанні ERP ў якасці крыніцы для інфармацыйнае сховішча. Але калі інфармацыйнае сховішча ён павінен вярнуцца ў мінулае і атрымаць багоў дадзеныя гісторыі, якія раней не збіраліся і не захоўваліся ERP, то асяроддзе ERP становіцца неэфектыўным.

ERP І МЕТАДАНЫЯ

Яшчэ адно меркаванне аб ERP e інфармацыйнае сховішча - гэта метаданыя, якія існуюць у асяроддзі ERP. Падобна таму, як метададзеныя пераходзяць з асяроддзя ERP у інфармацыйнае сховішча, метададзеныя павінны быць перамешчаны такім жа чынам. Акрамя таго, метададзеныя павінны быць ператвораны ў фармат і структуру, неабходныя інфраструктуры інфармацыйнае сховішча. Існуе вялікая розніца паміж аператыўнымі метададзенымі і метададзенымі DSS. Аперацыйныя метаданыя ў першую чаргу для распрацоўшчыка і

праграміст. Метададзеныя DSS прызначаны ў першую чаргу для канчатковага карыстальніка. Існуючыя метаданыя ў праграмах ERP або ODS неабходна пераўтварыць, і гэта пераўтварэнне не заўсёды лёгкае і простае.

ПАТРУК ДАНЫХ ERP

Калі ERP выкарыстоўваецца ў якасці пастаўшчыка дадзеныя для інфармацыйнае сховішча павінен быць трывалы інтэрфейс, які рухае дадзеныя ад асяроддзя ERP да асяроддзя інфармацыйнае сховішча. Інтэрфейс павінен:

  • ▪ быць простым у выкарыстанні
  • ▪ дазволіць доступ да дадзеныя ERP
  • ▪ прыняць значэнне дадзеныя якія збіраюцца перанесці ў ст інфармацыйнае сховішча
  • ▪ ведаць абмежаванні ERP, якія могуць узнікнуць пры доступе да дадзеныя ERP:
  • ▪ рэферэнтная цэласнасць
  • ▪ іерархічныя адносіны
  • ▪ няяўныя лагічныя адносіны
  • ▪ пагадненне аб прымяненні
  • ▪ усе структуры дадзеныя падтрымліваецца ERP і гэтак далей...
  • ▪ быць эфектыўным у доступе дадзеныя, забяспечваючы:
  • ▪ прамы рух дадзеныя
  • ▪ набыццё дробязі дадзеныя
  • ▪ падтрымка своечасовага доступу да дадзеныя
  • ▪ зразумець фармат дадзеныя, і гэтак далей… ІНТЭРФЭЙС З SAP Інтэрфейс можа быць двух тыпаў, дамарослы або камерцыйны. Некаторыя з асноўных гандлёвых інтэрфейсаў ўключаюць:
  • ▪ SAS
  • ▪ Рашэнні Prims
  • ▪ D2k, і гэтак далей... ШКОЛЬКІ ТЭХНАЛОГІЙ ERP Ставіцца да асяроддзя ERP як да адзінай тэхналогіі - вялікая памылка. Існуе мноства тэхналогій ERP, кожная з якіх мае свае моцныя бакі. Самыя вядомыя прадаўцы на рынку:
  • ▪ SAP
  • ▪ Oracle Financials
  • ▪ PeopleSoft
  • ▪ Дж. Д. Эдвардс
  • ▪ Баан SAP SAP - гэта найбуйнейшае і найбольш поўнае праграмнае забеспячэнне ERP. Прыкладанні SAP ўключаюць мноства тыпаў прыкладанняў у многіх галінах. SAP мае рэпутацыю:
  • ▪ вельмі вялікі
  • ▪ вельмі складана і дорага рэалізаваць
  • ▪ неабходна шмат людзей і кансультантаў для рэалізацыі
  • ▪ для рэалізацыі патрэбныя спецыяльныя людзі
  • ▪ укараненне займае шмат часу. Акрамя таго, SAP мае рэпутацыю запамінання дадзеныя вельмі асцярожна, што ўскладняе доступ да іх для тых, хто знаходзіцца па-за зонай SAP. Моц SAP у тым, што ён здольны захопліваць і захоўваць вялікую колькасць дадзеныя. Нядаўна SAP абвясціла аб сваім намеры пашырыць свае прыкладанні на інфармацыйнае сховішча. Выкарыстанне SAP у якасці пастаўшчыка мае шмат плюсаў і мінусаў інфармацыйнае сховішча. Перавага заключаецца ў тым, што SAP ужо ўсталяваны і што большасць кансультантаў ужо ведаюць SAP.
    Недахопы наяўнасці SAP у якасці пастаўшчыка інфармацыйнае сховішча іх шмат: SAP не мае вопыту ў свеце інфармацыйнае сховішча Калі SAP з'яўляецца пастаўшчыком інфармацыйнае сховішча, трэба “выняць” i дадзеныя ад SAP да інфармацыйнае сховішча. Дато паслужны спіс закрытай сістэмы SAP, наўрад ці будзе лёгка атрымаць i з SAP у яе (???). Ёсць шмат састарэлых асяроддзяў, якія кіруюць SAP, такіх як IMS, VSAM, ADABAS, ORACLE, DB2 і гэтак далей. SAP настойвае на падыходзе «не прыдумана тут». SAP не хоча супрацоўнічаць з іншымі пастаўшчыкамі для выкарыстання або стварэння інфармацыйнае сховішча. SAP настойвае на стварэнні ўсяго свайго праграмнага забеспячэння самастойна.

Хоць SAP з'яўляецца вялікай і магутнай кампаніяй, яна спрабуе перапісаць тэхналогіі ELT, OLAP, сістэмнага адміністравання і нават асноўны код дбм гэта проста вар'яцтва. Замест таго, каб пайсці на супрацоўніцтва з пастаўшчыкамі інфармацыйнае сховішча Кампанія SAP даўно прытрымліваецца прынцыпу «яны ведаюць лепш за ўсё». Такое стаўленне стрымлівае поспех, які SAP можа дасягнуць у гэтай галіне інфармацыйнае сховішча.
Адмова SAP дазволіць знешнім пастаўшчыкам аператыўна і зграбна атрымаць доступ да сваіх дадзеныя. Сама сутнасць выкарыстання а інфармацыйнае сховішча лёгкі доступ дадзеныя. Уся гісторыя SAP заснавана на ўскладненні доступу дадзеныя.
Адсутнасць у SAP вопыту працы з вялікімі аб'ёмамі дадзеныя; у галіне в інфармацыйнае сховішча ёсць тамы дадзеныя ніколі не бачыў SAP і кіраваць гэтымі вялікімі аб'ёмамі дадзеныя трэба мець адпаведную тэхналогію. SAP, відаць, не ведае аб гэтым тэхналагічным бар'еры, які існуе для выхаду на поле інфармацыйнае сховішча.
Карпаратыўная культура SAP: SAP зрабіла бізнес, каб атрымаць дадзеныя ад сістэмы. Але для гэтага трэба мець іншы менталітэт. Традыцыйна кампаніі, якія займаюцца праграмным забеспячэннем, атрымлівалі добрыя магчымасці перадачы дадзеных у асяроддзе, не спраўляліся з тым, каб даныя ішлі іншым шляхам. Калі SAP удасца зрабіць такі пераход, яна стане першай кампаніяй, якая зробіць гэта.

Карацей кажучы, пытанне, ці варта кампаніі выбіраць SAP у якасці пастаўшчыка інфармацыйнае сховішча. Ёсць вельмі сур'ёзныя рызыкі з аднаго боку і вельмі мала ўзнагарод з другога. Але ёсць яшчэ адна прычына, якая адпуджвае выбар SAP у якасці пастаўшчыка інфармацыйнае сховішча. Таму што кожная кампанія павінна мець тое ж самае інфармацыйнае сховішча усіх астатніх кампаній? The інфармацыйнае сховішча гэта сэрца канкурэнтнай перавагі. Калі б кожная кампанія прыняла тое ж самае інфармацыйнае сховішча было б цяжка, хоць і не немагчыма, дасягнуць канкурэнтнай перавагі. SAP, здаецца, лічыць, што a інфармацыйнае сховішча гэта можна разглядаць як файлы cookie, і гэта яшчэ адна прыкмета іх ментальнасці прыкладанняў "атрымаць дадзеныя".

Ні адзін іншы пастаўшчык ERP не з'яўляецца такім дамінуючым, як SAP. Несумненна, знойдуцца кампаніі, якія пойдуць шляхам SAP інфармацыйнае сховішча але мабыць гэтыя інфармацыйнае сховішча SAP будзе вялікім, дарагім і працаёмкім на стварэнне.

Гэтыя асяроддзя ўключаюць такія віды дзейнасці, як апрацоўка банкаўскіх кас, працэсы браніравання авіякампаній, працэсы страхавых патрабаванняў і гэтак далей. Чым больш эфектыўнай была сістэма транзакцый, тым больш відавочнай была неабходнасць падзелу паміж аперацыйным працэсам і DSS (сістэмай падтрымкі прыняцця рашэнняў). Аднак з кадравымі і кадравымі сістэмамі вы ніколі не сутыкаецеся з вялікімі аб'ёмамі транзакцый. І, вядома, калі чалавек прымаецца на працу або пакідае кампанію, гэта запіс транзакцыі. Але ў параўнанні з іншымі сістэмамі ў кадравай і кадравай сістэмах проста не так шмат транзакцый. Такім чынам, у кадравых і кадравых сістэмах не зусім відавочна, што існуе патрэба ў DataWarehouse. Шмат у чым гэтыя сістэмы ўяўляюць сабой аб'яднанне сістэм DSS.

Але ёсць яшчэ адзін фактар, які неабходна ўлічваць, калі вы маеце справу са сховішчамі дадзеных і PeopleSoft. У многіх асяроддзях, г.зн дадзеныя чалавечых і персанальных рэсурсаў з'яўляюцца другаснымі ў параўнанні з асноўным бізнесам кампаніі. Большасць кампаній займаюцца вытворчасцю, продажам, аказаннем паслуг і гэтак далей. Чалавечыя рэсурсы і кадравыя сістэмы звычайна з'яўляюцца другаснымі (або падтрымліваюць) асноўны напрамак дзейнасці кампаніі. Таму гэта неадназначна і нязручна інфармацыйнае сховішча асобна для кадраў і кадравай падтрымкі.

У гэтым плане PeopleSoft моцна адрозніваецца ад SAP. У SAP абавязковым з'яўляецца наяўнасць a інфармацыйнае сховішча. З PeopleSoft гэта не так адназначна. Сховішча даных не з'яўляецца абавязковым для PeopleSoft.

Лепшае, што можна сказаць пра дадзеныя PeopleSoft - гэта тое інфармацыйнае сховішча можна выкарыстоўваць для архівавання i дадзеныя якія адносяцца да старых чалавечых і асабістых рэсурсаў. Другая прычына, чаму кампанія захоча выкарыстоўваць a інфармацыйнае сховішча a

шкода асяроддзя PeopleSoft заключаецца ў тым, каб дазволіць доступ і бясплатны доступ да інструментаў аналізу, каб дадзеныя ад PeopleSoft. Але акрамя гэтых прычын, могуць быць выпадкі, калі пажадана не мець сховішча даных дадзеныя PeopleSoft.

Падводзячы вынік

Ёсць шмат ідэй адносна будаўніцтва а інфармацыйнае сховішча у праграмным забеспячэнні ERP.
Некаторыя з іх:

  • ▪ Мае сэнс мець а інфармацыйнае сховішча гэта як што-небудзь яшчэ ў індустрыі?
  • ▪ Наколькі гнуткая ERP інфармацыйнае сховішча праграмнае забеспячэнне?
  • ▪ ERP інфармацыйнае сховішча праграмнае забеспячэнне можа апрацоўваць аб'ём дадзеныя які знаходзіцца ў аінфармацыйнае сховішча арэна"?
  • ▪ Што такое запіс трасіроўкі, які робіць пастаўшчык ERP, нягледзячы на ​​​​просты і недарагі з пункту гледжання часу, дадзеныя? (Які паслужны спіс пастаўшчыкоў ERP па дастаўцы недарагіх, своечасовых і простых да доступу даных?)
  • ▪ Як пастаўшчык ERP разумее архітэктуру DSS і фабрыку карпаратыўнай інфармацыі?
  • ▪ Пастаўшчыкі ERP разумеюць, як дасягнуць дадзеныя у навакольным асяроддзі, але і зразумець, як іх экспартаваць?
  • ▪ Наколькі пастаўшчык ERP адкрыты для інструментаў сховішча даных?
    Усе гэтыя меркаванні павінны быць зроблены пры вызначэнні месца размяшчэння інфармацыйнае сховішча які будзе прымаць я дадзеныя ЕРП і інш дадзеныя. Увогуле, калі няма пераканаўчай прычыны паступаць інакш, будаўніцтва рэкамендуецца інфармацыйнае сховішча па-за межамі асяроддзя пастаўшчыка ERP. РАЗДЗЕЛ 1 Агляд арганізацыі BI Ключавыя моманты:
    Сховішчы інфармацыі працуюць у зваротным кірунку да архітэктуры бізнес-аналітыкі (BI):
    Карпаратыўная культура і ІТ могуць абмежаваць поспех у стварэнні арганізацый BI.

Тэхналогія больш не з'яўляецца абмежавальным фактарам для арганізацый BI. Пытанне для архітэктараў і планіроўшчыкаў заключаецца не ў тым, ці існуе тэхналогія, а ў тым, ці могуць яны эфектыўна рэалізаваць наяўную тэхналогію.

Для многіх кампаній а інфармацыйнае сховішча гэта крыху больш, чым пасіўны дэпазіт, які размяркоўвае дадзеныя карыстальнікам, якім гэта неабходна. THE дадзеныя яны здабываюцца з зыходных сістэм і запаўняюцца ў мэтавыя структуры інфармацыйнае сховішча. Я дадзеныя іх таксама можна ачысціць, калі пашанцуе. Аднак дадатковая каштоўнасць не дадаецца і не збіраецца дадзеныя падчас гэтага працэсу.

Па сутнасці, пасіўны Dw, у лепшым выпадку, забяспечвае толькі i дадзеныя чысты і працаздольны для асацыяцый карыстальнікаў. Стварэнне інфармацыі і аналітычнае разуменне цалкам залежаць ад карыстальнікаў. Судзіце, ці DW (інфармацыйнае сховішча) поспех суб'ектыўны. Калі мы ацэньваем поспех па здольнасці эфектыўна збіраць, інтэграваць і чысціць дадзеныя карпаратыўны на прадказальнай аснове, тады так, DW мае поспех. З іншага боку, калі мы паглядзім на збор, кансалідацыю і выкарыстанне інфармацыі арганізацыяй у цэлым, то DW - правал. DW практычна не забяспечвае ніякай інфармацыйнай каштоўнасці. У выніку карыстальнікі вымушаныя абыходзіцца, ствараючы інфармацыйныя бункеры. У гэтым раздзеле прадстаўлена поўнае ўяўленне аб архітэктуры кампаніі BI (Business Intelligence). Мы пачынаем з апісання BI, а затым пяройдзем да абмеркавання інфармацыйнага дызайну і распрацоўкі, у адрозненне ад простага прадастаўлення інфармацыі. дадзеныя карыстальнікам. Дыскусіі затым сканцэнтраваны на разліку кошту вашых намаганняў BI. У заключэнне мы вызначым, як IBM задавальняе архітэктурныя патрабаванні вашай арганізацыі да BI.

Апісанне архітэктуры в Арганізацыя БІ

Магутныя інфармацыйныя сістэмы, арыентаваныя на транзакцыі, цяпер з'яўляюцца звычайнай з'явай на кожным буйным прадпрыемстве, эфектыўна выраўноўваючы ўмовы для карпарацый па ўсім свеце.

Аднак для захавання канкурэнтаздольнасці цяпер патрэбныя аналітычна арыентаваныя сістэмы, якія могуць зрабіць рэвалюцыю ў здольнасці кампаніі нанава адкрываць і выкарыстоўваць інфармацыю, якой яны ўжо валодаюць. Гэтыя аналітычныя сістэмы вынікаюць з разумення багацця дадзеныя даступны. BI можа палепшыць прадукцыйнасць прадпрыемства. Кампаніі могуць палепшыць адносіны паміж кліентамі і пастаўшчыкамі, павысіць рэнтабельнасць прадуктаў і паслуг, стварыць новыя і лепшыя прапановы, кантраляваць рызыкі і, сярод многіх іншых пераваг, значна скараціць выдаткі. Дзякуючы BI ваша кампанія, нарэшце, пачынае выкарыстоўваць інфармацыю аб кліентах у якасці канкурэнтнага актыву дзякуючы прыкладанням, якія маюць рынкавыя мэты.

Наяўнасць правільных бізнес-інструментаў азначае наяўнасць канчатковых адказаў на ключавыя пытанні, такія як:

  • ▪ Які з нашых кліенты яны прымушаюць нас зарабляць больш, ці яны прымушаюць нас губляць грошы?
  • ▪ Дзе жывуць нашы лепшыя кліенты у адносінах да крама/ склад, што яны часта?
  • ▪ Якія з нашых прадуктаў і паслуг можна прадаць найбольш эфектыўна і каму?
  • ▪ Якія тавары можна прадаць найбольш эфектыўна і каму?
  • ▪ Якая кампанія продажаў найбольш паспяховая і чаму?
  • ▪ Якія каналы продажаў найбольш эфектыўныя для якіх прадуктаў?
  • ▪ Як мы можам палепшыць адносіны з нашымі лепшымі людзьмі кліенты? У большасці кампаній ёсць дадзеныя грубыя спосабы адказаць на гэтыя пытанні.
    Аперацыйныя сістэмы ствараюць вялікую колькасць прадуктаў, кліентаў і дадзеныя рынак ад пунктаў продажу, браніравання, абслугоўвання кліентаў і сістэм тэхнічнай падтрымкі. Задача складаецца ў тым, каб атрымаць і выкарыстоўваць гэтую інфармацыю. Шматлікія кампаніі атрымліваюць прыбытак толькі ад невялікіх частак сваіх сродкаў дадзеныя для стратэгічнага аналізу.
    I дадзеныя астатнія, часта ў спалучэнні з i дадзеныя атрыманая з знешніх крыніц, такіх як урадавыя справаздачы, і іншая набытая інфармацыя, з'яўляецца залатым руднікам, які толькі чакае свайго вывучэння, і дадзеныя іх проста трэба ўдакладніць у інфармацыйным кантэксце вашай арганізацыі.

Гэтыя веды могуць прымяняцца рознымі спосабамі, пачынаючы ад распрацоўкі агульнай карпаратыўнай стратэгіі і заканчваючы асабістай камунікацыяй з пастаўшчыкамі праз кол-цэнтры, выстаўленне рахункаў, Internet і іншыя моманты. Сучаснае бізнес-асяроддзе патрабуе, каб DW і звязаныя з імі рашэнні BI развіваліся за рамкі традыцыйных бізнес-структур. дадзеныя які я дадзеныя нармаваны на атамным узроўні і «зорка/кубічныя фермы».

Што неабходна, каб заставацца канкурэнтаздольнымі, так гэта зліццё традыцыйных і перадавых тэхналогій у спробе падтрымаць шырокі аналітычны ландшафт.
У заключэнне можна сказаць, што агульнае асяроддзе павінна паляпшаць веды кампаніі ў цэлым, гарантуючы, што дзеянні, прынятыя ў выніку праведзенага аналізу, будуць карыснымі, каб усе выйгралі.

Напрыклад, выкажам здагадку, што вы класіфікуеце свой кліенты у катэгорыі высокай ці нізкай рызыкі.
Калі гэтая інфармацыя генеруецца з дапамогай здабычы мадэляў або іншымі спосабамі, яна павінна быць змешчана ў DW і зроблена даступнай для ўсіх з дапамогай любога інструмента доступу, напрыклад, статычных справаздач, электронных табліц, табліц або онлайн-аналітычнай апрацоўкі (OLAP).

Тым не менш, у цяперашні час вялікая частка гэтай інфармацыі застаецца ў бункерах дадзеныя асоб або аддзелаў, якія займаюцца аналізам. Арганізацыя ў цэлым практычна не бачная для разумення. Толькі змяшаўшы гэты тып інфармацыйнага змесціва ў вашу карпаратыўную DW, вы можаце ліквідаваць інфармацыйныя бункеры і палепшыць сваё асяроддзе DW.
Ёсць дзве асноўныя перашкоды для развіцця арганізацыі BI.
Па-першае, у нас праблема самой арганізацыі і яе дысцыпліны.
Хаця мы не можам дапамагчы са зменамі палітыкі арганізацыі, мы можам дапамагчы зразумець кампаненты BI арганізацыі, яе архітэктуру і тое, як тэхналогіі IBM спрыяюць яе развіццю.
Другі бар'ер, які трэба пераадолець, - гэта адсутнасць інтэграванай тэхналогіі і ведаў аб метадах, якія ахопліваюць усю прастору BI, а не толькі невялікі кампанент.

IBM пачынае змагацца са зменамі ў тэхналогіі інтэграцыі. Вы абавязаны забяспечыць прадуманы дызайн. Гэтая архітэктура павінна быць распрацавана з дапамогай тэхналогіі, абранай для бесперашкоднай інтэграцыі, або, як мінімум, з дапамогай тэхналогіі, якая адпавядае адкрытым стандартам. Акрамя таго, кіраўніцтва вашай кампаніі павінна пераканацца, што BI мерапрыемства выконваецца ў адпаведнасці з планам і не дапускае развіцця інфармацыйных бункераў, якія ўзнікаюць у выніку карысці або мэтаў.
Гэта не азначае, што асяроддзе BI неадчувальна рэагуе на розныя патрэбы і патрабаванні розных карыстальнікаў; замест гэтага гэта азначае, што рэалізацыя гэтых індывідуальных патрэб і патрабаванняў робіцца на карысць усёй арганізацыі BI.
Апісанне архітэктуры арганізацыі BI можна знайсці на старонцы 9 на малюнку 1.1.Архітэктура дэманструе багатае спалучэнне тэхналогій і метадаў.
З традыцыйнага пункту гледжання архітэктура ўключае ў сябе наступныя кампаненты склада

Атамны пласт(Atomic Layer).

Гэта аснова, сэрца ўсёй DW і, такім чынам, стратэгічнай справаздачнасці.
I дадзеныя якія захоўваюцца тут захаваюць гістарычную цэласнасць, паведамляе а дадзеныя і ўключаюць вытворныя паказчыкі, а таксама ачышчаюць, інтэгруюць і захоўваюць з дапамогай вылучэння мадэляў.
Усё наступнае выкарыстанне гэтых дадзеныя і адпаведная інфармацыя атрымана з гэтай структуры. Гэта выдатны крыніца для майнинга дадзеныя і для справаздач са структураванымі запытамі SQL

Аператыўны склад а дадзеныя або справаздачы аснове дадзеныя(Сховішча аператыўных даных (ODS) або справаздачнасць база дадзеных.)

Гэта структура з дадзеныя спецыяльна распрацаваны для тэхнічнай справаздачнасці.

I дадзеныя захаваныя і паведамленыя вышэй гэтыя структуры могуць нарэшце распаўсюджвацца на склад праз пляцоўку, дзе яны могуць быць выкарыстаны для стратэгічнай сігналізацыі.

Пастановачная пляцоўка.

Першы прыпынак для большасці дадзеныя прызначаны для складской абстаноўкі - зона арганізацыі.
Вось я дадзеныя інтэгруюцца, ачышчаюцца і ператвараюцца ў дадзеныя прыбытку, які будзе запаўняць структуру склада

Фінікі.

Гэтая частка архітэктуры ўяўляе сабой структуру в дадзеныя выкарыстоўваецца спецыяльна для OLAP. Наяўнасць вітрын дадзеных, калі i дадзеныя захоўваюцца ў схемах зорак, якія перакрываюцца дадзеныя шматмерныя ў рэляцыйным асяроддзі або ў файлах дадзеныя Канфідэнцыяльнасць, якая выкарыстоўваецца пэўнай тэхналогіяй OLAP, такой як сервер OLAP DB2, не мае значэння.

Адзіным абмежаваннем з'яўляецца тое, што архітэктура палягчае выкарыстанне дадзеныя шматмерны.
Архітэктура таксама ўключае ў сябе важныя тэхналогіі і метады Bi, якія вылучаюцца як:

Прасторавы аналіз

Прастора з'яўляецца інфармацыйным звышпрыбыткам для аналітыка і мае вырашальнае значэнне для поўнага вырашэння. Прастора можа прадстаўляць інфармацыю пра людзей, якія жывуць у пэўным месцы, а таксама інфармацыю аб тым, дзе гэта месца знаходзіцца фізічна адносна астатняга свету.

Каб выканаць гэты аналіз, вы павінны пачаць з прывязкі інфармацыі да каардынат шыраты і даўгаты. Гэта называецца «геакадаванне» і павінна быць часткай працэсу вымання, пераўтварэння і загрузкі (ETL) на атамарным узроўні вашага склада.

Інтэлектуальны аналіз дадзеных.

Здабыча дадзеныя дазваляе нашым кампаніям павялічваць колькасць кліенты, каб прагназаваць тэндэнцыі продажаў і дазволіць кіраваць адносінамі з кліенты (CRM), сярод іншых ініцыятыў BI.

Здабыча дадзеныя таму ён павінен быць інтэграваны са структурамі дадзеныя Dwhouse і падтрымліваецца складскімі працэсамі для забеспячэння эфектыўнага і дзейснага выкарыстання адпаведных тэхналогій і метадаў.

Як паказана ў архітэктуры BI, атамны ўзровень Dwhouse, а таксама вітрыны даных з'яўляюцца выдатнай крыніцай дадзеныя для здабычы. Гэтыя ж аб'екты таксама павінны быць атрымальнікамі вынікаў здабычы, каб забяспечыць іх даступнасць для самай шырокай аўдыторыі.

Агенты.

Існуюць розныя «агенты» для праверкі кліента па кожнай кропцы, напрыклад, аперацыйныя сістэмы кампаніі і самі dw. Гэтыя агенты могуць быць прасунутымі нейронавымі сеткамі, навучанымі даведвацца аб тэндэнцыях у кожным пункце, такіх як будучы попыт на прадукт, заснаваны на стымуляванні продажаў, механізмы на аснове правілаў, якія рэагуюць на дата набор абставінаў, ці нават простыя агенты, якія паведамляюць пра выключэнні «вышэйшым кіраўнікам». Гэтыя працэсы звычайна адбываюцца ў рэжыме рэальнага часу і, такім чынам, павінны быць цесна звязаны з іх рухам дадзеныя. Усе гэтыя структуры ст дадзеныя, тэхналогіі і метады гарантуюць, што вы не будзеце марнаваць ноч, ствараючы арганізацыю вашага BI.

Гэтая дзейнасць будзе развівацца паступова, для невялікіх кропак.
Кожны этап - гэта незалежны праект, які называецца ітэрацыяй вашай ініцыятывы DW або BI. Ітэрацыі могуць уключаць у сябе ўкараненне новых тэхналогій, пачынаючы з новых метадаў, дадаючы новыя структуры дадзеныя , загрузка i дадзеныя дадатковы , або з пашырэннем аналізу вашага асяроддзя. Больш падрабязна гэты параграф разглядаецца ў раздзеле 3.

У дадатак да традыцыйных структур DW і інструментаў BI ёсць і іншыя функцыі вашай арганізацыі BI, якія вам трэба распрацаваць, напрыклад:

Кропкі кантакту з кліентамі (Customer touch кропак).

Як і ў любой сучаснай арганізацыі, існуе шэраг кантактных кропак з кліентамі, якія паказваюць, як атрымаць станоўчы вопыт для вашай кліенты. Ёсць традыцыйныя каналы, такія як рознічныя гандляры, аператары камутатараў, прамая пошта, мультымедыйная і друкаваная рэклама, а таксама больш сучасныя каналы, такія як электронная пошта і Інтэрнэт, дадзеныя прадукты з нейкай кропкай кантакту павінны быць набыты, транспартаваны, ачышчаны, апрацаваны і затым заселены на аб'ектах дадзеныя БІ.

Базы а дадзеныя аператыўныя і карыстальніцкія аб'яднанні (Аперат

базы дадзеных і супольнасці карыстальнікаў).
У канцы кантактных пунктаў ст кліенты знойдзены асн дадзеныя прыкладанняў кампаніі і суполак карыстальнікаў. THE дадзеныя існуючыя з'яўляюцца дадзеныя традыцыйныя, якія павінны быць аб'яднаны і зліты з дадзеныя якія паступаюць ад кантактных кропак для задавальнення неабходнай інфармацыі.

Аналітыкі. (Аналітыкі)

Асноўным бенефіцыярам асяроддзя BI з'яўляецца аналітык. Менавіта яму выгадная цяперашняя здабыча дадзеныя аператыўны, інтэграваны з рознымі крыніцамі дадзеныя , дапоўнены такімі функцыямі, як геаграфічны аналіз (геакадзіраванне) і прадстаўлены ў тэхналогіях BI, якія дазваляюць выманне, OLAP, пашыраныя справаздачы SQL і геаграфічны аналіз. Асноўным інтэрфейсам аналітыка для асяроддзя справаздачнасці з'яўляецца партал BI.

Аднак аналітык не адзіны, хто выйграе ад архітэктуры BI.
Кіраўнікі, буйныя асацыяцыі карыстальнікаў і нават члены, пастаўшчыкі і я кліенты павінны знайсці перавагі ў карпаратыўнай BI.

Задняя пятля падачы.

Архітэктура BI - гэта асяроддзе навучання. Характэрным прынцыпам развіцця з'яўляецца дапушчэнне ўстойлівых структур дадзеныя абнаўляцца ў залежнасці ад выкарыстоўванай тэхналогіі BI і дзеянняў, выкананых карыстальнікам. Прыкладам можа служыць ацэнка кліентаў.

Калі аддзел продажаў мадэлюе балы кліентаў для выкарыстання новай паслугі, то аддзел продажаў не павінен быць адзінай групай, якая атрымлівае выгаду ад гэтай паслугі.

Замест гэтага выманне мадэляў павінна выконвацца як натуральная частка патоку даных на прадпрыемстве, а ацэнкі кліентаў павінны стаць неад'емнай часткай інфармацыйнага кантэксту сховішча, бачнай для ўсіх карыстальнікаў. Bi-bI-арыентаваны IBM Suite, уключаючы DB2 UDB, DB2 OLAP Server, уключае большасць асноўных тэхналагічных кампанентаў, вызначаных на малюнку 1.1.

Мы выкарыстоўваем архітэктуру, як яна паказана на гэтай ілюстрацыі з кнігі, каб даць нам пэўны ўзровень пераемнасці і прадэманстраваць, як кожны прадукт IBM упісваецца ў агульную схему BI.

Прадастаўленне інфармацыйнага кантэнту (Прадастаўленне інфармацыйны змест)

Праектаванне, распрацоўка і ўкараненне асяроддзя BI - складаная задача. Дызайн павінен ахопліваць як бягучыя, так і будучыя патрабаванні бізнесу. Архітэктурны чарцёж павінен быць поўным, каб уключаць усе высновы, зробленыя на этапе праектавання. Выкананне павінна заставацца прыхільным адзінай мэце: распрацоўцы архітэктуры BI, якая афіцыйна прадстаўлена ў праекце і заснавана на патрабаваннях бізнесу.

Асабліва цяжка сцвярджаць, што дысцыпліна забяспечыць адносны поспех.
Гэта проста, таму што вы не распрацоўваеце асяроддзе BI адразу, а робіце гэта невялікімі крокамі з цягам часу.

Аднак вызначэнне BI-кампанентаў вашай архітэктуры важна па дзвюх прычынах: вы будзеце кіраваць усімі наступнымі рашэннямі па тэхнічнай архітэктуры.
Вы зможаце свядома планаваць канкрэтнае выкарыстанне тэхналогіі, нават калі вы не атрымаеце паўторнага выкарыстання тэхналогіі на працягу некалькіх месяцаў.

Дастатковае разуменне патрабаванняў вашага бізнесу паўплывае на тып прадуктаў, якія вы набываеце для сваёй архітэктуры.
Праектаванне і распрацоўка вашай архітэктуры гарантуе захаванне вашага склада

не выпадковая падзея, а, хутчэй, старанна сканструяваная «добра прадуманая». опера мастацтва як мазаіка змешаных тэхн.

Дызайн інфармацыйнага кантэнту

Усе першапачатковыя праекты павінны быць сканцэнтраваны на ключавых кампанентах BI, якія спатрэбяцца агульнаму асяроддзю зараз і ў будучыні, і вызначаць іх.
Важна ведаць патрабаванні бізнесу.

Яшчэ да таго, як пачнецца фармальная распрацоўка, планіроўшчыкі часта могуць вызначыць адзін ці два кампаненты адразу.
Аднак баланс кампанентаў, які можа спатрэбіцца для вашай архітэктуры, знайсці не так проста. На этапе праектавання асноўная частка архітэктуры звязвае сеанс распрацоўкі прыкладанняў (JAD) з пошукам вызначэння патрабаванняў бізнесу.

Часам гэтыя патрабаванні могуць быць даручаны інструментам запытаў і справаздач.
Напрыклад, карыстальнікі заяўляюць, што калі яны жадаюць аўтаматызаваць бягучую справаздачу, яны павінны стварыць яе ўручную, аб'яднаўшы дзве бягучыя справаздачы і дадаўшы вылічэнні, атрыманыя з камбінацыі дадзеныя.
Нягледзячы на ​​тое, што гэта патрабаванне простае, яно вызначае пэўную функцыянальнасць функцыі, якую вы павінны ўключыць пры набыцці інструментаў справаздачнасці для вашай арганізацыі.

Дызайнер таксама павінен прад'яўляць дадатковыя патрабаванні для атрымання поўнай карціны. Ці хочуць карыстальнікі падпісацца на гэтую справаздачу?
Ці ствараюцца падмноства справаздач і адпраўляюцца па электроннай пошце розным карыстальнікам? Ці хочуць яны бачыць гэтую справаздачу на партале кампаніі? Усе гэтыя патрабаванні з'яўляюцца часткай простай неабходнасці замяніць ручную справаздачу па запытах карыстальнікаў. Перавага гэтых тыпаў патрабаванняў заключаецца ў тым, што ўсе, карыстальнікі і дызайнеры, маюць разуменне канцэпцыі справаздач.

Аднак ёсць і іншыя віды бізнесу, якія мы павінны планаваць. Калі бізнес-патрабаванні выкладзены ў выглядзе стратэгічных бізнес-пытанняў, экспертам-дызайнерам лёгка распазнаць патрабаванні да меры/факту і памераў.

Калі карыстальнікі JAD не ведаюць, як выкласці свае патрабаванні ў выглядзе бізнес-задачы, дызайнер часта дае прыклады, каб хутка пачаць сеанс збору патрабаванняў.
Эксперт-дызайнер можа дапамагчы карыстальнікам зразумець не толькі стратэгічны трэйдзінг, але і тое, як яго фармаваць.
Падыход да збору патрабаванняў разглядаецца ў главе 3; пакуль мы проста хочам адзначыць неабходнасць распрацоўкі для ўсіх тыпаў патрабаванняў BI.

Стратэгічная бізнес-задача - гэта не толькі бізнес-патрабаванне, але і падказка для дызайну. Калі вы павінны адказаць на шматмернае пытанне, то вы павінны запомніць, прадставіць i дадзеныя мерныя, і калі вам трэба запомніць ст дадзеныя шматмерны, вы павінны вырашыць, які тып тэхналогіі або тэхнікі вы збіраецеся выкарыстоўваць.

Вы рэалізуеце схему зарэзерваванай кубічнай зоркі, ці абодва? Як бачыце, нават простая бізнес-задача можа істотна паўплываць на дызайн. Але гэтыя тыпы бізнес-патрабаванняў з'яўляюцца звычайнай з'явай і зразумелыя, па меншай меры, дызайнерам і планіроўшчыкам з вопытам праектавання.

Аб тэхналогіях і падтрымцы OLAP вялося дастаткова дыскусій, і даступны шырокі спектр рашэнняў. Да гэтага часу мы згадвалі пра неабходнасць аб'яднаць простую справаздачнасць з патрабаваннямі да памераў бізнесу і пра тое, як гэтыя патрабаванні ўплываюць на тэхнічныя архітэктурныя рашэнні.

Але якія патрабаванні не зразумелыя ні карыстальнікам, ні камандзе Dw? Вам калі-небудзь спатрэбіцца прасторавы аналіз?
Мадэлі майнинга дадзеныя ці будуць яны неабходнай часткай вашай будучыні? Хто ведае?

Важна адзначыць, што гэтыя тыпы тэхналогій не вельмі добра вядомыя супольнасцям карыстальнікаў і членам каманды Dw, збольшага гэта можа быць таму, што імі звычайна займаюцца некаторыя ўнутраныя або староннія тэхнічныя эксперты. Гэта крайні выпадак праблем, якія спараджаюць такія тэхналогіі. Калі карыстальнікі не могуць апісаць бізнес-патрабаванні або сфармуляваць іх такім чынам, каб даць рэкамендацыі дызайнерам, яны могуць застацца незаўважанымі або, што яшчэ горш, проста праігнараванымі.

Больш праблемай становіцца, калі дызайнер і распрацоўшчык не могуць распазнаць прымяненне адной з гэтых перадавых, але важных тэхналогій.
Як мы часта чулі, як дызайнеры кажуць: «ну, чаму б нам не адкласці гэта ў бок, пакуль не атрымаем гэтую іншую рэч? «Іх сапраўды цікавяць прыярытэты, ці яны проста пазбягаюць незразумелых ім патрабаванняў? Хутчэй за ўсё, гэта апошняя гіпотэза. Выкажам здагадку, што ваша каманда продажаў паведаміла аб бізнес-патрабаванні, як паказана на малюнку 1.3, як бачыце, патрабаванне аформлена ў форме бізнес-задачы. Розніца паміж гэтай задачай і тыповай памернай задачай заключаецца ў адлегласці. У гэтым выпадку аддзел продажаў хоча штомесяц ведаць агульны аб'ём продажаў прадукцыі, складоў і кліенты якія жывуць у межах 5 міль ад склада, дзе яны купляюць.

На жаль, дызайнеры і архітэктары могуць проста ігнараваць прасторавы кампанент, кажучы: «У нас ёсць кліент, прадукт і дадзеныя дэпазіту. Давайце трымаць дыстанцыю да наступнага паўтарэння.

«Няправільны адказ. Гэты тып бізнес-задач - гэта BI. Гэта ўяўляе сабой больш глыбокае разуменне нашага бізнесу і надзейную аналітычную прастору для нашых аналітыкаў. BI выходзіць за рамкі простых запытаў або стандартных справаздач або нават OLAP. Гэта не значыць, што гэтыя тэхналогіі не важныя для вашай BI, але яны самі па сабе не прадстаўляюць асяроддзе BI.

Дызайн для інфармацыйнага кантэксту (Дызайн для інфармацыйнага кантэнту)

Цяпер, калі мы вызначылі бізнес-патрабаванні, якія адрозніваюць розныя асноўныя кампаненты, яны павінны быць уключаны ў агульны архітэктурны праект. Некаторыя кампаненты BI з'яўляюцца часткай нашых першапачатковых намаганняў, у той час як некаторыя не будуць укаранёны на працягу некалькіх месяцаў.

Тым не менш, усе вядомыя патрабаванні адлюстраваны ў канструкцыі, так што калі нам трэба ўкараніць тую ці іншую тэхналогію, мы гатовыя гэта зрабіць. Штосьці ў праекце будзе адлюстроўваць традыцыйнае мысленне.

Гэты набор з дадзеныя выкарыстоўваецца для падтрымкі наступнага выкарыстання дадзеныя кіруючыся бізнес-праблемамі, якія мы вызначылі. Па меры фарміравання дадатковых дакументаў, напрыклад, праектнай распрацоўкі дадзеныя, мы пачнем фармалізаваць, як i дадзеныя яны распаўсюджваюцца ў навакольным асяроддзі. Мы пераканаліся ў неабходнасці прадстаўляць i дадзеныя памерным спосабам, падзяліўшы іх (у адпаведнасці з канкрэтнымі канкрэтнымі патрэбамі) на вітрыны дадзеных.

Наступнае пытанне, на які трэба адказаць: як будуць будавацца гэтыя вітрыны даных?
Вы будуеце зоркі, каб падтрымаць кубы, ці толькі кубы, ці толькі зоркі? (або справа кубікі, або справа зоркі). Стварыце архітэктуру для залежных вітрын даных, якія патрабуюць атамарнага ўзроўню для ўсіх дадзеныя вы набываеце? Дазволіць незалежным вітрынам даных атрымліваць i дадзеныя непасрэдна з аперацыйных сістэм?

Якую тэхналогію Cube вы паспрабуеце стандартызаваць?

У вас велізарная колькасць багоў дадзеныя патрабуецца для аналізу памераў, ці вам патрэбныя кубікі ад вашай нацыянальнай службы продажаў штотыдзень, ці абодва? Вы ствараеце што-небудзь такое магутнае, як DB2 OLAP Server для фінансаў або кубы Cognos PowerPlay для вашай гандлёвай арганізацыі, або абодва? Гэта важныя архітэктурныя праектныя рашэнні, якія з гэтага моманту будуць уплываць на ваша BI-асяроддзе. Так, вы выявілі патрэбу ў OLAP. Цяпер як вы будзеце выконваць такую ​​тэхніку і тэхналогію?

Як некаторыя з самых перадавых тэхналогій уплываюць на ваш дызайн? Давайце выкажам здагадку, што вы вызначылі патрэбу ў прасторы ў вашай арганізацыі. Цяпер вы павінны ўспомніць выданні архітэктурных чарцяжоў, нават калі вы не плануеце рабіць прасторавыя кампаненты на працягу некалькіх месяцаў. Архітэктар павінен сёння праектаваць зыходзячы з таго, што патрэбна. Прадказаць неабходнасць прасторавай аналітыкі, якая генеруе, захоўвае, выконвае і забяспечвае доступ дадзеныя прасторавыя. Гэта, у сваю чаргу, павінна служыць абмежаваннем адносна тыпу праграмнай тэхналогіі і спецыфікацый платформы, якія вы можаце разглядаць у цяперашні час. Напрыклад, сістэма адміністравання в база дадзеных рэляцыйны ўзровень (RDBMS), які вы выконваеце для свайго атамнага ўзроўню, павінен мець надзейны прасторавы экстэнт. Гэта забяспечыць максімальную прадукцыйнасць пры выкарыстанні геаметрыі і прасторавых аб'ектаў у вашых аналітычных праграмах. Калі ваша RDBMS не можа справіцца з дадзеныя (прасторава-цэнтрычны) унутрана, так што вам прыйдзецца ўсталяваць a база дадзеных (прасторава-цэнтрычны) знешні. Гэта ўскладняе кіраванне праблемамі і зніжае вашу агульную прадукцыйнасць, не кажучы ўжо пра дадатковыя праблемы, створаныя вашымі адміністратарамі баз дадзеных, паколькі яны, верагодна, маюць мінімальнае разуменне асноў дадзеныя прасторавыя таксама. З іншага боку, калі ваш механізм RDMBS апрацоўвае ўсе прасторавыя кампаненты і яго аптымізатар ведае пра асаблівыя патрэбы (напрыклад, індэксаванне) прасторавых аб'ектаў, то вашыя адміністратара базы дадзеных могуць лёгка справіцца з кіраваннем праблемамі, і вы зможаце максімальна павялічыць прадукцыйнасць.

Акрамя таго, вам трэба наладзіць прамежкавую вобласць і ўзровень атамнага асяроддзя, каб уключыць ачыстку адраса (a

ключавы элемент прасторавага аналізу), а таксама наступнае захаванне касмічных аб'ектаў. Пераемнасць выпускаў малюнкаў працягваецца цяпер, калі мы ўвялі паняцце выразнага кірунку. З аднаго боку, гэта дадатак будзе вызначаць тып праграмнага забеспячэння, неабходнага для вашых ETL.

Вам патрэбныя такія прадукты, як Trillium, каб даць яму чысты адрас, або пастаўшчык ETL па вашаму выбару, каб забяспечыць гэтую функцыянальнасць?
На дадзены момант важна, каб вы ацанілі ўзровень праектавання, які павінен быць завершаны, перш чым пачаць укараненне вашага склада. Прыведзеныя вышэй прыклады павінны прадэманстраваць мноства дызайнерскіх рашэнняў, якія павінны прытрымлівацца ідэнтыфікацыі любога канкрэтнага бізнес-патрабавання. Пры правільным выкананні гэтыя праектныя рашэнні спрыяюць ўзаемазалежнасці паміж фізічнымі структурамі вашага асяроддзя, выбарам выкарыстоўванай тэхналогіі і патокам распаўсюджвання інфармацыйнага кантэнту. Без гэтай звычайнай архітэктуры BI ваша арганізацыя будзе падвяргацца хаатычнай сумесі існуючых тэхналогій, у лепшым выпадку няшчыльна злучаных, каб забяспечыць уяўную стабільнасць.

Падтрымліваць інфармацыйнае напаўненне

Прынесці каштоўнасць інфармацыі вашай арганізацыі - вельмі складаная задача. Без дастатковага разумення і вопыту або належнага планавання і дызайну нават лепшыя каманды пацерпяць няўдачу. З іншага боку, калі ў вас ёсць выдатная інтуіцыя і дэталёвае планаванне, але няма дысцыпліны для выканання, вы проста змарнавалі грошы і час, бо вашы намаганні асуджаныя на правал. Паведамленне павінна быць ясным: калі вам не хапае аднаго або некалькіх з гэтых навыкаў, разумення/вопыту або дысцыпліны планавання/праектавання або рэалізацыі, гэта паралізуе або разбурыць будынак арганізацыі BI.

Ці дастаткова падрыхтавана ваша каманда? Ці ёсць хто-небудзь у вашай BI-камандзе, хто разумее шырокі аналітычны ландшафт, даступны ў асяроддзі BI, а таксама метады і тэхналогіі, неабходныя для падтрымання гэтага ландшафту? Ці ёсць хто-небудзь у вашай камандзе, хто можа распазнаць розніцу прыкладанняў паміж прасунутымі

статычныя справаздачы і OLAP, ці адрозненні паміж ROLAP і OLAP? Адзін з членаў вашай каманды дакладна разумее, як здабываць і як гэта можа паўплываць на склад або як склад можа падтрымліваць прадукцыйнасць здабывання? Член каманды разумее каштоўнасць дадзеныя касмічныя або агентныя тэхналогіі? Ці ёсць у вас хто-небудзь, хто шануе унікальнае прымяненне інструментаў ETL у параўнанні з тэхналогіяй брокера паведамленняў? Калі ў вас яго няма, вазьміце яго. BI значна большы, чым нармалізаваны атамны ўзровень, OLAP, зорныя схемы і ODS.

Разуменне і вопыт распазнавання патрабаванняў BI і іх рашэнняў важныя для вашай здольнасці належным чынам фармалізаваць патрэбы карыстальнікаў, а таксама распрацоўваць і ўкараняць іх рашэнні. Калі ў вашай суполкі карыстальнікаў узнікаюць цяжкасці з апісаннем патрабаванняў, праца каманды склада - забяспечыць гэтае разуменне. Але калі каманда склада

не прызнае канкрэтнае прымяненне BI - напрыклад, інтэлектуальны аналіз дадзеных - тады гэта не самае лепшае, што асяроддзя BI часта абмяжоўваюцца толькі пасіўнымі сховішчамі. Аднак ігнараванне гэтых тэхналогій не прымяншае іх значнасці і ўплыву, які яны аказваюць на развіццё магчымасцей бізнес-аналітыкі вашай арганізацыі, а таксама на інфармацыйную сферу, якую вы плануеце развіваць.

Планаванне павінна ўключаць у сябе паняцце чарчэння, і абодва патрабуюць кампетэнтнага чалавека. Акрамя таго, праектаванне патрабуе філасофіі каманднага склада і захавання стандартаў. Напрыклад, калі ваша кампанія стварыла стандартную платформу або вызначыла пэўную RDBMS, якую вы хочаце стандартызаваць на ўсёй платформе, абавязак прытрымлівацца гэтых стандартаў ляжыць на ўсіх членах каманды. Звычайна каманда паказвае неабходнасць стандартызацыі (суполкам карыстальнікаў), але сама каманда не жадае прытрымлівацца стандартаў, устаноўленых таксама ў іншых сферах кампаніі ці, магчыма, нават у падобных кампаніях. Гэта не толькі крывадушна, але і паказвае, што кампанія не ў стане выкарыстоўваць існуючыя рэсурсы і інвестыцыі. Гэта не азначае, што няма сітуацый, якія патрабуюць нестандартызаванай платформы або тэхналогіі; аднак складскія намаганні

яны павінны раўніва ахоўваць стандарты прадпрыемства, пакуль патрабаванні бізнесу не патрабуюць іншага.

Трэці ключавы кампанент, неабходны для стварэння арганізацыі BI, - гэта дысцыпліна.
Гэта ў поўнай меры залежыць як ад чалавека, так і ад асяроддзя. Планіроўшчыкі праектаў, спонсары, архітэктары і карыстальнікі павінны цаніць дысцыпліну, неабходную для стварэння інфармацыйнага ландшафту кампаніі. Дызайнеры павінны накіроўваць свае праектныя намаганні такім чынам, каб дапаўняць іншыя неабходныя намаганні ў грамадстве.

Напрыклад, выкажам здагадку, што ваша кампанія стварае ERP-прыкладанне, якое мае складскі кампанент.
Такім чынам, дызайнеры ERP нясуць адказнасць за супрацоўніцтва з камандай складскога асяроддзя, каб не канкурыраваць і не дубляваць ужо пачатую працу.

Дысцыпліна таксама з'яўляецца тэмай, якая павінна разглядацца ўсёй арганізацыяй і звычайна вызначаецца і даручаецца выканаўчаму ўзроўню.
Ці гатовыя кіраўнікі прытрымлівацца распрацаванага падыходу? Падыход, які абяцае стварэнне інфармацыйнага кантэнту, які ў канчатковым рахунку прынясе каштоўнасць усім сферам дзейнасці прадпрыемства, але, магчыма, ставіць пад пагрозу парадак дня асобных асоб або аддзелаў? Памятаеце прымаўку «Думаць пра ўсё важней, чым думаць аб адным». Гэта выказванне справядліва для арганізацый BI.

На жаль, многія склады засяроджваюць свае намаганні на тым, каб прынесці каштоўнасць пэўнаму аддзелу або канкрэтным карыстальнікам, не звяртаючы ўвагі на арганізацыю ў цэлым. Выкажам здагадку, што выканаўчая ўлада запытвае дапамогу ў каманды байцоў. Каманда адказвае 90-дзённымі намаганнямі, якія ўключаюць не толькі выкананне патрабаванняў да апавяшчэнняў, вызначаных кіраўніком, але і забеспячэнне таго, каб усе дадзеныя базы змешваюцца на атамным узроўні перад увядзеннем у прапанаваную тэхналогію куба.
Гэта інжынернае дапаўненне гарантуе, што прадпрыемства атрымае карысць дадзеныя неабходны кіраўніку.
Тым не менш, выканаўчы размаўляў са знешнімі кансалтынгавымі фірмамі, якія прапанавалі падобную заяўку з дастаўкай менш чым за 4 тыдні.

Пры ўмове, што каманда ўнутранага склада кампетэнтная, у кіраўніка ёсць выбар. Хто можа падтрымаць дадатковую інжынерную дысцыпліну, неабходную для развіцця прадпрыемства з інфармацыйнымі актывамі, або можа выбраць хуткае стварэнне ўласнага рашэння. Здаецца, апошняе выбіраецца занадта часта і служыць толькі для стварэння кантэйнераў інфармацыі, якія прыносяць карысць толькі некаторым асобам.

Кароткатэрміновыя і доўгатэрміновыя мэты

Архітэктары і дызайнеры праектаў павінны аформіць доўгатэрміновае бачанне агульнай архітэктуры і планы росту ў арганізацыі BI. Гэта спалучэнне кароткатэрміновай выгады і доўгатэрміновага планавання прадстаўляе два бакі намаганняў BI. Кароткатэрміновы прыбытак - гэта аспект BI, які звязаны з ітэрацыямі вашага склада.

Тут планіроўшчыкі, архітэктары і спонсары сканцэнтраваны на задавальненні канкрэтных камерцыйных патрабаванняў. Менавіта на гэтым узроўні будуюцца фізічныя структуры, набываюцца тэхналогіі і ўкараняюцца метады. Яны ні ў якім разе не створаны для задавальнення канкрэтных патрабаванняў, вызначаных канкрэтнымі супольнасцямі карыстальнікаў. Усё робіцца для таго, каб адпавядаць канкрэтным патрабаванням, якія вызначае канкрэтная супольнасць.
Аднак доўгатэрміновае планаванне - гэта іншы аспект BI. Тут планы і праекты гарантавалі, што любая фізічная структура будзе пабудавана, абраныя тэхналогіі і ўкаранёны метады выкананы з прыцэлам на прадпрыемства. Менавіта доўгатэрміновае планаванне забяспечвае згуртаванасць, неабходную для таго, каб гарантаваць, што любыя кароткатэрміновыя выгады атрымаюць бізнес-выгады.

Абгрунтуйце свае намаганні BI

Un інфармацыйнае сховішча сам па сабе ён не мае ўласнай каштоўнасці. Іншымі словамі, паміж складскімі тэхналогіямі і метадамі ўкаранення няма ўласнай каштоўнасці.

Каштоўнасць любых складскіх намаганняў выяўляецца ў дзеяннях, якія выконваюцца ў выніку складскога асяроддзя і інфармацыйнага зместу, які культывуецца з цягам часу. Гэта вельмі важна зразумець, перш чым спрабаваць ацаніць каштоўнасць любой ініцыятывы wherehouse.

Занадта часта архітэктары і дызайнеры спрабуюць прымяніць каштоўнасць фізічных і тэхнічных кампанентаў склада, калі насамрэч каштоўнасць заснавана на бізнес-працэсах, на якія станоўча ўплывае склад і добра атрыманая інфармацыя.

Тут заключаецца праблема стварэння BI: як вы апраўдваеце інвестыцыі? Калі wherehouse сам па сабе не мае ўласнай каштоўнасці, распрацоўшчыкі праекта павінны даследаваць, вызначыць і фармалізаваць перавагі, атрыманыя тымі асобамі, якія будуць выкарыстоўваць склад для паляпшэння канкрэтных бізнес-працэсаў або каштоўнасці абароненай інфармацыі, або абодвух.

Справа ўскладняецца тым, што любы бізнес-працэс, на які ўплываюць намаганні па складзіраванні, можа прынесці «значныя» або «нязначныя» перавагі. Значныя перавагі забяспечваюць адчувальную метрыку для вымярэння рэнтабельнасці інвестыцый (ROI) - напрыклад, паварочванне запасаў дадатковы час на працягу пэўнага перыяду або для зніжэння кошту транспарціроўкі за адпраўку. Цяжэй вызначыць тонкія перавагі, такія як паляпшэнне доступу да інфармацыі, з пункту гледжання матэрыяльнай каштоўнасці.

Падключыце свой праект, каб даведацца пра Дзелавыя запыты

Занадта часта планіроўшчыкі праектаў спрабуюць звязаць складскую вартасць з аморфнымі мэтамі прадпрыемства. Заявіўшы, што «каштоўнасць склада заснавана на нашай здольнасці задавальняць стратэгічныя запыты», мы прыемна адкрываем дыскусію. Але гэтага аднаго недастаткова, каб вызначыць, ці ёсць сэнс інвеставаць у запасы. Лепш за ўсё звязаць складскія ітэрацыі з канкрэтнымі, вядомымі патрабаваннямі бізнесу.

Вымярэнне ROI

Разлік рэнтабельнасці інвестыцый ва ўмовах склада можа быць асабліва складаным. Асабліва цяжка, калі перавага

прынцып пэўнага паўтарэння - гэта тое, што немагчыма адчуць або лёгка вымераць. Адно даследаванне паказала, што карыстальнікі бачаць дзве асноўныя перавагі BI-ініцыятыў:

  • ▪ Стварыце здольнасць прымаць рашэнні
  • ▪ Стварыць доступ да інфармацыі
    Гэтыя перавагі з'яўляюцца мяккімі (або мяккімі) перавагамі. Лёгка зразумець, як мы можам разлічыць рэнтабельнасць інвестыцый на аснове сур'ёзных (або сур'ёзных) пераваг, такіх як зніжэнне транспартных выдаткаў, але як вымераць здольнасць прымаць лепшыя рашэнні?
    Гэта, безумоўна, складаная задача для планіроўшчыкаў праектаў, калі яны спрабуюць пераканаць кампанію інвеставаць у пэўны склад. Павелічэнне продажаў або зніжэнне выдаткаў больш не з'яўляюцца цэнтральнымі тэмамі, якія рухаюць асяроддзе BI.
    Замест гэтага вы разглядаеце запыты бізнесу аб паляпшэнні доступу да інфармацыі, каб пэўны аддзел мог хутчэй прымаць рашэнні. Гэта стратэгічныя фактары, якія аднолькава важныя для прадпрыемства, але больш неадназначныя і іх цяжэй ахарактарызаваць у матэрыяльнай метрыцы. У гэтым выпадку разлік рэнтабельнасці інвестыцый можа ўвесці ў зман, калі не сказаць, што не мае значэння.
    Планіроўшчыкі праекта павінны быць у стане прадэманстраваць адчувальную каштоўнасць для кіраўнікоў, каб вырашыць, ці вартыя інвестыцыі ў пэўную ітэрацыю. Тым не менш, мы не будзем прапаноўваць новы метад разліку рэнтабельнасці інвестыцый і не будзем прыводзіць аргументы за або супраць.
    Ёсць шмат артыкулаў і кніг, якія абмяркоўваюць асновы разліку рэнтабельнасці інвестыцый. Існуюць спецыяльныя каштоўныя прапановы, такія як каштоўнасць інвестыцый (VOI), якія прапануюць такія групы, як Gartner, якія вы можаце даследаваць. Замест гэтага мы засяродзімся на асноўных аспектах любой рэнтабельнасці інвестыцый або іншых каштоўнасных прапаноў, якія вам трэба разгледзець. Прымяненне ROI Акрамя спрэчкі аб «цвёрдых» перавагах супраць «мяккіх» пераваг, звязаных з намаганнямі BI, ёсць і іншыя пытанні, якія варта ўлічваць пры прымяненні рэнтабельнасці інвестыцый. Напрыклад:

Прыпісвайце намаганням DW занадта шмат эканоміі, якая ўсё роўна атрымаецца
Дапусцім, ваша кампанія перайшла з архітэктуры мэйнфрэйма на размеркаванае асяроддзе UNIX. Такім чынам, любая эканомія, якая можа (ці не можа) быць рэалізавана ў выніку гэтых намаганняў, не павінна адносіцца выключна да складу, калі наогул (?).

Калі не ўлічваць усё, гэта дорага каштуе. І ёсць шмат рэчаў, якія трэба прыняць да ўвагі. Разгледзім наступны спіс:

  • ▪ Пачатковыя выдаткі, уключаючы мэтазгоднасць.
  • ▪ Кошт спецыяльнага абсталявання з адпаведным сховішчам і камунікацыямі
  • ▪ Кошт праграмнага забеспячэння, уключаючы кіраванне дадзеныя і пашырэнні кліент/сервер, праграмнае забеспячэнне ETL, тэхналогіі DSS, інструменты візуалізацыі, прыкладанні для планавання і працоўнага працэсу, а таксама праграмнае забеспячэнне для маніторынгу.
  • ▪ Кошт праектавання канструкцыі дадзеныя, са стварэннем і аптымізацыяй
  • ▪ Кошт распрацоўкі праграмнага забеспячэння непасрэдна звязаны з намаганнямі BI
  • ▪ Кошт падтрымкі на месцы, уключаючы аптымізацыю прадукцыйнасці, уключаючы кантроль версій праграмнага забеспячэння і дапамогу Прымяніць рэнтабельнасць інвестыцый "Вялікага выбуху". Будаўніцтва склада адным гіганцкім намаганнем асуджана на правал, таму нават разлічыце рэнтабельнасць інвестыцый для ініцыятывы вялікага прадпрыемства. Прапанова дзіўная, і планіроўшчыкі працягваюць рабіць слабыя спробы ацаніць каштоўнасць усіх намаганняў. Чаму планіроўшчыкі спрабуюць ацаніць дзелавую ініцыятыву ў грашовым выражэнні, калі шырока вядома і прызнана, што ацаніць канкрэтныя паўторы складана? Як такое магчыма? Гэта немагчыма, за некаторымі выключэннямі. Не рабіце гэтага. Цяпер, калі мы вызначылі, чаго нельга рабіць пры разліку рэнтабельнасці інвестыцый, вось некалькі пунктаў, якія дапамогуць нам стварыць надзейны працэс для ацэнкі каштоўнасці вашых намаганняў BI.

Атрыманне кансенсусу аб рэнтабельнасці інвестыцый. Незалежна ад таго, якую тэхніку вы абралі для ацэнкі каштоўнасці вашых намаганняў па BI, яна павінна быць узгоднена з усімі бакамі, уключаючы распрацоўшчыкаў праекта, спонсараў і кіраўнікоў прадпрыемстваў.

Паменшыце рэнтабельнасць інвестыцый на часткі, якія можна ідэнтыфікаваць. Неабходным крокам да разумнага разліку рэнтабельнасці інвестыцый з'яўляецца сканцэнтраванне гэтага разліку на канкрэтным праекце. Затым гэта дазваляе вам ацаніць кошт на аснове выканання канкрэтных патрабаванняў бізнесу

Вызначце выдаткі. Як ужо згадвалася, трэба ўлічваць шматлікія выдаткі. Акрамя таго, выдаткі павінны ўключаць не толькі тыя, якія звязаны з адной ітэрацыяй, але і выдаткі, звязаныя з забеспячэннем адпаведнасці карпаратыўным стандартам.

Вызначце перавагі. Выразна звязваючы рэнтабельнасць інвестыцый з канкрэтнымі патрабаваннямі бізнесу, мы павінны быць у стане вызначыць перавагі, якія прывядуць да выканання патрабаванняў.

Скарачэнне выдаткаў і выгод у немінучай прыбытку. Гэта лепшы спосаб заснаваць вашыя ацэнкі на чыстай цяперашняй кошту (NPV) у адрозненне ад таго, каб спрабаваць прагназаваць будучую каштоўнасць будучых прыбыткаў.

Звядзіце да мінімуму час падзелу рэнтабельнасці інвестыцый. Ён добра дакументаваны на працягу доўгага перыяду часу, калі ён выкарыстоўваўся ў вашай рэнтабельнасці інвестыцый.

Выкарыстоўвайце больш чым адну формулу ROI. Існуе мноства метадаў прагназавання рэнтабельнасці інвестыцый, і вы павінны спланаваць, ці варта выкарыстоўваць адзін або некалькі з іх, уключаючы чыстую цяперашнюю вартасць, унутраную норму прыбытку (IRR) і акупнасць.

Вызначце паўторны працэс. Гэта мае вырашальнае значэнне для разліку любой доўгатэрміновай кошту. Адзіны паўтаральны працэс павінен быць задакументаваны для ўсіх наступных паслядоўнасцей праекта.

Пералічаныя праблемы з'яўляюцца найбольш распаўсюджанымі, вызначанымі экспертамі ў асяроддзі байцоў. Настойлівае патрабаванне кіраўніцтва забяспечыць рэнтабельнасць інвестыцый "вялікага выбуху" вельмі дэзарыентуе. Калі вы пачнеце ўсе свае разлікі рэнтабельнасці інвестыцый, разбіўшы іх на ідэнтыфікаваныя, адчувальныя часткі, у вас ёсць добры шанец ацаніць дакладны рэйтынг рэнтабельнасці інвестыцый.

Пытанні адносна пераваг рэнтабельнасці інвестыцый

Якімі б ні былі вашы перавагі, мяккімі ці жорсткімі, вы можаце выкарыстоўваць некаторыя асноўныя пытанні, каб вызначыць іх каштоўнасць. Напрыклад, выкарыстоўваючы простую сістэму шкаліравання ад 1 да 10, вы можаце вымераць эфект ад любых намаганняў, выкарыстоўваючы наступныя пытанні:

  • Як бы вы ацанілі разуменне дадзеныя сочыце за гэтым праектам вашай кампаніі?
  • Як бы вы ацанілі паляпшэнне працэсу ў выніку гэтага праекта?
  • Як бы вы вымералі ўплыў новых ідэй і высноў, даступных у выніку гэтай ітэрацыі
  • Якім было ўздзеянне новых і прадукцыйных вылічальных асяроддзяў у выніку таго, што было вывучана? Калі адказаў на гэтыя пытанні мала, магчыма, што кампанія не вартая ўкладзеных сродкаў. Пытанні з высокім балам паказваюць на значны прырост каштоўнасці і павінны служыць кіраўніцтвам для далейшага расследавання. Напрыклад, высокі бал за ўдасканаленне працэсаў павінен прымусіць дызайнераў вывучыць, як былі палепшаны працэсы. Вы можаце выявіць, што некаторыя або ўсе даходы з'яўляюцца адчувальнымі, і таму можна лёгка прымяніць грашовую ацэнку. Атрыманне максімальнай карысці ад першай ітэрацыі склад Найвялікшы вынік вашых карпаратыўных намаганняў часта дае першыя некалькі ітэрацый. Гэтыя першыя спробы традыцыйна ствараюць найбольш карысны інфармацыйны кантэнт для грамадскасці і дапамагаюць стварыць тэхналагічную аснову для наступных прыкладанняў BI. Звычайна кожная наступная паслядоўнасць дадзеныя складскіх праектаў прыносяць усё менш і менш дадатковай каштоўнасці для прадпрыемства ў цэлым. Гэта асабліва актуальна, калі ітэрацыя не дадае новых тэм і не адпавядае патрэбам новай супольнасці карыстальнікаў.

Гэтая функцыя захоўвання таксама прымяняецца да растучых стосаў дадзеныя гісторыкаў. Паколькі наступныя намаганні патрабуюць большага дадзеныя і як яшчэ дадзеныя выліваюцца на склад з часам, большая частка дадзеныя становіцца менш актуальным для выкарыстоўванага аналізу. Гэтыя дадзеныя іх часта называюць дадзеныя у стане спакою, і ўтрымліваць іх заўсёды дорага, таму што яны амаль не выкарыстоўваюцца.

Што гэта значыць для спонсараў праекта? Па сутнасці, першыя спонсары дзеляцца больш, чым каштуюць інвестыцыі. Гэта асноўнае, таму што яны з'яўляюцца штуршком для стварэння шырокага пласта тэхналогій і рэсурснага асяроддзя склада, у тым ліку арганічных.

Але гэтыя першыя крокі прыносяць найбольшую каштоўнасць, і таму распрацоўшчыкам праектаў часта даводзіцца апраўдваць інвестыцыі.
Праекты, зробленыя пасля вашай BI-ініцыятывы, могуць мець меншыя (у параўнанні з першымі) і прамыя выдаткі, але прынесці меншую каштоўнасць для кампаніі.

А ўладальнікам арганізацый трэба задумацца аб выкідванні назапашванняў дадзеныя і менш актуальныя тэхналогіі.

Інтэлектуальны аналіз дадзеных: выманне Dati

Шматлікія архітэктурныя кампаненты патрабуюць варыяцый у тэхналогіях і метадах інтэлектуальнага аналізу дадзеных -
напрыклад, розныя "агенты" для вывучэння цікавых месцаў кліенты, аперацыйныя сістэмы кампаніі і для самой dw. Гэтыя агенты могуць быць перадавымі нейронавымі сеткамі, навучанымі тэндэнцыям POT, такім як будучы попыт на прадукт, заснаваны на стымуляванні продажаў; рухавікі, заснаваныя на правілах, каб рэагаваць на набор дата абставінаў, напрыклад, медыцынскі дыягназ і рэкамендацыі па лячэнні; або нават простыя агенты з роляй справаздач аб выключэннях для вышэйшых кіраўнікоў. Наогул гэтыя працэсы экстракцыі дадзеныя si

праверка ў рэжыме рэальнага часу; такім чынам, яны павінны быць цалкам аб'яднаны з рухам дадзеныя самі.

Онлайн аналітычная апрацоўка Апрацоўка

Інтэрнэт-аналітыка

Здольнасць нарэзаць, нарэзаць кубікамі, згортваць, дэталізаваць і выконваць аналіз
што-калі, знаходзіцца ў межах, у цэнтры ўвагі тэхналагічнага комплексу IBM. Напрыклад, для DB2 існуюць функцыі анлайнавай аналітычнай апрацоўкі (OLAP), якія ўносяць аналіз памераў у механізм праграмнага забеспячэння. база дадзеных тое ж самае.

Гэтыя функцыі дадаюць шматмерную карыснасць SQL, адначасова карыстаючыся ўсімі перавагамі натуральнай часткі DB2. Іншым прыкладам інтэграцыі OLAP з'яўляецца інструмент для вымання DB2 OLAP Server Analyzer. Гэтая тэхналогія дазваляе хутка і аўтаматычна аналізаваць кубы OLAP-сервера DB2 для пошуку значэнняў і справаздачы аб іх дадзеныя незвычайныя або нечаканыя ва ўсім кубе для бізнес-аналітыка. І, нарэшце, функцыі DW Center даюць архітэктарам магчымасць кантраляваць, сярод іншага, профіль куба сервера DB2 OLAP як натуральнай часткі працэсаў ETL.

Прасторавы аналіз Прасторавы аналіз

Прастора складае палову аналітычных апор (лідаў), неабходных для панарамы
аналітычны шырокі (час прадстаўляе другую палову). Атамны ўзровень сховішча, намаляваны на малюнку 1.1, уключае як час, так і прастору. Пазнакі часу прывязваюць аналіз па часе, а інфармацыя аб адрасе - па прасторы. Пазнакі часу праводзяць аналіз па часе, а адрасная інфармацыя - па прасторы. На дыяграме паказана геакадзіраванне - працэс пераўтварэння адрасоў у кропкі на карце або ў кропкі ў прасторы, каб такія паняцці, як адлегласць і ўнутры/звонку, можна было выкарыстоўваць у аналізе - праводзіцца на атамарным узроўні і прасторавы аналіз, які даступны для аналітык. IBM прадастаўляе прасторавыя пашырэнні, распрацаваныя сумесна з Інстытутам даследаванняў экалагічных сістэм (ESRI). база дадзеных DB2, каб касмічныя аб'екты маглі захоўвацца як звычайная частка база дадзеных рэляцыйная. DB2

Прасторавыя пашыральнікі таксама забяспечваюць усе пашырэнні SQL, каб скарыстацца прасторавым аналізам. Напрыклад, пашырэнні SQL для запытаў
адлегласць паміж адрасамі або тое, ці знаходзіцца кропка ўнутры або па-за вызначанай шматкутнай вобласці, з'яўляюцца аналітычным стандартам для Spatial Extender. Для атрымання дадатковай інфармацыі глядзіце раздзел 16.

База дадзеных-Resident Tools Інструменты База дадзеных-Жыхар

DB2 мае мноства рэзідэнтных BI-функцый SQL, якія дапамагаюць у аналізе. Да іх адносяцца:

  • Функцыі рэкурсіі для выканання аналізу, такія як «знаходжанне ўсіх магчымых маршрутаў палёту з Сан - Францыска a I Love New York».
  • Аналітычныя функцыі для ранжыравання, кумулятыўныя функцыі, куб і зборка для палягчэння задач, якія звычайна адбываюцца толькі з тэхналогіяй OLAP, цяпер з'яўляюцца натуральнай часткай рухавіка база дадзеных
  • Магчымасць стварэння табліц, якія змяшчаюць вынікі
    Прадаўцы з база дадзеных лідэры змешваюць больш магчымасцяў BI ў база дадзеных тое самае.
    Асноўныя пастаўшчыкі база дадзеных яны змешваюць больш магчымасцяў BI ў база дадзеных тое самае.
    Гэта забяспечвае лепшую прадукцыйнасць і больш варыянтаў выканання для рашэнняў BI.
    Асаблівасці і функцыі DB2 V8 падрабязна разглядаюцца ў наступных раздзелах:
    Тэхнічная архітэктура і асновы кіравання дадзенымі (раздзел 5)
  • Асновы DB2 BI (раздзел 6)
  • Табліцы матэрыялізаваных запытаў DB2 (раздзел 7)
  • Функцыі DB2 OLAP (раздзел 13)
  • DB2 Enhanced BI Features and Functions (Раздзел 15) Спрошчаная сістэма дастаўкі даных Сістэма дастаўкі дадзеныя спрошчаны

Архітэктура, намаляваная на малюнку 1.1, уключае мноства збудаванняў дадзеныя фізічны. Адным з іх з'яўляецца склад в дадзеныя аперацыйная. Як правіла, ODS - гэта прадметна-арыентаваны, інтэграваны і сучасны аб'ект. Вы б пабудавалі ODS для падтрымкі, напрыклад, офіса продажаў. Продажы ОРВ будуць дапаўняць дадзеныя з мноства розных сістэм, але захаваў бы толькі, напрыклад, сённяшнія транзакцыі. ODS таксама можна абнаўляць шмат разоў на дзень. У той жа час працэсы падштурхоўваюць дадзеныя інтэграваны ў іншыя прыкладанні. Гэтая структура спецыяльна распрацавана для інтэграцыі дадзеныя бягучы і дынамічны і можа быць верагодным кандыдатам для падтрымкі аналітыкі ў рэжыме рэальнага часу, напрыклад, прадастаўлення сэрвісным агентам кліенты бягучая інфармацыя аб продажах кліента шляхам здабывання інфармацыі аб тэндэнцыях продажаў з самога склада. Іншая структура, паказаная на малюнку 1.1, - гэта фармальны стан dw. Гэта не толькі месца для выканання неабходнай інтэграцыі, якасці дадзеныяі трансфармацыі дадзеныя ўваходнага склада, але гэта таксама надзейная і часовая зона захоўвання для дадзеныя копіі, якія можна выкарыстоўваць у аналізах у рэальным часе. Калі вы вырашыце выкарыстаць ODS або сцэнічную зону, адзін з лепшых інструментаў для засялення гэтых структур дадзеныя выкарыстанне розных аператыўных крыніц - гэта гетэрагенны размеркаваны запыт DB2. Гэтая магчымасць забяспечваецца дадатковай функцыяй DB2 пад назвай DB2 Relational Connect (толькі запыт) і праз DB2 DataJoiner (асобны прадукт, які забяспечвае магчымасць запыту, устаўкі, абнаўлення і выдалення ў гетэрагенных размеркаваных РСУБД).

Гэтая тэхналогія дазваляе архітэктарам дадзеныя завязваць дадзеныя вытворчасць з аналітычнымі працэсамі. Тэхналогія не толькі можа адаптавацца практычна да любых патрабаванняў да рэплікацыі, якія могуць узнікнуць з дапамогай аналітыкі ў рэальным часе, але яна таксама можа падключацца да шырокага спектру баз даных дадзеныя найбольш папулярныя, уключаючы DB2, Oracle, Sybase, SQL Server, Informix і іншыя. DB2 DataJoiner можна выкарыстоўваць для запаўнення структуры дадзеныя фармальны як ODS або нават пастаянная табліца, прадстаўленая на складзе, прызначаная для хуткага аднаўлення імгненных абнаўленняў або для продажу. Вядома, гэтыя ж структуры дадзеныя можна запоўніць з дапамогай

яшчэ адна важная тэхналогія, прызначаная для рэплікацыі дадзеныя, IBM DataPropagator Relational. (DataPropagator - гэта асобны прадукт для цэнтральных сістэм. DB2 UNIX, Linux, Windows і OS/2 уключаюць службы рэплікацыі даных дадзеныя як стандартная функцыя).
Яшчэ адзін спосаб перамяшчэння дадзеныя на прадпрыемстве працуе інтэгратар карпаратыўных прыкладанняў, таксама вядомы як брокер паведамленняў. Гэтая унікальная тэхналогія дазваляе непераўзыдзены кантроль для нацэльвання і перамяшчэння дадзеныя вакол кампаніі. IBM мае найбольш шырока выкарыстоўваны брокер паведамленняў, MQSeries, або разнавіднасць прадукту, якая ўключае патрабаванні электронная камерцыя, IBM WebSphere MQ.
Каб даведацца больш пра тое, як выкарыстоўваць MQ для падтрымкі складоў і асяроддзя BI, наведайце вэб-сайт кнігі. На дадзены момант дастаткова сказаць, што гэтая тэхналогія з'яўляецца выдатным сродкам для захопу і трансфармацыі (з выкарыстаннем MQSeries Integrator) дадзеныя Цэнтраваныя (мэтавыя) аператары, набраныя для рашэнняў BI. Тэхналогія MQ была інтэграваная і ўпакаваная ў UDB V8, што азначае, што чэргамі паведамленняў цяпер можна кіраваць, як калі б яны былі табліцамі DB2. Канцэпцыя зваркі паведамленняў у чарзе і сусвету база дадзеных рэляцыйныя накіроўваюцца да магутнага асяроддзя дастаўкі дадзеныя.

Нулявая затрымка Нулявая затрымка

Канчатковай стратэгічнай мэтай IBM з'яўляецца аналіз без затрымкі. Як вызначана
Gartner, сістэма BI павінна мець магчымасць рабіць высновы, засвойваць і прадастаўляць інфармацыю аналітыкам па патрабаванні. Праблема, вядома, у тым, як змяшаць дадзеныя бягучая і ў рэжыме рэальнага часу з неабходнай гістарычнай інфармацыяй, такой як i дадзеныя звязаная мадэль/тэндэнцыя або вынятае разуменне, напрыклад, прафіляванне кліента.

Такая інфармацыя ўключае, напрыклад, ідэнтыфікацыю кліенты высокі або нізкі рызыка або якія прадукты i кліенты яны, хутчэй за ўсё, будуць купляць, калі ў іх ужо ёсць сыр у кошыку.

Дасягненне нулявой затрымкі на самай справе залежыць ад двух асноўных механізмаў:

  • Поўнае аб'яднанне в дадзеныя якія аналізуюцца з дапамогай устаноўленых метадаў і інструментаў, створаных BI
  • Сістэма дастаўкі дадзеныя эфектыўны, каб пераканацца, што аналітыка ў рэальным часе сапраўды даступная. Гэтыя перадумовы для нулявой затрымкі не адрозніваюцца ад дзвюх мэт, пастаўленых IBM і апісаных вышэй. Блізкае спарванне з дадзеныя Гэта частка праграмы бясшвоўнай інтэграцыі IBM. І стварыць сістэму дастаўкі дадзеныя эфектыўнасць цалкам залежыць ад даступнай тэхналогіі, якая спрашчае працэс дастаўкі дадзеныя. У выніку дзве з трох мэт IBM маюць вырашальнае значэнне для рэалізацыі трэцяй. IBM свядома развівае сваю тэхналогію, каб забяспечыць нулявую затрымку для складоў. Кароткі змест / Сінт Арганізацыя BI прапануе дарожную карту для стварэння вашага асяроддзя
    ітэрацыйна. Ён павінен быць скарэкціраваны ў адпаведнасці з патрэбамі вашага бізнесу, як цяперашнімі, так і будучымі. Без шырокага архітэктурнага бачання складскія ітэрацыі - гэта не больш чым выпадковая рэалізацыя цэнтральнага склада, якая мала спрыяе стварэнню шырокага інфарматыўнага прадпрыемства. Першая перашкода для кіраўнікоў праектаў - гэта тое, як апраўдаць інвестыцыі, неабходныя для развіцця арганізацыі BI. У той час як разлік рэнтабельнасці інвестыцый заставаўся асновай укаранення складскіх паслуг, дакладна прадказаць яго становіцца ўсё больш складана. Гэта прывяло да іншых метадаў вызначэння таго, ці апраўдваеце вы свае грошы. Напрыклад, вартасць інвестыцый2 (VOI) прапагандуецца як рашэнне. Гэта ўскладзена на архітэктараў в дадзеныя і планіроўшчыкі праектаў наўмысна ствараюць і прадастаўляюць інфармацыю асацыяцыям карыстальнікаў, а не проста прадастаўляюць ім паслугі дадзеныя. Паміж імі існуе велізарная розніца. Інфармацыя - гэта тое, што робіць розніцу ў прыняцці рашэнняў і эфектыўнасці; адносна, я дадзеныя яны з'яўляюцца будаўнічымі блокамі для атрымання гэтай інфармацыі.

Нават калі я крытычна стаўлюся да крыніцы дадзеныя Для задавальнення бізнес-запытаў асяроддзе BI павінна выконваць большую ролю ў стварэнні інфармацыйнага кантэнту. Мы павінны зрабіць дадатковыя крокі для ачысткі, інтэграцыі, пераўтварэння або іншым чынам стварыць інфармацыйнае змесціва, на якое карыстальнікі змогуць дзейнічаць, а затым мы павінны пераканацца, што гэтыя дзеянні і рашэнні, дзе гэта разумна, адлюстроўваюцца ў асяроддзі BI. Калі мы перанясем склад толькі для абслугоўвання дадзеныя, гарантуецца, што асацыяцыі карыстальнікаў будуць ствараць інфармацыйны кантэнт, неабходны для прыняцця мер. Гэта гарантуе, што іх супольнасць зможа прымаць лепшыя рашэнні, але прадпрыемства пакутуе ад недахопу ведаў, якія яны выкарыстоўвалі. Дато Паколькі архітэктары і планіроўшчыкі ініцыююць канкрэтныя праекты ў асяроддзі BI, яны застаюцца адказнымі перад прадпрыемствам у цэлым. Просты прыклад гэтай двухбаковай характарыстыкі ітэрацый BI можна знайсці ў крыніцы дадзеныя. Усе дадзеныя атрыманыя для канкрэтных бізнес-запытаў павінны быць запоўненыя ў першым атамным узроўні. Гэта забяспечвае развіццё карпаратыўнага інфармацыйнага актыву, а таксама кіраванне канкрэтнымі запытамі карыстальнікаў, вызначанымі ў ітэрацыі.

WhatisaDataWarehouse?

інфармацыйнае сховішча гэта сэрца архітэктуры інфармацыйных сістэм з 1990 года і падтрымлівае інфармацыйныя працэсы, прапаноўваючы трывалую інтэграваную платформу дадзеныя гістарычныя дадзеныя, узятыя за аснову для наступных аналізаў. THE інфармацыйнае сховішча яны прапануюць прастату інтэграцыі ў свеце несумяшчальных сістэм прыкладанняў. інфармацыйнае сховішча гэта ператварылася ў тэндэнцыю. інфармацыйнае сховішча арганізоўваць і захоўваць i дадзеныя неабходны для інфармацыйна-аналітычных працэсаў, заснаваных на доўгай гістарычнай часовай перспектыве. Усё гэта прадугледжвае значную і пастаянную прыхільнасць да будаўніцтва і абслугоўвання інфармацыйнае сховішча.

Такім чынам, што такое a інфармацыйнае сховішча? А інфармацыйнае сховішча і:

  • ▪ прадметна-арыентаваны
  • ▪ інтэграваная сістэма
  • ▪ варыянт часу
  • ▪ энерганезалежны (немагчыма сцерці)

зборнік дадзеныя выкарыстоўваецца для падтрымкі кіраўніцкіх рашэнняў пры рэалізацыі працэсаў.
I дадзеныя устаўлены ст інфармацыйнае сховішча у большасці выпадкаў яны паходзяць з аператыўнага асяроддзя. The інфармацыйнае сховішча ён ствараецца блокам захоўвання, фізічна аддзеленым ад астатняй сістэмы, якую ён змяшчае дадзеныя раней трансфармаваны праграмамі, якія аперуюць інфармацыяй, атрыманай з аперацыйнага асяроддзя.

Літаральнае вызначэнне а інфармацыйнае сховішча заслугоўвае паглыбленага тлумачэння, паколькі існуюць важныя матывацыі і асноўныя значэнні, якія апісваюць характарыстыкі склада.

ПРАДМЕТНАЯ АРЫЕНТАВАНАСЦЬ ТЭМАТЫЧНЫ

Першая характарыстыка а інфармацыйнае сховішча заключаецца ў тым, што ён арыентаваны на асноўных гульцоў у кампаніі. Кіраўніцтва па выпрабаваннях праз дадзеныя ён у адрозненне ад больш класічнага метаду, які прадугледжвае арыентацыю прыкладанняў на працэсы і функцыі, метад, які ў асноўным падзяляецца большасцю менш сучасных сістэм кіравання.

Аперацыйны свет распрацаваны вакол прыкладанняў і функцый, такіх як пазыкі, зберажэнні, банкаўскія карты і давер для фінансавай установы. Свет dw арганізаваны вакол асноўных прадметаў, такіх як кліент, прадавец, прадукт і дзейнасць. Выраўноўванне вакол тэм уплывае на дызайн і рэалізацыю дадзеныя знойдзены ў dw. Што яшчэ больш важна, асноўная тэма ўплывае на найбольш важную частку структуры ключа.

На свет прыкладанняў уплываюць як дызайн базы дадзеных, так і дызайн працэсу. Свет dw арыентаваны выключна на мадэляванне дадзеныя і па дызайне в база дадзеных. Праектаванне працэсу (у яго класічнай форме) не з'яўляецца часткай асяроддзя dw.

Адрозненні паміж выбарам прымянення працэсу/функцыі і выбарам прадмета таксама выяўляюцца ў адрозненнях у змесце дадзеныя на падрабязным узроўні. THE дадзеныя dw не ўключаюць i дадзеныя якія не будуць выкарыстоўвацца для працэсу DSS падчас прыкладанняў

аператыўна арыентаваны дадзеныя змяшчаюць i дадзеныя каб неадкладна задаволіць функцыянальныя патрабаванні / патрабаванні да апрацоўкі, якія могуць мець або не мець ніякай карысці для аналітыка DSS.
Яшчэ адзін важны спосаб, у якім аператыўна-арыентаваных прыкладанняў дадзеныя адрозніваюцца ад дадзеныя dw знаходзіцца ў дэі-справаздачах дадзеныя. Я дадзеныя аперацыі падтрымліваюць бесперапынную сувязь паміж двума або больш табліцамі на аснове дзеючага бізнес-правіла. THE дадзеныя dw перасякаюць спектр часу, і ўзаемасувязяў, знойдзеных у dw, шмат. Мноства правілаў гандлю (і, адпаведна, шмат адносін паміж дадзеныя ) прадстаўлены на складзе а дадзеныя паміж двума ці больш сталамі.

(Для падрабязнага тлумачэння таго, як узнікаюць адносіны паміж дадзеныя апрацоўваюцца ў DW, мы звяртаемся да тэхнічнай тэмы па гэтым пытанні.)
Ні з іншага пункту гледжання, акрамя фундаментальнай розніцы паміж выбарам функцыянальнага/працэснага прыкладання і выбарам прадмета, ці існуе большая розніца паміж аперацыйнымі сістэмамі і дадзеныя і DW.

ІНТЭГРАЦЫЯ ІНТЭГРАЦЫЯ

Найбольш важным аспектам асяроддзя dw з'яўляецца тое, што i дадзеныя знойдзеныя ў dw лёгка інтэгруюцца. ЗАЎСЁДЫ. БЕЗ ВЫКЛЮЧЭННЯЎ. Сама сутнасць асяроддзя dw заключаецца ў тым, што i дадзеныя якія змяшчаюцца ў межах склада інтэграваныя.

Інтэграцыя выяўляецца рознымі спосабамі - у паслядоўных вызначаных канвенцыях, у паслядоўных вымярэннях зменных, у паслядоўных закадзіраваных структурах, у фізічных атрыбутах дадзеныя паслядоўны, і гэтак далей.

На працягу многіх гадоў распрацоўшчыкі розных прыкладанняў прымалі мноства рашэнняў аб тым, як трэба распрацоўваць прыкладанне. Стыль і індывідуальныя дызайнерскія рашэнні дызайнерскіх прыкладанняў выяўляюць сябе сотнямі спосабаў: у адрозненнях у кадаванні, структуры ключоў, фізічных характарыстыках, ідэнтыфікацыйных канвенцыях і гэтак далей. Калектыўная здольнасць многіх распрацоўшчыкаў прыкладанняў ствараць супярэчлівыя прыкладанні легендарная. Малюнак 3 паказвае некаторыя найбольш важныя адрозненні ў спосабах распрацоўкі прыкладанняў.

Кадзіроўка: Кадзіроўка:

Распрацоўшчыкі прыкладанняў па-рознаму выбіралі кадыроўку поля – сэкс. Дызайнер уяўляе сэкс літарамі «м» і «ж». Іншы дызайнер прадстаўляе пол як «1» і «0». Іншы дызайнер уяўляе сэкс літарамі «х» і «у». Іншы дызайнер прадстаўляе пол як «мужчынскі» і «жаночы». Не мае вялікага значэння, як сэкс трапляе ў DW. «М» і «Ж», напэўна, такія ж добрыя, як і ўся п'еса.

Важна тое, што незалежна ад паходжання палавога поля, яно трапляе ў DW у паслядоўным інтэграваным стане. Такім чынам, калі поле загружаецца ў DW з прыкладання, дзе яно было прадстаўлена ў фармаце «M» і «F», дадзеныя неабходна пераўтварыць у фармат DW.

Вымярэнне атрыбутаў: вымярэнне Атрыбуты:

На працягу многіх гадоў распрацоўшчыкі прыкладанняў выбіралі для вымярэння трубаправода розныя спосабы. Дызайнер захоўвае дадзеныя трубаправода ў сантыметрах. Іншы дызайнер прыкладанняў захоўвае дадзеныя трубаправода ў цалях. Іншы дызайнер прыкладанняў захоўвае дадзеныя трубаправода ў мільёнах кубічных футаў у секунду. І яшчэ адзін канструктар захоўвае інфармацыю аб трубаправодзе з пункту гледжання ярдаў. Незалежна ад крыніцы, калі інфармацыя аб канвееры паступае ў DW, яна павінна вымярацца такім жа чынам.

Згодна з паказаннямі на малюнку 3, праблемы інтэграцыі закранаюць амаль усе аспекты праекта - фізічныя характарыстыкі дадзеныя, дылема наяўнасці больш чым адной крыніцы дадзеныя, праблема неадпаведнасці выяўленых узораў, фарматаў ст дадзеныя непаслядоўныя і гэтак далей.

Незалежна ад тэмы дызайну, вынік аднолькавы - г.зн дадзеныя павінны захоўвацца ў DW адзіным і глабальна прымальным спосабам, нават калі асноўныя аперацыйныя сістэмы захоўваюць іх па-рознаму дадзеныя.

Калі аналітык DSS разглядае DW, мэтай аналітыка павінна быць выкарыстанне дадзеныя якія знаходзяцца на складзе,

а не задацца пытаннем аб даверы або паслядоўнасці дадзеныя.

ВАРЫЯНЦЫЯ ЧАСУ

Усе i я дадзеныя у DW яны дакладныя да пэўнага моманту часу. Гэтая асноўная характарыстыка ст дадзеныя у DW гэта моцна адрозніваецца ад тых дадзеныя знойдзены ў працоўным асяроддзі. THE дадзеныя аперацыйнага асяроддзя такія ж дакладныя, як і ў момант доступу. Іншымі словамі, у працоўным асяроддзі пры доступе да дыска дадзеныя, чакаецца, што ён будзе адлюстроўваць дакладныя значэнні на момант доступу. Таму што я дадзеныя у DW дакладныя, як у нейкі момант часу (г.зн. не «прама цяпер»), гаворыцца, што я дадзеныя знойдзеныя ў DW з'яўляюцца «адхіленнем часу».
Часовая дысперсія дадзеныя DW згадваецца па-рознаму.
Самы просты спосаб - i дадзеныя DW прадстаўляюць дадзеныя на працяглы час - ад пяці да дзесяці гадоў. Часовы гарызонт, прадстаўлены для аперацыйнага асяроддзя, значна карацейшы за сённяшнія бягучыя значэнні ад шасцідзесяці дзевяноста
Праграмы, якія павінны добра працаваць і быць даступнымі для апрацоўкі транзакцый, павінны мець мінімальную колькасць дадзеныя калі яны дазваляюць любую ступень гнуткасці. Такім чынам, аператыўныя прыкладанні маюць кароткі часовы гарызонт, як тэма дызайну аўдыяпрыкладанняў.
Другі спосаб з'яўлення «адхіленні ў часе» ў DW - гэта структура ключа. Кожная ключавая структура ў DW змяшчае, яўна ці відавочна, элемент часу, напрыклад дзень, тыдзень, месяц і г.д. Элемент часу амаль заўсёды знаходзіцца ўнізе злучанага ключа, знойдзенага ў DW. У такіх выпадках элемент часу будзе існаваць няяўна, напрыклад, калі ўвесь файл дублюецца ў канцы месяца або квартала.
Трэці спосаб адлюстравання дысперсіі часу заключаецца ў тым, што i дадзеныя DW пасля правільнай рэгістрацыі не можа быць абноўлены. THE дадзеныя DW з'яўляюцца для ўсіх практычных мэтаў доўгай серыяй здымкаў. Вядома, калі здымкі былі зроблены няправільна, то здымкі можна змяніць. Але калі выказаць здагадку, што здымкі зроблены правільна, яны не будуць зменены, як толькі зроблены. У некаторых

У некаторых выпадках змяненне здымкаў у DW можа быць неэтычным або нават несапраўдным. THE дадзеныя аператыўныя, дакладныя на момант доступу, яны могуць быць абноўлены па меры неабходнасці.

НЕЛЯТУЧНЫ

Чацвёртая важная характарыстыка DW - гэта энерганезалежнасць.
Абнаўленні, устаўкі, выдаленні і мадыфікацыі ўносяцца рэгулярна ў працоўныя асяроддзя на аснове кожнага запісу. Але асноўныя маніпуляцыі з дадзеныя якія неабходныя ў DW значна прасцей. Ёсць толькі два віды аперацый, якія адбываюцца ў DW - першапачатковая загрузка дадзеныя і доступ да дадзеныя. Няма абнаўленняў дадзеныя (у агульным сэнсе абнаўлення) у DW як звычайная аперацыя апрацоўкі. Ёсць некалькі вельмі моцных наступстваў гэтай асноўнай розніцы паміж аператыўнай апрацоўкай і апрацоўкай DW. На ўзроўні праектавання неабходнасць быць асцярожным адносна анамальнага абнаўлення не з'яўляецца фактарам DW, паколькі абнаўленне дадзеныя не праводзіцца. Гэта азначае, што на фізічным узроўні праектавання можна браць на сябе волю для аптымізацыі доступу дадзеныя, у прыватнасці, у працы з тэмамі фізічнай нармалізацыі і дэнармалізацыі. Іншым следствам прастаты аперацый DW з'яўляецца асноўная тэхналогія, якая выкарыстоўваецца для запуску асяроддзя DW. Неабходнасць падтрымкі ўбудаваных абнаўленняў запісаў за запісамі (як гэта часта бывае з аператыўнай апрацоўкай) патрабуе, каб тэхналогія мела вельмі складаную аснову пры ўяўнай прастаце.
Тэхналогія, якая падтрымлівае рэзервовае капіраванне і аднаўленне, транзакцыі і цэласнасць дадзеныя і выяўленне і ліквідацыя ўмоў тупіка даволі складаныя і не неабходныя для апрацоўкі DW. Характарыстыкі DW, праектная накіраванасць, інтэграцыя дадзеныя у DW, дысперсія часу і прастата кіравання дадзеныя, усё гэта прыводзіць да асяроддзя, якое вельмі і вельмі адрозніваецца ад класічнага аперацыйнага асяроддзя. Крыніца амаль усе дадзеныя DW з'яўляюцца аперацыйнай асяроддзем. Павабна думаць, што існуе масавая залішнесць дадзеныя паміж двума асяроддзямі.
На самай справе, першае ўражанне, якое ўзнікае ў многіх людзей, - гэта вялікая празмернасць дадзеныя паміж аперацыйным асяроддзем і аперацыйным асяроддзем

DW. Такая інтэрпрэтацыя павярхоўная і дэманструе неразуменне таго, што адбываецца ў DW.
На самай справе ёсць мінімум празмернасці дадзеныя паміж аперацыйным асяроддзем і я дадзеныя DW. Разгледзім наступнае: I дадзеныя іх фільтруюць дата пераключэнне з аперацыйнай асяроддзя ў сераду DW. Многія дадзеныя яны ніколі не выходзяць за межы працоўнага асяроддзя. Акрамя таго, што я дадзеныя якія неабходныя для апрацоўкі DSS, знаходзяць свой кірунак у навакольным асяроддзі

▪ часавы гарызонт дадзеныя гэта вельмі адрозніваецца ад аднаго асяроддзя да іншага. THE дадзеныя у асяроддзі працы яны вельмі крутыя. THE дадзеныя у DW яны значна старэйшыя. Толькі з пункту гледжання часовага гарызонту існуе вельмі мала супадзенняў паміж аператыўным асяроддзем і DW.

▪ DW змяшчае дадзеныя рэзюмэ, якія ніколі не сустракаюцца ў навакольным асяроддзі

▪ Я дадзеныя падвяргаюцца фундаментальнай трансфармацыі па меры пераходу да малюнку 3 дадзеныя істотна мадыфікуюцца пры ўмове, што яны выбраны і перамешчаны ў DW. Іншымі словамі, большасць дадзеныя ён фізічна і радыкальна зменены, калі ён перанесены ў DW. З пункту гледжання інтэграцыі яны не аднолькавыя дадзеныя якія знаходзяцца ў працоўным асяроддзі. У святле гэтых фактараў празмернасць ст дадзеныя паміж двума асяроддзямі - рэдкая падзея, якая прыводзіць да рэзервавання менш чым на 1% паміж двума асяроддзямі. СТРУКТУРА СКЛАДА DW маюць выразную структуру. Існуюць розныя ўзроўні рэзюмэ і дэталізацыі, якія размяжоўваюць DW.
Рознымі кампанентамі DW з'яўляюцца:

  • метададзеныя
  • Dati актуальныя дэталі
  • Dati са старых дэталяў
  • Dati крыху абагульнены
  • Dati высока абагульнены

Безумоўна, галоўны клопат - за дадзеныя актуальныя дэталі. Гэта галоўная праблема, таму што:

  • I дадзеныя актуальныя дэталі адлюстроўваюць апошнія падзеі, якія заўсёды выклікаюць вялікую цікавасць і
  • i дадзеныя бягучых дэталяў аб'ёмны, таму што захоўваецца на самым нізкім узроўні дэталізацыі і
  • i дадзеныя Актуальныя звесткі амаль заўсёды захоўваюцца на дыскавай памяці, доступ да якой хуткі, але дарагі і складаны ў выкарыстанні дадзеныя дэталяў, тым старэйшыя яны дадзеныя якія захоўваюцца ў некаторай памяці маса. Доступ да яго адбываецца перыядычна і захоўваецца на сумяшчальным узроўні дэталізацыі дадзеныя актуальныя дэталі. Хоць захоўваць на альтэрнатыўным носьбіце неабавязкова з-за вялікага аб'ёму дадзеныя у спалучэнні са спарадычным доступам а дадзеныя, падтрымка памяці для дадзеныя больш старыя падрабязныя дадзеныя звычайна не захоўваюцца на дыску. THE дадзеныя абагульнены трохі з'яўляюцца дадзеныя якія адганяюцца ад нізкага ўзроўню дэталізацыі да бягучага ўзроўню дэталізацыі. Гэты ўзровень DW амаль заўсёды захоўваецца на дыскавым сховішчы. Праблемы праектавання, якія стаяць перад архітэктарам дадзеныя у пабудове гэтага ўзроўню DW з'яўляюцца:
  • За якую адзінку часу складаецца зводка, зробленая вышэй
  • Які змест, атрыбуты будуць крыху абагульніць змест дадзеныя Наступны ўзровень дадзеныя у DW з'яўляецца тое, што з дадзеныя высока абагульнены. THE дадзеныя вельмі абагульненыя кампактныя і лёгка даступныя. THE дадзеныя вельмі абагульненыя часам сустракаюцца ў асяроддзі DW, а ў іншых выпадках i дадзеныя вельмі абагульненыя знаходзяцца па-за непасрэднымі сценамі тэхналогіі, якая змяшчае DW. (у любым выпадку, я дадзеныя вельмі абагульненыя з'яўляюцца часткай DW незалежна ад таго, дзе i дадзеныя фізічна размешчаны). Апошнім кампанентам DW з'яўляюцца метададзеныя. У многіх адносінах метададзеныя знаходзяцца ў іншым вымярэнні, чым іншыя дадзеныя DW, таму што метададзеныя не ўтрымліваюць ніякіх дата бярэцца непасрэдна з працоўнага асяроддзя. Метададзеныя адыгрываюць асаблівую і вельмі важную ролю ў DW. Метададзеныя выкарыстоўваюцца як:
  • каталог, які дапаможа аналітыку DSS знайсці змесціва DW,
  • кіраўніцтва па адлюстраванні ст дадзеныя пра тое, як я дадзеныя былі ператвораны з аператыўнага асяроддзя ў асяроддзе DW,
  • кіраўніцтва па алгарытмах, якія выкарыстоўваюцца для абагульнення паміж ст дадзеныя бягучыя дэталі ei дадзеныя крыху абагульнены, г.зн дадзеныя Карацей кажучы, метаданыя гуляюць значна большую ролю ў асяроддзі DW, чым калі-небудзь у аператыўным асяроддзі СТАРЫЯ ДЭТАЛІ НОСІВА Для захоўвання такога роду можна выкарыстоўваць магнітную стужку дадзеныя. Фактычна існуе вялікая разнастайнасць носьбітаў інфармацыі, якія варта разглядаць для старога захоўвання дадзеныя дэталяў. У залежнасці ад аб'ёму дадзеныя, частата доступу, кошт інструментаў і тып доступу, цалкам верагодна, што іншым інструментам спатрэбіцца стары ўзровень дэталізацыі ў DW. ПАТОК ДАННЫХ Ідзе нармальная і прадказальная плынь дадзеныя ўнутры DW.
    I дадзеныя яны трапляюць у DW з аперацыйнага асяроддзя. (УВАГА: Ёсць некалькі вельмі цікавых выключэнняў з гэтага правіла. Аднак амаль усе дадзеныя увесці DW з аперацыйнай асяроддзя). Дато што i я дадзеныя увядзіце DW з аперацыйнага асяроддзя, ён пераўтворыцца, як было апісана раней. Пры ўмове ўваходжання ў DW, г.зн дадзеныя увядзіце бягучы ўзровень дэталізацыі, як паказана. Ён знаходзіцца там і выкарыстоўваецца, пакуль не адбудзецца адна з трох падзей:
  • ачышчаецца,
  • абагульняецца, і/або ▪è састарэлы працэс у DW перамяшчаецца i дадзеныя бягучыя дэталі а дадзеныя старых дэталяў, зыходзячы з узросту дадзеныя. Працэс

рэзюмэ выкарыстоўвае дэталі дадзеныя вылічваць i дадзеныя злёгку абагульнены і вельмі абагульнены ўзроўні дадзеныя. Ёсць некаторыя выключэнні з паказанага патоку (будзе разгледжана пазней). Аднак, як правіла, для пераважнай большасці дадзеныя знойдзены ў DW, паток дадзеныя гэта як на малюнку.

ВЫКАРЫСТАННЕ ДАДЗЕНЫХ

Нядзіўна, што розныя ўзроўні дадзеныя у DW яны не атрымліваюць розных узроўняў выкарыстання. Як правіла, чым вышэй узровень абагульнення, тым больш я дадзеныя яны выкарыстоўваюцца.
Шмат ужыванняў адбываецца ў дадзеныя вельмі абагульнены, у той час як старыя дадзеныя дэталі амаль не выкарыстоўваюцца. Ёсць важкія прычыны перавесці арганізацыю на парадыгму выкарыстання рэсурсаў. Больш падвёў я дадзеныя, тым хутчэй і больш эфектыўна дабрацца да дадзеныя. Калі а крама выяўляе, што выконвае шмат працэсаў на ўзроўні дэталізацыі DW, тады спажываецца адпаведна вялікая колькасць машынных рэсурсаў. Гэта ў інтарэсах кожнага як мага хутчэй апрацаваць як мага больш высокі ўзровень абагульнення.

Для многіх магазінаў аналітык DSS у асяроддзі да DW выкарыстоўваўся дадзеныя на ўзроўні дэталізацыі. Шмат у чым прыезд ст дадзеныя падрабязная зводка нагадвае ахоўную коўдру, нават калі даступны іншыя ўзроўні зводкі. Адным з накірункаў дзейнасці арх дадзеныя гэта адвучыць карыстальніка DSS ад пастаяннага выкарыстання дадзеныя на самым нізкім узроўні дэталізацыі. У архітэктара ёсць дзве матывацыі дадзеныя:

  • шляхам усталявання сістэмы чарджбек, калі канчатковы карыстальнік аплачвае спажытыя рэсурсы і
  • якія паказваюць, што вельмі добры час водгуку можа быць дасягнуты, калі паводзіны з i дадзеныя знаходзіцца на высокім узроўні абагульнення, у той час як дрэнны час адказу зыходзіць з паводзін дадзеныя на нізкім узроўні ІНШЫЯ РАЗМЕРЫ Ёсць некаторыя іншыя меркаванні па будаўніцтве і кіраванні DW.
    Першае меркаванне - гэта індэксы. THE дадзеныя на больш высокіх узроўнях абагульнення яны могуць свабодна індэксавацца, у той час як i дадзеныя

на больш нізкіх узроўнях дэталізацыі яны настолькі грувасткія, што іх можна ашчадна індэксаваць. Ад той жа лексемы, г.зн дадзеныя на высокім узроўні дэталізацыі можа быць адносна лёгка рэструктурызаваны, у той час як аб'ём дадзеныя на ніжніх узроўнях ён настолькі вялікі, што i дадзеныя іх нельга лёгка адрамантаваць. Такім чынам, мадэль в дадзеныя і фармальная праца, выкананая дызайнам, закладвае аснову для DW, які прымяняецца амаль выключна на сучасным узроўні дэталізацыі. Іншымі словамі, мадэльная дзейнасць в дадзеныя яны не прымяняюцца да ўзроўняў абагульнення, амаль у кожным выпадку. Яшчэ адно структурнае меркаванне - падраздзяленне г дадзеныя ад DW.

Падзел можна зрабіць на двух узроўнях – на ўзроўні дбм і на прыкладным узроўні. У дывізіі на ўзроўні дбм, дбм інфармаваны аб падраздзяленнях і адпаведна іх кантралюе. У выпадку падзелу на прыкладным узроўні толькі праграміст інфармуецца аб падзелах, і адказнасць за іх кіраванне кладзецца на яго

Ніжэй за ўзровень дбм, шмат працы выконваецца аўтаматычна. З аўтаматычным кіраваннем падраздзяленнямі звязана шмат гнуткасці. У выпадку падзелаў на прыкладным узроўні дадзеныя Дэль інфармацыйнае сховішча, на праграміста ляжыць шмат працы, але канчатковым вынікам з'яўляецца гнуткасць у адміністраванні дадзеныя ў інфармацыйнае сховішча

БОЛЬШАЯ АНАМАЛІЯ

У той час як кампаненты ст інфармацыйнае сховішча Яны працуюць, як апісана амаль для ўсіх дадзеныя, ёсць некаторыя карысныя выключэнні, якія трэба абмеркаваць. Выключэннем з'яўляецца тое, што з дадзеныя публічныя зводныя даныя. Гэтыя дадзеныя зводкі, якія былі разлічаны з інфармацыйнае сховішча але яны выкарыстоўваюцца грамадствам. THE дадзеныя Публічныя зводкі захоўваюцца і кіруюцца ў інфармацыйнае сховішча, хоць, як было сказана раней, яны разлічаны. Бухгалтары працуюць, каб вырабіць такія штоквартальна дадзеныя напрыклад, даходы, квартальныя выдаткі, квартальны прыбытак і гэтак далей. Праца, якую выконваюць бухгалтары, з'яўляецца знешняй інфармацыйнае сховішча. Аднак я дадзеныя выкарыстоўваюцца «ўнутрана» ўнутры кампаніі - ад маркетынг, продажу і г.д. Яшчэ адна анамалія, якая не будзе абмяркоўвацца, гэта тое, што дадзеныя вонкавы.

Яшчэ адзін выключны выгляд дадзеныя што можна знайсці ў а інфармацыйнае сховішча гэта пастаянныя падрабязныя даныя. Гэта выклікае неабходнасць пастаяннага захоўвання дадзеныя на падрабязным узроўні па этычных або юрыдычных прычынах. Калі кампанія падвяргае сваіх работнікаў уздзеянню небяспечных рэчываў, гэта неабходна дадзеныя падрабязны і пастаянны. Калі кампанія вырабляе прадукт, звязаны з грамадскай бяспекай, напрыклад, запчасткі для самалёта, у гэтым ёсць неабходнасць дадзеныя пастаянныя дэталі, а таксама калі кампанія заключае небяспечныя кантракты.

Кампанія не можа дазволіць сабе не заўважаць дэталяў, таму што на працягу наступных некалькіх гадоў у выпадку судовага працэсу, адклікання, спрэчнага будаўнічага дэфекту і г.д. экспазіцыя кампаніі можа быць вялікай. У выніку ўзнікае унікальны тып дадзеныя вядомы як пастаянныя падрабязныя даныя.

Рэзюмэ

Un інфармацыйнае сховішча - гэта аб'ектна-арыентаваны, інтэграваны, часавы варыянт, сукупнасць дадзеныя энерганезалежны для падтрымкі патрэб адміністрацыі ў прыняцці рашэнняў. Кожная з асноўных функцый а інфармацыйнае сховішча мае свае наступствы. Плюс ёсць чатыры ўзроўні дадзеныя Дэль інфармацыйнае сховішча:

  • Старая дэталь
  • Бягучая дэталь
  • Dati крыху паўтарыў
  • Dati вельмі абагульненыя метададзеныя таксама з'яўляюцца важнай часткай інфармацыйнае сховішча. АФЕРАТ Паняцце захоўвання дадзеныя Апошнім часам гэта прыцягнула вялікую ўвагу і стала трэндам 90-х.Гэта звязана са здольнасцю а інфармацыйнае сховішча пераадолець абмежаванні сістэм падтрымкі кіравання, такіх як сістэмы падтрымкі прыняцця рашэнняў (DSS) і выканаўчыя інфармацыйныя сістэмы (EIS). Нават калі канцэпцыя інфармацыйнае сховішча выглядае перспектыўна, рэалізаваць i інфармацыйнае сховішча можа быць праблематычным з-за маштабных складскіх працэсаў. Нягледзячы на ​​складанасць складскіх праектаў дадзеныя, многія пастаўшчыкі і кансультанты, якія складаюць дадзеныя яны сцвярджаюць, што захоўванне ст дадзеныя ток не выклікае ніякіх праблем. Аднак на пачатку гэтага даследчага праекта незалежных, строгіх і сістэматычных даследаванняў амаль не праводзілася. Такім чынам, цяжка сказаць, што насамрэч адбываецца ў галіны, калі яны будуюцца інфармацыйнае сховішча. Гэта даследаванне даследавала практыку складзіравання дадзеныя contemporary, якая накіравана на больш глыбокае разуменне аўстралійскай практыкі. Агляд літаратуры даў кантэкст і аснову для эмпірычнага даследавання. Ёсць шэраг высноў з гэтага даследавання. Па-першае, гэта даследаванне выявіла дзейнасць, якая ўзнікла падчас распрацоўкі ст інфармацыйнае сховішча. У многіх раёнах, г.зн дадзеныя сабраныя пацвердзілі практыку, пра якую гаворыцца ў літаратуры. Па-другое, пытанні і праблемы, якія могуць паўплываць на развіццё інфармацыйнае сховішча былі выяўленыя гэтым даследаваннем. Нарэшце, перавагі, атрыманыя аўстралійскімі арганізацыямі, звязаныя з выкарыстаннем інфармацыйнае сховішча былі выяўленыя.

Капітолій 1

Кантэкст даследавання

Канцэпцыя сховішчаў дадзеных атрымала шырокае распаўсюджванне і стала новай тэндэнцыяй у 90-я гады (McFadden 1996, TDWI 1996, Shah and Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman and Oates 2000). Гэта відаць з расце колькасці артыкулаў аб сховішчах дадзеных у гандлёвых выданнях (Little and Gibson 1999). Шмат артыкулаў (гл., Напрыклад, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett and King 1996, Graham et al. Edwards 1996, TDWI 1996) паведамляюць пра значныя перавагі, атрыманыя арганізацыямі, якія ўкараняюць i інфармацыйнае сховішча. Яны пацвердзілі сваю тэорыю асобнымі сведчаннямі паспяховых укараненняў, высокай рэнтабельнасцю інвестыцый (ROI), а таксама прадастаўленнем рэкамендацый або метадалогій для распрацоўкі інфармацыйнае сховішча

(Shanks et al. 1997, Seddon and Benjamin 1998, Little and Gibson 1999). У крайнім выпадку Graham et al. (1996) паведамілі, што сярэдняя прыбытковасць трохгадовых інвестыцый складае 401%.

Большая частка сучаснай літаратуры, аднак, не звяртае ўвагі на складанасці, звязаныя з правядзеннем такіх праектаў. Праекты а інфармацыйнае сховішча звычайна яны складаныя і буйнамаштабныя і таму маюць высокую верагоднасць няўдачы, калі іх не кантраляваць старанна (Шах і Мільштэйн 1997, Экерсан 1997, Фолі 1997b, Цымер 1997, Борт 1998, Гібс і Клаймер 1998, Рао 1998). Яны патрабуюць велізарнай колькасці як чалавечых, так і фінансавых рэсурсаў, а таксама часу і намаганняў для іх стварэння (Hill 1998, Crofts 1998). Звычайны час і фінансавыя сродкі, якія патрабуюцца, складаюць прыкладна два гады і два-тры мільёны долараў адпаведна (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Гэты час і фінансавыя сродкі неабходныя для кантролю і кансалідацыі многіх розных аспектаў захоўвання дадзеных (Cafasso 1995, Hill 1998). Акрамя апаратнага і праграмнага забеспячэння, іншыя функцыі, якія адрозніваюцца ад здабычы дадзеныя да працэсаў загрузкі дадзеныя, аб'ём памяці для кіравання абнаўленнямі і мета дадзеныя для навучання карыстальнікаў, неабходна ўлічваць.

На момант пачатку гэтага даследчага праекта было вельмі мала акадэмічных даследаванняў у галіне сховішчаў дадзеных, асабліва ў Аўстраліі. Гэта было відаць з недахопу апублікаваных артыкулаў пра сховішчы дадзеных у часопісах і іншых навуковых працах таго часу. Многія з даступных акадэмічных прац апісваюць вопыт ЗША. Адсутнасць акадэмічных даследаванняў у галіне сховішчаў дадзеных выклікала заклікі да строгіх даследаванняў і эмпірычных даследаванняў (McFadden 1996, Shanks et al. 1997, Little and Gibson 1999). У прыватнасці, даследаванні па працэсе рэалізацыі інфармацыйнае сховішча неабходна правесці для пашырэння агульных ведаў аб рэалізацыі інфармацыйнае сховішча і паслужыць асновай для будучага даследчага даследавання (Shanks et al. 1997, Little and Gibson 1999).

Такім чынам, мэта гэтага даследавання - вывучыць, што на самой справе адбываецца, калі арганізацыі выконваюць і выкарыстоўваюць i інфармацыйнае сховішча у Аўстраліі. У прыватнасці, гэта даследаванне будзе ўключаць у сябе аналіз усяго працэсу развіцця a інфармацыйнае сховішча, пачынаючы ад ініцыяцыі і планавання праз праектаванне і рэалізацыю і наступнае выкарыстанне ў аўстралійскіх арганізацыях. Акрамя таго, даследаванне таксама ўнясе свой уклад у бягучую практыку шляхам вызначэння абласцей, дзе практыку можна яшчэ больш палепшыць, а неэфектыўнасць і рызыкі можна звесці да мінімуму або пазбегнуць. Акрамя таго, гэта паслужыць асновай для іншых даследаванняў інфармацыйнае сховішча у Аўстраліі і запоўніць прабел, які зараз існуе ў літаратуры.

Даследчыя пытанні

Мэтай дадзенага даследавання з'яўляецца вывучэнне дзейнасці, звязанай з ажыццяўленнем інфармацыйнае сховішча і іх выкарыстанне аўстралійскімі арганізацыямі. У прыватнасці, вывучаюцца элементы, якія тычацца планавання праекта, распрацоўкі, эксплуатацыі, выкарыстання і звязаных з гэтым рызык. Такім чынам, пытанне гэтага даследавання:

«Якая цяпер практыка інфармацыйнае сховішча у Аўстраліі?"

Каб эфектыўна адказаць на гэтае пытанне, неабходны шэраг дадатковых даследчых пытанняў. У прыватнасці, з літаратуры, прадстаўленай у раздзеле 2, былі вылучаны тры падпытанні для кіраўніцтва гэтым даследчым праектам: інфармацыйнае сховішча ад аўстралійскіх арганізацый? З якімі праблемамі вы сутыкнуліся?

Якія перавагі атрыманы?
Для адказу на гэтыя пытанні быў выкарыстаны пошукавы дызайн з выкарыстаннем апытання. Як пошукавае даследаванне, адказы на вышэйзгаданыя пытанні не з'яўляюцца поўнымі (Shanks et al. 1993, Denscombe 1998). У гэтым выпадку для паляпшэння адказаў на гэтыя пытанні патрабуецца трыянгуляцыя. Аднак расследаванне дасць трывалую аснову для будучай працы па вывучэнні гэтых пытанняў. Падрабязнае абмеркаванне абгрунтавання і дызайну метаду даследавання прадстаўлена ў главе 3.

Структура даследчага праекта

Гэты даследчы праект падзелены на дзве часткі: кантэкстуальнае даследаванне канцэпцыі сховішча даных і эмпірычнае даследаванне (гл. малюнак 1.1), кожнае з якіх разглядаецца ніжэй.

Частка I: Кантэкстуальнае даследаванне

Першая частка даследавання складалася з агляду бягучай літаратуры па розных тыпах сховішчаў дадзеных, уключаючы сістэмы падтрымкі прыняцця рашэнняў (DSS), інфармацыйныя сістэмы кіраўнікоў (EIS), тэматычныя даследаванні інфармацыйнае сховішча і паняцці ст інфармацыйнае сховішча. Акрамя таго, вынікі форумаў інфармацыйнае сховішча і групы сустрэч экспертаў і практыкаў пад кіраўніцтвам даследчай групы Monash DSS унеслі свой уклад у гэты этап даследавання, які меў на мэце атрымаць уяўленне аб практыцы інфармацыйнае сховішча і вызначыць рызыкі, звязаныя з іх прыняццем. Падчас гэтага перыяду кантэкстуальнага даследавання было ўстаноўлена разуменне праблемнай вобласці, каб забяспечыць асноўныя веды для наступных эмпірычных даследаванняў. Аднак гэта быў пастаянны працэс падчас правядзення даследавання.

Частка II: Эмпірычнае даследаванне

Адносна новая канцэпцыя сховішчаў даных, асабліва ў Аўстраліі, выклікала неабходнасць правядзення апытання, каб атрымаць шырокую карціну карыстальніцкага досведу. Гэтая частка была выканана пасля таго, як праблемная вобласць была ўстаноўлена шляхам шырокага агляду літаратуры. Канцэпцыя захоўвання дадзеных, сфарміраваная на этапе кантэкстнага даследавання, была выкарыстана ў якасці ўваходных дадзеных для першапачатковай анкеты гэтага даследавання. Пасля гэтага была праведзена праверка анкеты. Вы эксперты ў інфармацыйнае сховішча удзельнічаў у выпрабаванні. Мэтай апрабацыі першапачатковай анкеты была праверка паўнаты і дакладнасці пытанняў. Па выніках тэсціравання анкета была дапрацавана і дапрацаваны варыянт быў накіраваны ўдзельнікам апытання. Затым вернутыя анкеты былі прааналізаваны на i дадзеныя у табліцах, дыяграмах і іншых фарматах. THE

вынікі аналізу дадзеныя яны ўтвараюць здымак практыкі захоўвання дадзеных у Аўстраліі.

АГЛЯД СХовішча даных

Канцэпцыя сховішча дадзеных развівалася разам з удасканаленнем камп'ютэрных тэхналогій.
Яно накіравана на пераадоленне праблем, з якімі сутыкаюцца групы падтрымкі прыкладанняў, такія як Сістэма падтрымкі прыняцця рашэнняў (DSS) і Інфармацыйная сістэма кіраўнікоў (EIS).

У мінулым самай вялікай перашкодай для гэтых прыкладанняў была няздольнасць гэтых прыкладанняў забяспечыць a база дадзеных неабходныя для аналізу.
У асноўным гэта абумоўлена характарам працы кіраўніцтва. Інтарэсы кіраўніцтва кампаніі пастаянна мяняюцца ў залежнасці ад сферы дзейнасці. Таму я дадзеныя фундаментальныя для гэтых прыкладанняў, яны павінны мець магчымасць хутка змяняцца ў залежнасці ад часткі, якая падлягае апрацоўцы.
Гэта азначае, што я дадзеныя павінны быць даступныя ў адпаведнай форме для запытаных аналізаў. Фактычна, у мінулым групам падтрымкі прыкладанняў было вельмі цяжка сабраць і інтэграваць дадзеныя са складаных і разнастайных крыніц.

Астатняя частка гэтага раздзела прадстаўляе агляд канцэпцыі сховішча даных і абмяркоўвае, як інфармацыйнае сховішча можа пераадолець праблемы груп падтрымкі прыкладанняў.
Тэрмін "Склад дадзеных” быў папулярызаваны Уільямам Інманам у 1990 годзе. Яго часта цытуемае вызначэнне бачыць Склад дадзеных як зборнік дадзеныя прадметна-арыентаваны, інтэграваны, энерганезалежны і зменлівы ў часе ў падтрымку кіраўніцкіх рашэнняў.

Выкарыстоўваючы гэтае вызначэнне, Inmon падкрэслівае, што i дадзеныя які пражывае ў а інфармацыйнае сховішча яны павінны валодаць наступнымі 4 характарыстыкамі:

  • ▪ Прадметна-арыентаваны
  • ▪ Інтэграваны
  • ▪ Энерганезалежны
  • ▪ Зменлівы з цягам часу Пад прадметна-арыентаваным Inmon азначае, што я дадзеныя ў інфармацыйнае сховішча у найбуйнейшых арганізацыйных галінах, якія былі

вызначаны ў мадэлі дадзеныя. Напрыклад усе дадзеныя адносна я кліенты змяшчаюцца ў прадметнай вобласці кліенты. Гэтаксама і ўсе дадзеныя якія адносяцца да прадуктаў, утрымліваюцца ў прадметнай вобласці PRODUCTS.

Інтэграваны Inmon азначае, што i дадзеныя якія паступаюць з розных платформаў, сістэм і месцаў аб'ядноўваюцца і захоўваюцца ў адным месцы. У выніку дадзеныя падобныя павінны быць пераўтвораны ў паслядоўныя фарматы, каб іх можна было лёгка дадаваць і параўноўваць.
Напрыклад, мужчынскі і жаночы пол у адной сістэме абазначаюцца літарамі M і F, а ў іншай - 1 і 0. Каб правільна інтэграваць іх, адзін або абодва фарматы павінны быць пераўтвораны так, каб абодва фарматы былі аднолькавымі. У гэтым выпадку мы можам змяніць M на 1 і F на 0 ці наадварот. Прадметна-арыентаваны і інтэграваны паказваюць, што ст інфармацыйнае сховішча прызначаны для забеспячэння функцыянальнага і папярочнага бачання дадзеныя кампаніяй.

Пад энерганезалежнымі ён мае на ўвазе, што i дадзеныя ў інфармацыйнае сховішча заставацца паслядоўнымі і абнаўляць дадзеныя гэта не трэба. Замест гэтага кожная змена ст дадзеныя дадаюцца арыгіналы база дадзеных Дэль інфармацыйнае сховішча. Гэта азначае, што гістарычная дзеі дадзеныя змяшчаецца ў інфармацыйнае сховішча.

Для зменных з часам Inmon паказвае, што i дадзеныя ў інфармацыйнае сховішча заўсёды ўтрымліваюць індыкатары часу дадзеныя яны звычайна перасякаюць пэўны часовай гарызонт. Напрыклад а
інфармацыйнае сховішча можа ўтрымліваць 5-гадовыя гістарычныя каштоўнасці кліенты з 1993 па 1997 гг. Наяўнасць гісторыі і часовага шэрагу дадзеныя дазваляе аналізаваць тэндэнцыі.

Un інфармацыйнае сховішча ён можа сабраць сваё дадзеныя з сістэм OLTP; з крыніц дадзеныя па-за межамі арганізацыі і/або іншымі адмысловымі праектамі сістэмы захопу дадзеныя.
I дадзеныя экстракты могуць прайсці працэс ачысткі, у дадзеным выпадку i дадзеныя трансфармуюцца і інтэгруюцца перад захаваннем у база дадзеных Дэль інфармацыйнае сховішча. Затым, я дадзеныя

жыхароў у межах в база дадзеных Дэль інфармацыйнае сховішча даступныя для ўваходу канчатковых карыстальнікаў і інструментаў аднаўлення. З дапамогай гэтых інструментаў канчатковы карыстальнік можа атрымаць доступ да інтэграванага прадстаўлення арганізацыі дадзеныя.

I дадзеныя жыхароў у межах в база дадзеных Дэль інфармацыйнае сховішча яны захоўваюцца як у падрабязным, так і ў зводным фарматах.
Узровень рэзюмэ можа залежаць ад характару дадзеныя. Я дадзеныя падрабязны можа складацца з дадзеныя бягучы e дадзеныя гісторыкі
I дадзеныя роялці не ўключаны ў інфармацыйнае сховішча пакуль я дадзеныя ў інфармацыйнае сховішча абнаўляюцца.
У дадатак да захоўвання я дадзеныя сябе, а інфармацыйнае сховішча ён таксама можа захоўваць іншы тып дата называецца МЕТАДАНЫЯ, якія апісваюць дадзеныя жыхароў у яго база дадзеных.
Ёсць два тыпу метададзеных: метаданыя распрацоўкі і метададзеныя аналітыкі.
Метададзеныя распрацоўкі выкарыстоўваюцца для кіравання і аўтаматызацыі працэсаў здабывання, ачысткі, адлюстравання і загрузкі дадзеныя ў інфармацыйнае сховішча.
Інфармацыя, якая змяшчаецца ў метададзеных распрацоўкі, можа ўтрымліваць падрабязную інфармацыю аб аперацыйных сістэмах, падрабязную інфармацыю аб элементах, якія трэба атрымаць, мадэль дадзеныя Дэль інфармацыйнае сховішча і бізнес-правілы канвертавання дадзеныя.

Другі тып метададзеных, вядомы як метаданыя аналітыкі, дазваляе канчатковаму карыстальніку даследаваць змесціва інфармацыйнае сховішча знайсці дадзеныя даступныя і іх значэнне ў зразумелых, нетэхнічных тэрмінах.

Таму метаданыя аналітыкі працуюць як мост паміж інфармацыйнае сховішча і прыкладання для канчатковых карыстальнікаў. Гэтыя метададзеныя могуць утрымліваць бізнес-мадэль, апісанне дадзеныя адпаведнасць бізнес-мадэлі, загадзя вызначаныя запыты і справаздачы, інфармацыя для доступу карыстальнікаў і індэкс.

Для належнага функцыянавання метаданыя аналізу і распрацоўкі павінны быць аб'яднаны ў адзіныя інтэграваныя метаданыя стрымлівання.

На жаль, многія з існуючых інструментаў маюць свае ўласныя метаданыя, і ў цяперашні час для іх няма стандартаў

дазволіць інструментам сховішча даных інтэграваць гэтыя метададзеныя. Каб выправіць гэтую сітуацыю, многія трэйдары асноўных інструментаў для сховішчаў даных стварылі Савет па мета-дадзеных, які пазней стаў Кааліцыяй мета-дадзеных.

Мэтай гэтай кааліцыі з'яўляецца стварэнне стандартнага набору метададзеных, які дазваляе розным інструментам захоўвання дадзеных пераўтвараць метададзеныя
Іх намаганні прывялі да нараджэння спецыфікацыі абмену мета-дадзенымі (MDIS), якая дазволіць абменьвацца інфармацыяй паміж архівамі Microsoft і адпаведнымі файламі MDIS.

Існаванне дадзеныя як абагульненыя/індэксаваныя, так і падрабязныя дае карыстальніку магчымасць выканаць ДРЫЛЬ ДРОВ (свідраванне) з дадзеныя індэксуюцца на падрабязныя і наадварот. Існаванне дадзеныя падрабязныя гісторыі дазваляюць ствараць аналіз тэндэнцый з цягам часу. Акрамя таго, метаданыя аналітыкі можна выкарыстоўваць у якасці каталога база дадзеных Дэль інфармацыйнае сховішча каб дапамагчы канечным карыстальнікам знайсці дадзеныя неабходна.

У параўнанні з сістэмамі OLTP з іх здольнасцю падтрымліваць аналіз дадзеныя і справаздачнасць, ст інфармацыйнае сховішча яна разглядаецца як больш прыдатная сістэма для інфармацыйных працэсаў, такіх як стварэнне запытаў і адказ на іх, а таксама стварэнне справаздач. У наступным раздзеле будуць падрабязна асветлены адрозненні дзвюх сістэм.

СКЛОВІШЧА ДАННЫХ СУПРАЦЬ СІСТЭМ OLTP

Многія з інфармацыйных сістэм у арганізацыях прызначаны для падтрымкі штодзённай працы. Гэтыя сістэмы, вядомыя як OLTP SYSTEMS, фіксуюць пастаянна абнаўляюцца штодзённыя транзакцыі.

I дадзеныя у гэтых сістэмах яны часта мадыфікуюцца, дадаюцца або выдаляюцца. Напрыклад, адрас кліента змяняецца, калі ён пераязджае з аднаго месца ў іншае. У гэтым выпадку новы адрас будзе зарэгістраваны шляхам змены адраснага поля база дадзеных. Асноўная мэта гэтых сістэм - знізіць транзакцыйныя выдаткі і ў той жа час скараціць час апрацоўкі. Прыклады сістэм OLTP ўключаюць важныя дзеянні, такія як увод заказаў, налічэнне заработнай платы, выстаўленне рахункаў-фактур, вытворчасць, абслугоўванне кліентаў кліенты.

У адрозненне ад сістэм OLTP, якія былі створаны для працэсаў, заснаваных на транзакцыях і падзеях, г.зн інфармацыйнае сховішча былі створаны для падтрымкі працэсаў, заснаваных на аналітыцы дадзеныя і працэсы прыняцця рашэнняў.

Звычайна гэта дасягаецца інтэграцыяй i дадзеныя з розных OLTP і знешніх сістэм у адным «кантэйнеры». дадзеныя, як абмяркоўвалася ў папярэднім раздзеле.

Мадэль працэсу сховішча дадзеных Monash

Мадэль працэсу для інфармацыйнае сховішча Monash быў распрацаваны даследчыкамі з Monash DSS Research Group і заснаваны на літаратуры інфармацыйнае сховішча, аб вопыце падтрымкі распрацоўкі сістэмных палёў, аб абмеркаванні з пастаўшчыкамі прыкладанняў для выкарыстання на інфармацыйнае сховішча, на групу экспертаў па выкарыстанні інфармацыйнае сховішча.

Фазы: ініцыяцыя, планаванне, развіццё, аперацыі і тлумачэнні. Дыяграма тлумачыць ітэрацыйную або эвалюцыйную прыроду развіцця a інфармацыйнае сховішча з дапамогай двухбаковых стрэлак, размешчаных паміж рознымі фазамі. У гэтым кантэксце «ітэратыўны» і «эвалюцыйны» азначаюць, што на кожным этапе працэсу дзейнасць па ўкараненні заўсёды можа распаўсюджвацца ў зваротным кірунку да папярэдняй фазы. Гэта звязана з характарам праекта інфармацыйнае сховішча у якім у любы момант узнікаюць дадатковыя запыты ад канчатковага карыстальніка. Напрыклад, на этапе распрацоўкі працэсу інфармацыйнае сховішча, канчатковы карыстальнік запытвае новае вымярэнне або прадметную вобласць, якая не была часткай першапачатковага плана, гэта трэба дадаць у сістэму. Гэта выклікае змены ў праекце. У выніку група дызайнераў павінна змяніць патрабаванні дакументаў, створаных да гэтага часу на этапе праектавання. У многіх выпадках бягучы стан праекта павінен вярнуцца да фазы праектавання, дзе неабходна дадаць і задакументаваць новыя патрабаванні. Канчатковы карыстальнік павінен мець магчымасць бачыць разгледжаную канкрэтную дакументацыю і змены, унесеныя на этапе распрацоўкі. У канцы гэтага цыкла распрацоўкі праект павінен атрымаць выдатную зваротную сувязь як ад каманд распрацоўшчыкаў, так і ад карыстальнікаў. Затым зваротная сувязь паўторна выкарыстоўваецца для паляпшэння будучага праекта.

Планаванне магутнасці
Dw, як правіла, вельмі вялікія па памеры і вельмі хутка растуць (Best 1995, Rudin 1997a) у выніку колькасці дадзеныя гісторыі, якія яны захоўваюць ад іх працягласці. Рост таксама можа быць выкліканы дадзеныя дапаўненні, запытаныя карыстальнікамі для павышэння кошту дадзеныя што ў іх ужо ёсць. Адпаведна патрабаванням да захоўвання дадзеныя можна значна палепшыць (Eckerson 1997). Такім чынам, вельмі важна забяспечыць, шляхам правядзення планавання патэнцыялу, што сістэма, якая будуецца, можа расці па меры росту патрэб (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Пры планаванні маштабаванасці базы дадзеных трэба ведаць чаканы рост памеру сховішча, тыпы магчымых запытаў і колькасць канчатковых карыстальнікаў, якія падтрымліваюцца (Бест 1995, Рудзін 1997b, Фолі 1997a). Стварэнне маштабаваных прыкладанняў патрабуе спалучэння маштабаваных серверных тэхналогій і маштабаваных метадаў распрацоўкі прыкладанняў (Best 1995, Rudin 1997b. Абодва неабходныя для стварэння высокамаштабаваных прыкладанняў. Маштабуемыя серверныя тэхналогіі могуць зрабіць простым і выгадным даданне сховішча, памяці і працэсара без пагаршэння якасці прадукцыйнасці (Lang 1997, Telephony 1997).

Існуюць дзве асноўныя тэхналогіі маштабуемых сервераў: сіметрычная множная апрацоўка (SMP) і масавая паралельная апрацоўка (MPP) (IDC 1997, Humphries et al. 1999). SMP-сервер звычайна мае некалькі працэсараў, якія падзяляюць памяць, сістэмную шыну і іншыя рэсурсы (IDC 1997, Humphries et al. 1999). Для яго павелічэння можна дадаць дадатковыя працэсары моц вылічальны. Яшчэ адзін спосаб павялічыць моц сервера SMP, каб аб'яднаць мноства машын SMP. Гэты метад вядомы як кластэрызацыя (Humphries et al. 1999). Сервер MPP, з іншага боку, мае некалькі працэсараў, кожны са сваёй памяццю, сістэмай шыны і іншымі рэсурсамі (IDC 1997, Humphries et al. 1999). Кожны працэсар называецца вузлом. Павелічэнне ў моц вылічальных можа быць дасягнута

даданне дадатковых вузлоў да сервераў MPP (Humphries et al. 1999).

Слабым бокам сервераў SMP з'яўляецца тое, што занадта шмат аперацый уводу-вываду (I/O) могуць перагрузіць сістэмную шыну (IDC 1997). Гэтая праблема не ўзнікае на серверах MPP, паколькі кожны працэсар мае ўласную сістэму шыны. Аднак узаемасувязі паміж кожным вузлом, як правіла, значна больш павольныя, чым сістэма шыны SMP. Акрамя таго, серверы MPP могуць дадаць дадатковы ўзровень складанасці для распрацоўшчыкаў прыкладанняў (IDC 1997). Такім чынам, на выбар паміж SMP і MPP-серверамі можа ўплываць мноства фактараў, у тым ліку складанасць прыкладанняў, суадносіны цана/прадукцыйнасць, неабходная магутнасць апрацоўкі, прадухіленыя праграмы dw і павелічэнне памеру база дадзеных dw і ў колькасці канчатковых карыстальнікаў.

Шматлікія метады праектавання маштабаваных прыкладанняў могуць быць выкарыстаны ў планаванні магутнасці. Адзін выкарыстоўвае розныя перыяды апавяшчэнняў, такія як дні, тыдні, месяцы і гады. Маючы розныя перыяды паведамлення, база дадзеных яго можна падзяліць на кіравана згрупаваныя часткі (Inmon et al. 1997). Іншы метад заключаецца ў выкарыстанні зводных табліц, якія пабудаваны шляхам падвядзення вынікаў дадзеныя da дадзеныя падрабязна. Такім чынам, я дадзеныя абагульненыя больш кампактныя, чым падрабязныя, што патрабуе менш месца ў памяці. Так што дадзеныя дэталяў можна захоўваць у менш дарагім сховішчы, што дазваляе зэканоміць яшчэ больш месца. Хоць выкарыстанне зводных табліц можа зэканоміць месца ў памяці, яны патрабуюць шмат намаганняў, каб падтрымліваць іх у актуальным стане і адпавядаць патрэбам бізнесу. Тым не менш, гэты метад шырока выкарыстоўваецца і часта выкарыстоўваецца ў спалучэнні з папярэднім метадам (Best 1995, Inmon 1996a, Chauduri і Dayal
1997).

вызначальны Склад дадзеных Тэхнічныя архітэктуры. Вызначэнне метадаў архітэктуры dw

Першыя прыхільнікі сховішчаў даных у асноўным задумвалі цэнтралізаваную рэалізацыю dw, у якой усе дадзеныя, у тым ліку я дадзеныя знешнія, былі аб'яднаны ў адзінае,
фізічнае захоўванне (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Асноўная перавага гэтага падыходу заключаецца ў тым, што канчатковыя карыстальнікі могуць атрымаць доступ да карпаратыўнага прагляду дадзеныя арганізацыйныя (Ovum 1998). Яшчэ адна перавага ў тым, што ён прапануе стандартызацыю дадзеныя праз арганізацыю, што азначае, што існуе толькі адна версія або вызначэнне для кожнай тэрміналогіі, якая выкарыстоўваецца ў сховішчы dw (метададзеных) (Flanagan and Safdie 1997, Ovum 1998). З іншага боку, недахопам гэтага падыходу з'яўляецца тое, што ён дарагі і складаны ў стварэнні (Flanagan and Safdie 1997, Ovum 1998, Inmon et al. 1998). Неўзабаве пасля архітэктуры захоўвання дадзеныя цэнтралізаваны стаў папулярным, канцэпцыя здабывання меншых падмностваў эвалюцыянавала дадзеныя для падтрымкі патрэбаў канкрэтных прыкладанняў (Varney 1996, IDC 1997, Berson and Smith 1997, peacock 1998). Гэтыя невялікія сістэмы з'яўляюцца вытворнымі ад большай інфармацыйнае сховішча цэнтралізаваны. Яны называюцца інфармацыйнае сховішча залежныя ведамасныя або залежныя вітрыны даных. Архітэктура залежнага вітрына дадзеных вядомая як трох'ярусная архітэктура, дзе першы ўзровень складаецца з інфармацыйнае сховішча цэнтралізаваны, другі складаецца з радовішчаў ст дадзеныя ведамасны і трэці складаецца з доступу да дадзеныя і інструментамі аналізу (Demarest 1994, Inmon et al. 1997).

Вітрыны дадзеных звычайна будуюцца пасля інфармацыйнае сховішча цэнтралізаваны быў пабудаваны для задавальнення патрэб пэўных адзінак (White 1995, Varney 1996).
Вітрыны дадзеных захоўваюць дадзеныя вельмі актуальныя ў дачыненні да пэўных адзінак (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

Перавага гэтага метаду ў тым, што не будзе дата не інтэграваны і што i дадзеныя будзе менш лішнім у вітрынах даных, як і ўсе іншыя дадзеныя яны прыходзяць са склада дадзеныя інтэграваны. Яшчэ адна перавага заключаецца ў тым, што паміж кожнай вітрынай дадзеных і яе крыніцамі будзе мала сувязяў дадзеныя таму што кожная вітрына дадзеных мае толькі адну крыніцу дадзеныя. Акрамя таго, з такой архітэктурай канчатковыя карыстальнікі ўсё яшчэ могуць атрымаць доступ да агляду дадзеныя

карпаратыўныя арганізацыі. Гэты метад вядомы як метад "зверху ўніз", калі вітрыны даных будуюцца пасля інфармацыйнае сховішча (паўлін 1998, Гоф 1998).
Павялічваючы неабходнасць паказваць вынікі на ранняй стадыі, некаторыя арганізацыі пачалі будаваць незалежныя вітрыны дадзеных (Flanagan and Safdie 1997, White 2000). У гэтым выпадку вітрыны дадзеных атрымліваюць сваё дадзеныя прама з асноў дадзеныя OLTP, а не з цэнтралізаванага і інтэграванага склада, што пазбаўляе ад неабходнасці мець цэнтральны склад на месцы.

Кожная вітрына дадзеных патрабуе хаця б адной спасылкі на яе крыніцы дадзеныя. Недахопам наяўнасці некалькіх злучэнняў для кожнай вітрыны з'яўляецца тое, што ў параўнанні з папярэднімі дзвюма архітэктурамі празмернасць дадзеныя значна павялічваецца.

Кожная вітрына дадзеных павінна захоўваць усе дадзеныя патрабуецца лакальна, каб не ўплываць на сістэмы OLTP. Гэта выклікае тое, што i дадзеныя яны захоўваюцца ў розных вітрынах дадзеных (Inmon et al. 1997). Іншым недахопам гэтай архітэктуры з'яўляецца тое, што яна прыводзіць да стварэння складаных узаемасувязяў паміж вітрынамі даных і іх крыніцамі даных. дадзеныя якія цяжка выконваць і кантраляваць (Inmon et al. 1997).

Іншым недахопам з'яўляецца тое, што канчатковыя карыстальнікі не могуць атрымаць доступ да агляду інфармацыі аб кампаніі, таму што i дадзеныя розных вітрын дадзеных не інтэграваныя (Ovum 1998).
Яшчэ адным недахопам з'яўляецца тое, што можа быць больш чым адно вызначэнне для кожнай тэрміналогіі, якая выкарыстоўваецца ў вітрынах даных, што спараджае неадпаведнасці дадзеныя у арганізацыі (Ovum 1998).
Нягледзячы на ​​недахопы, разгледжаныя вышэй, незалежныя вітрыны дадзеных па-ранейшаму прыцягваюць цікавасць многіх арганізацый (IDC 1997). Адным з фактараў, які робіць іх прывабнымі, з'яўляецца тое, што яны хутчэй развіваюцца і патрабуюць менш часу і рэсурсаў (Bresnahan 1996, Berson and Smith 1997, Ovum 1998). Такім чынам, яны служаць галоўным чынам у якасці тэставых праектаў, якія могуць быць выкарыстаны для хуткага вызначэння пераваг і/ці недахопаў у праекце (Parsaye 1995, Braly 1995, Newing 1996). У гэтым выпадку частка, якая будзе рэалізавана ў пілотным праекце, павінна быць невялікай, але важнай для арганізацыі (Newing 1996, Mansell-Lewis 1996).

Вывучаючы прататып, канчатковыя карыстальнікі і адміністрацыя могуць вырашыць, працягваць або спыніць праект (Flanagan and Safdie 1997).
Калі рашэнне будзе працягвацца, вітрыны дадзеных для іншых галін павінны будавацца па чарзе. Ёсць два варыянты для канчатковых карыстальнікаў у залежнасці ад іх патрэбаў у стварэнні незалежных матрыц даных: інтэграваная/аб'яднаная і неінтэграваная (Ovum 1998)

У першым спосабе кожная новая вітрына даных павінна будавацца на аснове бягучых вітрын даных і мадэлі дадзеныя выкарыстоўваецца кампаніяй (Varney 1996, Berson and Smith 1997, Peacock 1998). Неабходнасць выкарыстання мадэлі дадзеныя кампаніі азначае, што трэба пераканацца, што існуе толькі адно вызначэнне для кожнай тэрміналогіі, якая выкарыстоўваецца на вітрынах дадзеных, гэта таксама гарантуе, што розныя вітрыны дадзеных могуць быць аб'яднаны, каб даць агляд інфармацыі аб кампаніі (Bresnahan 1996). Гэты метад называецца «знізу ўверх» і з'яўляецца лепшым, калі ёсць абмежаванні ў фінансавых сродках і часе (Flanagan and Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). У другім спосабе пабудаваныя вітрыны дадзеных могуць задаволіць патрэбы толькі канкрэтнага падраздзялення. Разнавіднасцю аб'яднанай вітрыны дадзеных з'яўляецца інфармацыйнае сховішча распаўсюджана, у якой ст база дадзеных Прамежкавае праграмнае забеспячэнне Hub Server выкарыстоўваецца для аб'яднання шматлікіх вітрын даных у адно сховішча дадзеныя распаўсюджваецца (Белы 1995). У гэтым выпадку, я дадзеныя кампаніі размеркаваны ў некалькіх вітрынах дадзеных. Запыты канчатковых карыстальнікаў накіроўваюцца база дадзеных прамежкавае праграмнае забеспячэнне сервернага цэнтра, якое здабывае ўсе дадзеныя запытваецца вітрынамі даных і вяртае вынікі праграмам канчатковых карыстальнікаў. Гэты метад прадастаўляе дзелавую інфармацыю канчатковым карыстальнікам. Аднак праблемы незалежных вітрын дагэтуль не ліквідаваныя. Існуе яшчэ адна архітэктура, якую можна выкарыстоўваць, якая называецца інфармацыйнае сховішча віртуальны (Белы 1995). Аднак гэтая архітэктура, апісаная на малюнку 2.9, не з'яўляецца архітэктурай захоўвання даных. дадзеныя рэальны, бо ён не перамяшчае загрузку з сістэм OLTP на інфармацыйнае сховішча (Demarest 1994).

Фактычна запыты а дадзеныя ад канчатковых карыстальнікаў перадаюцца сістэмам OLTP, якія вяртаюць вынікі пасля апрацоўкі запытаў карыстальнікаў. Хоць гэтая архітэктура дазваляе канчатковым карыстальнікам ствараць справаздачы і рабіць запыты, яна не можа забяспечыць

дадзеныя гісторыя і агляд інфармацыі аб кампаніі, як i дадзеныя з розных сістэм OLTP не інтэграваныя. Такім чынам, гэтая архітэктура не можа задаволіць аналіз дадзеныя комплекс, напрыклад, прагнозы.

Выбар праграм доступу і аднаўлення дадзеныя

Мэта пабудовы а інфармацыйнае сховішча заключаецца ў перадачы інфармацыі канчатковым карыстальнікам (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); адно або некалькі прыкладанняў доступу і аднаўлення дадзеныя павінны быць прадастаўлены. На сённяшні дзень існуе вялікая разнастайнасць гэтых прыкладанняў, з якіх карыстальнік можа выбраць (Hammergren 1998, Humphries et al. 1999). Выбраныя вамі прыкладанні вызначаюць поспех вашых намаганняў па складзіраванні дадзеныя у арганізацыі, таму што прыкладанні з'яўляюцца найбольш прыкметнай часткай інфармацыйнае сховішча да канчатковага карыстальніка (Inmon et al. 1997, Poe 1996). Быць паспяховым а інфармацыйнае сховішча, павінны мець магчымасць падтрымліваць аналітычную дзейнасць дадзеныя канчатковага карыстальніка (Poe 1996, Seddon and Benjamin 1998, Eckerson 1999). Такім чынам, павінен быць вызначаны «ўзровень» таго, чаго жадае канчатковы карыстальнік (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

Увогуле, канчатковыя карыстальнікі могуць быць згрупаваныя ў тры катэгорыі: выканаўчыя карыстальнікі, бізнес-аналітыкі і вопытныя карыстальнікі (Poe 1996, Humphries et al. 1999). Кіраўнічым карыстальнікам патрэбны лёгкі доступ да наканаваных набораў справаздач (Humphries et al. 1999). Гэтыя каэфіцыенты можна лёгка атрымаць з дапамогай навігацыі па меню (Poe 1996). Акрамя таго, справаздачы павінны прадстаўляць інфармацыю з дапамогай графічнага прадстаўлення, такога як табліцы і шаблоны для хуткай перадачы інфармацыі (Humphries et al. 1999). Бізнес-аналітыкі, якія могуць не мець тэхнічных магчымасцяў самастойна распрацоўваць справаздачы з нуля, павінны мець магчымасць мадыфікаваць бягучыя справаздачы ў адпаведнасці са сваімі канкрэтнымі патрэбамі (Poe 1996, Humphries et al. 1999). Дасведчаныя карыстальнікі, з іншага боку, - гэта тып канчатковых карыстальнікаў, якія маюць магчымасць ствараць і пісаць запыты і справаздачы з нуля (Poe 1996, Humphries et al. 1999). Яны тыя, хто

яны распрацоўваюць справаздачы для іншых тыпаў карыстальнікаў (Poe 1996, Humphries et al. 1999).

Пасля таго, як патрабаванні канчатковага карыстальніка будуць вызначаны, трэба зрабіць выбар прыкладанняў доступу і аднаўлення дадзеныя сярод усіх даступных (Poe 1996, Inmon et al. 1997).
Доступ да дадзеныя і інструменты пошуку можна класіфікаваць на 4 тыпу: інструменты OLAP, інструменты EIS/DSS, інструменты запытаў і справаздач і інструменты інтэлектуальнага аналізу дадзеных.

Інструменты OLAP дазваляюць карыстальнікам ствараць спецыяльныя запыты, а таксама тыя, якія зроблены на база дадзеных Дэль інфармацыйнае сховішча. Акрамя таго, гэтыя прадукты дазваляюць карыстальнікам дэталёва з дадзеныя ад агульных да падрабязных.

Інструменты EIS/DSS забяспечваюць справаздачнасць кіраўнікоў, напрыклад, аналіз "што, калі" і доступ да справаздач, якія кіруюцца меню. Справаздачы павінны быць загадзя вызначаны і аб'яднаны з меню для палягчэння навігацыі.
Інструменты запытаў і справаздач дазваляюць карыстальнікам ствараць наканаваныя і спецыяльныя справаздачы.

Інструменты інтэлектуальнага аналізу даных выкарыстоўваюцца для выяўлення адносін, якія могуць праліць новае святло на забытыя аперацыі ў дадзеныя сховішча дадзеных.

Акрамя аптымізацыі патрабаванняў кожнага тыпу карыстальнікаў, выбраныя інструменты павінны быць інтуітыўна зразумелымі, эфектыўнымі і простымі ў выкарыстанні. Яны таксама павінны быць сумяшчальныя з іншымі часткамі архітэктуры і мець магчымасць працаваць з існуючымі сістэмамі. Таксама рэкамендуецца выбіраць інструменты доступу і пошуку дадзеных з разумнымі коштамі і прадукцыйнасцю. Іншыя крытэрыі, якія варта ўлічваць, уключаюць абавязацельствы пастаўшчыка інструмента падтрымліваць свой прадукт і тое, як ён будзе развівацца ў будучых выпусках. Каб забяспечыць уцягванне карыстальнікаў у выкарыстанне сховішча даных, каманда распрацоўшчыкаў прыцягвае карыстальнікаў да працэсу выбару інструмента. У гэтым выпадку павінна быць праведзена практычная ацэнка карыстальніка.

Каб палепшыць каштоўнасць сховішча даных, каманда распрацоўшчыкаў можа таксама забяспечыць вэб-доступ да свайго сховішча даных. Інтэрнэт-сховішча даных дазваляе карыстальнікам атрымліваць доступ да дадзеныя з аддаленых месцаў або падчас падарожжа. Дадатковая інфармацыя можа

забяспечвацца з меншымі выдаткамі за кошт скарачэння выдаткаў на навучанне.

2.4.3 Склад дадзеных Фаза аперацыі

Гэты этап складаецца з трох дзеянняў: вызначэнне стратэгій абнаўлення даных, кантроль дзейнасці сховішча даных і кіраванне бяспекай сховішча даных.

Вызначэнне стратэгій абнаўлення даных

Пасля першапачатковай загрузкі, г.зн дадзеныя ў база дадзеных сховішча дадзеных неабходна перыядычна абнаўляць, каб прайграць унесеныя ў іх змены дадзеныя арыгіналы. Такім чынам, вы павінны вырашыць, калі абнаўляць, як часта планаваць абнаўленне і як абнаўляць даныя дадзеныя. Прапануецца абнавіць дадзеныя калі сістэму можна перавесці ў аўтаномны рэжым. Частата абнаўлення вызначаецца камандай распрацоўшчыкаў у залежнасці ад патрабаванняў карыстальніка. Ёсць два падыходы да абнаўлення сховішча дадзеных: поўнае абнаўленне і пастаянная загрузка змяненняў.

Першы падыход, поўнае абнаўленне, патрабуе перазагрузкі ўсіх дадзеныя з нуля. Гэта азначае, што ўсе дадзеныя неабходныя павінны быць здабыты, ачышчаны, трансфармаваны і інтэграваны ў кожнае абнаўленне. Варта, наколькі гэта магчыма, пазбягаць гэтага падыходу, таму што ён патрабуе шмат часу і рэсурсаў.

Альтэрнатыўны падыход - пастаянная загрузка змяненняў. Гэта дадае i дадзеныя якія былі зменены пасля апошняга цыкла абнаўлення сховішча даных. Выяўленне новых або змененых запісаў значна памяншае колькасць дадзеныя якія павінны распаўсюджвацца ў сховішча дадзеных пры кожным абнаўленні, бо толькі гэтыя дадзеныя будзе дададзены ў база дадзеных сховішча дадзеных.

Ёсць як мінімум 5 падыходаў, якія можна выкарыстоўваць для зняцця i дадзеныя новы або зменены. Каб атрымаць эфектыўную стратэгію абнаўлення даных дадзеныя можа быць карыснай сумесь гэтых падыходаў, якая фіксуе ўсе змены ў сістэме.

Першы падыход, які выкарыстоўвае пазнакі часу, мяркуе, што ўсе прызначаныя дадзеныя адрэдагаваў і абнавіў пазнаку часу, каб вы маглі лёгка ідэнтыфікаваць усіх дадзеныя зменены і новы. Гэты падыход, аднак, не атрымаў шырокага прымянення ў большасці сучасных аперацыйных сістэм.
Другі падыход заключаецца ў выкарыстанні дэльта-файла, згенераванага дадаткам, які змяшчае толькі змены, зробленыя ў дадзеныя. Выкарыстанне гэтага файла таксама павялічвае цыкл абнаўлення. Аднак нават гэты метад не выкарыстоўваўся ў многіх прыкладаннях.
Трэці падыход заключаецца ў сканаванні файла часопіса, які ў асноўным змяшчае інфармацыю, падобную да дэльта-файла. Адзіная розніца ў тым, што файл часопіса ствараецца для працэсу аднаўлення і можа быць складаным для разумення.
Чацвёрты падыход - змяніць код прыкладання. Аднак большасць праграмнага кода старыя і нетрывалыя; таму гэтай тэхнікі варта пазбягаць.
Апошні падыход - параўнаць дадзеныя крыніцы з асноўным дэі-файлам дадзеныя.

Кантроль дзейнасці сховішча даных

Пасля таго, як сховішча дадзеных было выпушчана для карыстальнікаў, яго неабходна кантраляваць на працягу доўгага часу. У гэтым выпадку адміністратар сховішча даных можа выкарыстоўваць адзін або некалькі інструментаў кіравання і кантролю для маніторынгу выкарыстання сховішча даных. У прыватнасці, можа быць сабрана інфармацыя аб людзях і часе, калі яны звяртаюцца да сховішча дадзеных. Давай дадзеныя сабраны, можна стварыць профіль выкананай працы, які можа выкарыстоўвацца ў якасці ўваходных дадзеных для ажыццяўлення карыстальнікам вяртання плацяжоў. Chargeback дазваляе карыстальнікам атрымліваць інфармацыю аб кошце апрацоўкі сховішча даных.

Акрамя таго, аўдыт сховішча даных таксама можа выкарыстоўвацца для вызначэння тыпаў запытаў, іх памеру, колькасці запытаў у дзень, часу рэакцыі на запыты, дасягнутых сектараў і колькасці дадзеныя апрацаваны. Яшчэ адна мэта правядзення аўдыту сховішча даных - вызначыць дадзеныя якія не выкарыстоўваюцца. Гэтыя дадзеныя іх можна выдаліць са сховішча даных, каб палепшыць час

адказу на выкананне запытаў і сачыць за ростам дадзеныя якія знаходзяцца ў межах база дадзеных сховішча дадзеных.

Кіраванне бяспекай сховішча даных

Сховішча дадзеных змяшчае дадзеныя інтэграваны, крытычны, адчувальны, да якога можна лёгка дабрацца. Па гэтай прычыне яго трэба абараняць ад несанкцыянаваных карыстальнікаў. Адзін са спосабаў рэалізацыі бяспекі - выкарыстанне функцыі del СКБД прызначаць розныя прывілеі розным тыпам карыстальнікаў. Такім чынам, профіль доступу павінен падтрымлівацца для кожнага тыпу карыстальнікаў. Іншы спосаб абараніць сховішча дадзеных - зашыфраваць яго, як напісана ў база дадзеных сховішча дадзеных. Доступ да дадзеныя і інструменты пошуку павінны расшыфраваць дадзеныя перад прадстаўленнем вынікаў карыстальнікам.

2.4.4 Склад дадзеных Фаза разгортвання

Гэта апошні этап у цыкле ўкаранення сховішча дадзеных. Мерапрыемствы, якія будуць праводзіцца на гэтым этапе, уключаюць навучанне карыстальнікаў карыстанню сховішчам даных і правядзенне аглядаў сховішча даных.

Навучанне карыстальнікаў

Перад доступам да дадзеныя сховішча даных і выкарыстанне інструментаў пошуку. Як правіла, заняткі павінны пачынацца са знаёмства з канцэпцыяй захоўвання дадзеныя, змест сховішча даных, мета дадзеныя і асноўныя асаблівасці інструментаў. Затым больш прасунутыя карыстальнікі могуць таксама вывучаць фізічныя табліцы і карыстальніцкія функцыі інструментаў доступу і пошуку даных.

Ёсць шмат падыходаў да навучання карыстальнікаў. Адзін з іх уключае ў сябе выбар многіх карыстальнікаў або аналітыкаў, выбраных з набору карыстальнікаў на аснове іх лідэрскіх і камунікатыўных навыкаў. Іх асабіста навучаюць усяму, што ім трэба ведаць, каб азнаёміцца ​​з сістэмай. Пасля заканчэння навучання яны вяртаюцца на свае працоўныя месцы і пачынаюць вучыць іншых карыстальнікаў карыстацца сістэмай. На ст

На аснове таго, што яны даведаліся, іншыя карыстальнікі могуць пачаць даследаваць сховішча дадзеных.
Іншы падыход заключаецца ў навучанні многіх карыстальнікаў адначасова, як калі б вы праходзілі курс у класе. Гэты метад падыходзіць, калі ёсць шмат карыстальнікаў, якіх трэба навучаць адначасова. Яшчэ адзін метад - навучанне кожнага карыстальніка паасобку, аднаго за адным. Гэты спосаб падыходзіць, калі карыстальнікаў мала.

Мэта навучання карыстальнікаў - азнаёміць вас з доступам да дадзеныя і інструменты пошуку, а таксама змесціва сховішча даных. Аднак некаторыя карыстальнікі могуць быць здзіўлены колькасцю інфармацыі, прадстаўленай падчас трэніроўкі. Такім чынам, для пастаяннай дапамогі і адказаў на канкрэтныя пытанні неабходна правесці пэўную колькасць сеансаў павышэння кваліфікацыі. У некаторых выпадках ствараецца група карыстальнікаў для аказання такой падтрымкі.

Збор водгукаў

Пасля разгортвання сховішча даных карыстальнікі могуць выкарыстоўваць i дадзеныя якія знаходзяцца ў сховішчы дадзеных для розных мэтаў. У асноўным аналітыкі або карыстальнікі выкарыстоўваюць i дадзеныя у сховішчы дадзеных для:

  1. 1 Вызначце тэндэнцыі кампаніі
  2. 2 Прааналізуйце профілі пакупкі кліенты
  3. 3 Падзяліце i кліенты і я
  4. 4 Забяспечце найлепшыя паслугі кліенты – наладзіць паслугі
  5. 5 Сфармулюйце стратэгіі маркетынг
  6. 6 Прапануйце канкурэнтаздольныя цэны для аналізу выдаткаў і дапамогі ў кантролі
  7. 7 Падтрымка прыняцця стратэгічных рашэнняў
  8. 8 Вызначце магчымасці вылучыцца
  9. 9 Палепшыце якасць бягучых бізнес-працэсаў
  10. 10 Праверце прыбытак

У адпаведнасці з напрамкам развіцця сховішча даных можна правесці серыю аглядаў сістэмы для атрымання зваротнай сувязі

як ад каманды распрацоўшчыкаў, так і ад супольнасці канчатковых карыстальнікаў.
Атрыманыя вынікі могуць быць улічаны ў наступным цыкле распрацоўкі.

Паколькі сховішча дадзеных мае паступовы падыход, вельмі важна вучыцца на поспехах і памылках папярэдніх распрацовак.

2.5 Рэзюмэ

У гэтай главе абмяркоўваліся падыходы, якія прысутнічаюць у літаратуры. У раздзеле 1 абмяркоўвалася канцэпцыя сховішча дадзеных і яго роля ў навуцы прыняцця рашэнняў. У раздзеле 2 былі апісаны асноўныя адрозненні паміж сховішчамі дадзеных і сістэмамі OLTP. У раздзеле 3 мы абмяркоўвалі мадэль сховішча даных Monash, якая выкарыстоўвалася ў раздзеле 4 для апісання дзеянняў, звязаных з працэсам распрацоўкі сховішча даных, гэтыя тэзісы не грунтаваліся на строгіх даследаваннях. Тое, што адбываецца ў рэчаіснасці, можа моцна адрознівацца ад таго, што паведамляецца ў літаратуры, аднак гэтыя вынікі могуць быць выкарыстаны для стварэння базавай асновы, якая падкрэслівае канцэпцыю сховішча даных для гэтага даследавання.

Капітолій 3

Метады даследавання і праектавання

У гэтай главе разглядаюцца метады даследавання і распрацоўкі гэтага даследавання. Першая частка паказвае агульны погляд на метады даследавання, даступныя для пошуку інфармацыі, акрамя таго, абмяркоўваюцца крытэрыі для выбару найлепшага метаду для канкрэтнага даследавання. У раздзеле 2 затым абмяркоўваюцца два метады, выбраныя з толькі што выкладзенымі крытэрамі; з іх адзін будзе абраны і прыняты з прычынамі, выкладзенымі ў раздзеле 3, дзе таксама выкладзены прычыны для выключэння іншага крытэрыю. У раздзеле 4 прадстаўлены план даследавання, а ў раздзеле 5 - высновы.

3.1 Даследаванні ў галіне інфармацыйных сістэм

Даследаванні ў галіне інфармацыйных сістэм не проста абмяжоўваюцца тэхналагічнай сферай, але таксама павінны быць пашыраны, каб уключыць паводніцкія і арганізацыйныя мэты.
Мы абавязаны гэтым тэзісам розных дысцыплін, пачынаючы ад сацыяльных і заканчваючы натуральнымі навукамі; гэта прыводзіць да неабходнасці пэўнага спектру метадаў даследавання з удзелам колькасных і якасных метадаў, якія будуць выкарыстоўвацца для інфармацыйных сістэм.
Усе даступныя метады даследавання важныя, на самай справе некалькі даследчыкаў, такіх як Джэнкінс (1985), Нунамэйкер і інш. (1991), і Galliers (1992) сцвярджаюць, што не існуе канкрэтнага універсальнага метаду для правядзення даследаванняў у розных галінах інфармацыйных сістэм; на самай справе метад можа быць прыдатным для канкрэтнага даследавання, але не для іншых. Гэта прыводзіць да неабходнасці выбару метаду, які падыходзіць для нашага канкрэтнага даследчага праекта: для гэтага выбару Benbasat et al. (1987) сцвярджаюць, што неабходна ўлічваць характар ​​і мэту даследавання.

3.1.1 Характар ​​даследавання

Розныя метады, заснаваныя на характары даследавання, можна падзяліць на тры традыцыі, шырока вядомыя ў навуцы аб інфармацыі: пазітывісцкія, інтэрпрэтацыйныя і крытычныя даследаванні.

3.1.1.1 Пазітывісцкія даследаванні

Пазітывісцкія даследаванні таксама вядомыя як навуковыя або эмпірычныя даследаванні. Ён імкнецца: «растлумачыць і прадказаць, што будзе адбывацца ў сацыяльным свеце, гледзячы на ​​заканамернасці і прычынна-выніковыя сувязі паміж элементамі, якія яго складаюць» (Shanks et al 1993).

Пазітывісцкім даследаванням таксама ўласцівы паўтаральнасць, спрашчэнні і абвяржэнні. Акрамя таго, пазітывісцкія даследаванні дапускаюць існаванне апрыёрных сувязяў паміж даследуемымі з'явамі.
Згодна з Galliers (1992), таксанамія - гэта метад даследавання, які ўваходзіць у пазітывісцкую парадыгму, якая, аднак, не абмяжоўваецца гэтым, насамрэч ёсць лабараторныя эксперыменты, палявыя эксперыменты, тэматычныя даследаванні, дэманстрацыі тэарэм, прагнозы і мадэляванне. Выкарыстоўваючы гэтыя метады, даследчыкі прызнаюць, што вывучаныя з'явы можна назіраць аб'ектыўна і строга.

3.1.1.2 Інтэрпрэтацыйнае даследаванне

Інтэрпрэтацыйнае даследаванне, якое часта называюць фенаменалогіяй або антыпазітывізмам, апісваецца Нойманам (1994) як «сістэматычны аналіз сацыяльнага значэння дзеяння праз прамое і дэталёвае назіранне за людзьмі ў натуральных сітуацыях, каб прыйсці да разумення і да інтэрпрэтацыі таго, як людзі ствараюць і падтрымліваюць свой сацыяльны свет». Інтэрпрэтацыйныя даследаванні адмаўляюць здагадку, што назіраныя з'явы можна назіраць аб'ектыўна. Насамрэч яны грунтуюцца на суб'ектыўных інтэрпрэтацыях. Больш за тое, даследчыкі-інтэрпрэтатары не навязваюць апрыёрныя значэнні феноменам, якія вывучаюць.

Гэты метад уключае суб'ектыўныя/аргументацыйныя даследаванні, даследаванні дзеянняў, апісальныя/інтэрпрэтацыйныя даследаванні, даследаванні будучыні і ролевыя гульні. У дадатак да гэтых апытанняў і тэматычных даследаванняў можна ўключыць у гэты падыход, паколькі яны тычацца даследаванняў асобных асоб або арганізацый у складаных сітуацыях рэальнага свету.

3.1.1.3 Крытычныя даследаванні

Крытычны запыт - найменш вядомы падыход у сацыяльных навуках, але нядаўна ён прыцягнуў увагу даследчыкаў інфармацыйных сістэм. Філасофскае дапушчэнне, што сацыяльная рэальнасць гістарычна ствараецца і ўзнаўляецца людзьмі, а таксама сацыяльнымі сістэмамі з іх дзеяннямі і ўзаемадзеяннем. Іх здольнасць, аднак, абумоўлена шэрагам сацыяльных, культурных і палітычных меркаванняў.

Як і інтэрпрэтацыйныя даследаванні, крытычныя даследаванні сцвярджаюць, што пазітывісцкія даследаванні не маюць нічога агульнага з сацыяльным кантэкстам і ігнаруюць яго ўплыў на дзеянні чалавека.
З іншага боку, крытычнае даследаванне крытыкуе інтэрпрэтацыйнае даследаванне за тое, што яно занадта суб'ектыўнае і не мае на мэце дапамагчы людзям палепшыць сваё жыццё. Найбольшая розніца паміж крытычным даследаваннем і двума іншымі падыходамі заключаецца ў яго ацэначным вымярэнні. У той час як аб'ектыўнасць пазітывісцкіх і інтэрпрэтацыйных традыцый заключаецца ў прагназаванні або тлумачэнні статус-кво або сацыяльнай рэальнасці, крытычнае даследаванне накіравана на крытычную ацэнку і трансфармацыю вывучаемай сацыяльнай рэальнасці.

Крытычныя даследчыкі звычайна выступаюць супраць статус-кво, каб ліквідаваць сацыяльныя адрозненні і палепшыць сацыяльныя ўмовы. Крытычнае даследаванне мае прыхільнасць да працэсуальнага погляду на цікавыя з'явы і, такім чынам, звычайна з'яўляецца падоўжным. Прыкладамі метадаў даследавання з'яўляюцца шматгадовыя гістарычныя даследаванні і этнаграфічныя даследаванні. Крытычныя даследаванні, аднак, не былі шырока выкарыстаны ў даследаванні інфармацыйных сістэм

3.1.2 Мэта даследавання

Разам з характарам даследавання яго мэта можа быць арыенцірам даследчыка пры выбары таго ці іншага метаду даследавання. Мэта даследчага праекта цесна звязана з пазіцыяй даследавання ў даследчым цыкле, які складаецца з трох этапаў: пабудова тэорыі, праверка тэорыі і ўдасканаленне тэорыі. Такім чынам, у залежнасці ад часу даследчага цыкла даследчы праект можа мець тлумачальную, апісальную, даследчую або прагназавальную мэту.

3.1.2.1 Пошукавыя даследаванні

Даследчыя даследаванні накіраваны на вывучэнне цалкам новай тэмы і фармуляванне пытанняў і гіпотэз для будучых даследаванняў. Гэты тып даследаванняў выкарыстоўваецца ў пабудове тэорыі для атрымання першапачатковых спасылак у новай вобласці. Як правіла, выкарыстоўваюцца якасныя метады даследавання, такія як тэматычныя даследаванні або фенаменалагічныя даследаванні.

Тым не менш, таксама можна выкарыстоўваць колькасныя метады, такія як даследчыя даследаванні або эксперыменты.

3.1.3.3 Апісальныя даследаванні

Апісальнае даследаванне накіравана на аналіз і падрабязнае апісанне канкрэтнай арганізацыйнай сітуацыі або практыкі. Гэта падыходзіць для пабудовы тэорый, а таксама можа выкарыстоўвацца для пацверджання або аспрэчвання гіпотэз. Апісальныя даследаванні звычайна ўключаюць выкарыстанне мер і проб. Найбольш прыдатныя метады даследавання ўключаюць апытанні і аналіз папярэднікаў.

3.1.2.3 Растлумачальныя даследаванні

Тлумачальнае даследаванне спрабуе растлумачыць, чаму так адбываецца. Ён пабудаваны на фактах, якія ўжо вывучаны, і спрабуе знайсці прычыны гэтых фактаў.
Такім чынам, тлумачальнае даследаванне звычайна будуецца на пошукавых або апісальных даследаваннях і з'яўляецца дапаможным для тэсціравання і ўдасканалення тэорый. У тлумачальных даследаваннях звычайна выкарыстоўваюцца тэматычныя даследаванні або метады даследавання, заснаваныя на апытаннях.

3.1.2.4 Прафілактычныя даследаванні

Прафілактычныя даследаванні накіраваны на прагназаванне падзей і паводзін, якія вывучаюцца (Marshall and Rossman 1995). Прадказанне - гэта стандартная навуковая праверка праўды. У гэтым тыпе даследаванняў звычайна выкарыстоўваюцца апытанні або аналіз дадзеныя гісторыкаў. (Інь 1989)

Прыведзенае вышэй абмеркаванне паказвае, што існуе шэраг магчымых метадаў даследавання, якія могуць быць выкарыстаны ў канкрэтным даследаванні. Аднак павінен быць адзін канкрэтны метад, больш прыдатны, чым іншыя, для канкрэтнага тыпу даследчага праекта. (Galliers 1987, Yin 1989, De Vaus 1991). Такім чынам, кожны даследчык павінен старанна ацаніць моцныя і слабыя бакі розных метадаў, каб прыняць найбольш прыдатны і сумяшчальны метад даследавання з даследчым праектам. (Джэнкінс 1985, Перван і Клас 1992, Баномія 1985, Інь 1989, Хімілтан і Айвз 1992).

3.2. Магчымыя метады даследавання

Мэтай гэтага праекта было вывучэнне вопыту аўстралійскіх арганізацый з i дадзеныя захоўваецца з разв інфармацыйнае сховішча. Дато што ў цяперашні час у Аўстраліі не хапае даследаванняў у галіне сховішчаў даных, гэты даследчы праект усё яшчэ знаходзіцца ў тэарэтычнай фазе даследчага цыкла і мае даследчую мэту. Вывучэнне вопыту аўстралійскіх арганізацый, якія выкарыстоўваюць сховішчы даных, патрабуе інтэрпрэтацыі рэальнага грамадства. Такім чынам, філасофскія дапушчэнні, якія ляжаць у аснове даследчага праекта, прытрымліваюцца традыцыйнай інтэрпрэтацыі.

Пасля строгага вывучэння даступных метадаў былі вызначаны два магчымыя метады даследавання: апытанні і тэматычныя даследаванні, якія могуць быць выкарыстаны для пошукавых даследаванняў (Shanks et al. 1993). Галіерс (1992) аргументуе прыдатнасць гэтых двух метадаў для гэтага канкрэтнага даследавання ў сваёй перагледжанай сістэматыцы, кажучы, што яны прыдатныя для пабудовы тэорыі. У наступных двух падраздзелах падрабязна разглядаецца кожны метад.

3.2.1 Апытальны метад даследавання

Апытальны метад даследавання паходзіць ад старажытнага метаду перапісу. Перапіс складаецца са збору інфармацыі пра ўсё насельніцтва. Гэты метад дарагі і непрактычны, асабліва калі насельніцтва вялікае. Такім чынам, у параўнанні з перапісам, апытанне звычайна засяроджваецца на зборы інфармацыі для невялікай колькасці, або выбаркі, прадстаўнікоў насельніцтва (Fowler 1988, Neuman 1994). Выбарка адлюстроўвае сукупнасць, з якой яна складзена, з рознымі ўзроўнямі дакладнасці ў залежнасці ад структуры выбаркі, памеру і выкарыстоўванага метаду адбору (Fowler 1988, Babbie 1982, Neuman 1994).

Метад апытання вызначаецца як «маментальныя здымкі практык, сітуацый або поглядаў у пэўны момант часу, зробленыя з дапамогай анкет або інтэрв'ю, з якіх можна зрабіць высновы
зрабіў» (Galliers 1992:153) [здымак практык, сітуацый або поглядаў у пэўны момант часу, зроблены з дапамогай анкет або інтэрв'ю, з якіх можна зрабіць высновы]. Апытанні маюць справу са зборам інфармацыі аб некаторых аспектах даследавання ад пэўнай колькасці ўдзельнікаў шляхам задавання пытанняў (Fowler 1988). Гэтыя анкеты і інтэрв'ю, якія ўключаюць асабістыя тэлефонныя інтэрв'ю і структураваныя, таксама з'яўляюцца метадамі збору дадзеныя найбольш часта выкарыстоўваюцца ў расследаваннях (Blalock 1970, Nachmias and Nachmias 1976, Fowler 1988), можна выкарыстоўваць назіранні і аналіз (Gable 1994). З усіх гэтых метадаў збору ст дадзеныя, выкарыстанне анкеты з'яўляецца найбольш папулярным метадам, так як гэта гарантуе, што i дадзеныя

сабраныя з'яўляюцца структураванымі і адфарматаванымі, што палягчае класіфікацыю інфармацыі (Hwang 1987, de Vaus 1991).

Пры аналізе я дадзеныя, у стратэгіі расследавання часта выкарыстоўваюцца колькасныя метады, такія як статыстычны аналіз, але таксама можна выкарыстоўваць якасныя метады (Galliers 1992, Pervan

і Klass 1992, Gable 1994). Звычайна, я дадзеныя сабраныя выкарыстоўваюцца для аналізу размеркаванняў і мадэляў асацыяцый (Fowler 1988).

Хаця апытанні звычайна падыходзяць для даследаванняў, звязаных з пытаннем "што?" (што) або выходзячы з яго, напрыклад, «колькі» і «колькі», яны могуць быць зададзены праз пытанне «чаму» (Sonquist and Dunkelberg 1977, Yin 1989). Згодна з Sonquist і Dunkelberg (1977), даследчыя даследаванні накіраваны на аспрэчванне гіпотэз, ацэнку праграм, апісанне папуляцыі і распрацоўку мадэляў чалавечых паводзін. Больш за тое, апытанні могуць быць выкарыстаны для вывучэння пэўнага меркавання насельніцтва, умоў, меркаванняў, характарыстык, чаканняў і нават паводзін у мінулым ці цяперашнім (Neuman 1994).

Апытанні дазваляюць даследчыкам выявіць адносіны сярод насельніцтва, і вынікі звычайна больш агульныя, чым іншыя метады (Sonquist and Dunkelberg 1977, Gable 1994). Апытанні дазваляюць даследчыкам ахопліваць шырокую геаграфічную вобласць і ахопліваць шмат рэспандэнтаў (Blalock 1970, Sonquist і Dunkelberg 1977, Hwang і Lin 1987, Gable 1994, Neuman 1994). Нарэшце, апытанні могуць даць інфармацыю, якая недаступная ў іншым месцы або ў форме, неабходнай для аналізу (Fowler 1988).

Аднак ёсць некаторыя абмежаванні ў правядзенні апытання. Недахопам з'яўляецца тое, што даследчык не можа атрымаць шмат інфармацыі аб даследаваным аб'екце. Гэта звязана з тым, што апытанні праводзяцца толькі ў пэўны час і, такім чынам, існуе абмежаваная колькасць зменных і людзей, з якімі даследчык можа

даследаванне (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Іншым недахопам з'яўляецца тое, што правядзенне апытання можа быць вельмі дарагім з пункту гледжання часу і рэсурсаў, асабліва калі яно ўключае асабістыя інтэрв'ю (Fowler 1988).

3.2.2. Запытальны метад даследавання

Запытальны метад даследавання прадугледжвае паглыбленае вывучэнне канкрэтнай сітуацыі ў кантэксце рэальнага свету на працягу пэўнага перыяду часу без умяшання з боку даследчыка (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). У асноўным гэты метад выкарыстоўваецца для апісання ўзаемасувязяў паміж зменнымі, якія вывучаюцца ў канкрэтнай сітуацыі (Galliers 1992). Расследаванні могуць уключаць адзінкавыя або некалькі выпадкаў, у залежнасці ад аналізаванай з'явы (Franz and Robey 1987, Eisenhardt 1989, Yin 1989).

Даследчы метад запыту вызначаецца як «эмпірычнае даследаванне, якое вывучае сучасную з'яву ў яе рэальным кантэксце, выкарыстоўваючы мноства крыніц, сабраных ад аднаго або некалькіх суб'ектаў, такіх як людзі, групы або арганізацыі» (Yin 1989). Няма дакладнага падзелу паміж з'явай і яе кантэкстам, і няма эксперыментальнага кантролю або маніпуляцыі зменнымі (Yin 1989, Benbasat et al. 1987).

Існуе мноства тэхнік збору дадзеныя якія могуць быць выкарыстаны ў апытальных метадах, якія ўключаюць прамыя назіранні, агляды архіўных дакументаў, анкетаванне, агляд дакументацыі і структураваныя інтэрв'ю. Валодаючы разнастайнай тэхнікай збору ўраджаю дадзеныя, даследаванні дазваляюць даследчыкам мець справу з абодвума дадзеныя якасны і колькасны адначасова (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Як і ў выпадку з метадам апытання, даследчык апытання выступае ў якасці назіральніка або даследчыка, а не ў якасці актыўнага ўдзельніка даследуемай арганізацыі.

Бенбасат і інш (1987) сцвярджаюць, што метад даследавання асабліва прыдатны для пабудовы даследчай тэорыі, якая пачынаецца з даследчага пытання і працягваецца адукацыяй.

тэорыі ў працэсе збору дадзеныя. Быць прыдатным і для сцэны

пабудовы тэорыі, Франц і Робі (1987) мяркуюць, што метад запыту таксама можа быць выкарыстаны для фазы комплекснай тэорыі. У гэтым выпадку на падставе сабраных доказаў правяраецца або абвяргаецца дадзеная тэорыя або гіпотэза. Акрамя таго, апытанне таксама падыходзіць для даследаванняў, звязаных з пытаннямі «як» або «чаму» (Yin 1989).

У параўнанні з іншымі метадамі, апытанні дазваляюць даследчыкам больш дэталёва фіксаваць важную інфармацыю (Galliers 1992, Shanks et al. 1993). Акрамя таго, апытанні дазваляюць даследчыкам зразумець прыроду і складанасць вывучаемых працэсаў (Benbasat et al. 1987).

Ёсць чатыры асноўныя недахопы, звязаныя з метадам апытання. Па-першае, гэта адсутнасць кантраляваных адлічэнняў. Суб'ектыўнасць даследчыка можа змяніць вынікі і высновы даследавання (Yin 1989). Другі недахоп - адсутнасць кантраляванага назірання. У адрозненне ад эксперыментальных метадаў, даследчыкі не могуць кантраляваць вывучаемыя з'явы, калі яны разглядаюцца ў натуральным кантэксце (Gable 1994). Трэці недахоп - недастатковая магчымасць тыражавання. Гэта адбываецца таму, што даследчык наўрад ці будзе назіраць тыя ж падзеі і не можа праверыць вынікі канкрэтнага даследавання (Lee 1989). Нарэшце, як следства непаўтаральнасці, цяжка абагульніць вынікі, атрыманыя ў выніку аднаго або некалькіх даследаванняў (Galliers 1992, Shanks et al. 1993). Усе гэтыя праблемы, аднак, не з'яўляюцца непераадольнымі і могуць быць мінімізаваны даследчыкам шляхам прымянення адпаведных дзеянняў (Lee 1989).

3.3. Абгрунтуйце методыку даследавання прыняты

З двух магчымых метадаў даследавання для гэтага даследавання найбольш прыдатным лічыцца метад апытання. Расследаванне было спынена пасля ўважлівага разгляду адпаведных

вартасці і недахопы. Прыдатнасць або непрыдатнасць кожнага метаду для гэтага даследавання абмяркоўваецца ніжэй.

3.3.1. Непрыдатнасць метаду даследавання расследавання

Метад апытання патрабуе паглыбленага вывучэння канкрэтнай сітуацыі ў адной або некалькіх арганізацыях на працягу пэўнага перыяду часу (Eisenhardt 1989). У гэтым выпадку тэрмін можа перавышаць часовыя рамкі, дадзеныя для гэтага даследавання. Яшчэ адна прычына адмовы ад выкарыстання метаду апытання заключаецца ў тым, што вынікі могуць пагаршацца недастатковай строгасцю (Yin 1989). Суб'ектыўнасць даследчыка можа паўплываць на вынікі і высновы. Іншая прычына заключаецца ў тым, што гэты метад больш падыходзіць для даследаванняў тыпу "як" ці "чаму" (Yin 1989), у той час як даследчае пытанне для гэтага даследавання - "што". І апошняе, але не менш важнае: цяжка абагульніць высновы толькі аднаго або некалькіх даследаванняў (Galliers 1992, Shanks et al. 1993). Зыходзячы з гэтага абгрунтавання, метад даследавання апытання не быў абраны, бо ён непрыдатны для гэтага даследавання.

3.3.2. Зручнасць спосабу пошуку расследаванне

Калі гэтае даследаванне праводзілася, практыка захоўвання дадзеных не была шырока прынята аўстралійскімі арганізацыямі. Такім чынам, не было шмат інфармацыі аб іх рэалізацыі ў аўстралійскіх арганізацыях. Даступная інфармацыя паступіла ад арганізацый, якія ўкаранілі або выкарыстоўвалі a інфармацыйнае сховішча. У гэтым выпадку метад даследавання з'яўляецца найбольш прыдатным, так як ён дазваляе атрымаць інфармацыю, якая недаступная ў іншым месцы або ў форме, неабходнай для аналізу (Fowler 1988). Акрамя таго, метад апытання дазваляе даследчыку атрымаць добрае ўяўленне пра практыку, сітуацыі або погляды ў пэўны час (Galliers 1992, Denscombe 1998). Агляд быў неабходны для пашырэння ведаў аб аўстралійскім вопыце захоўвання дадзеных.

Акрамя таго, Сонквіст і Дункельберг (1977) сцвярджаюць, што вынікі апытання больш агульныя, чым іншыя метады.

3.4. Дызайн даследавання абследавання

Апытанне аб практыцы сховішчаў дадзеных было праведзена ў 1999 годзе. Мэтавую групу складалі аўстралійскія арганізацыі, зацікаўленыя ў даследаваннях сховішчаў дадзеных, паколькі яны, верагодна, ужо былі праінфармаваныя аб дадзеныя якія яны захоўваюць і, такім чынам, могуць даць карысную інфармацыю для гэтага даследавання. Мэтавая група была вызначана ў выніку першапачатковага апытання ўсіх аўстралійскіх членаў Інстытута сховішчаў дадзеных (Tdwi-aap). У гэтым раздзеле абмяркоўваецца дызайн фазы эмпірычнага даследавання гэтага даследавання.

3.4.1. Тэхніка ўборкі ўраджаю дадзеныя

З трох метадаў, якія звычайна выкарыстоўваюцца ў апытаннях (г.зн. анкета па пошце, тэлефоннае інтэрв'ю і асабістае інтэрв'ю) (Nachmias 1976, Fowler 1988, de Vaus 1991), для гэтага даследавання была прынятая анкета па пошце. Першая прычына прыняцця апошняй заключаецца ў тым, што яна можа ахапіць геаграфічна рассеянае насельніцтва (Blalock 1970, Nachmias і Nachmias 1976, Hwang і Lin 1987, de Vaus 1991, Gable 1994). Па-другое, паштовая анкета падыходзіць для высокаадукаваных удзельнікаў (Fowler 1988). Пошта анкета для гэтага даследавання была адрасавана спонсарам праекта па сховішчы дадзеных, дырэктарам і/або кіраўнікам праектаў. Па-трэцяе, паштовыя анкеты прыдатныя, калі даступны абаронены спіс рассылкі (Salant and Dilman 1994). TDWI, у дадзеным выпадку, надзейная асацыяцыя сховішчаў даных прадставіла спіс рассылкі сваіх аўстралійскіх членаў. Яшчэ адна перавага паштовай анкеты ў параўнанні з тэлефоннай анкетай або асабістым інтэрв'ю заключаецца ў тым, што яна дазваляе рэспандэнтам больш дакладна адказваць, асабліва калі рэспандэнтам неабходна праглядаць нататкі або абмяркоўваць пытанні з іншымі людзьмі (Fowler 1988).

Патэнцыйным недахопам можа быць час, неабходны для правядзення анкетавання па пошце. Звычайна апытанне па пошце праводзіцца ў такой паслядоўнасці: адпраўка лістоў, чаканне адказаў і адпраўка пацверджання (Fowler 1988, Bainbridge 1989). Такім чынам, агульны час можа быць большым, чым час, неабходны для асабістых інтэрв'ю або тэлефонных інтэрв'ю. Аднак агульны час можа быць вядомы загадзя (Fowler 1988, Denscombe 1998). Час, затрачаны на правядзенне асабістых інтэрв'ю, не можа быць вядомы загадзя, паколькі ён адрозніваецца ад аднаго інтэрв'ю да іншага (Fowler 1988). Тэлефонныя інтэрв'ю могуць быць больш хуткімі, чым паштовыя анкеты і асабістыя інтэрв'ю, але могуць мець высокі працэнт неадказаў з-за недаступнасці некаторых людзей (Fowler 1988). Акрамя таго, тэлефонныя інтэрв'ю звычайна абмяжоўваюцца адносна кароткімі спісамі пытанняў (Bainbridge 1989).

Іншым недахопам паштовай анкеты з'яўляецца высокі працэнт неадказаў (Fowler 1988, Bainbridge 1989, Neuman 1994). Тым не менш, былі прыняты меры супрацьдзеяння шляхам звязвання гэтага даследавання з даверанай установай сховішча дадзеных (напрыклад, TDWI) (Bainbridge 1989, Neuman 1994), якая адпраўляе два лісты-напаміны тым, хто не адказвае (Fowler 1988, Neuman 1994), а таксама ўключае ў сябе дадатковы ліст. тлумачэнне мэты даследавання (Neuman 1994).

3.4.2. Адзінка аналізу

Мэта гэтага даследавання - атрымаць інфармацыю аб укараненні сховішчаў даных і іх выкарыстанні ў аўстралійскіх арганізацыях. Мэтавая група складаецца з усіх аўстралійскіх арганізацый, якія ўкаранілі або ўкараняюць, г.зн інфармацыйнае сховішча. Затым асобныя арганізацыі рэгіструюцца на імя. Анкету разаслалі па пошце арганізацыям, зацікаўленым ва ўсынаўленні інфармацыйнае сховішча. Гэты метад гарантуе, што сабраная інфармацыя паступае з найбольш прыдатных рэсурсаў кожнай арганізацыі-ўдзельніцы.

3.4.3. Узор апытання

«Спіс рассылкі» ўдзельнікаў апытання быў атрыманы з TDWI. З гэтага спісу ў якасці асновы для выбаркі былі выбраны 3000 аўстралійскіх арганізацый. Выбарцы быў адпраўлены дадатковы ліст з тлумачэннем праекта і мэты апытання, а таксама бланк адказаў і загадзя аплачаны канверт для вяртання запоўненай анкеты. З 3000 арганізацый 198 пагадзіліся ўдзельнічаць у даследаванні. Такая малая колькасць адказаў была чаканай дата вялікая колькасць аўстралійскіх арганізацый, якія тады прынялі або прымаюць стратэгію захоўвання дадзеных у сваіх арганізацыях. Такім чынам, мэтавая група для гэтага даследавання складаецца толькі з 198 арганізацый.

3.4.4. Змест анкеты

Структура анкеты была заснавана на мадэлі сховішча дадзеных Монаша (разгледжанай раней у частцы 2.3). Змест анкеты быў заснаваны на аналізе літаратуры, прадстаўленым у раздзеле 2. Копію анкеты, разасланай удзельнікам апытання, можна знайсці ў Дадатку B. Анкета складаецца з шасці раздзелаў, якія ідуць па фазах ахопленай мадэлі. У наступных шасці абзацах коратка выкладзены змест кожнага раздзела.

Раздзел A: Асноўная інфармацыя аб арганізацыі
Гэты раздзел утрымлівае пытанні, звязаныя з профілем арганізацый-удзельніц. Акрамя таго, некаторыя пытанні звязаны са статусам праекта ўдзельніка па сховішчы даных. Канфідэнцыйная інфармацыя, такая як назва арганізацыі, не была выяўлена ў аналізе апытання.

Раздзел Б: Пач
Пытанні ў гэтым раздзеле звязаны з задачай запуску сховішча даных. Былі зададзены пытанні адносна ініцыятараў праектаў, гарантаў, неабходных навыкаў і ведаў, мэтаў развіцця сховішчаў даных і чаканняў канчатковых карыстальнікаў.

Раздзел C: Дызайн
У гэтым раздзеле змяшчаюцца пытанні, звязаныя з планаваннем дзейнасці інфармацыйнае сховішча. У прыватнасці, пытанні тычыліся аб'ёму выканання, працягласці праекта, кошту праекта і аналізу выдаткаў і выгод.

Раздзел D: Развіццё
У раздзеле распрацоўкі ёсць пытанні, якія тычацца дзейнасці па распрацоўцы інфармацыйнае сховішча: збор патрабаванняў канчатковых карыстальнікаў, крыніцы дадзеныя, лагічная мадэль дадзеныя, прататыпы, планаванне магутнасці, тэхнічныя архітэктуры і выбар інструментаў распрацоўкі сховішчаў даных.

Раздзел E: Аперацыя
Аперацыйныя пытанні, звязаныя з працай і пашыральнасцю інфармацыйнае сховішча, як ён развіваецца на наступным этапе развіцця. там якасць дадзеных, стратэгіі абнаўлення дадзеныя, зярністасць дадзеныя, маштабаванасць інфармацыйнае сховішча і пытанні бяспекі інфармацыйнае сховішча былі сярод тыпаў зададзеных пытанняў.

Раздзел F: Развіццё
Гэты раздзел утрымлівае пытанні, звязаныя з выкарыстаннем інфармацыйнае сховішча канчатковымі карыстальнікамі. Даследчыка цікавіла прызначэнне і карыснасць ст інфармацыйнае сховішча, прынятыя стратэгіі агляду і навучання і стратэгія кантролю інфармацыйнае сховішча прыняты.

3.4.5. Хуткасць адказу

Нягледзячы на ​​тое, што апытанні па пошце крытыкуюць за нізкі ўзровень адказаў, былі прыняты меры для павышэння ўзроўню вяртання (як абмяркоўвалася раней у частцы 3.4.1). Тэрмін «частота адказаў» адносіцца да працэнта людзей у канкрэтнай выбарцы апытання, якія адказалі на анкету (Denscombe 1998). Наступная формула была выкарыстана для разліку частаты адказаў для гэтага даследавання:

Колькасць людзей, якія адказалі
Каэфіцыент адказаў = ——————————————————————————— X 100 Агульная колькасць адпраўленых анкет

3.4.6. Пілотныя выпрабаванні

Перад тым, як анкета была адпраўлена выбарцы, пытанні былі вывучаны шляхам правядзення пілотных тэстаў, як было прапанавана Лакам і Рубінам (1987), Джэксанам (1988) і дэ Во (1991). Мэта пілотных тэстаў - выявіць любыя нязручныя, двухсэнсоўныя выразы і пытанні, якія цяжка інтэрпрэтаваць, растлумачыць любыя азначэнні і тэрміны, якія выкарыстоўваюцца, і вызначыць прыблізны час, неабходны для запаўнення анкеты (Warwick and Lininger 1975, Jackson 1988, Salant і Дылман 1994). Пілотныя выпрабаванні праводзіліся шляхам выбару суб'ектаў з характарыстыкамі, падобнымі да канчатковых суб'ектаў, як прапанаваў Дэвіс э Козенца (1993). У гэтым даследаванні шэсць спецыялістаў па сховішчах дадзеных былі выбраны ў якасці пілотных суб'ектаў. Пасля кожнага пілотнага выпрабавання ўносіліся неабходныя карэкціроўкі. З дапамогай праведзеных пілотных выпрабаванняў удзельнікі ўнеслі свой уклад у перафарміраванне і пераўсталяванне канчатковай версіі анкеты.

3.4.7. Метады аналізу па Dati

I дадзеныя анкет, сабраных з закрытых анкет, былі прааналізаваны з дапамогай пакета статыстычных праграм пад назвай SPSS. Многія з адказаў былі прааналізаваны з дапамогай апісальнай статыстыкі. Шэраг анкет былі вернуты няпоўнымі. Да іх ставіліся з большай увагай, каб пераканацца, што i дадзеныя адсутныя не былі следствам памылак пры ўводзе даных, а таму, што пытанні не падыходзілі рэгістратару, або рэгістратар вырашыў не адказваць на адно або некалькі канкрэтных пытанняў. Гэтыя адсутныя адказы былі праігнараваныя падчас аналізу дадзеныя і былі закадаваныя як «- 9», каб гарантаваць іх выключэнне з працэсу аналізу.

Пры падрыхтоўцы анкеты закрытыя пытанні былі пракадзіраваны, прысваіўшы кожнаму варыянту нумар. Нумар затым быў выкарыстаны для падрыхтоўкі дадзеныя падчас аналізу (Denscombe 1998, Sapsford and Jupp 1996). Напрыклад, у пытанні 1 раздзела B было шэсць варыянтаў: савет дырэктараў, вышэйшае кіраўніцтва, ІТ-аддзел, бізнес-падраздзяленне, кансультанты і іншыя. У файле в дадзеныя SPSS была згенеравана зменная для ўказання «ініцыятара праекта» з шасцю пазнакамі значэнняў: «1» для «савета дырэктараў», «2» для «старшага кіраўніка» і гэтак далей. Выкарыстанне шкалы Лікерціна ў некаторых закрытых пытаннях таксама дазволіла лёгка ідэнтыфікаваць з улікам выкарыстання адпаведных лікавых значэнняў, уведзеных у SPSS. Для пытанняў з няпоўнымі адказамі, якія не былі ўзаемавыключальнымі, кожны варыянт разглядаўся як адна зменная з двума пазнакамі значэнняў: «1» для «адзначанага» і «2» для «не адзначанага».

Адкрытыя пытанні разглядаліся інакш, чым закрытыя. Адказы на гэтыя пытанні не былі ўведзены ў SPSS. Замест гэтага яны аналізаваліся ўручную. Выкарыстанне гэтага тыпу пытанняў дазваляе нам атрымаць інфармацыю аб свабодна выказаных ідэях і асабістым вопыце рэспандэнтаў (Bainbridge 1989, Denscombe 1998). Там, дзе гэта было магчыма, была зроблена катэгарызацыя адказаў.

Для аналізу дадзеныявыкарыстоўваюцца простыя метады статыстычнага аналізу, такія як частата адказу, сярэдняе значэнне, стандартнае адхіленне і медыяна (Argyrous 1996, Denscombe 1998).
Гама-тэст быў добрым для атрымання колькасных паказчыкаў сувязяў паміж дадзеныя парадкавыя (Norusis 1983, Argyrous 1996). Гэтыя тэсты падыходзілі таму, што выкарыстоўваныя парадкавыя шкалы не мелі шмат катэгорый і маглі быць паказаны ў табліцы (Norusis 1983).

3.5 Рэзюмэ

У гэтай главе абмяркоўваліся метадалогія і дызайн даследавання, прынятыя для гэтага даследавання.

Выбар найбольш прыдатнага метаду даследавання для канкрэтнага даследавання прымае пад увагу
разгляд шэрагу правіл, у тым ліку характару і тыпу даследавання, а таксама вартасцяў і недахопаў кожнага з магчымых метадаў (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, yin 1989, Hamilton and Ives 1992, Galliers 1992, Нёман 1994). Улічваючы недахоп існуючых ведаў і тэорыі адносна прыняцця сховішчаў даных у Аўстраліі, гэта даследаванне патрабуе інтэрпрэтацыйнага метаду даследавання з магчымасцю вывучэння вопыту аўстралійскіх арганізацый. Абраны метад даследавання быў абраны для збору інфармацыі аб прыняцці аўстралійскімі арганізацыямі канцэпцыі сховішча даных. У якасці методыкі збору была абраная паштовая анкета дадзеныя. Абгрунтаванне метаду даследавання і методыкі збору дадзеныя выбраныя будуць прадстаўлены ў гэтай главе. Акрамя таго, было прадстаўлена абмеркаванне адзінкі аналізу, выбаркі, працэнтаў адказаў, зместу анкеты, папярэдняга тэсту анкеты і метаду аналізу дадзеныя.

Праектаванне а Склад дадзеных:

Спалучэнне ўзаемасувязі аб'ектаў і памернага мадэлявання

РЭЗЮМЭ
Захоўванне i дадзеныя з'яўляецца актуальнай праблемай для многіх арганізацый. Ключавое пытанне ў развіцці камп'ютэрнага захоўвання дадзеныя гэта яго дызайн.
Дызайн павінен падтрымліваць выяўленне канцэпцый у інфармацыйнае сховішча да старой сістэмы і іншых крыніц дадзеныя а таксама лёгкае разуменне і эфектыўнасць у рэалізацыі інфармацыйнае сховішча.
Значная частка захоўвання літаратуры в дадзеныя рэкамендуе выкарыстоўваць мадэляванне ўзаемаадносін суб'ектаў або памернае мадэляванне для прадстаўлення дызайну інфармацыйнае сховішча.
У гэтым артыкуле мы пакажам, як абодва ўяўленні можна аб'яднаць у адзін падыход да малявання інфармацыйнае сховішча. Выкарыстоўваецца сістэмны падыход

разглядаецца ў тэматычным даследаванні і вызначаецца ў шэрагу важных наступстваў з практыкамі.

СКЛОВІШЧА ДАННЫХ

Un інфармацыйнае сховішча звычайна яго вызначаюць як «прадметна-арыентаваны, інтэграваны, зменлівы ў часе і энерганезалежны збор даных у падтрымку рашэнняў кіраўніцтва» (Inmon and Hackathorn, 1994). Прадметна-арыентаваны і інтэграваны сведчыць аб тым, што ст інфармацыйнае сховішча прызначаны для перасячэння функцыянальных межаў сістэм Legaci, каб прапанаваць інтэграваную перспектыву дадзеныя.
Варыянт часу ўплывае на гістарычны характар ​​або характар ​​часавых шэрагаў дадзеныя у ун інфармацыйнае сховішча, што дазваляе аналізаваць тэндэнцыі. Энерганезалежны паказвае, што інфармацыйнае сховішча ён не абнаўляецца пастаянна, як a база дадзеных OLTP. Хутчэй ён перыядычна абнаўляецца, с дадзеныя якія паступаюць з унутраных і знешніх крыніц. The інфармацыйнае сховішча ён спецыяльна распрацаваны для пошуку, а не для абнаўлення цэласнасці і прадукцыйнасці працы.
Ідэя захоўвання i дадзеныя не новы, гэта была адна з мэтаў кіравання дадзеныя з шасцідзесятых гадоў (The Martin, 1982).
I інфармацыйнае сховішча яны прапануюць інфраструктуру дадзеныя для сістэм падтрымкі кіравання. Сістэмы падтрымкі кіравання ўключаюць у сябе сістэмы падтрымкі прыняцця рашэнняў (DSS) і інфармацыйныя сістэмы выканаўчай улады (EIS). DSS - гэта камп'ютарная інфармацыйная сістэма, прызначаная для паляпшэння прыняцця чалавекам рашэнняў. EIS звычайна з'яўляецца сістэмай дастаўкі дадзеныя што дазваляе кіраўнікам прадпрыемстваў лёгка атрымаць доступ да прагляду дадзеныя.
Агульная архітэктура а інфармацыйнае сховішча вылучае ролю ст інфармацыйнае сховішча у падтрымцы кіравання. А таксама прапануе інфраструктуру дадзеныя для EIS і DSS, інш інфармацыйнае сховішча да яго можна атрымаць прамы доступ праз запыты. THE дадзеныя уключаны ў а інфармацыйнае сховішча заснаваныя на аналізе патрабаванняў да кіраўніцкай інфармацыі і атрыманы з трох крыніц: унутраных састарэлых сістэм, сістэм збору даных спецыяльнага прызначэння і знешніх крыніц даных. THE дадзеныя ва ўнутраных састарэлых сістэмах яны часта лішнія, супярэчлівыя, нізкай якасці і захоўваюцца ў розных фарматах, таму іх неабходна ўзгадніць і ачысціць перад загрузкай у

інфармацыйнае сховішча (Inmon, 1992; McFadden, 1996). THE дадзеныя якія паступаюць з сістэм захоўвання дадзеныя ad hoc і з крыніц дадзеныя знешнія часта выкарыстоўваюцца для павелічэння (абнаўлення, замены) i дадзеныя са старых сістэм.

Ёсць шмат пераканаўчых прычын для развіцця а інфармацыйнае сховішча, якія ўключаюць паляпшэнне прыняцця рашэнняў за кошт эфектыўнага выкарыстання большай колькасці інфармацыі (Ives 1995), падтрымку канцэнтрацыі ўвагі на суцэльных здзелках (Graham 1996) і скарачэнне дадзеныя для EIS і DSS (Graham 1996, McFadden 1996).

Нядаўняе эмпірычнае даследаванне паказала ў сярэднім рэнтабельнасць інвестыцый для інфармацыйнае сховішча на 401% праз тры гады (Graham, 1996). Аднак іншыя эмпірычныя даследаванні в інфармацыйнае сховішча выявілі значныя праблемы, уключаючы цяжкасці ў вымярэнні і прызначэнні пераваг, адсутнасць выразнай мэты, недаацэнку мэты і складанасці працэсу захоўвання пераваг дадзеныя, у прыватнасці ў дачыненні да крыніц і чысціні дадзеныя. Захоўванне i дадзеныя можна разглядаць як рашэнне праблемы кіравання дадзеныя паміж арганізацыямі. Маніпуляцыя дадзеныя як сацыяльны рэсурс ён заставаўся адной з ключавых праблем у кіраванні інфармацыйнымі сістэмамі ва ўсім свеце на працягу многіх гадоў (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Папулярны падыход да кіравання дадзеныя у васьмідзесятыя гэта была распрацоўка мадэлі дадзеныя сацыяльны. мадэль дадзеныя social быў распрацаваны, каб прапанаваць стабільную аснову для распрацоўкі новых сістэм прыкладанняў і база дадзеных і рэканструкцыя і інтэграцыя старых сістэм (Brancheau et al.

1989, Гудхью і інш. 1988:1992, Кім і Эверэст 1994). Аднак існуе шмат праблем з такім падыходам, у прыватнасці, складанасць і кошт кожнай задачы, а таксама працяглы час, неабходны для атрымання адчувальных вынікаў (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il інфармацыйнае сховішча гэта асобная база дадзеных, якая існуе разам са састарэлымі базамі дадзеных, а не замяняе іх. Такім чынам, гэта дазваляе кіраваць кіраваннем дадзеныя і пазбегнуць дарагой рэканструкцыі старых сістэм.

ІСНУЮЧЫЯ ПАДЫХОДЫ ДА ПРАЕКТАВАННЯ ДАННЫХ

WAREHOUSE

Працэс пабудовы і ўдасканалення а інфармацыйнае сховішча гэта трэба разумець хутчэй як эвалюцыйны працэс, а не як жыццёвы цыкл развіцця традыцыйных сістэм (Дэзіё, 1995, Shanks, O'Donnell and Arnott 1997a). У праекце ўдзельнічае шмат працэсаў інфармацыйнае сховішча такія як ініцыялізацыя, планаванне; інфармацыя, атрыманая з патрабаванняў, зададзеных кіраўнікам кампаніі; крыніцы, пераўтварэнні, ачыстка ад дадзеныя і сінхранізацыя са старых сістэм і іншых крыніц дадзеныя; сістэмы дастаўкі ў распрацоўцы; маніторынг інфармацыйнае сховішча; і бессэнсоўнасць эвалюцыйнага працэсу і пабудовы а інфармацыйнае сховішча (Stinchi, O'Donnell and Arnott 1997b). У гэтым часопісе мы засяроджваемся на тым, як маляваць дадзеныя захоўваецца ў кантэксце гэтых іншых працэсаў. Ёсць некалькі прапанаваных падыходаў да архітэктуры інфармацыйнае сховішча у літаратуры (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Кожная з гэтых методык мае кароткі агляд з аналізам іх моцных і слабых бакоў.

Інмон (1994) падыход да Склад дадзеных дызайн

Inmon (1994) прапанаваў чатыры ітэрацыйныя этапы распрацоўкі a інфармацыйнае сховішча (гл. малюнак 2). Першы крок - распрацаваць шаблон дадзеныя сацыяльны, каб зразумець, як я дадзеныя іх можна інтэграваць у розныя функцыянальныя вобласці арганізацыі шляхам падзелу дадзеныя захоўваць у раёнах. мадэль дадзеныя гэта зроблена для захоўвання дадзеныя якія адносяцца да прыняцця рашэнняў, у т.л дадзеныя гісторыкаў, у т.л дадзеныя выведзеныя і агрэгаваныя. Другі крок — вызначэнне тэматыкі для рэалізацыі. Яны заснаваныя на прыярытэтах, вызначаных канкрэтнай арганізацыяй. Трэці крок ўключае ў сябе малюнак база дадзеных для прадметнай вобласці звярніце асаблівую ўвагу на ўключэнне адпаведных узроўняў дэталізацыі. Inmon рэкамендуе выкарыстоўваць мадэль аб'ектаў і адносін. Чацвёрты крок - вызначэнне зыходных сістэм дадзеныя патрабуецца і развіваць працэсы трансфармацыі для захопу, ачысткі і фарматавання i дадзеныя.

Моцныя бакі падыходу Inmon у тым, што мадэль дадзеныя сацыяльная забяспечвае аснову для інтэграцыі ст дадзеныя у рамках арганізацыі і планавання апор для ітэратыўнага развіцця інфармацыйнае сховішча. Яго недахопы - складанасць і дарагоўля ў распрацоўцы мадэлі дадзеныя сацыяльныя, цяжкасці ў разуменні мадэляў сутнасцяў і адносін, якія выкарыстоўваюцца ў абедзвюх мадэлях, што дадзеныя сацыяльныя і што з дадзеныя захоўваюцца па прадметных абласцях, і адпаведнасць дадзеныя чарцяжа інфармацыйнае сховішча для рэалізацыі база дадзеных рэляцыйная, але не для база дадзеных шматмерны.

Айвза (1995) Падыход да Склад дадзеных дызайн

Айвз (1995) прапануе чатырохэтапны падыход да распрацоўкі інфармацыйнай сістэмы, які, на яго думку, прыдатны для распрацоўкі інфармацыйнае сховішча (гл. малюнак 3). Падыход у значнай ступені заснаваны на інфармацыйнай інжынерыі для распрацоўкі інфармацыйных сістэм (Martin 1990). Першы крок - вызначыць мэты, крытычныя фактары і фактары поспеху і ключавыя паказчыкі эфектыўнасці. Ключавыя бізнес-працэсы і неабходная інфармацыя мадэлююцца, каб прывесці нас да мадэлі дадзеныя сацыяльны. Другі крок прадугледжвае распрацоўку вызначальнай архітэктуры дадзеныя захоўваецца па раёнах, база дадзеных di інфармацыйнае сховішча, тэхналагічныя кампаненты, якія неабходныя, набор арганізацыйнай падтрымкі, неабходнай для ўкаранення і працы інфармацыйнае сховішча. Трэці крок ўключае ў сябе выбар неабходных праграмных пакетаў і інструментаў. Чацвёрты крок - дэталёвае праектаванне і будаўніцтва інфармацыйнае сховішча. Айвз адзначае, што захоўванне дадзеныя гэта абмежаваны ітэрацыйны працэс.

Моцнымі бакамі падыходу Айвза з'яўляюцца выкарыстанне спецыяльных метадаў для вызначэння патрабаванняў да інфармацыі, выкарыстанне структураванага працэсу для падтрымкі інтэграцыі інфармацыйнае сховішча, выбар адпаведнага абсталявання і праграмнага забеспячэння, а таксама выкарыстанне некалькіх метадаў прадстаўлення для інфармацыйнае сховішча. Яго недахопы ўласцівыя складанасці. Іншыя ўключаюць цяжкасці ў развіцці многіх узроўняў база дадзеных ўнутры ст інфармацыйнае сховішча у разумныя тэрміны і кошт.

Падыход Кімбалла (1994). Склад дадзеных дызайн

Кімбал (1994) прапанаваў пяць ітэрацыйных крокаў для распрацоўкі a інфармацыйнае сховішча (гл. малюнкі 4). Яго падыход асабліва прысвечаны распрацоўцы сола інфармацыйнае сховішча і аб выкарыстанні мерных мадэляў у перавагу перад мадэлямі сутнасці і адносін. Кімбал аналізуе гэтыя памерныя мадэлі, таму што бізнес-лідэрам лягчэй зразумець бізнес, гэта больш эфектыўна пры складаных кансультацыях і распрацоўцы база дадзеных фізічны больш эфектыўны (Kimball 1994). Кімбал прызнае, што развіццё a інфармацыйнае сховішча гэта паўтараецца, і гэта інфармацыйнае сховішча асобныя табліцы можна аб'яднаць, падзяліўшы іх на табліцы агульных памераў.

Першы крок - вызначыць канкрэтную прадметную вобласць, якую трэба ўдасканаліць. Другі і трэці этапы тычацца памернага мадэлявання. На другім этапе меры вызначаюць рэчы, якія ўяўляюць цікавасць у прадметнай вобласці, і згрупаваныя ў табліцу фактаў. Напрыклад, у прадметнай вобласці продажаў паказчыкі цікавасці могуць уключаць колькасць прададзеных тавараў і долар у якасці валюты продажу. Трэці крок уключае вызначэнне вымярэнняў, якія з'яўляюцца спосабамі групоўкі фактаў. У прадметнай вобласці продажаў адпаведныя памеры могуць уключаць прадмет, месцазнаходжанне і перыяд часу. Табліца фактаў мае ключ з некалькіх частак, каб звязаць яе з кожнай табліцай вымярэнняў і звычайна змяшчае вельмі вялікую колькасць фактаў. Наадварот, табліцы вымярэнняў утрымліваюць апісальную інфармацыю аб вымярэннях і іншых атрыбутах, якія можна выкарыстоўваць для групоўкі фактаў. Звязаная прапанаваная табліца фактаў і памераў утварае так званую зоркавую схему з-за яе формы. Чацвёрты крок прадугледжвае стварэнне a база дадзеных шматмерны, каб удасканаліць зорны ўзор. Заключны крок - ідэнтыфікацыя зыходных сістэм дадзеныя патрабуецца і развіваць працэсы трансфармацыі для захопу, ачысткі і фарматавання i дадзеныя.

Моцныя бакі падыходу Кімбалла ўключаюць выкарыстанне памерных мадэляў для прадстаўлення дадзеныя захоўваецца, што робіць яго лёгкім для разумення і прыводзіць да эфектыўнага фізічнага дызайну. Памерная мадэль, якая таксама лёгка выкарыстоўвае абедзве сістэмы база дадзеных рэляцыйныя могуць быць удасканалены або сістэмы база дадзеных шматмерны. Яго недахопы ўключаюць адсутнасць некаторых метадаў для палягчэння планавання або інтэграцыі многіх шаблонаў зорак у a інфармацыйнае сховішча і цяжкасці праектавання з экстрэмальнай дэнармалізаванай структуры ў памерную мадэль a дадзеныя у састарэлай сістэме.

Макфадэн (1996) Падыход да дадзеных Дызайн склада

McFadden (1996) прапануе пяціэтапны падыход да праектавання a інфармацыйнае сховішча (гл. малюнак 5).
Яго падыход заснаваны на сінтэзе ідэй з літаратуры і арыентаваны на афармленне сінгла інфармацыйнае сховішча. Першы крок прадугледжвае аналіз патрабаванняў. Нягледзячы на ​​тое, што тэхнічныя спецыфікацыі не прадпісаны, нататкі Макфадэна ідэнтыфікуюць асобы дадзеныя спецыфікацыі і іх атрыбуты, і спасылаецца на чытачоў Watson і Frolick (1993) для захопу патрабаванняў.
На другім этапе распрацавана мадэль адносін суб'ектаў інфармацыйнае сховішча а затым пацвярджаецца кіраўнікамі прадпрыемстваў. Трэці крок уключае вызначэнне адлюстравання са старых сістэм і знешніх крыніц інфармацыйнае сховішча. Чацвёрты этап уключае працэсы распрацоўкі, разгортвання і сінхранізацыі дадзеныя ў інфармацыйнае сховішча. На заключным этапе пастаўка сістэмы распрацоўваецца з асаблівым акцэнтам на карыстальніцкі інтэрфейс. Макфадэн адзначае, што працэс малявання звычайна паўтараецца.

Моцнымі бакамі падыходу Макфадэна з'яўляецца ўдзел кіраўнікоў прадпрыемстваў у вызначэнні патрабаванняў, а таксама важнасць рэсурсаў дадзеныя, іх ачыстка і збор. Яго недахопы ўключаюць адсутнасць працэсу разбурэння вялікага праекта інфармацыйнае сховішча у многіх комплексных этапах, і

цяжкасці з разуменнем мадэляў сутнасці і адносін, якія выкарыстоўваюцца пры распрацоўцы інфармацыйнае сховішча.

Выбіраюць нас не толькі тыя, хто нам блізкі.

    0/5 (0 водгукаў)
    0/5 (0 водгукаў)
    0/5 (0 водгукаў)

    Даведайцеся больш у Інтэрнэт-агенцтве Інтэрнэт

    Падпішыцеся, каб атрымліваць апошнія артыкулы па электроннай пошце.

    аватар аўтара
    адмін Генеральны дырэктар
    👍 Інтэрнэт-агенцтва | Эксперт вэб-агенцтва ў галіне лічбавага маркетынгу і SEO. Web Agency Online - гэта вэб-агенцтва. Для Agenzia Web Online поспех у лічбавай трансфармацыі заснаваны на асновах Iron SEO версіі 3. Спецыяльнасці: сістэмная інтэграцыя, інтэграцыя карпаратыўных прыкладанняў, сэрвіс-арыентаваная архітэктура, воблачныя вылічэнні, сховішча даных, бізнес-аналітыка, вялікія дадзеныя, парталы, інтранэт, вэб-прыкладанні Праектаванне і кіраванне рэляцыйнымі і шматмернымі базамі дадзеных Праектаванне інтэрфейсаў для лічбавых медыя: зручнасць выкарыстання і графіка. Онлайн вэб-агенцтва прапануе кампаніям наступныя паслугі: -SEO на Google, Amazon, Bing, Yandex; -Вэб-аналітыка: Google Analytics, Google Tag Manager, Yandex Metrica; -Канверсіі карыстальнікаў: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM на Google, Bing, Amazon Ads; - Маркетынг у сацыяльных сетках (Facebook, Linkedin, Youtube, Instagram).
    My Agile Privacy
    Гэты сайт выкарыстоўвае тэхнічныя і прафілявальныя файлы cookie. Націскаючы на ​​«Прыняць», вы дазваляеце ўсе прафіляваныя файлы cookie. Пры націсканні на адхіленне або X усе файлы cookie прафілявання адхіляюцца. Націснуўшы на наладзіць, можна выбраць, якія прафіляваныя файлы cookie актываваць.
    Гэты сайт адпавядае Закону аб абароне даных (LPD), Федэральнаму закону Швейцарыі ад 25 верасня 2020 г. і GDPR, Рэгламенту ЕС 2016/679, якія тычацца абароны персанальных даных, а таксама свабоднага перамяшчэння такіх даных.