fbpx

Склад дадзеных і ERP | ЦЕНТРАЛЬНЫ АРХІВ ДАНЫХ: ГІСТОРЫЯ І ЭВАЛЮЦЫІ

АРХІЎ ДАЦІ ЦЭНТРАЛЬНАЯ : ГІСТОРЫЯ І ЭВАЛЮЦЫЯ


Дзве дамінуючыя тэмы карпаратыўных тэхналогій у 90-я - гэта
заяўляе я інфармацыйнае сховішча і ERP. Даўно гэтыя два магутныя
токі былі часткамі карпаратыўных ІТ, ніколі не маючы
скрыжаванні. Гэта было амаль як калі б яны былі матэрыяй і антыматэрыяй. Але
рост абедзвюх з'яў непазбежна вёў да адной
іх скрыжаванне. Сёння кампаніі сутыкаюцца з праблемай
што рабіць з ERP e інфармацыйнае сховішча. Гэты артыкул праілюструе
якія праблемы і як яны вырашаюцца кампаніямі.
НА ПАЧАТКУ…
На пачатку было інфармацыйнае сховішча. інфармацыйнае сховішча быў народжаны для
супрацьстаяць прыкладной сістэме апрацоўкі транзакцый.
У першыя дні запамінання дадзеныя гэта павінна было быць
проста супрацьлегласць прыкладанням для апрацоўкі электроннай пошты
транзакцыі. Але ў наш час ёсць куды больш выдасканаленыя бачання
таго, што можа зрабіць інфармацыйнае сховішча. У сучасным свеце
інфармацыйнае сховішча устаўляецца ў структуру, якая можа быць
пад назвай «Фабрыка карпаратыўнай інфармацыі».
ФАБРЫКА КАРПАРАЦЫЙНАЙ ІНФАРМАЦЫІ
(CIF)
Фабрыка карпаратыўнай інфармацыі мае архітэктурныя складнікі
стандарт: узровень трансфармацыі і інтэграцыі кода
які аб'ядноўвае я дадзеныя пакуль я дадзеныя яны перамяшчаюцца з асяроддзя ст
прымяненне да навакольнага асяроддзя інфармацыйнае сховішча кампаніі; а
інфармацыйнае сховішча кампаніі, дзе знаходзіцца дадзеныя
падрабязныя і комплексныя гіст. The інфармацыйнае сховішча кампаніі служыць
падмурак, на якім могуць быць пабудаваны ўсе астатнія часткі
асяроддзя в інфармацыйнае сховішча; сховішча аператыўных даных (ODS).
ODS - гэта гібрыдная структура, якая змяшчае некаторыя аспекты даных
склад і іншыя аспекты асяроддзя OLTP; вітрыны дадзеных, дзе i
розныя аддзелы могуць мець сваю ўласную версію дадзеных
склад; а інфармацыйнае сховішча разведкі, у якой я
«філосафы» кампаніі (мысляры) могуць задаваць свае запыты
72 гадзіны без шкоднага ўздзеяння на інфармацыйнае сховішча; і памяць
каля лініі, у якой дадзеныя стары і дадзеныя аб'ёмныя дэталі могуць быць
захоўваецца танна.
ДЗЕ ERP КАМБІНУЕЦЦА З THE
ФАБРЫКА КАРПАРАЦЫЙНАЙ ІНФАРМАЦЫІ
ERP зліваецца з карпаратыўнай інфармацыйнай фабрыкай у двух месцах.
У першую чаргу ў якасці базавай праграмы, якая забяспечвае i
дадзеныя дадатку да інфармацыйнае сховішча. У гэтым выпадку i дадзеныя,
ствараецца як пабочны прадукт працэсу транзакцыі,
інтэгруюцца і загружаюцца ў інфармацыйнае сховішча кампаніі. The
другая кропка аб'яднання паміж ERP і CIF і ODS. Насамрэч шмат
асяроддзях ERP выкарыстоўваецца як класічны ODS.
У выпадку, калі ERP выкарыстоўваецца ў якасці асноўнага прыкладання, гэта
той жа ERP можа таксама выкарыстоўвацца ў CIF як ODS. У
У любым выпадку, калі ERP будзе выкарыстоўвацца ў абедзвюх ролях, ёсць
павінна быць дакладнае адрозненне паміж двума сутнасцямі. Іншымі словамі,
калі ERP гуляе ролю базавага прыкладання і ODS, т.е
трэба адрозніваць дзве архітэктурныя адзінкі. Калі адзіночны
укараненне ERP спрабуе выканаць абедзве ролі
у той жа час непазбежна ўзнікнуць праблемы ў
праектаванне і рэалізацыя гэтай структуры.
АСОБНЫЯ ODS І БАЗАВЫЯ ПРЫМЕНАННІ
Ёсць шмат прычын, якія прыводзяць да падзелу кампанентаў
архітэктурны. Мабыць, самае красамоўнае пытанне для падзелу
розныя кампаненты архітэктуры - гэта тое, што кожны кампанент
архітэктуры мае свой погляд. Базавая праграма служыць
для іншай мэты, чым для ODS. Паспрабуйце перакрывацца
базавы погляд прыкладання на свет ODS ці наадварот
гэта не правільны спосаб працы.
Такім чынам, першая праблема ERP у CIF - гэта праблема
праверыць, ці ёсць адрозненне паміж базавымі праграмамі і
Пашырэнне ODS.
МАДЭЛІ ДАНЫХ У КАРПАРАЦЫІ
ФАБРЫКА ІНФАРМАЦЫІ
Для дасягнення згуртаванасці паміж рознымі кампанентамі
архітэктуры CIF, павінна быць мадэль дадзеныя. Я
мадэлі а дадзеныя яны служаць сувязным звяном паміж рознымі кампанентамі
архітэктуры, такіх як базавыя прыкладанні і ODS. THE
мадэлі а дадзеныя стаць «інтэлектуальнай дарожнай картай», каб мець
правільнае значэнне ад розных архітэктурных кампанентаў CIF.
Ідучы рука аб руку з гэтым паняццем, ідэя заключаецца ў тым, што гэта павінна быць
быць выдатнай і унікальнай мадэллю дадзеныя. Вядома, ён павінен
быць узорам дадзеныя для кожнага з кампанентаў і далей там
гэта павінен быць разумны шлях, які злучае розныя мадэлі.
Кожны кампанент архітэктуры - ODS, базавыя прыкладанні,
інфармацыйнае сховішча кампаніі, і гэтак далей.. – патрэбнае сваё
мадэль дадзеныя. І таму павінна быць дакладнае вызначэнне
як гэтыя мадэлі дадзеныя яны ўзаемадзейнічаюць адзін з адным.
РУХАЦЬ Я ДАЦІ ERP У ДАННЫХ
WAREHOUSE
Калі паходжанне ст дадзеныя з'яўляецца базавым дадаткам і/або ODS, калі
ERP устаўляе i дадзеныя ў інфармацыйнае сховішча, гэты запіс павінен
адбываюцца на самым нізкім узроўні дэталізацыі. Паўтарыце або
проста агрэгаваць i дадзеныя як яны выходзяць
з базавага прыкладання ERP або ERP ODS няма
правільная рэч. THE дадзеныя дэталі неабходныя ў дадзеных
склад для стварэння асновы працэсу DSS. Такія дадзеныя
яны будуць шмат у чым зменены дзякуючы вітрынам дадзеных і вывучэнню
Дэль інфармацыйнае сховішча.
Перасоўванне дадзеныя з асяроддзя базавага прыкладання
ЕРП да асяроддзя в інфармацыйнае сховішча кампаніі робіцца ў а
дастаткова расслаблена. Гэты зрух адбываецца пасля гэтага
прыблізна праз 24 гадзіны пасля абнаўлення або стварэння ў ERP. Факт
маюць «лянівы» рух дадзеныя ў інфармацыйнае сховішча
кампаніі дазваляе дадзеныя якія паступаюць з ЕРП «разлічыцца».
Аднойчы я дадзеныя захоўваюцца ў базавым дадатку,
тады вы можаце смела рухацца i дадзеныя ERP
у бізнэсе. Яшчэ адна мэта, якую можна дасягнуць дзякуючы руху
«лянівых» багоў дадзеныя гэта выразнае размежаванне паміж аперацыйнымі працэсамі і
Пашырэнне DS. З «хуткім» рухам ст дадзеныя дэмаркацыйная лінія
паміж DSS і аператыўным застаецца расплывістым.
Рух а дадзеныя ад ERP ODS да інфармацыйнае сховішча
кампаніі праводзіцца перыядычна, звычайна
штотыдзень або штомесяц. У гэтым выпадку рух а
дадзеныя у яго аснове ляжыць неабходнасць «пачысціць» старое дадзеныя гісторыкаў.
Натуральна, ODS змяшчае i дадзеныя якія значна больш свежыя
павага да дадзеныя гісторыкі знайшлі ў ст інфармацыйнае сховішча.
Перасоўванне дадзеныя ў інфармацыйнае сховішча гэта амаль ніколі не робіцца
«оптам» (па-аптовым). Скапіруйце табліцу
ад асяроддзя ERP да інфармацыйнае сховішча гэта не мае сэнсу. Адзін падыход
значна больш рэалістычным з'яўляецца рух выбраных адзінак дадзеныя.
Толькі дадзеныя якія змяніліся з моманту апошняга абнаўлення даных
warehouse - гэта тыя, якія павінны быць перамешчаны ў дадзеныя
склад. Адзін са спосабаў даведацца, якія дадзеныя яны былі зменены
з моманту апошняга абнаўлення трэба паглядзець на часовыя пазнакі дадзеныя
знойдзены ў асяроддзі ERP. Дызайнер выбірае ўсе змены
якія ўзніклі пасля апошняга абнаўлення. Іншы падыход
заключаецца ў выкарыстанні метадаў фіксацыі змяненняў дадзеныя. З
гэтыя метады аналізуюць часопісы і часопісныя стужкі, каб
вызначыць, якія дадзеныя неабходна перанесці з асяроддзя ERP
Гэта з інфармацыйнае сховішча. Гэтыя метады лепш за ўсё
як часопісы і журнальныя стужкі можна чытаць з файлаў ERP
без далейшага ўплыву на іншыя рэсурсы ERP.
ІНШЫЯ ЎСКЛАДНЕННІ
Адна з праблем ERP у CIF - гэта тое, што адбываецца з іншымі
крыніцы прыкладанняў або і.а дадзеныя ODS, у які яны павінны ўнесці свой уклад
інфармацыйнае сховішча але яны не з'яўляюцца часткай асяроддзя ERP. Улічваючы
закрытая прырода ERP, асабліва SAP, спроба інтэграцыі
Ключы ад знешніх крыніц дадзеныя з i дадзеныя якія прыходзяць з ERP інш
час рухацца i дадзеныя ў інфармацыйнае сховішча, гэта вялікая праблема.
І якая дакладна верагоднасць таго, што i дадзеныя прыкладанняў або
ODS па-за межамі асяроддзя ERP будзе інтэграваны ў даныя
склад? Шанцы на самай справе вельмі высокія.
ЗНАЙСЦІ ДАЦІ ГІСТАРЫЧНЫ АД ЕРП
Яшчэ адна праблема з i дадзеныя ERP з'яўляецца выніковым
ад патрэбы мець дадзеныя гісторыкаў у межах ст інфармацыйнае сховішча.
Звычайна інфармацыйнае сховішча патрэбы дадзеныя гісторыкаў. І
Тэхналогія ERP звычайна не захоўвае іх дадзеныя
гістарычныя, прынамсі, не ў той ступені, дзе гэта неабходна ў дадзеных
склад. Пры вялікай колькасці дадзеныя гісторыкаў пачынаецца рэкл
быць дададзены ў сераду ERP, гэта асяроддзе павінна быць
вычышчаны. Напрыклад, выкажам здагадку, што a інфармацыйнае сховішча павінен
быць загружаны з пяці гадоў дадзеныя гістарычны, а ERP захоўвае
максімум шэсць месяцаў з іх дадзеныя. Пакуль кампанія задаволена
сабраць серыю дадзеныя Гісторыкі з цягам часу,
тады няма праблем з выкарыстаннем ERP як крыніцы для
інфармацыйнае сховішча. Але калі інфармацыйнае сховішча трэба ісці
назад у часе і прыняць багоў дадзеныя гісторыкі, якія не былі
раней сабраны і захаваны ERP, затым у асяроддзі ERP
гэта становіцца неэфектыўным.
ERP І МЕТАДАНЫЯ
Яшчэ адно меркаванне аб ERP e інфармацыйнае сховішча гэта
на існуючыя метададзеныя ў асяроддзі ERP. А таксама метададзеныя
яны пераходзяць з асяроддзя ERP у дэл інфармацыйнае сховішча,
метададзеныя павінны быць перамешчаны такім жа чынам. Акрамя таго, я
метададзеныя павінны быць пераўтвораны ў фармат і структуру
патрабуе інфраструктура в інфармацыйнае сховішча. Ёсць вялікі
розніца паміж аператыўнымі метададзенымі і метададзенымі DSS. Метададзеныя
аператыўныя ў першую чаргу для распрацоўніка і для
праграміст. Метададзеныя DSS прызначаны ў першую чаргу для карыстальніка
фінал. Існуючыя метаданыя ў праграмах ERP або ODS
іх трэба навярнуць, і гэтае навяртанне не заўсёды лёгка
і прамыя.
ПАТРУК ДАНЫХ ERP
Калі ERP выкарыстоўваецца ў якасці пастаўшчыка дадзеныя для інфармацыйнае сховішча ci
гэта павінен быць трывалы інтэрфейс, які рухае i дадзеныя ад навакольнага асяроддзя
ERP да навакольнага асяроддзя інфармацыйнае сховішча. Інтэрфейс павінен:
▪ быць простым у выкарыстанні
▪ дазволіць доступ да дадзеныя ERP
▪ падабраць сэнс дадзеныя якія збіраюцца перанесці
ў інфармацыйнае сховішча
▪ ведаць абмежаванні ERP, якія могуць узнікнуць у
момант, калі доступ зроблены дадзеныя ERP:
▪ рэферэнтная цэласнасць
▪ іерархічныя адносіны
▪ няяўныя лагічныя адносіны
▪ пагадненне аб прымяненні
▪ усе структуры дадзеныя падтрымліваецца ERP і гэтак далей...
▪ быць эфектыўным у доступе дадзеныя, забяспечваючы:
▪ прамы рух дадзеныя
▪ набыццё дробязі дадзеныя
▪ падтрымка своечасовага доступу да дадзеныя
▪ разуменне фармату дадзеныя, і гэтак далей…
ІНТЭРФЭЙС З SAP
Інтэрфейс можа быць двух тыпаў, дамарослы або камерцыйны.
Некаторыя з асноўных камерцыйных інтэрфейсаў ўключаюць:
▪ SAS
▪ Асноўныя рашэнні
▪ D2k, і гэтак далей...
ШКОЛЬКІ ТЭХНАЛОГІЙ ERP
Ставіцца да асяроддзя ERP так, як да адной тэхналогіі
вялікая памылка. Існуе мноства тэхналогій ERP, кожная з якіх мае сваю ўласную
моцныя бакі. Самыя вядомыя прадаўцы на рынку:
▪ SAP
▪ Oracle Financials
▪ PeopleSoft
▪ Дж. Д. Эдвардс
▪ Баанс
SAP
SAP - гэта найбуйнейшае і найбольш поўнае праграмнае забеспячэнне ERP. Прыкладанні
SAP ўключае мноства тыпаў прыкладанняў у многіх галінах. SAP мае
рэпутацыя быць:
▪ вельмі вялікі
▪ вельмі складана і дорага рэалізаваць
▪ трэба шмат людзей і кансультантаў
рэалізаваны
▪ патрэбныя спецыялісты для рэалізацыі
▪ патрабуе шмат часу для рэалізацыі
Акрамя таго, SAP мае рэпутацыю захоўвання сваіх дадзеныя высока
асцярожна, што ўскладняе доступ да іх
асоба за межамі зоны SAP. Сіла SAP - быць
здольны захопліваць і захоўваць вялікую колькасць дадзеныя.
SAP нядаўна абвясціла аб сваім намеры пашырыць
яго прымянення да інфармацыйнае сховішча. Ёсць шмат плюсаў і мінусаў
у выкарыстанні SAP у якасці пастаўшчыка інфармацыйнае сховішча.
Перавагай з'яўляецца тое, што SAP ужо ўсталяваны і большая частка
кансультанты ўжо ведаюць SAP.
Недахопы наяўнасці SAP у якасці пастаўшчыка інфармацыйнае сховішча яны
многія: SAP не мае вопыту ў свеце інфармацыйнае сховішча
Калі SAP з'яўляецца пастаўшчыком інфармацыйнае сховішча, неабходна «выняць»
i дадзеныя ад SAP да інфармацыйнае сховішча. Дато паслужны спіс SAP
закрытай сістэмы, наўрад ці будзе лёгка перайсці ад SAP
гэта (???). Ёсць шмат састарэлых асяроддзяў, якія забяспечваюць SAP,
такія як IMS, VSAM, ADABAS, ORACLE, DB2 і гэтак далей.
SAP настойвае на падыходзе «не прыдумана тут». SAP не хоча
супрацоўнічаць з іншымі пастаўшчыкамі для выкарыстання або стварэння інфармацыйнае сховішча.
SAP настойвае на стварэнні ўсяго свайго праграмнага забеспячэння самастойна.
Хоць SAP з'яўляецца буйной і магутнай кампаніяй, факт
спроба перапісаць тэхналогіі ELT, OLAP, адміністравання
сістэму і нават кодавую базу дбм гэта проста вар'яцтва.
Замест таго, каб пайсці на супрацоўніцтва з пастаўшчыкамі
di інфармацыйнае сховішча даўні, SAP прытрымліваўся падыходу, які
яны «лепш ведаюць». Такое стаўленне стрымлівае поспех, які
SAP можа мець у раёне в інфармацыйнае сховішча.
Адмова SAP дазволіць знешнім пастаўшчыкам доступ
імгненна і вытанчана дадзеныя. Сама сутнасць выкарыстання
un інфармацыйнае сховішча лёгкі доступ дадзеныя. Уся гісторыя SAP такая
на аснове ўскладнення доступу дадзеныя.
Адсутнасць у SAP вопыту працы з вялікімі аб'ёмамі дадзеныя;
у галіне в інфармацыйнае сховішча ёсць тамы дадзеныя ніколі не бачыў з тых часоў
SAP і кіраваць гэтымі вялікімі аб'ёмамі дадзеныя вам трэба мець адзін
падыходная тэхналогія. SAP, відаць, не ведае пра гэта
тэхналагічны бар'ер, які існуе для ўваходу ў поле дадзеных
склад.
Карпаратыўная культура SAP: SAP стварыла бізнес
у атрыманні i дадзеныя ад сістэмы. Але для гэтага трэба мець
іншае мысленне. Традыцыйна, праграмныя кампаніі, якія былі
добрыя ў перадачы дадзеных у асяроддзе, у якіх не ўмелі
атрымаць дадзеныя, каб пайсці іншым шляхам. Калі SAP можа зрабіць гэта
Switch стане першай кампаніяй, якая зробіць гэта.
Карацей кажучы, пытанне, ці варта выбіраць кампанію
SAP як пастаўшчык інфармацыйнае сховішча. Ёсць вельмі сур'ёзныя рызыкі
з аднаго боку і вельмі мала ўзнагарод з другога. Але ёсць і іншы
прычына, якая перашкаджае выбару SAP у якасці пастаўшчыка дадзеных
склад. Бо кожная кампанія павінна мець аднолькавую дату
склад усіх астатніх кампаній? The інфармацыйнае сховішча гэта сэрца
канкурэнтнай перавагі. Калі б кожная кампанія прыняла тое ж самае
інфармацыйнае сховішча было б цяжка, хоць і не немагчыма,
дасягнуць канкурэнтнай перавагі. SAP, здаецца, лічыць, што a
інфармацыйнае сховішча можна разглядаць як бісквіт, і гэта а
яшчэ адзін знак іх «атрымаць дадзеныя
ў”.
Ні адзін іншы пастаўшчык ERP не з'яўляецца такім дамінуючым, як SAP.
Несумненна, знойдуцца кампаніі, якія пойдуць шляхам SAP
для сваіх інфармацыйнае сховішча але, як мяркуецца, гэтыя даты
Склады SAP будуць вялікімі, дарагімі і патрабаваць шмат
часу на іх стварэнне.
Гэтыя асяроддзя ўключаюць такія віды дзейнасці, як апрацоўка банкаўскіх касіраў,
працэсы браніравання авіякампаній, працэсы падачы скаргаў
страхаванне, і гэтак далей. Сістэма транзакцый была больш эфектыўнай,
больш відавочнай была неабходнасць падзелу паміж аперацыйнай і працэснай
DSS (Сістэма падтрымкі прыняцця рашэнняў). Аднак з рэсурснымі сістэмамі
чалавечага і асабістага, ніколі не сутыкаешся з вялікімі аб'ёмамі
транзакцыі. І, вядома, калі чалавека бяруць на працу
або пакінуць кампанію гэта запіс транзакцыі.
Але адносна іншых сістэм кадравыя сістэмы і
асабістыя паведамленні проста не маюць шмат транзакцый. Таму ў
людскія рэсурсы і кадравыя сістэмы не зусім відавочна, што існуе
патрэбен DataWarehouse. Шмат у чым гэтыя сістэмы
уяўляюць сабой уніфікацыю сістэм СППР.
Але ёсць яшчэ адзін фактар, які трэба ўлічваць, калі трэба
зрабіць з Datawarehouse і з PeopleSoft. У многіх колах, г.зн дадзеныя
чалавечыя і асабістыя рэсурсы другасныя ў параўнанні з бізнесам
кіраўнік кампаніі. Большасць кампаній выконваюць
вытворчасць, продаж, аказанне паслуг і гэтак далей. THE
Сістэмы кадраў і персаналу звычайна з'яўляюцца другаснымі (або з
падтрымка) асноўнага напрамку дзейнасці кампаніі. Такім чынам, гэта
двухсэнсоўны і нязручны а інфармацыйнае сховішча асобны для ст
падтрымка чалавечых і асабістых рэсурсаў.
У гэтым плане PeopleSoft моцна адрозніваецца ад SAP. З SAP гэта так
абавязкова, што ёсць a інфармацыйнае сховішча. З PeopleSoft гэта не так
тады так зразумела. Сховішча даных не з'яўляецца абавязковым для PeopleSoft.
Лепшае, што можна сказаць пра дадзеныя PeopleSoft - гэта дадзеныя
склад можна выкарыстоўваць для захоўвання i дадзеныя адносна
старыя чалавечыя і асабістыя рэсурсы. Другая прычына для
які кампанія хацела б выкарыстаць a інфармацыйнае сховішча a
шкода асяроддзя PeopleSoft заключаецца ў дазволе доступу і
бясплатны доступ да інструментаў аналізу, ai дадзеныя ад PeopleSoft. Але
у дадатак да гэтых прычын, могуць быць выпадкі, калі лепш гэтага не рабіць
ёсць сховішча дадзеных для дадзеныя PeopleSoft.
Падводзячы вынік
Ёсць шмат ідэй адносна пабудовы дадзеных
склад у праграмным забеспячэнні ERP.
Некаторыя з іх:
▪ Мае сэнс мець а інфармацыйнае сховішча які выглядае як любы
яшчэ ў галіны?
▪ Наколькі гнуткая ERP інфармацыйнае сховішча праграмнае забеспячэнне?
▪ ERP інфармацыйнае сховішча праграмнае забеспячэнне можа апрацоўваць аб'ём
дадзеныя які знаходзіцца ў аінфармацыйнае сховішча арэна"?
▪ Што такое рэгістрацыя трасіроўкі, якую робіць пастаўшчык ERP
сутыкнуўшыся з лёгкім і недарагім, працаёмкім, і дадзеныя? (што
гэта паслужны спіс пастаўшчыкоў ERP па пастаўцы недарагіх, на
час, лёгкі доступ да дадзеных?)
▪ Што такое разуменне архітэктуры DSS і
"фабрыка карпаратыўнай інфармацыі" пастаўшчыком ERP?
▪ Пастаўшчыкі ERP разумеюць, як атрымаць дадзеныя усе ўнутраныя
навакольнага асяроддзя, але і зразумець, як іх экспартаваць?
▪ Наколькі пастаўшчык ERP адкрыты для інструментаў даных
складзіраванне?
Усе гэтыя меркаванні неабходна ўлічваць пры вызначэнні
дзе паставіць інфармацыйнае сховішча які будзе прымаць я дадзеныя ЕРП і інш
дадзеныя. Увогуле, калі для гэтага няма важкай прычыны
каб зрабіць інакш, рэкамендуецца пабудаваць інфармацыйнае сховішча з
з асяроддзя пастаўшчыка ERP.
РАЗДЗЕЛ 1
Агляд арганізацыі BI
Ключавыя моманты:
Сховішчы інфармацыі працуюць наадварот
да архітэктуры бізнес-аналітыкі (BI):
Карпаратыўная культура і ІТ могуць абмежаваць поспех у
пабудова BI арганізацый.
Тэхналогія больш не з'яўляецца абмежавальным фактарам для арганізацый BI. The
праблема для архітэктараў і планіроўшчыкаў не ў тым, ці
тэхналогіі існуюць, але калі яны могуць эфектыўна рэалізаваць
даступныя тэхналогіі.
Для многіх кампаній а інфармацыйнае сховішча гэта крыху больш, чым дэпазіт
пасіўны, які размяркоўвае я дадзеныя карыстальнікам, якім гэта неабходна. THE дадзеныя
яны здабываюцца з зыходных сістэм і запаўняюцца ў мэтавыя структуры
di інфармацыйнае сховішча. Я дадзеныя іх таксама можна ачысціць з цэлым
стан. Аднак дадатковая каштоўнасць таксама не дадаецца
сабраны па дадзеныя падчас гэтага працэсу.
Па сутнасці, пасіўны Dw, у лепшым выпадку, забяспечвае
толькі я дадзеныя чысты і працаздольны для асацыяцый карыстальнікаў. там
стварэнне інфармацыі і аналітычнае разуменне залежаць
цалкам карыстальнікамі. Судзіце, ці DW (інфармацыйнае сховішча) ёсць
поспех суб'ектыўны. Калі судзіць аб поспеху
здольнасць эфектыўна збіраць, інтэграваць і чысціць i дадзеныя
карпаратыўны на прадказальнай аснове, тады так, DW мае поспех.
З іншага боку, калі мы паглядзім на калекцыю, кансалідацыю і вось
выкарыстанне інфармацыі арганізацыі ў цэлым, то
DW - правал. DW практычна не дае ніякай каштоўнасці
інфармацыі. У выніку карыстальнікі вымушаныя абыходзіцца,
ствараючы такім чынам запасы інфармацыі. У гэтай главе прадстаўлены
поўнае бачанне, каб абагульніць архітэктуру BI (Бізнес
Intelligence) кампаніі. Пачнем з апісання BI e
тады мы пяройдзем да абмеркавання дызайну і
развіццё інфармацыі, у адрозненне ад простага прадастаўлення i дадзеныя
карыстальнікам. Затым дыскусіі сканцэнтраваны на разліку
каштоўнасць вашых BI намаганняў. У заключэнне мы вызначым, як IBM
нагадвае архітэктурныя патрабаванні вашай арганізацыі да BI.
Апісанне архітэктуры в
Арганізацыя БІ
Магутныя транзакцыйна-арыентаваныя інфармацыйныя сістэмы цяпер
звычайная з'ява ў кожным буйным прадпрыемстве, як яны ўзровень
эфектыўна гульнявое поле для карпарацый у свеце.
Аднак для таго, каб заставацца канкурэнтаздольнымі, цяпер патрэбны аналітычныя сістэмы
арыентаваных на якія могуць зрабіць рэвалюцыю ў здольнасці кампаніі, адкрыўшы нанова выд
выкарыстоўваючы інфармацыю, якую яны ўжо маюць. Гэтыя сістэмы
аналітычны атрымаць ад разумення ад багацця дадзеныя
даступны. BI можа палепшыць прадукцыйнасць усёй інфармацыі
прадпрыемства. Кампаніі могуць палепшыць адносіны паміж кліентамі
пастаўшчыкоў, палепшыць прыбытак ад прадуктаў і паслуг, генераваць
новыя і лепшыя прапановы, праверыць рызыкі і сярод многіх іншых
даходы рэзка скарацілі выдаткі. З BI ваш
Кампанія, нарэшце, пачынае выкарыстоўваць інфармацыю аб кліентах
у якасці канкурэнтнага актыву дзякуючы прыкладанням, якія маюць мэты
рынак.
Наяўнасць правільных спосабаў вядзення бізнесу азначае наяўнасць канчатковых адказаў
ключавыя пытанні, такія як:
▪ Які з нашых кліенты яны прымушаюць нас зарабляць больш, ці там
яны робяць страты?
▪ Дзе жывуць нашы лепшыя кліенты у адносінах да крама/
склад яны часта?
▪ Якія з нашых прадуктаў і паслуг можна прадаць больш
эфектыўна і каму?
▪ Якія тавары можна прадаць найбольш эфектыўна і каму?
▪ Якая кампанія продажаў больш паспяховая і чаму?
▪ Якія каналы продажаў найбольш эфектыўныя для якіх прадуктаў?
▪ Як мы можам палепшыць адносіны з нашым лепшым кліенты?
У большасці кампаній ёсць дадзеныя груба адказваць
гэтыя пытанні.
Аперацыйныя сістэмы ствараюць вялікую колькасць прадукту
заказчык і аф дадзеныя рынку з гандлёвых кропак, з рэзервацый,
ад сістэм абслугоўвання кліентаў і тэхнічнай падтрымкі. Задача такая
здабываць і выкарыстоўваць гэтую інфармацыю.
Шматлікія кампаніі атрымліваюць прыбытак толькі ад невялікіх сваіх доляк дадзеныя
для стратэгічнага аналізу.
I дадзеныя астатнія, часта ў спалучэнні з i дадзеныя атрыманне знешніх крыніц, такіх як i
«дзяржаўныя справаздачы» і іншая набытая інфармацыя — адно
залаты руднік толькі чакае, каб яго даследавалі, г.зн дадзеныя мусіць
толькі быць удакладнены ў інфармацыйным кантэксце вашага
арганізацыі.
Гэтыя веды можна ўжываць рознымі спосабамі, варыяцыямі
ад распрацоўкі агульнай карпаратыўнай стратэгіі да
асабістыя зносіны з пастаўшчыкамі, праз кол-цэнтры,
выстаўленне рахункаў, Internet і іншыя моманты. Сённяшняе бізнес-асяроддзе дыктуе
што DW і звязаныя з імі рашэнні BI развіваюцца далей
выкананне традыцыйных канструкцый дадзеныя які я дадзеныя нармаваны да
на атамным узроўні і «фермы зоркі/куба».
Каб заставацца канкурэнтаздольнымі, неабходна зліццё
традыцыйныя і перадавыя тэхналогіі ў спробе падтрымаць a
велізарны аналітычны ландшафт.
У заключэнне, агульнае асяроддзе павінна пашыраць веды
прадпрыемства ў цэлым, забяспечваючы прынятыя дзеянні
у выніку праведзеных аналізаў яны спатрэбяцца, каб кожны быў
карысць.
Напрыклад, выкажам здагадку, што вы класіфікуеце свой кліенты у катэгорыях
высокі або нізкі рызыка.
Калі гэтая інфармацыя генеруецца з мадэлі вымання або
іншымі спосабамі, яго трэба змясціць у Dw і зрабіць даступным
любы, з дапамогай любога інструмента доступу, напрыклад i
статычныя справаздачы, электронныя табліцы, табліцы або аналітычная апрацоўка ст
лінія (OLAP).
Аднак у цяперашні час такой інфармацыі вельмі шмат
яны застаюцца ў бункерах дадзеныя асоб або аддзелаў, якія яны ствараюць
аналіз. Арганізацыя, у цэлым, практычна не бачная
для разумення. Проста змешванне гэтага тыпу кантэнту
інфармацыя ў вашым прадпрыемстве dw, якую вы можаце ліквідаваць
інфармацыю і палепшыць ваша асяроддзе Dw.
Ёсць дзве асноўныя перашкоды для развіцця арганізацыі
БІ.
Па-першае, у нас праблема самой арганізацыі
адпаведнай дысцыпліны.
Нават калі мы не можам дапамагчы са зменамі палітыкі
арганізацыі, мы можам дапамагчы зразумець кампаненты
арганізацыя BI, яе архітэктура і як
Тэхналогія IBM спрыяе яе развіццю.
Другі бар'ер, які трэба пераадолець, - недахоп тэхналогій
інтэграваны і веданне метаду, які нагадвае ўсю прастору
BI у адрозненне ад толькі невялікага кампанента.
IBM рэагуе на змены ў тэхналогіях
інтэграваных. Вы абавязаны стварыць дызайн
упэўнены ў сабе. Гэтую архітэктуру трэба развіваць разам
тэхналогія, абраная для інтэграцыі без абмежаванняў, або, па меншай меры, з
тэхналогія, якая адпавядае адкрытым стандартам. Акрамя таго, ваш
кіраўніцтва кампаніі павінна пераканацца, што прадпрыемства Бі
ажыццяўляецца па праграме і не дапускаць
развіццё інфармацыйных бункераў у выніку самаабслугоўвання
парадак дня, або мэты.
Гэта не азначае, што асяроддзе BI не адчувальна
рэагаваць на розныя патрэбы і патрабаванні розных карыстальнікаў; замест гэтага гэта азначае
што рэалізацыя гэтых індывідуальных патрэбаў і патрабаванняў
зроблена на карысць усёй арганізацыі BI.
Апісанне архітэктуры BI арганізацыі можа
можна знайсці на старонцы 9 на малюнку 1.1. Архітэктура дэманструе
багатае спалучэнне тэхналогій і прыёмаў.
З традыцыйнага пункту гледжання, архітэктура ўключае ў сябе наступныя кампаненты
склада
Атамны пласт(Atomic Layer).
Гэта аснова, сэрца ўсёй Dw і, такім чынам,
стратэгічная справаздачнасць.
I дадзеныя якія захоўваюцца тут захаваюць гістарычную цэласнасць, паведамляе а
дадзеныя і ўключаць вытворную метрыку, а таксама быць чыстымі,
інтэграваны і захоўваецца з дапамогай шаблонаў майнинга.
Усё наступнае выкарыстанне гэтых дадзеныя і адпаведная інфармацыя ёсць
паходзіць ад гэтай структуры. Гэта выдатны крыніца для
здабыча дадзеныя і для справаздач са структураванымі запытамі SQL
Аператыўны склад а дадзеныя або справаздачы аснове
дадзеныя(Сховішча аператыўных даных (ODS) або справаздачнасць
база дадзеных.)
Гэта структура з дадзеныя спецыяльна распрацаваны для
тэхнічная справаздачнасць.
I дадзеныя захоўваецца і паведамляецца над гэтымі структурамі можа нарэшце
распаўсюджваюцца на склад праз зону арганізацыі (пастаноўка
вобласці), дзе ён можа быць выкарыстаны для стратэгічнай сігналізацыі.
Пастановачная пляцоўка.
Першы прыпынак для большасці дадзеныя прызначаны для навакольнага асяроддзя
склад - гэта зона арганізацыі.
Вось я дадзеныя інтэгруюцца, ачышчаюцца і ператвараюцца ў дадзеныя карысна, што
яны будуць запаўняць структуру склада
Фінікі.
Гэтая частка архітэктуры ўяўляе сабой структуру в дадзеныя выкарыстоўваецца
спецыяльна для OLAP. Наяўнасць вітрын дадзеных, калі i дадзеныя яны
захоўваюцца ў зорных схемах, якія яны накладваюць дадзеныя
шматмерныя ў рэляцыйнай асяроддзі, або ў шафах
di дадзеныя запатэнтаваны, які выкарыстоўваецца пэўнай тэхналогіяй OLAP, такой як
Сервер DB2 OLAP, не мае значэння.
Адзіным абмежаваннем з'яўляецца тое, што архітэктура палягчае выкарыстанне дадзеныя
шматмерны.
Архітэктура таксама ўключае важныя тэхналогіі і метады Bi
якія адрозніваюцца як:
Прасторавы аналіз
Космас - гэта інфармацыйная звышпрыбыткі для аналітыка і
гэта вельмі важна для поўнага дазволу. Прастора можа
прадстаўляюць звесткі аб людзях, якія жывуць у пэўным месцы
месцазнаходжанне, а таксама інфармацыю аб тым, дзе гэта месцазнаходжанне
фізічна ў параўнанні з астатнім светам.
Каб правесці гэты аналіз, вы павінны пачаць з прывязкі вашага
інфармацыя аб каардынатах шыраты і даўгаты. Што значыць
называецца "геакадаванне" і павінна быць часткай вымання,
трансфармацыі, а таксама працэсу загрузкі (ETL) да ўзроўню
атамны нумар вашага склада.
Інтэлектуальны аналіз дадзеных.
Здабыча дадзеныя дазваляе нашым кампаніям расці
колькасць кліенты, каб прагназаваць тэндэнцыі продажаў і ўключыць
кіраванне адносінамі з кліенты (CRM), сярод іншых ініцыятыў ст
БІ.
Здабыча дадзеныя таму ён павінен быць інтэграваны са структурамі
дадзеныя Dwhouse і падтрымліваецца складскімі працэсамі для
забяспечыць эфектыўнае і эфектыўнае выкарыстанне тэхналогій і
звязаныя метады.
Як паказана ў архітэктуры BI, атамны ўзровень
Dwhouse, як і вітрыны дадзеных, з'яўляецца выдатнай крыніцай дадзеныя
для здабычы. Такія ж структуры таксама павінны быць
атрымальнікі вынікаў экстракцыі для забеспячэння даступнасці для
самая вялікая аўдыторыя (самая шырокая аўдыторыя).
Агенты.
Існуюць розныя «агенты», якія вывучаюць кліента па кожным пункце, напрыклад, г.зн
кампаніі аперацыйных сістэм і той жа dw. Гэтыя агенты могуць
быць прасунутымі нейронавымі сеткамі, навучанымі, каб даведацца аб
тэндэнцыі кожнай кропкі, напрыклад, на аснове будучага попыту на прадукцыю
на стымуляванне збыту, механізмы, заснаваныя на правілах, на якія трэба рэагаваць
un дата набор абставінаў, ці нават простыя агенты, якія
яны паказваюць на выключэнні для «вышэйшых кіраўнікоў». Гэтыя працэсы так
звычайна прысутнічае ў рэжыме рэальнага часу і, такім чынам, павінен
быць цесна звязаны з іх рухам дадзеныя.
Усе гэтыя структуры ст дадзеныя, тэхналогіі і методыкі гарантыя
што вы не будзеце праводзіць ноч, ствараючы арганізацыю
ваш BI.
Гэтая дзейнасць будзе развівацца паступова, для малых
кропак.
Кожны крок з'яўляецца незалежнай працай праекта, і паведамляецца
у якасці паўтарэння вашай ініцыятывы dw або BI. Ітэрацыі
можа ўключаць у сябе ўкараненне новых тэхналогій, для
пачаць з новых метадаў, дадаючы новыя структуры дадзеныя ,
загрузка i дадзеныя дадатковыя, або з пашырэннем аналізу
ваша асяроддзе. Гэты пункт абмяркоўваецца падрабязней
падрабязней у раздзеле 3.
Акрамя традыцыйных структур інструментаў Dw і Bi ёсць і іншыя
функцыі вашай арганізацыі BI, для якіх вы павінны
дызайн, напрыклад:
Кропкі кантакту з кліентамі (Customer touch
кропак).
Як і ва ўсіх сучасных арганізацыях, існуе шэраг
кропкі кантакту з кліентамі, якія паказваюць, як атрымаць вопыт
пазітыў для вашага кліенты. Ёсць традыцыйныя каналы, такія як i
гандляры, аператары камутатараў, прамая пошта, мультымедыя і друк
рэклама, а таксама самыя сучасныя каналы, такія як электронная пошта і Інтэрнэт, г.зн дадзеныя
павінны быць набыты прадукты з пэўнай кропкай дотыку,
транспартуецца, ачышчаецца, апрацоўваецца і затым засяляецца на аб'екты дадзеныя з
БІ.
Базы а дадзеныя аператыўныя і карыстальніцкія аб'яднанні (Аперат
базы дадзеных і супольнасці карыстальнікаў).
У канцы кантактных пунктаў ст кліенты знойдзены асн дадзеныя
прыкладанняў кампаніі і суполак карыстальнікаў. THE дадзеныя існуючы
яны дадзеныя традыцыйныя, якія павінны быць аб'яднаны і зліты з дадзеныя што
яны выцякаюць з кропак дотыку, каб выканаць неабходнае
інфармацыі.
Аналітыкі. (Аналітыкі)
Асноўным бенефіцыярам асяроддзя BI з'яўляецца аналітык. Гэта ён
выгады ад цяперашняй здабычы ст дадзеныя аператыўная, інтэграваная з
розныя крыніцы дадзеныя , дапоўнены такімі функцыямі, як аналітыка
геаграфічныя (геакадзіраванне) і прадстаўлены ў тэхналогіях BI, якія
дазваляюць майнинг, OLAP, пашыраныя справаздачы і аналіз SQL
геаграфічны. Асноўны інтэрфейс аналітыка да навакольнага асяроддзя
справаздачнасць - партал BI.
Аднак аналітык не адзіны, хто выйграе ад архітэктуры
БІ.
Кіраўнікі, буйныя асацыяцыі карыстальнікаў і нават члены, пастаўшчыкі і я
кліенты павінны знайсці перавагі ў карпаратыўнай BI.
Задняя пятля падачы.
Архітэктура BI - гэта асяроддзе навучання. Прынцып
асаблівасцю развіцця з'яўляецца магчымасць устойлівых структур дадзеныя
абнаўляцца выкарыстанай тэхналогіяй BI і дзеяннямі
прадпрыемствы карыстальнікаў. Прыкладам можа служыць ацэнка
кліент (ацэнка кліентаў).
Калі аддзел продажаў праводзіць мадэль майнинга
балаў кліентаў, як выкарыстоўваць новую паслугу, то
Аддзел продажаў не павінен быць адзінай групай бенефіцыяраў
службы.
Замест гэтага мадэль майнинга павінна быць выканана як частка
характар ​​патоку даных у кампаніі і балы кліента
павінна стаць неад'емнай часткай інфармацыйнага асяроддзя ст
склад, бачны ўсім карыстальнікам. IBM Suite, арыентаваны на Bi-bI
уключаючы DB2 UDB, DB2 OLAP Server уключае большасць
частка важных кампанентаў тэхнікі, вызначаных на рыс
1.1.
Мы выкарыстоўваем архітэктуру, як яна паказана на малюнку гэтай кнігі
даць нам узровень пераемнасці і прадэманстраваць, як кожны прадукт
IBM ўпісваюцца ў агульную схему BI.
Прадастаўленне інфармацыйнага кантэнту (Прадастаўленне
інфармацыйны змест)
Праектаванне, распрацоўка і ўкараненне асяроддзя BI - гэта
цяжкая задача. Дызайн павінен ахопліваць абодва
бягучыя і будучыя патрабаванні бізнесу. Архітэктурны праект
павінна быць поўнай, каб уключыць усе знойдзеныя высновы
на этапе праектавання. Расстрэл павінен застацца
імкнецца да адзінай мэты: распрацаваць архітэктуру BI
як фармальна прадстаўлена на чарцяжы і заснавана на патрабаваннях
бізнэс.
Асабліва цяжка сцвярджаць, што дысцыпліна забяспечыць
адносны поспех.
Гэта проста, таму што вы не ствараеце асяроддзе BI для ўсіх
раптоўна, але робіцца невялікімі крокамі з цягам часу.
Аднак ідэнтыфікацыя BI-кампанентаў вашай архітэктуры ёсць
важна па дзвюх прычынах: Вы будзеце кіраваць усімі наступнымі рашэннямі
тэхніка архітэктуры.
Вы зможаце свядома распрацаваць канкрэтнае выкарыстанне тэхналогіі
хоць вы можаце не атрымаць паўтор, які яму патрэбны
тэхналогіі на некалькі месяцаў.
Дастатковае разуменне патрабаванняў вашага бізнесу паўплывае на тып
прадуктаў, якія вы набудзеце для сваёй архітэктуры.
Планаванне і развіццё вашай архітэктуры забяспечыць
што ваш склад
не выпадковая падзея, а хутчэй "добра прадуманая",
старанна складзеная рэклама опера мастацтва, як мазаіка
змешаная тэхналогія.
Дызайн інфармацыйнага кантэнту
Увесь першапачатковы дызайн павінен быць сканцэнтраваны і ідэнтыфікаваць
асноўныя кампаненты BI, якія спатрэбяцца вашаму асяроддзю
агульнае ў сучаснасці і будучыні.
Важна ведаць патрабаванні бізнесу.
Яшчэ да таго, як пачнецца афіцыйнае планаванне,
планіроўшчык праекта часта можа вызначыць адзін ці два
кампанент адразу.
Баланс кампанентаў, якія могуць спатрэбіцца для
вашу архітэктуру, аднак, не знайсці лёгка.
На этапе праектавання асноўная частка архітэктуры
звязвае сеанс распрацоўкі прыкладанняў (JAD) з пошукам
вызначыць патрабаванні бізнесу.
Часам гэтыя патрабаванні могуць быць перададзены інструментам
запыты і справаздачнасць.
Напрыклад, карыстальнікі заяўляюць, што хочуць аўтаматызаваць
у цяперашні час справаздачу трэба стварыць уручную інтэграцыі
два каэфіцыента току і даданне разлікаў, атрыманых з
спалучэнне дадзеныя.
Хоць гэта патрабаванне простае, яно вызначае пэўны
функцыянальнасць функцыі, якую вы павінны ўключыць, калі
купіць інструменты справаздачнасці для арганізацыі.
Дызайнер таксама павінен прад'яўляць дадатковыя патрабаванні да
атрымаць поўную карціну. Карыстальнікі хочуць падпісацца на
гэты даклад?
Падгрупы справаздачы ствараюцца і адпраўляюцца розным па электроннай пошце
карыстальнікаў? Ці хочуць яны бачыць гэтую справаздачу на партале кампаніі?
Усе гэтыя патрабаванні з'яўляюцца часткай простай неабходнасці
замяніць ручную справаздачу па просьбе карыстальнікаў. Карысць
з гэтых тыпаў патрабаванняў ёсць усе, карыстальнікі і дызайнеры
разуменне канцэпцыі справаздач.
Аднак ёсць і іншыя віды бізнесу, якія мы павінны планаваць.
Калі дзелавыя патрабаванні выкладзены ў форме
Бізнес-стратэгічныя пытанні, гэта лёгка для дасведчанага планіроўшчыка
адрозніваць патрабаванні да мер і фактаў.
На малюнку 1.2 паказаны памерныя і памерныя кампаненты a
Дзелавая праблема.
Калі карыстальнікі JAD не ведаюць, як выкласці свае патрабаванні
у выглядзе бізнес-задачы, дызайнер часта даставіць
прыклады для пропуску-запуску сеансу збору даных
патрабаванні.
Эксперт-дызайнер можа дапамагчы карыстальнікам зразумець не толькі
стратэгічны гандаль, але і як яго сфармаваць.
Падыход да збору патрабаванняў разглядаецца ў главе 3; Для
цяпер мы проста хочам адзначыць неабходнасць дызайну для ўсіх
тыпы патрабаванняў BI
Стратэгічная бізнес-задача - гэта не проста патрабаванне
Бізнэс, але і дызайнерская падказка. Калі трэба адказаць
на шматмернае пытанне, то вы павінны запомніць,
прадставіць i дадзеныя мерныя, і калі вам трэба запомніць ст
дадзеныя шматмерны, вы павінны вырашыць, якую тэхналогію або
тэхніка, якую вы збіраецеся выкарыстоўваць.
Вы рэалізуеце схему зарэзерваванай кубічнай зоркі, ці абодва?
Як бачыце, нават простая бізнес-задача
можа істотна паўплываць на дызайн. Аднак
гэтыя тыпы бізнес-патрабаванняў звычайныя і, вядома, як мінімум
вопытнымі планіроўшчыкамі і дызайнерамі.
Было дастаткова спрэчак аб тэхналогіях і падтрымцы
OLAP і шырокі выбар рашэнняў. Дагэтуль
мы згадвалі пра неабходнасць аб'яднаць простую справаздачнасць з i
патрабаванні да памеру бізнесу і як гэтыя патрабаванні
уплываць на тэхнічныя архітэктурныя рашэнні.
Але што гэта за патрабаванні, якія не так лёгка зразумець
карыстальнікамі ці камандай Dw? Аналіз вам калі-небудзь спатрэбіцца
прасторавы (analysis spatiali)?
Мадэлі майнинга дадзеныя яны будуць вашай неабходнай часткай
будучыня? Хто ведае?
Важна адзначыць, што такіх тэхналогій няшмат
вядомы агульным супольнасцям карыстальнікаў і членам каманды
Dw, часткова, гэта можа адбыцца таму, што яны звычайна
апрацоўваюцца некаторымі ўнутранымі або староннімі тэхнічнымі экспертамі. Гэта а
крайні выпадак праблем, якія ствараюць гэтыя тыпы тэхналогій. Я
карыстальнікі не могуць апісаць бізнес-патрабаванні або аформіць іх
каб даць рэкамендацыі дызайнерам, яны могуць
застаюцца незаўважанымі або, што яшчэ горш, проста ігнаруюцца.
Больш праблематычна гэта становіцца, калі дызайнер і распрацоўшчык праваліліся
можа распазнаць прымяненне аднаго з гэтых перадавых але
крытычныя тэхналогіі.
Як мы часта чулі, як дызайнеры кажуць: «ну, навошта
хіба мы не адкладзем гэта ў бок, пакуль не атрымаем гэтую іншую рэч?
«Ці яны сапраўды зацікаўлены ў прыярытэтах, ці яны проста пазбягаюць i
патрабаванні яны не разумеюць? Хутчэй за ўсё апошняя здагадка.
Дапусцім, ваша каманда продажаў паведаміла аб патрабаванні
бізнесу , як паказана на малюнку 1.3, як вы бачыце,
патрабаванне афармляецца ў выглядзе бізнес-задачы. там
розніца паміж гэтай праблемай і тыповай памернай праблемай
адлегласць. У гэтым выпадку каманда продажаў хоча ведаць,
штомесяц агульны аб'ём продажаў з прадуктаў, складоў і
кліенты якія жывуць у межах 5 міль ад склада, дзе яны
яны купляюць.
На жаль, дызайнеры або архітэктары проста могуць
ігнаруйце прасторавы кампанент, кажучы: «у нас ёсць кліент,
прадукт і я дадзеныя дэпазіту. Трымаем дыстанцыю пакуль
яшчэ адна ітэрацыя.
«Няправільны адказ. Гэты тып бізнес-задачы тычыцца
цалкам БІ. Гэта ўяўляе сабой больш глыбокае разуменне
наш бізнес і надзейную аналітычную прастору для нашых аналітыкаў.
BI выходзіць за рамкі простых запытаў або стандартных справаздач
нават OLAP. Гэта не значыць, што гэтыя тэхналогіі не працуюць
яны важныя для вашага BI, але самі па сабе не
асяроддзе BI.
Дызайн для інфармацыйнага кантэксту
(Дызайн для інфармацыйнага кантэнту)
Цяпер, калі мы вызначылі бізнес-патрабаванні, якія вылучаюцца
розныя асноўныя кампаненты, павінны быць уключаны ў канструкцыю
агульнаарх. Некаторыя кампаненты BI ўваходзяць у склад
нашых першапачатковых намаганняў, а некаторыя не будуць рэалізаваны
некалькі месяцаў.
Аднак усе вядомыя патрабаванні адлюстраваны ў канструкцыі так, што
калі нам трэба ўкараніць пэўную тэхналогію, мы гэта робім
рыхтуйся гэта зрабіць. Нешта пра праект будзе адлюстроўваць думку
традыцыйныя.
Напрыклад, на малюнку 1.1 у пачатку главы паказаны даныя
mart, які захоўвае i дадзеныя габарытныя.
Гэты набор з дадзеныя выкарыстоўваецца для падтрымкі наступнага выкарыстання
дадзеныя памерных абумоўлена бізнес-праблемамі, якія
мы вызначылі. Як і дадатковыя дакументы
генеруецца, напрыклад, распрацоўка дызайну дадзеныя, мы
мы пачнем фармалізаваць, як i дадзеныя яны распаўсюджваюцца ў навакольным асяроддзі.
Мы пераканаліся ў неабходнасці прадстаўляць i дадзеныя так
памерныя, падраздзяляючы іх (у адпаведнасці з канкрэтнымі патрэбамі
вызначаны) на вітрынах даных.
Наступнае пытанне: як яны будуць будавацца
гэтыя вітрыны дадзеных?
Вы будуеце зоркі, каб падтрымаць кубы, ці проста кубы, ці толькі зоркі?
(або справа кубікі, або справа зоркі). Стварыце архітэктуру для дадзеных
залежныя крамы, якія патрабуюць атамнага ўзроўню для ўсіх дадзеныя
вы набываеце? Дазволіць незалежным вітрынам даных атрымліваць i дадзеныя
непасрэдна з аперацыйных сістэм?
Якую тэхналогію Cube вы паспрабуеце стандартызаваць?
У вас велізарная колькасць багоў дадзеныя патрабуецца для аналізу памераў
ці вам патрэбныя кубікі вашай нацыянальнай службы продажаў на адным
штотыдзень або абодва? Стварыце магутны прадмет
напрыклад, DB2 OLAP Server for Finance або кубы Cognos
PowerPlay для вашай гандлёвай арганізацыі ці для абодвух?
Гэта вялікія архітэктурныя праектныя рашэнні, якія
яны будуць уплываць на ваша асяроддзе BI. Так,
вы выявілі патрэбу ў OLAP. Цяпер як вы гэта зробіце
від тэхнікі і тэхналогіі?
Як некаторыя з самых перадавых тэхналогій уплываюць на ваш
малюнкі? Мы мяркуем, што вы вызначылі патрэбу
месца ў вашай арганізацыі. Цяпер вы павінны патэлефанаваць у
праблемы з архітэктурным малюнкам, нават калі яны незапланаваныя
ажыццяўляць касмічныя кампаненты на працягу некалькіх месяцаў. Архітэктар павінен
дызайн сёння на аснове таго, што неабходна. Прадбачыць неабходнасць
прасторавы аналіз, які генеруе, захоўвае, выконвае і пастаўляе
доступ да дадзеныя прасторавыя. Гэта ў сваю чаргу павінна служыць
абмежаванне адносна тыпу тэхналогіі і спецыфікацый
праграмная платформа, якую вы зараз можаце разглядаць. Для
напрыклад, сістэма адміністравання ст база дадзеных рэляцыйныя
(RDBMS) вы выконваеце для вашага атамнага ўзроўню павінны мець
даступны надзейны прасторавы памер. Гэта забяспечыла б
максімальная прадукцыйнасць пры выкарыстанні геаметрыі і аб'ектаў
месца ў вашых аналітычных праграмах. Калі ваша RDBMS гэтага не робіць
можа справіцца з i дадзеныя (прасторава-цэнтрычны) унутрана, таму вам прыйдзецца
усталяваць а база дадзеных (прасторава-цэнтрычны) знешні. Гэта ўскладняе
кіраванне праблемамі і ставіць пад пагрозу вашу агульную прадукцыйнасць,
не кажучы ўжо пра дадатковыя праблемы, створаныя для вас
Адміністратары баз дадзеных, таму што яны, верагодна, маюць мінімальнае разуменне
з асноў ст дадзеныя прасторавыя таксама. З іншага боку, калі ваш рухавік
RDMBS апрацоўвае ўсе прасторавыя кампаненты і звязаныя з імі
аптымізатар ведае асаблівыя патрэбы (напрыклад,
індэксаванне) прасторавых аб'ектаў, то вашыя адміністратара базы дадзеных могуць справіцца
аператыўна вырашаць праблемы, і вы можаце падняць іх
прадукцыйнасць.
Акрамя таго, вам трэба наладзіць прамежкавую вобласць і пласт
атамнага асяроддзя, каб уключыць ачыстку адрасоў (un
ключавы элемент прасторавага аналізу), а таксама наступны
эканомія прасторы аб'ектаў. Пераемнасць выданняў ст
маляванне працягваецца цяпер, калі мы ўвялі паняцце ачысткі
адрас. З аднаго боку, гэта дадатак будзе вызначаць тып
праграмнае забеспячэнне, неабходнае для вашых намаганняў ETL.
Вам патрэбны такія прадукты, як Trillium, каб даць вам адрас
clean, або пастаўшчык ETL па вашаму выбару, каб забяспечыць гэта
функцыянальнасць?
Пакуль што важна, каб вы ацанілі стандарт дызайну
павінны быць завершаны, перш чым вы пачнеце рэалізоўваць свой
асяроддзя (склад). Прыведзеныя вышэй прыклады павінны
прадэманстраваць мноства рашэнняў малявання, якія павінны прытрымлівацца
вызначэнне любога канкрэтнага бізнес-патрабавання. Калі зроблена
правільна, гэтыя дызайнерскія рашэнні спрыяюць
ўзаемазалежнасць паміж фізічнымі структурамі вашага асяроддзя,
выбар выкарыстоўванай тэхналогіі і патоку размнажэння
інфармацыйнае напаўненне. Без гэтай звычайнай архітэктуры
BI, ваша арганізацыя будзе падвяргацца змешванню
хаатычныя з існуючых тэхналогій, у лепшым выпадку, аб'яднаныя ў шляху
недакладныя, каб забяспечыць уяўную стабільнасць.
Падтрымліваць інфармацыйнае напаўненне
Прынесці каштоўнасць інфармацыі вашай арганізацыі
вельмі цяжкая аперацыя. Без дастатковага разумення
і вопыт, або правільнае планаванне і дызайн, нават
лепшыя каманды праваліліся б. З іншага боку, калі ў вас ёсць вялікі
інтуіцыя і дэталёвае планаванне, але не дысцыпліна для
выканання, вы проста змарнавалі грошы і час
таму што вашы намаганні абавязкова пацерпяць няўдачу. Паведамленне павінна
быць ясным: калі вам не хапае аднаго або некалькіх з іх
навыкі, разуменне/вопыт або планаванне/маляванне o
выканання дысцыпліны, гэта прывядзе да паралізуе або
разбурыць будынак арганізацыі БІ.
Ці дастаткова падрыхтавана ваша каманда? На вашым нехта ёсць
Каманда BI, якая разумее шырокую аналітычную прастору
у асяроддзі BI, у неабходных метадах і тэхналогіях
каб зрабіць гэты пейзаж? Ёсць нехта ў вашай камандзе
які можа распазнаць розніцу прыкладанняў паміж пашыранымі
статычныя справаздачы і OLAP, ці адрозненні паміж ROLAP і OLAP? Адзін з
члены вашай каманды дакладна распазнаюць шлях
экстракт і як гэта можа паўплываць на склад ці як
можа склад падтрымліваць прадукцыйнасць майнинга? Член
каманды разумее каштоўнасць дадзеныя космас або тэхналогіі
на аснове агента? У вас ёсць хто-небудзь, хто шануе унікальнае прыкладанне
інструментаў ETL супраць брокерскай тэхналогіі
паведамленне? Калі ў вас яго няма, вазьміце яго. BI - гэта значна больш
вялікі нармалізаванага атамнага пласта, OLAP, схем a
зорка і ODS.
Майце разуменне і вопыт, каб распазнаваць патрабаванні
BI і іх рашэнняў мае важнае значэнне для вашай здольнасці
правільна фармалізаваць патрэбы карыстальнікаў і аформіць
і рэалізаваць свае рашэнні. Калі ваша супольнасць карыстальнікаў мае
цяжкасці апісання патрабаванняў, гэта задача каманды в
склад забяспечыць такое разуменне. Але калі каманда в
склад
не прызнае канкрэтнае прымяненне BI - напрыклад, дадзеныя
здабыча карысных выкапняў - тады гэта не самае лепшае, што робяць асяроддзя BI
часта абмяжоўваюцца пасіўнымі дэпазітамі. Аднак ігнаруйце іх
тэхналогій не прымяншае іх значнасці і эфекту, які яны аказваюць
на з'яўленне ўласных магчымасцей бізнес-аналітыкі
арганізацыі, а таксама распрацаваную вамі інфармацыйную структуру
прасоўваць.
Планаванне павінна ўключаць у сябе паняцце чарцяжа, пад рэд
абодва патрабуюць кампетэнтнага чалавека. Плюс, праектаванне
патрабуе філасофіі і назіральнасці каманды
стандартаў. Напрыклад, калі ваша кампанія заснавала a
стандартную платформу або вызначыў пэўную СУБД, якую вы
хочаце стандартызаваць платформу, гэта непазбежна
усе ў камандзе прытрымліваюцца гэтых стандартаў. Наогул адзін
каманда паказвае неабходнасць нармалізацыі (карыстальніку
супольнасці), але сама каманда не жадае далучацца
стандарты таксама ўстаноўлены ў іншых галінах кампаніі ці, магчыма, нават у
падобныя кампаніі. Гэта не толькі крывадушна, але і гарантуе, што кампанія гэтага не робіць
здольны выкарыстоўваць існуючыя рэсурсы і інвестыцыі. Гэта не значыць
што няма сітуацый, якія гарантуюць платформу або a
нестандартызаваная тэхналогія; аднак намаганнямі склада
павінны раўніва ахоўваць стандарты прадпрыемства да
што бізнес-патрабаванні не патрабуюць іншага.
Трэці ключавы кампанент, неабходны для стварэння BI
арганізацыя - гэта дысцыпліна.
Гэта ў поўнай меры залежыць як ад чалавека, так і ад асяроддзя.
Планіроўшчыкі праектаў, спонсары, архітэктары і карыстальнікі павінны цаніць
дысцыпліна, неабходная для пабудовы інфармацыйнай структуры кампаніі.
Дызайнеры павінны накіроўваць свае дызайнерскія намаганні такім чынам, каб
завяршыць іншыя неабходныя справы ў грамадстве.
Напрыклад, дапусцім, што ваша кампанія будуе
Прыкладанне ERP, якое мае складскі кампанент.
Таму распрацоўшчыкі ERP абавязаны супрацоўнічаць з
каманда складскога асяроддзя, каб не канкураваць або
дубляваць ужо пачатую працу.
Дысцыпліна - гэта таксама тэма, пра якую трэба клапаціцца
усёй арганізацыяй і звычайна ўстанаўліваецца і даручаецца a
выканаўчы ўзровень.
Ці гатовыя кіраўнікі прытрымлівацца распрацаванага падыходу? А
падыход, які абяцае стварыць інфармацыйны кантэнт, які ёсць
у рэшце рэшт гэта прынясе каштоўнасць для ўсіх сфер прадпрыемства, але, магчыма
Ці ставіць пад пагрозу парадак дня асобы або аддзела? Успомніце прымаўку
«Думаць пра ўсё важней, чым думаць толькі пра адно».
Гэта выказванне справядліва для арганізацый BI.
На жаль, многія склады канцэнтруюць свае намаганні
спрабуючы нацэліць і прынесці каштоўнасць пэўнаму аддзелу або
канкрэтных карыстальнікаў, не звяртаючы ўвагі на арганізацыю ў
генерал. Дапусцім, менеджэр просіць дапамогі ў каманды
камяніца. Каманда адказвае працай, якая доўжылася 90 дзён
уключае не толькі выкананне патрабаванняў да апавяшчэнняў, вызначаных у
менеджэр, але гарантуе, што ўсе дадзеныя асновы ўмешваюцца ў пласт
атамнай перад увядзеннем у тэхналогію куба
прапанова.
Гэта інжынернае дадатак гарантуе, што прадпрыемства
катэдж выйграе ад дадзеныя неабходны кіраўніку.
Тым не менш, кіраўнік размаўляў са знешнімі кансалтынгавымі фірмамі
прапанавалі аналагічнае прыкладанне з дастаўкай менш чым за 4
тыдняў.
Калі выказаць здагадку, што ўнутраная каманда камбайнераў кампетэнтная, то
у кіраўніка ёсць выбар. Хто можа падтрымаць дысцыпліну
дадатковая інжынерыя, неабходная для росту актыву
інфарматыўны бізнес або вы можаце стварыць свой уласны
рашэнне хутка. Апошняе здаецца сапраўды абраным
занадта часта і служыць толькі для стварэння інфармацыйных кантэйнераў
што прыносіць карысць толькі некаторым або асобным асобам.
Кароткатэрміновыя і доўгатэрміновыя мэты
Архітэктары і дызайнеры павінны аформіць а
доўгатэрміновае бачанне агульнай архітэктуры і планы на
расці ў арганізацыі BI. Гэта спалучэнне
кароткатэрміновая выгада і доўгатэрміновае планаванне
прадстаўляюць два бакі намаганняў BI. Кароткатэрміновы прыбытак
крайні тэрмін - гэта аспект BI, які звязаны з ітэрацыямі
ваш склад.
Менавіта на гэта арыентуюцца планіроўшчыкі, архітэктары і спонсары
адпавядаць спецыфічным патрабаванням бізнесу. Менавіта на гэтым узроўні, дзе
пабудаваны фізічныя структуры, набыта тэхналогія і
тэхнікі рэалізуюцца. Яны зусім не створаны для таго, каб мець справу з імі
спецыфічныя патрабаванні, вызначаныя канкрэтнымі супольнасцямі карыстальнікаў.
Усё зроблена для задавальнення канкрэтных вызначаных патрабаванняў
ад пэўнай суполкі.
Аднак доўгатэрміновае планаванне - гэта іншы аспект
БІ. Тут гэта было забяспечана планамі і праектамі
пабудаваны любы фізічны будынак, выбраныя тэхналогіі і
тэхнікі, створаныя з прыцэлам на прадпрыемства. І
доўгатэрміновае планаванне, якое забяспечвае згуртаванасць
неабходныя для таго, каб бізнес-выгоды атрымлівалі ўсе
знойдзеныя кароткатэрміновыя выгады.
Абгрунтуйце свае намаганні BI
Un інфармацыйнае сховішча сам па сабе ён не мае ўласнай каштоўнасці. У іншым
словамі, тэхналогіі не маюць уласнай каштоўнасці
склад і тэхніка рэалізацыі.
Каштоўнасць любых складскіх намаганняў знаходзіцца ў дзеяннях
выконваецца ў адпаведнасці са складскім асяроддзем і зместам
інфарматыўны культывуецца з цягам часу. Гэта важны момант для разумення
перш чым вы паспрабуеце ацаніць каштоўнасць любой ініцыятывы
дзе дом.
Занадта часта архітэктары і дызайнеры спрабуюць прымяніць каштоўнасць да
фізічныя і тэхнічныя кампаненты склада, калі на самай справе значэнне
заснавана на бізнес-працэсах, на якія станоўча ўплывае
склад і добра набытая інфармацыя.
У гэтым заключаецца праблема стварэння BI: як вы апраўдваеце інвестыцыі?
Калі wherehouse сам па сабе не мае ўласнай каштоўнасці, дызайнеры з
праект павінен даследаваць, вызначыць і фармалізаваць перавагі
дасягаецца тымі асобамі, якія будуць выкарыстоўваць склад для
палепшыць канкрэтныя бізнес-працэсы або каштоўнасць
абароненая інфармацыя або абодва.
Каб ускладніць справу, любы бізнес-працэс
пацярпелых ад складскіх намаганняў можа прынесці карысць
«значны» або «нязначны». Значныя перавагі забяспечваюць а
матэрыяльная метрыка для вымярэння рэнтабельнасці інвестыцый (ROI) - напр
Напрыклад, паварот інвентарызацыі дадатковы час на працягу перыяду
канкрэтныя або для больш нізкай кошту дастаўкі за адпраўленне. Гэта больш
Цяжка вызначыць невялікія перавагі, такія як паляпшэнне доступу да
інфармацыя, з пункту гледжання матэрыяльнай каштоўнасці.
Падключыце свой праект, каб даведацца пра
Дзелавыя запыты
Занадта часта дызайнеры праектаў спрабуюць злучыць каштоўнасць
склада з аморфнымі мэтамі кампаніі. Заяўляючы, што
«Каштоўнасць склада заснавана на нашай здольнасці
задаволіць стратэгічныя запыты» мы адкрываем
гаворка. Але аднаго гэтага недастаткова, каб вызначыць, ці ёсць
інвеставаць у склад мае сэнс. Лепш падключаць паўторы
складоў з канкрэтнымі і вядомымі бізнес-запытамі.
Вымярэнне ROI
Разлік рэнтабельнасці інвестыцый ва ўмовах склада можна
асабліва цяжка. Асабліва цяжка, калі перавага
прынцып канкрэтнага паўтору - гэта нешта нематэрыяльнае або
лёгка вымераць. Даследаванне паказала, што карыстальнікі ўспрымаюць
дзве асноўныя перавагі BI-ініцыятыў:
▪ Стварыце здольнасць прымаць рашэнні
▪ Стварыць доступ да інфармацыі
Гэтыя перавагі з'яўляюцца мяккімі (або мяккімі) перавагамі. Гэта лёгка ўбачыць
як мы можам разлічыць рэнтабельнасць інвестыцый на аснове цвёрдага ліду (ці
больш), напрыклад, зніжэнне кошту транспарту, але як
мы вымяраем здольнасць прымаць лепшыя рашэнні?
Гэта, безумоўна, праблема для дызайнераў праектаў, калі
яны спрабуюць пераканаць кампанію інвеставаць у канкрэтную
складскія намаганні. Павелічэнне продажаў або памяншэнне выдаткаў
яны больш не з'яўляюцца цэнтральнымі тэмамі, якія рухаюць асяроддзе BI.
Замест гэтага вы разглядаеце бізнес-запыты на доступ
лепш за ўсё да інфармацыі, каб канкрэтны аддзел мог
прымаць рашэнні хутчэй. Гэта стратэгічныя драйверы а
якія аднолькава важныя для бізнесу, але з'яўляюцца
больш неадназначны і складаней ахарактарызаваць у матэрыяльнай метрыцы.
У гэтым выпадку разлік рэнтабельнасці інвестыцый можа ўвесці ў зман, калі не сказаць, што не мае значэння.
Дызайнеры праекта павінны быць у стане прадэманстраваць каштоўнасць
матэрыяльныя, каб менеджэры маглі вырашыць, ці варта інвеставаць у іх
прымяняецца пэўны паўтор. Аднак мы не будзем прапаноўваць новы
метад разліку рэнтабельнасці інвестыцый, і мы не будзем прыводзіць ніякіх аргументаў на карысць або
супраць гэтага.
Ёсць шмат артыкулаў і кніг, якія абмяркоўваюць асновы для
разлічыць ROI. У якасці каштоўнасці ёсць спецыяльныя каштоўнасныя прапановы
па інвестыцыях (VOI), якія прапануюць такія групы, як Gartner, якія вы можаце
даследаваць. Замест гэтага мы засяродзімся на асноўных аспектах любога
ROI або іншыя каштоўнасныя прапановы, якія вам трэба разгледзець.
Прымяненне ROI
Акрамя аргумента «жорсткія» перавагі супраць «мяккіх».
звязаныя з намаганнямі BI ёсць і іншыя пытанні, якія варта разгледзець
калі мы ўжываем ROI. Напрыклад:
Прыпісвайце занадта шмат эканоміі намаганням DW, якія прыйдуць
камуніка
Дапусцім, ваша кампанія перайшла з архітэктуры
мэйнфрэйма ў размеркаванае асяроддзе UNIX. Дык любая
эканомія, якая можа (ці не можа) быць рэалізавана ў выніку гэтых намаганняў
не варта адносіць выключна, калі наогул (?), да
склад.
Калі не ўлічваць усё, гэта дорага каштуе. А спраў ёсць шмат
прыняць да ўвагі. Разгледзім наступны спіс:
▪ Пачатковыя выдаткі, уключаючы мэтазгоднасць.
▪ Кошт спецыяльнага абсталявання з адпаведным сховішчам e
сувязі
▪ Кошт праграмнага забеспячэння, уключаючы кіраванне дадзеныя і пашырэнні
кліент/сервер, праграмнае забеспячэнне ETL, тэхналогіі DSS, інструменты
візуалізацыя, праграмаванне і паток прыкладанняў
праграмнае забеспячэнне для працы і маніторынгу.
▪ Кошт праектавання канструкцыі дадзеныя, з рэалізацыяй, і
аптымізацыя
▪ Кошт распрацоўкі праграмнага забеспячэння непасрэдна звязаны з намаганнямі
BI
▪ Кошт абслугоўвання дома, уключаючы аптымізацыю
прадукцыйнасць, уключаючы кантроль версій праграмнага забеспячэння і
дапамога аперацый
Прымяніць рэнтабельнасць інвестыцый "Вялікага выбуху".
Стварэнне склада як адзіная і гіганцкая праца
абавязкова пацерпіць няўдачу, таму таксама разлічыце рэнтабельнасць інвестыцый для ініцыятывы
буйнога прадпрыемства Прапанова здзіўляе і тое, што дызайнеры
працягваюць рабіць слабыя спробы ацаніць каштоўнасць цэлага
намаганні.
Таму што дызайнеры імкнуцца надаць грашовую ацэнку
па дзелавой ініцыятыве, калі гэта шырока вядома і прызнана
Ці складана ацаніць канкрэтныя паўторы? Як такое магчыма? Гэта не
магчыма за невялікім выключэннем. Не рабіце гэтага.
Цяпер, калі мы ўсталявалі, чаго нельга рабіць пры разліку
ROI, тут ёсць некаторыя моманты, якія дапамогуць нам у вызначэнні
надзейны працэс для ацэнкі кошту вашых намаганняў BI.
Атрыманне кансенсусу аб рэнтабельнасці інвестыцый. Незалежна ад вашага
выбар метаду для ацэнкі кошту вашых намаганняў BI, неабходна
быць узгодненымі ўсімі бакамі, уключаючы распрацоўшчыкаў праекта,
спонсары і кіраўнікі кампаніі.
Паменшыце рэнтабельнасць інвестыцый на часткі, якія можна ідэнтыфікаваць. Неабходны крок насустрач
разумны разлік рэнтабельнасці інвестыцый заключаецца ў тым, каб засяродзіць гэты разлік на a
канкрэтны праект. Затым гэта дазваляе ацаніць значэнне
на аснове канкрэтных патрабаванняў бізнесу, якія выконваюцца
Вызначце выдаткі. Як ужо згадвалася, павінны быць шматлікія выдаткі
лічыцца. Акрамя таго, выдаткі павінны ўключаць не толькі спадарожныя выдаткі
да адной ітэрацыі, але і да звязаных з гэтым выдаткаў
для забеспячэння адпаведнасці стандартам кампаніі.
Вызначце перавагі. Выразная сувязь рэнтабельнасці інвестыцый з патрабаваннямі
канкрэтныя прадпрыемствы, мы павінны быць у стане ідэнтыфікаваць
перавагі, якія прывядуць да задавальнення патрабаванняў.
Скарачэнне выдаткаў і выгод у немінучай прыбытку. Гэта шлях
лепш заснаваць свае ацэнкі на чыстай цяперашняй кошту
(NPV) у адрозненне ад спробы прагназавання будучага кошту ў
будучы заробак.
Звядзіце да мінімуму час падзелу рэнтабельнасці інвестыцый. І'
добра задакументаваны на працягу доўгага перыяду часу, калі ён выкарыстоўваўся ў вашым
ROI
Выкарыстоўвайце больш чым адну формулу ROI. Ёсць мноства метадаў для
Прагноз рэнтабельнасці інвестыцый, і вы павінны спланаваць, ці выкарыстоўваць адзін або
плюс, уключаючы чыстую цяперашнюю вартасць, унутраную хуткасць вяртання
(IRR) і аднаўленне.
Вызначце паўторны працэс. Гэта вельмі важна для разліку
любая доўгатэрміновая каштоўнасць. Гэта павінна быць дакументальна а
адзіны паўтаральны працэс для ўсіх падпаслядоўнасцей праекта a
прытрымлівацца.
Пералічаныя праблемы з'яўляюцца найбольш распаўсюджанымі, якія вызначаюцца экспертамі
ахоўнага асяроддзя. Настойлівасць з боку кіраўніцтва в
рэнтабельнасць інвестыцый "вялікага выбуху" вельмі бянтэжыць. Калі пачаць усё
вашы разлікі рэнтабельнасці інвестыцый, зводзячы іх да ідэнтыфікаваных і адчувальных частак, у вас ёсць
добры шанец ацаніць дакладную ацэнку рэнтабельнасці інвестыцый.
Пытанні адносна пераваг рэнтабельнасці інвестыцый
Якімі б ні былі вашы перавагі, мяккімі ці цвёрдымі, вы можаце імі карыстацца
некаторыя асноўныя пытанні, каб вызначыць іх каштоўнасць. каб
напрыклад, выкарыстоўваючы простую сістэму маштабавання, ад 1 да 10, вы
вы можаце адсочваць уплыў любых намаганняў, выкарыстоўваючы наступнае
Дамен:
▪ Як бы вы ацанілі разуменне дадзеныя пасля гэтага
праект вашай кампаніі?
▪ Як бы вы ацанілі паляпшэнне працэсу ў выніку
гэты праект?
▪ Як бы вы зараз вымералі ўплыў новых ідэй і высноў
стаў даступным дзякуючы гэтай ітэрацыі
▪ Які ўплыў аказалі новыя камп'ютэрныя асяроддзя e
выкананне ў выніку таго, што было вывучана?
Калі адказаў на гэтыя пытанні мала, магчыма, што
кампанія не варта зробленых інвестыцый. Пытанні з кайфам
адзнака паказвае на значны прырост каштоўнасці і павінна
служыць кіраўніцтвам для далейшага расследавання.
Напрыклад, высокі бал за паляпшэнне працэсу
гэта павінна прымусіць дызайнераў вывучыць, што такое працэсы
быў палепшаны. Вы можаце выявіць, што некаторыя або ўсе прыбыткі вы атрымаеце
яны матэрыяльныя, і таму можна лёгка атрымаць грашовую каштоўнасць
прыкладной.
Атрыманне максімальнай карысці ад першай ітэрацыі
склад
Найвялікшы вынік вашых дзелавых намаганняў часта ў
першыя некалькі ітэрацый. Гэтыя першыя спробы традыцыйна
стварыць найбольш карысны інфармацыйны кантэнт для грамадскасці і
стварае тэхналагічную аснову дапамогі для наступных
Прыкладання BI.
Звычайна кожная наступная паслядоўнасць дадзеныя праекта
склады прыносяць кампаніі ўсё менш дадатковай вартасці
агульны. Гэта асабліва дакладна, калі вы не паўтараеце
дадае новыя тэмы або не адпавядае патрэбам новай
супольнасць карыстальнікаў.
Такая асаблівасць захоўвання датычыцца і акумулятараў
вырошчванне дадзеныя гісторыкаў. Паколькі наступныя намаганні патрабуюць большага
дадзеныя і як яшчэ дадзеныя выліваюцца на склад з часам, большая частка
дадзеныя становіцца менш актуальным для выкарыстоўванага аналізу. Гэтыя дадзеныя яны
часта наз дадзеныя у стане спакою, і ўтрымліваць іх заўсёды дорага, таму што
яны амаль не выкарыстоўваюцца.
Што гэта значыць для спонсараў праекта? Па сутнасці, я
першыя спонсары дзеляцца больш, чым каштуюць інвестыцыі.
Гэта першасна, таму што яны з'яўляюцца штуршком для заснавання пласта
шырокае тэхналагічнае асяроддзе і складскія рэсурсы,
у тым ліку арганічныя.
Але гэтыя першыя крокі прыносяць найбольшую каштоўнасць і, такім чынам, дызайнеры
праекта часта даводзіцца апраўдваць інвестыцыі.
Праекты, выкананыя пасля вашай ініцыятывы BI, могуць мець выдаткі
непаўнавартасныя (у параўнанні з першымі) і прамыя, але прыносяць меншую каштоўнасць
да кампаніі.
А ўладальнікам арганізацый трэба пачынаць разважаць
выкінуць назапашванне дадзеныя і менш актуальныя тэхналогіі.
Інтэлектуальны аналіз дадзеных: выманне Dati
Шматлікія архітэктурныя кампаненты патрабуюць варыяцый
тэхналогіі і метады інтэлектуальнага аналізу дадзеных -
напрыклад, розныя "агенты" для вывучэння цікавых месцаў
кліенты, аперацыйныя сістэмы кампаніі і для самой dw. Гэтыя
агенты могуць навучацца перадавым нейронавым сеткам
гаршчок тэндэнцыі, такія як будучы попыт на прадукцыю на аснове
стымуляванне збыту; заснаваныя на правілах рухавікі для
рэагаваць на набор дата абставін, напрыклад, дыягназ
медыцынскія і лячэбныя рэкамендацыі; ці нават простых агентаў
з роляй інфармавання аб выключэннях вышэйшага звяна (верх
кіраўнікі). Наогул гэтыя працэсы экстракцыі дадзеныя si
праверка ў рэжыме рэальнага часу; таму яны павінны быць адзінымі
цалкам з рухам дадзеныя самі.
Онлайн аналітычная апрацоўка Апрацоўка
Інтэрнэт-аналітыка
Магчымасць нарэзаць, нарэзаць кубікамі, катаць, дэталізаваць
і правесці аналіз
што-калі, уваходзіць у сферу дзеяння, мэту сюіты
Тэхналогія IBM. Напрыклад, функцыі аналітычнай апрацоўкі
Інтэрнэт (OLAP) існуе для DB2, які ўносіць аналіз памераў у
рухавік а база дадзеных тое ж самае.
Функцыі дадаюць памерную карыснасць у SQL
яны выкарыстоўваюць усе перавагі натуральнай часткі DB2. Іншы
прыкладам інтэграцыі OLAP з'яўляецца інструмент вымання DB2
Аналізатар сервера OLAP. Гэтая тэхналогія дазваляе кубікам
Сервер DB2 OLAP будзе хутка і аўтаматычна
прааналізаваны, каб вызначыць і паведаміць аб значэннях дадзеныя незвычайны або нечаканы
за ўвесь куб камерцыйнаму аналітыку. І, нарэшце, функцыі ст
DW Center забяспечвае сродкі для праверкі архітэктараў, у тым ліку
іншыя рэчы, профіль куба сервера DB2 OLAP як частка
натуральны характар ​​працэсаў ETL.
Прасторавы аналіз Прасторавы аналіз
Прастора ўяўляе палову аналітычных якароў (лідаў).
неабходны для панарамы
шырокі аналітычны (час прадстаўляе другую палову). Атамны ўзровень
(атамарны ўзровень) склада, прадстаўлены на малюнку 1.1,
уключае асновы як для часу, так і для прасторы. Запісы
аналізу часу і інфармацыі аб адрасе
якарныя аналізы з космасу. Пазнакі часу
яны праводзяць аналіз своечасова, і інфармацыя пра кірунак вядзе
аналіз прасторы. На дыяграме паказаны працэс геакадавання
пераўтварэнне адрасоў у кропкі на карце або кропкі ў прасторы
так што такія паняцці, як адлегласць і ўнутры / звонку могуць быць
выкарыстоўваецца ў аналізе–праводзіцца на атамным узроўні і прасторавым аналізе
які даступны аналітыку. IBM забяспечвае пашырэнні
космас, распрацаваны сумесна з Інстытутам даследаванняў экалагічных сістэм (ESRI),
al база дадзеных DB2 так што касмічныя аб'екты могуць быць
захоўваецца як звычайная частка база дадзеных рэляцыйная. DB2
Прасторавыя пашыральнікі, таксама забяспечваюць усе пашырэнні SQL для
выкарыстоўваць прасторавы аналіз. Напрыклад, пашырэнні SQL ад
пытанне аб
адлегласць паміж адрасамі або тое, ці знаходзіцца кропка ўнутры або па-за межамі вобласці
вызначаюцца паліганальныя, з’яўляюцца аналітычным стандартам з прастор
Пашыральнікі. Для атрымання дадатковай інфармацыі глядзіце раздзел 16.
База дадзеных-Resident Tools Інструменты База дадзеных-
Пастаялец
DB2 мае шмат рэзідэнтных функцый SQL, якія дапамагаюць
у аналізе дзеянняў. Да іх адносяцца:
▪ Функцыі рэкурсіі для выканання аналізу, такія як «знайсці
усе магчымыя маршруты палёту ад Сан - Францыска a I Love New York».
▪ Аналітычныя функцыі для ранжыравання, кумулятыўныя функцыі, куб
і зборкі для палягчэння задач, якія звычайна адбываюцца
толькі з тэхналогіяй OLAP, цяпер яны з'яўляюцца натуральнай часткай
рухавік а база дадзеных
▪ Магчымасць ствараць табліцы, якія змяшчаюць вынікі
Прадаўцы з база дадзеных лідэры змешваюць больш, чым магчымасці BI
ў база дадзеных тое самае.
Асноўныя пастаўшчыкі база дадзеных яны змешваюць больш чым
Функцыянальнасць BI ст база дадзеных тое самае.
Гэта забяспечвае лепшую прадукцыйнасць і больш варыянтаў бегу для вашага
Рашэнні BI.
Асаблівасці і функцыі DB2 V8 абмяркоўваюцца
падрабязна ў наступных раздзелах:
Тэхнічная архітэктура і асновы кіравання дадзенымі
(Раздзел 5)
▪ Асновы DB2 BI (раздзел 6)
▪ Табліцы матэрыялізаваных запытаў DB2
Табліцы) (Раздзел 7)
▪ Функцыі DB2 OLAP (раздзел 13)
▪ DB2 Enhanced BI магчымасці і функцыі (Enhanced BI
Характарыстыкі і функцыі) (Раздзел 15)
Спрошчаная сістэма дастаўкі даных
Сістэма дастаўкі дадзеныя спрошчаны
Архітэктура, прадстаўленая на малюнку 1.1, уключае мноства
збудаванні дадзеныя фізічны. Адным з іх з'яўляецца склад в дадзеныя аператыўны.
Як правіла, ODS з'яўляецца аб'ектна-арыентаваным,
інтэграваны і бягучы. Вы б стварылі ODS для падтрымкі, напр
напрыклад, офіс продажаў. Продажы ОРВ будуць дапаўняць дадзеныя
паходзіць з мноства розных сістэм, але захаваў бы толькі, напр
напрыклад, сённяшнія транзакцыі. ODS можна абнаўляць
нават шмат разоў на дзень. У той жа час працэсы
яны штурхаюць дадзеныя інтэграваны ў іншыя прыкладанні. Гэтая структура ёсць
спецыяльна распрацаваны для інтэграцыі дадзеныя бягучыя і дынамічныя эл
будзе верагодным кандыдатам для падтрымкі аналітыкі ў рэальным часе,
як прадастаўляць паслугі агентаў кліенты інфармацыя аб продажах
бягучыя тэндэнцыі кліента шляхам здабывання інфармацыі аб тэндэнцыях продажаў
з самога склада. Яшчэ адна структура, паказаная на малюнку 1.1
афіцыйны статус dw. Гэта не толькі месца для
выкананне неабходнай інтэграцыі, якасць дадзеныяІ
пераўтварэння в дадзеныя запасаў хутка, але гэта таксама
надзейнае і часовае сховішча для дадзеныя адказаць на гэта
можа выкарыстоўвацца ў аналізе ў рэжыме рэальнага часу. Калі вы вырашыце
выкарыстоўваць ODS або прамежкавую пляцоўку, адзін
з лепшых інструментаў для запаўнення гэтых структур дадзеныя з выкарыстаннем
розныя аператыўныя крыніцы - гэта гетэрагенны размеркаваны запыт DB2.
Гэтая магчымасць забяспечваецца дадатковай функцыяй DB2
называецца DB2 Relational Connect (толькі запыт) і праз DB2
DataJoiner (асобны прадукт, які пастаўляе прыкладанне,
устаўка, абнаўленне і магчымасць выдалення a
Гетэрагенныя размеркаваныя РСУБД).
Гэтая тэхналогія дазваляе архітэктарам дадзеныя завязваць дадзеныя di
вытворчасць з аналітычнымі працэсамі. Не толькі тэхналогіі
адаптавацца практычна да любога з запытаў рэплікацыі, якія
яны могуць з'явіцца з аналітыкай у рэжыме рэальнага часу, але гэта
Яны таксама могуць падключацца да самых розных баз дадзеныя più
папулярныя, у тым ліку DB2, Oracle, Sybase, SQL Server,
Informix і іншыя. Для запаўнення можна выкарыстоўваць DB2 DataJoiner
структура дадзеныя фармальны, як ODS або нават стол
пастаянна прадстаўлены на складзе, прызначаным для рэстаўрацыі
хутка для імгненных абнаўленняў або для продажу. натуральна,
гэтыя ж структуры дадзеныя можна запоўніць з дапамогай
яшчэ адна важная тэхналогія, прызначаная для рэплікацыі дадзеныя, IBM
DataPropagator Relational. (DataPropagator - гэта асобны прадукт
для цэнтральных сістэм. DB2 UNIX, Linux, Windows і OS/2 ўключаюць
службы рэплікацыі дадзеныя як стандартная функцыя).
Яшчэ адзін спосаб перамяшчэння дадзеныя дзеючы вакол
для прадпрыемства з'яўляецца інтэгратарам карпаратыўных прыкладанняў у адваротным выпадку
вядомы як брокер паведамленняў.Гэта
Унікальная тэхналогія дазваляе непераўзыдзены кантроль для цэнтравання
(таргетынг) і рухацца дадзеныя вакол кампаніі. IBM мае пасярэдніка
з найбольш шырока выкарыстоўванага паведамлення, MQSeries, або варыянт
прадукту, які ўключае ў сябе патрабаванні электронная камерцыя, IBM
WebSphere MQ.
Для дадатковага абмеркавання таго, як выкарыстоўваць MQ для падтрымкі a
magazzino e un ambiente BI, visitare вэб-сайт del libro. Per ora, è
Дастаткова сказаць, што гэтая тэхналогія з'яўляецца выдатным сродкам для
захоп і пераўтварэнне (з дапамогай MQSeries Integrator) дадзеныя
Цэнтраваныя (мэтавыя) аператары, набраныя для рашэнняў BI. там
Тэхналогія MQ была інтэграваная і ўпакаваная ў UDB V8, які
азначае, што цяпер можна кіраваць чэргамі паведамленняў
як калі б гэта былі табліцы DB2. Паняцце аб зварцы
паведамленні ў чарзе і сусвет база дадзеных рэляцыйная накіравана
да магутнага асяроддзя дастаўкі дадзеныя.
Нулявая затрымка Нулявая затрымка
Канчатковай стратэгічнай мэтай IBM з'яўляецца аналіз нулявой затрымкі.
Як вызначана
Gartner, сістэма BI павінна мець магчымасць рабіць высновы, засвойваць
і прадастаўляць інфармацыю для аналітыкаў па запыце. выклік,
вядома, справа ў тым, як змешваць дадзеныя бягучы і ў рэжыме рэальнага часу
з неабходнымі гістарычнымі звесткамі, такімі як i дадзеныя звязаная мадэль(-і).
тэндэнцыя, або вынятае разуменне, як акрэсленне ст
кліент.
Такая інфармацыя ўключае, напрыклад, ідэнтыфікацыю кліенты ad
высокі або нізкі рызыка або якія прадукты i кліенты яны будуць купляць шмат
напэўна, калі ў іх ужо ёсць сыр у вазках
набыткі.
Атрыманне нулявой затрымкі на самай справе залежыць ад двух
асноўныя механізмы:
▪ Поўнае аб'яднанне в дадзеныя якія аналізуюцца з
устаноўленыя прыёмы і сродкі, створаныя Б.І
▪ Сістэма дастаўкі дадзеныя эфектыўна, каб пераканацца, што
аналіз у рэжыме рэальнага часу сапраўды даступны
Гэтыя перадумовы для нулявой затрымкі нічым не адрозніваюцца ад двух
мэты, устаноўленыя IBM і апісаныя вышэй.
Цесная сувязь дадзеныя з'яўляецца часткай праграмы
бясшвоўная інтэграцыя, арганізаваная IBM. І стварыць сістэму
дастаўкі дадзеныя эфектыўны цалкам залежыць ад
даступная тэхналогія, якая спрашчае працэс дастаўкі
дадзеныя. У выніку дзве з трох мэт IBM з'яўляюцца крытычна важнымі
зрабіць трэці. IBM свядома распрацоўвае свае
тэхналогія для забеспячэння нулявой затрымкі з'яўляецца рэальнасцю для карыстальнікаў
складскія намаганні.
Кароткі змест / Сінт
Арганізацыя BI дае дарожную карту для
стварыць сваё асяроддзе
ітэрацыйна. Ён павінен быць скарэкціраваны ў адпаведнасці з патрэбамі
ваш бізнес, як цяперашні, так і будучы. Без архітэктурнага бачання
шырокі, склад паўтораў крыху больш за
выпадковыя рэалізацыі цэнтральнага склада, якія мала што робяць
стварыць шырокае інфарматыўнае прадпрыемства.
Першая перашкода для кіраўнікоў праектаў - гэта тое, як абгрунтаваць
інвестыцыі, неабходныя для развіцця арганізацыі BI.
Хоць разлік рэнтабельнасці інвестыцый застаецца асноўнай падтрымкай
склад дасягненняў, становіцца ўсё цяжэй
прадказаць дакладна. Гэта прывяло да іншых метадаў для
вызначэнне таго, ці апраўдваеце вы свае грошы. The
напрыклад, набываецца кошт інвестыцый2 (VOI).
як раствор.
Гэта ўскладзена на архітэктараў в дадзеныя і планіроўшчыкі праектаў
наўмысна ствараць і прадастаўляць інфармацыю асацыяцыям
карыстальнікаў, а не проста прадастаўляць ім паслугі дадзеныя. Гэта
велізарная розніца паміж імі. Інфармацыя - гэта тое, што чалавек робіць
розніца ў працэсах прыняцця рашэнняў і эфектыўнасці; адносна, я
дадзеныя яны з'яўляюцца будаўнічымі блокамі для атрымання гэтай інфармацыі.
Нават калі я крытычна стаўлюся да крыніцы дадзеныя звяртацца з просьбамі
камерцыйнае асяроддзе BI павінна адыгрываць большую ролю
у стварэнні інфармацыйнага кантэнту. Мы павінны прыняць
дадатковыя меры па ачыстцы, інтэграцыі, трансфармацыі або
інакш стварыць інфармацыйны кантэнт, паводле якога ст
карыстальнікі могуць прымаць меры, і таму мы павінны пераканацца, што тыя
дзеянні і рашэнні, калі яны разумныя, падтрымліваюцца
у асяроддзі BI. Калі мы перанясем склад толькі для абслугоўвання дадзеныя,
гарантавана, што асацыяцыі карыстальнікаў будуць ствараць кантэнт
інфармацыю, неабходную для прыняцця мер. Гэта гарантуе, што іх
супольнасць зможа прымаць лепшыя рашэнні, але кампанія
пакутуе ад недахопу ведаў, якія яны выкарыстоўвалі.
Дато што архітэктары і праекціроўшчыкі ініцыіруюць праекты
спецыфічныя для асяроддзя BI, яны застаюцца падсправаздачнымі прадпрыемству
па вялікім рахунку. Просты прыклад гэтых двух функцый
асобы ітэрацый БІ знойдзены ў крыніцы дадзеныя. Усе
дадзеныя атрыманы для канкрэтных камерцыйных запытаў павінны быць
заселены ў першы атамны пласт. Гэта забяспечвае развіццё
актывам карпаратыўнай інфармацыі, а таксама кіраваць, накіроўваць
Спецыфічныя для карыстальніка запыты, вызначаныя ў ітэрацыі.

Ш Т А Д А Т А В А Р Е Х А У СЕ ?
інфармацыйнае сховішча гэта сэрца архітэктуры інфармацыйных сістэм
з 1990 года і падтрымлівае інфармацыйныя працэсы, прапаноўваючы цвёрдыя
інтэграваная платформа дадзеныя гісторыкі ўзялі за аснову наступных
аналізы. THE інфармацыйнае сховішча прапануюць прастату інтэграцыі ў a
свет прыкладных сістэм, якія не сумяшчальныя адна з адной. Дата
warehouse ператварыўся ў трэнд. інфармацыйнае сховішча
арганізоўваць і захоўваць i дадзеныя неабходны для інфармацыйных працэсаў e
аналітычны, заснаваны на доўгай гістарычнай часовай перспектыве. Усе
гэта прадугледжвае значную і пастаянную прыхільнасць да будаўніцтва і
у абслугоўванні ст інфармацыйнае сховішча.
Такім чынам, што такое a інфармацыйнае сховішча? А інфармацыйнае сховішча і:
▪ прадметна-арыентаваны
▪ інтэграваная сістэма
▪ варыянт часу
▪ энерганезалежны (немагчыма сцерці)
зборнік дадзеныя выкарыстоўваецца для падтрымкі кіраўніцкіх рашэнняў у
ажыццяўленне працэсаў.
I дадзеныя устаўлены ст інфармацыйнае сховішча узнікаюць у большасці в
справы з аператыўнага асяроддзя. The інфармацыйнае сховішча гэта зроблена адным
блок захоўвання, фізічна аддзелены ад астатняй часткі
сістэмы, якая змяшчае дадзеныя раней трансфармаваны па
прыкладанні, якія працуюць з інфармацыяй, атрыманай з навакольнага асяроддзя
аператыўны.
Літаральнае вызначэнне а інфармацыйнае сховішча заслугоўвае глыбокага вывучэння
тлумачэнне, паколькі ёсць важныя матывацыі і значэнні
фон, які апісвае характарыстыкі склада.
ПРАДМЕТНАЯ АРЫЕНТАВАНАСЦЬ
ТЭМАТЫЧНЫ
Першая характарыстыка а інфармацыйнае сховішча заключаецца ў тым, што ён арыентаваны на
асноўныя гульцы ў кампаніі. Кіраўніцтва па выпрабаваннях праз
дадзеныя гэта ў адрозненне ад больш класічнага метаду, які ён прапануе
арыентацыя прыкладанняў на працэсы і функцыі,
метад у асноўным падзяляе большасць
старыя сістэмы кіравання.
Аператыўны свет распрацаваны вакол прыкладанняў і функцый
напрыклад, пазыкі, зберажэнні, банкаўскія карты і давер для ўстановы
фінансавыя. Свет dw арганізаваны вакол прадметаў
прынцыпы, такія як кліент, прадавец, прадукт і бізнес.
Выраўноўванне вакол тэм уплывае на дызайн і
на рэалізацыю дадзеныя знойдзены ў dw. Што яшчэ больш важна,
асноўная тэма закранае найбольш важную частку
ключавая структура.
На свет прыкладання ўплывае як дызайн даных
на аснове праектавання працэсу. Свет
dw арыентавана выключна на мадэляванне дадзеныя Ён уключаны
малюнак база дадзеных. Дызайн працэсу (у яго выглядзе
класічны) не з'яўляецца часткай асяроддзя dw.
Адрозненні паміж выбарам працэсу/функцыі і прымянення
выбар па прадметах выяўляюцца і як адрозненні ў змесце
з дадзеныя на падрабязным узроўні. THE дадзеныя dw не ўключаюць i дадзеныя што
не будзе выкарыстоўвацца для працэсу DSS падчас прыкладанняў
аператыўна арыентаваны дадзеныя змяшчаюць i дадзеныя задаволіць
неадкладна функцыянальныя патрабаванні / патрабаванні да апрацоўкі, якія могуць о
менш карысці для аналітыка DSS.
Яшчэ адзін важны спосаб, у якім аператыўныя арыентаваных прыкладанняў
ai дадзеныя адрозніваюцца ад дадзеныя dw знаходзіцца ў дэі-справаздачах дадзеныя. Я дадзеныя
аператыўна падтрымліваць бесперапынную сувязь паміж дзвюма ці больш табліцамі
на аснове бізнес-правіла, якое дзейнічае. THE дадзеныя па dw
яны перасякаюць спектр часу, і адносіны, выяўленыя ў dw
многія. Шмат правілаў гандлю (і, адпаведна, шмат
справаздачы а дадзеныя ) прадстаўлены на складзе а дадзеныя паміж двума о
некалькі табліц.
(Для падрабязнага тлумачэння таго, як узнікаюць адносіны паміж дадзеныя яны
апрацоўваецца ў DW, мы спасылаемся на тэхнічную тэму па гэтым пытанні
пытанне.)
З пункту гледжання розніцы
фундаментальны паміж выбарам функцыянальнага/працэснага прымянення і
выбар прадмета, існуе большая розніца паміж сістэмамі
аператыўная і я дадзеныя і DW.
ІНТЭГРАЦЫЯ ІНТЭГРАЦЫЯ
Найбольш важным аспектам асяроддзя dw з'яўляецца тое, што i дадзеныя знойдзены
яны лёгка інтэгруюцца ў dw. ЗАЎСЁДЫ. БЕЗ
ВЫКЛЮЧЭННІ. Сама сутнасць асяроддзя dw заключаецца ў тым, што i дадзеныя
якія змяшчаюцца ў межах склада інтэграваныя.
Інтэграцыя выяўляецца рознымі спосабамі – ва ўмоўнасцях
вызначаны паслядоўны, у вымярэнні паслядоўных зменных, ст
кадыфікаваныя структуры, якія складаюцца ў фізічных атрыбутах дадзеныя
паслядоўны, і гэтак далей.
На працягу многіх гадоў дызайнеры розных прыкладанняў зрабілі гэта
валоданне мноствам рашэнняў аб тым, як павінна быць заяўлена
быць развітым. Індывідуальныя стылявыя і дызайнерскія рашэнні
прыкладанняў дызайнераў раскрываюць сябе сотнямі спосабаў: у
адрозненні ў кадаванні, ключавая структура, фізічныя характарыстыкі,
ідэнтыфікацыя ўмоўнасцей і гэтак далей. Калектыўная здольнасць мн
Дызайнеры прыкладанняў ствараюць непаслядоўныя праграмы
гэта легендарна. Малюнак 3 паказвае некаторыя адрозненні
важна ў спосабах распрацоўкі прыкладанняў.
Кадзіроўка: Кадзіроўка:
Дызайнеры прыкладанняў выбралі кадаванне палёў -
сэкс- рознымі спосабамі. Дызайнер ўяўляе сэкс як
"м" і "ж". Іншы дызайнер уяўляе сэкс як «1»
і «0». Іншы дызайнер уяўляе сэкс як «ікс» і
"у". Іншы дызайнер уяўляе сэкс як «мужчынскі» і
"жаночы". Не мае вялікага значэння, як сэкс трапляе ў DW. "М"
і "F", напэўна, такія ж добрыя, як і ўсе
прадстаўніцтва.
Важна тое, што з якога б паходжання ні паходзіла поле сэксу,
гэта поле паступае ў DW у паслядоўным інтэграваным стане. Ад
следства, калі поле загружаецца ў DW з
дадатак, дзе яно было прадстаўлена ў фармаце
«М» і «Ж», г.зн дадзеныя неабходна пераўтварыць у фармат DW.
Вымярэнне атрыбутаў: вымярэнне
Атрыбуты:
Распрацоўшчыкі прыкладання вырашылі вымераць трубаправод у
розныя спосабы ў курсе
Некалькі гадоў. Дызайнер захоўвае дадзеныя трубаправода ў
сантыметраў. Іншы дызайнер прыкладанняў захоўвае дадзеныя
трубаправода ў цалях. Яшчэ адзін дызайнер
крамы прыкладанняў i дадзеныя трубаправода ў мільёнах кубічных футаў
у секунду. І іншы дызайнер захоўвае інфармацыю аб
трубаправода ў плане ярдаў. Незалежна ад крыніцы, калі
інфармацыя пра канвеер паступае ў DW, гэта павінна быць
вымяраецца такім жа чынам.
Згодна з паказаннямі на малюнку 3, пытанні інтэграцыі
яны ўплываюць практычна на ўсе аспекты праекта - функцыі
фізічныя багі дадзеныя, дылема наяўнасці больш чым адной крыніцы дадзеныя,
выпуск неадпаведных выяўленых узораў, фарматаў ст дадзеныя
непаслядоўныя і гэтак далей.
Незалежна ад тэмы дызайну, вынік аднолькавы -
i дадзеныя павінны захоўвацца ў DW у адзіночным ліку e
глабальна прымальны спосаб, нават калі аперацыйныя сістэмы
унізе яны захоўваюць па-рознаму я дадзеныя.
Калі аналітык DSS глядзіць на DW, мэта аналітыка
гэта павінна быць эксплуатацыя дадзеныя якія знаходзяцца на складзе,
а не задацца пытаннем аб даверы або паслядоўнасці
дадзеныя.
ВАРЫЯНЦЫЯ ЧАСУ
Усе i я дадзеныя у DW яны дакладныя да пэўнага моманту часу.
Гэтая асноўная характарыстыка ст дадзеныя у DW гэта моцна адрозніваецца ад тых дадзеныя
знойдзены ў працоўным асяроддзі. THE дадзеныя аперацыйнага асяроддзя з'яўляюцца
гэтак жа дакладна, як і ў момант доступу. Іншымі словамі,
у аперацыйным асяроддзі пры доступе да дыска дадзеныя, так
пачакайце, пакуль ён не адлюструе дакладныя значэнні на момант доступу.
Таму што я дадзеныя у DW такія ж дакладныя, як у нейкі момант у
час (г. зн. не «прама цяпер»), гаворыцца, што г.зн дадзеныя знойдзены ў DW
гэта «адхіленні ў часе».
Часовая дысперсія дадзеныя DW згадваецца па-рознаму.
Самы просты спосаб - i дадзеныя DW прадстаўляюць дадзеныя яго a
доўгі часовай гарызонт - ад пяці да дзесяці гадоў. Гарызонт
час, прадстаўлены для працоўнага асяроддзя, значна меншы
▪ ад сённяшніх бягучых значэнняў ад да шасцідзесяці дзевяноста
Праграмы, якія павінны добра працаваць і павінны быць
даступныя для апрацоўкі транзакцый павінны несці
мінімальная колькасць дадзеныя калі яны прызнаюць якую-небудзь ступень
гнуткасць. Такім чынам, у аператыўных прыкладанняў ёсць гарызонт
кароткі тэрмін, як тэма дызайну
аўдыё прыкладання.
Другі спосаб з'яўлення дысперсіі ў часе ў DW - гэта
ключавая структура. Кожная ключавая структура ў DW змяшчае,
імпліцытна або экспліцытна, элемент часу, напрыклад
дзень, тыдзень, месяц і г.д. Элемент часу прысутнічае амаль заўсёды
у ніжняй частцы злучанага ключа, знойдзенага ў DW. У гэтых
у выпадках, элемент часу будзе існаваць імпліцытна, як выпадковасць
дзе ўвесь файл дублюецца ў канцы месяца або квартала.
Трэці спосаб адлюстравання дысперсіі часу заключаецца ў тым, што i дадзеныя Дэль
DW, як толькі належным чынам зарэгістраваны, не можа быць
абноўлены. THE дадзеныя DW, для ўсіх практычных мэтаў, доўгі
серыя здымкаў. Вядома, калі здымкі ёсць
былі зроблены няправільна, то здымкі могуць быць
мадыфікаваны. Але пры ўмове, што здымкі зроблены
правільна, яны не змяняюцца, як толькі яны зроблены. У некаторых
выпадках гэта можа быць неэтычным або нават несапраўдным, што здымкі ў
DW зменены. THE дадзеныя аператыўны, дакладны як у
момант уваходу, іх можна абнаўляць па меры паступлення
неабходнасць.
НЕЛЯТУЧНЫ
Чацвёртая важная характарыстыка DW - гэта энерганезалежнасць.
Выконваюцца абнаўленні, устаўкі, выдаленні і мадыфікацыі
рэгулярна для аперацыйных умоў запісу за запісам. Але
асноўныя маніпуляцыі дадзеныя якія патрэбныя ў DW значна больш
простая. Ёсць толькі два віды аперацый, якія адбываюцца ў
DW – пачатковая загрузка дадзеныя і доступ да дадзеныя. Няма
няма абнаўленняў дадзеныя (у агульным сэнсе
абнаўленне) у DW як звычайная аперацыя апрацоўкі.
Ёсць некаторыя вельмі моцныя наступствы гэтай розніцы
база паміж аператыўнай апрацоўкай і апрацоўкай DW. На ўзроўні
дызайну, трэба быць асцярожным пры абнаўленні
ненармальны не з'яўляецца фактарам у DW з моманту абнаўлення дадзеныя не è
выкананы. Гэта азначае, што на фізічным узроўні праектавання,
можа быць дазволена аптымізаваць доступ да дадзеныя,
у прыватнасці, у працы з тэмамі нармалізацыі і
фізічная дэнармалізацыя. Яшчэ адно наступства прастаты
дзейнасці DW заключаецца ў асноўнай тэхналогіі, для якой выкарыстоўваецца
запусціць асяроддзе DW. Трэба падтрымліваць абнаўленні
запіс за запісам у радку (як гэта часта бывае з
аператыўнай апрацоўкі) тэхналогія павінна мець некатор
вельмі складаныя асновы пры ўяўнай прастаце.
Тэхналогія, якая падтрымлівае рэзервовае капіраванне і аднаўленне, транзакцыі
і цэласнасць дадзеныя і выяўленне і ліквідацыя ўмоў тупіка
даволі складаны і не патрэбны для апрацоўкі DW.
Характарыстыкі DW, арыентацыя на дызайн,
інтэграцыя ст дадзеныя у DW, дысперсія часу і прастата
кіравання ст дадзеныя, усё вядзе да асяроддзя, якое вельмі, вельмі
адрозніваецца ад класічнай аперацыйнай асяроддзя. Крыніца амаль усе
дадзеныя DW з'яўляюцца аперацыйнай асяроддзем. Падумаць хочацца
што існуе масіўная надмернасць дадзеныя паміж двума асяроддзямі.
На самай справе, першае ўражанне многіх людзей - гэта
вялікая празмернасць дадзеныя паміж аперацыйным асяроддзем і аперацыйным асяроддзем
DW. Такая трактоўка павярхоўная і дэманструе адно
адсутнасць разумення таго, што адбываецца ў DW.
На самай справе ёсць мінімум празмернасці дадзеныя паміж аперацыйным асяроддзем
і я дадзеныя DW. Давайце разгледзім наступнае:
▪ Я дадзеныя іх фільтруюць дата што пераходзіць з аперацыйнага асяроддзя
да асяроддзя DW. Многія дадзеныя яны ніколі не праходзяць звонку
ад аперацыйнай асяроддзя. Акрамя таго, што я дадзеныя якія неабходныя для
Апрацоўка DSS знаходзіць свой кірунак у навакольным асяроддзі
▪ часавы гарызонт дадзеныя гэта моцна адрозніваецца ад навакольнага асяроддзя
да іншага. THE дадзеныя у асяроддзі працы яны вельмі крутыя. THE дадзеныя
у DW яны значна старэйшыя. Проста з пункту гледжання
часовага гарызонту вельмі мала перакрываецца
паміж аперацыйным асяроддзем і DW.
▪ DW змяшчае дадзеныя рэзюмэ, якія ніколі не знойдзены
у навакольным асяроддзі
▪ Я дадзеныя перажываюць фундаментальную трансфармацыю ад
момант, калі яны пераходзяць на малюнак 3, ілюструе гэта найбольш
частка дадзеныя істотна зменены па стане
для выбару і перамяшчэння ў DW. Іншымі словамі,
большасць з дадзеныя фізічна мадыфікаваны і
радыкальна, як гэта перанесена ў DW. З пункту гледжання
інтэграцыі не аднолькавыя дадзеныя якія пражываюць
у аперацыйным асяроддзі.
У святле гэтых фактараў празмернасць ст дадзеныя паміж двума асяроддзямі ёсць
рэдкая падзея, якая прыводзіць да менш чым 1% надмернасці паміж імі
асяроддзях.
СТРУКТУРА СКЛАДА
DW маюць выразную структуру. Існуюць розныя ўзроўні рэзюмэ і
дэталі, якія размяжоўваюць DW.
Рознымі кампанентамі DW з'яўляюцца:
▪ Метададзеныя
Dati актуальныя дэталі
Dati са старых дэталяў
Dati крыху абагульнены
Dati высока абагульнены
Безумоўна, галоўны клопат - за дадзеныя дэталяў
плыні. Гэта галоўная праблема, таму што:
▪ Я дадзеныя бягучыя дэталі адлюстроўваюць апошнія падзеі,
якія заўсёды выклікаюць вялікую цікавасць і
▪ я дадзеныя бягучыя дэталі аб'ёмныя, таму што гэта
захоўваецца на самым нізкім узроўні дэталізацыі e
▪ я дадзеныя Актуальныя звесткі амаль заўсёды захоўваюцца на
дыскавае сховішча, доступ да якога хуткі, але дарагі
комплекс ад
I дадзеныя дэталяў, тым старэйшыя яны дадзеныя якія захоўваюцца на
нейкі ўспамін маса. Ён мае доступ эпізадычна, і гэта так
захоўваецца на ўзроўні дэталізацыі, сумяшчальным з дадзеныя дэтальяці
плыні. Пры гэтым захоўваць на носьбіце не абавязкова
альтэрнатыўнае захоўванне, з-за вялікага аб'ёму дадзеныя аб'яднаны с
спарадычны доступ дадзеныя, падтрымка памяці для дадзеныя di
Старыя дэталі звычайна не захоўваюцца на дыску.
I дадзеныя абагульнены трохі з'яўляюцца дадзеныя якія пераганяюцца са дна
узровень дэталізацыі знойдзены на бягучым узроўні дэталізацыі. гэта
Узровень DW амаль заўсёды захоўваецца на дыскавым сховішчы. THE
праблемы праектавання, якія ўзнікаюць перад архітэктарам дадзеныя
у пабудове гэтага ўзроўню DW з'яўляюцца:
▪ У якой адзінцы часу з’яўляецца зроблены вышэй канспект
▪ Які змест, атрыбуты будуць крыху абагульняць
змест дадзеныя
Наступны ўзровень дадзеныя у DW з'яўляецца тое, што з дадзеныя вельмі
зводкі. THE дадзеныя вельмі абагульненыя кампактныя і лёгкія
даступныя. THE дадзеныя часам сустракаюцца вельмі абагульненыя
у асяроддзі DW і ў іншых выпадках i дадзеныя вельмі абагульненыя з'яўляюцца
знаходзіцца па-за непасрэднымі сценамі тэхналогіі, якая змяшчае DW.
(у любым выпадку, я дадзеныя вельмі абагульненыя з'яўляюцца часткай DW
незалежна ад таго, дзе я дадзеныя фізічна размешчаны).
Апошнім кампанентам DW з'яўляюцца метададзеныя. Шмат у чым
метададзеныя знаходзяцца ў іншым вымярэнні, чым іншыя дадзеныя
DW, таму што метададзеныя не ўтрымліваюць ніякіх дата непасрэдна
узята з аперацыйнага асяроддзя. Метададзеныя адыгрываюць асаблівую ролю e
вельмі важны ў DW. Метададзеныя выкарыстоўваюцца як:
▪ каталог, які дапаможа аналітыку DSS знайсці
змест DW,
▪ кіраўніцтва па адлюстраванні дадзеныя пра тое, як я дадзеныя Яны былі
трансфармуецца з аператыўнага асяроддзя ў асяроддзе DW,
▪ кіраўніцтва па алгарытмах, якія выкарыстоўваюцца для абагульнення паміж дадзеныя di
падрабязна токі і я дадзеныя крыху абагульнены, г.зн дадзеныя вельмі
рэзюмэ,
Метададзеныя гуляюць значна больш важную ролю ў асяроддзі DW
чым яны калі-небудзь мелі ў аператыўным асяроддзі
СТАРЫЯ ДЭТАЛІ НОСІВА
Для захоўвання такога роду можна выкарыстоўваць магнітную стужку
дадзеныя. На самай справе існуе вялікая разнастайнасць інструментаў для захоўвання
іх трэба ўлічваць для захавання старых дадзеныя di
дэталь.
У залежнасці ад аб'ёму дадзеныя, частата доступу, кошт
інструментаў і тыпу доступу цалкам верагодна
што іншым інструментам спатрэбіцца стары ўзровень дэталізацыі
у DW.
ПАТОК ДАННЫХ
Ідзе нармальная і прадказальная плынь дадзеныя ўнутры DW.
I дадзеныя увайсці ў DW з аперацыйнай асяроддзя. (УВАГА: ёсць
некаторыя вельмі цікавыя выключэнні з гэтага правіла. Аднак амаль
tutti i дадзеныя увесці DW з аперацыйнай асяроддзя). Дато што i я дадзеныя
яны трапляюць у DW з аперацыйнага асяроддзя, яно трансфармуецца такім, якім было
апісана раней. Пры ўмове ўваходжання ў DW, г.зн дадзеныя яны ўваходзяць у
бягучы ўзровень дэталізацыі, як паказана. Ён знаходзіцца там і выкарыстоўваецца
пакуль не адбудзецца адна з трох падзей:
▪ ачышчаецца,
▪ абагульняецца, і/або
▪ ёсць
Састарэлы працэс у DW рухаецца i дадзеныя актуальныя дэталі
a дадзеныя старых дэталяў, зыходзячы з узросту дадзеныя. Працэс
рэзюмэ выкарыстоўвае дэталі дадзеныя вылічваць i дадзеныя
злёгку абагульнены і вельмі абагульнены ўзроўні дадзеныя. Ёсць
некаторыя выключэнні з паказанага патоку (будуць разгледжаны пазней).
Аднак, як правіла, для пераважнай большасці дадзеныя знойдзены
у DW, паток дадзеныя гэта як на малюнку.
ВЫКАРЫСТАННЕ ДАДЗЕНЫХ
Нядзіўна, што розныя ўзроўні дадзеныя у DW няма
атрымаць розныя ўзроўні выкарыстання. Як правіла, чым вышэй узровень
рэзюмэ, плюс i дадзеныя яны выкарыстоўваюцца.
Шмат ужыванняў адбываецца ў дадзеныя вельмі абагульнены, у той час як старыя
дадзеныя дэталі амаль не выкарыстоўваюцца. Ёсць важкая прычына
перавесці арганізацыю да парадыгмы выкарыстання рэсурсаў. Тым больш у яго
рэзюмэ я дадзеныя, тым хутчэй і больш эфектыўна дабрацца да дадзеныя, сам
un крама выявіць, што ён шмат апрацоўвае на ўзроўні дэталізацыі DW,
тады адпаведная вялікая колькасць машынных рэсурсаў
спажываецца. Прыцягнуць да адказнасці ў інтарэсах кожнага
як на высокім узроўні абагульнення як мага хутчэй.
Для многіх магазінаў аналітык DSS у асяроддзі да DW выкарыстоўваўся
дадзеныя на ўзроўні дэталізацыі. Шмат у чым прыезд ст дадзеныя дэтальяці
гэта нагадвае ахоўную коўдру, нават калі яны даступныя
іншыя ўзроўні рэзюмэ. Адным з накірункаў дзейнасці арх дадзеныя è
адвучыць карыстальніка DSS ад пастаяннага выкарыстання дадзеныя на самым высокім узроўні
нізкая дэталізацыя. Ёсць дзве прычыны
архітэктара в дадзеныя:
▪ усталяванне сістэмы чарджбэка, пры якой аплачвае канчатковы карыстальнік
спажытыя рэсурсы e
▪ якія паказваюць, што час водгуку можа быць вельмі добрым
атрымліваецца, калі паводзіны з i дадзеныя гэта на высокім узроўні
рэзюмэ, у той час як дрэнны час адказу адбываецца ад
паводзіны дадзеныя на нізкім узроўні
ІНШЫЯ РАЗМЕРЫ
Ёсць некаторыя іншыя меркаванні па будаўніцтве і кіраванні
ДВ.
Першае меркаванне - гэта індэксы. THE дадзеныя на вышэйшых узроўнях
рэзюмэ можна свабодна індэксаваць, а i дадзеныя
на больш нізкіх узроўнях дэталізацыі яны настолькі грувасткія, наколькі гэта магчыма
ашчадна індэксаваны. Ад той жа лексемы, г.зн дадзеныя на высокіх узроўнях
дэталі можна адносна лёгка адрамантаваць,
у той час як аб'ём дадзеныя на ніжніх узроўнях ён настолькі вялікі, што i дадзеныя ня
іх можна лёгка адрамантаваць. Адпаведна і мадэль
з дадзеныя і фармальная праца, праведзеная дызайнерскай пазіцыяй
аснова для DW наносіцца амаль выключна на ўзровень
дэталь ток. Іншымі словамі, мадэльная дзейнасць в
дадзеныя яны не прымяняюцца да ўзроўняў абагульнення, амаль у кожным выпадку.
Яшчэ адно структурнае меркаванне - падраздзяленне г
дадзеныя ад DW.
Падзел можна зрабіць на двух узроўнях – на ўзроўні дбм і
ўзровень прыкладання. У дывізіі на ўзроўні дбм, дбм è
інфармаваны аб падраздзяленнях і адпаведна кантралюе іх. У выпадку
падзел на прыкладным узроўні, толькі праграміст
інфармаваны аб дывізіях і адказнасці іх
кіраванне застаецца за ім
Ніжэй за ўзровень дбм, шмат працы выконваецца аўтаматычна. Гэта
шмат гнуткасці, звязанай з аўтаматычным адміністраваннем
падраздзяленні. У выпадку падзелаў на прыкладным узроўні дадзеныя Дэль
інфармацыйнае сховішча, шмат працы кладзецца на праграміста, але
канчатковым вынікам з'яўляецца гнуткасць у адміністраванні дадзеныя у даце
склад
БОЛЬШАЯ АНАМАЛІЯ
У той час як кампаненты ст інфармацыйнае сховішча Яны працуюць, як апісана
амаль для ўсіх дадзеныя, ёсць некаторыя карысныя выключэнні, якія павінны быць
абмяркоўвацца. Выключэннем з'яўляецца тое, што з дадзеныя публічныя зводкі
(публічныя зводныя звесткі). Гэтыя дадзеныя зводкі, якія былі
разлічваецца з інфармацыйнае сховішча але яны выкарыстоўваюцца грамадствам. THE дадзеныя
Публічныя зводкі захоўваюцца і кіруюцца ў інфармацыйнае сховішча,
хоць, як было сказана раней, яны разлічваюцца. THE
бухгалтары працуюць, каб вырабляць іх штоквартальна дадзеныя як
даходы, квартальныя выдаткі, квартальны прыбытак і гэтак далей. Праца
зробленае бухгалтарамі з'яўляецца знешнім для інфармацыйнае сховішча. Аднак я дадзеныя яны
выкарыстоўваецца «ўнутрана» ўнутры кампаніі - ад маркетынг, продажу і г.д.
Яшчэ адна анамалія, якая не будзе абмяркоўвацца, гэта тое, што дадзеныя вонкавы.
Яшчэ адзін выключны выгляд дадзеныя што можна знайсці ў дадзеным
склад - гэта пастаянныя падрабязныя даныя. Гэтыя прычыны
трэба пастаянна захоўваць i дадзеныя на адным узроўні
падрабязна па этычных або юрыдычных прычынах. Калі кампанія ўдзельнічае ў выставе i
звязаных з небяспечнымі рэчывамі работнікаў ёсць неабходнасць дадзеныя
падрабязны і пастаянны. Калі кампанія вырабляе прадукт, які
звязаны з грамадскай бяспекай, якія часткі самалёта ёсць
неабходнасць дадзеныя падрабязны пастаянны, а таксама калі кампанія
заключае небяспечныя кантракты.
Грамадства не можа дазволіць сабе не заўважаць дэталяў, таму што
на працягу наступных некалькіх гадоў, у выпадку судовага працэсу, адкліканне, a
спрэчны будаўнічы дэфект і інш. экспазіцыя кампаніі
гэта можа быць вялікім. У выніку ўзнікае унікальны тып дадзеныя
вядомы як пастаянныя падрабязныя даныя.
Рэзюмэ
Un інфармацыйнае сховішча з’яўляецца аб’ектна-арыентаваным, інтэграваным, варыянтам
часу, зборнік дадзеныя энерганезалежны для падтрымкі патрэб
рашэнне адміністрацыі. Кожная з асноўных функцый
un інфармацыйнае сховішча мае свае наступствы. Плюс іх чатыры
ўзроўні дадзеныя Дэль інфармацыйнае сховішча:
▪ Старая дэталь
▪ Бягучая дэталь
Dati крыху паўтарыў
Dati высока абагульнены
Метададзеныя таксама з'яўляюцца важнай часткай інфармацыйнае сховішча.
АФЕРАТ
Паняцце захоўвання дадзеныя нядаўна атрымаў
шмат увагі і стаў трэндам 90-х
дзякуючы ёмістасці а інфармацыйнае сховішча каб іх пераадолець
абмежаванні сістэм падтрымкі адміністравання, такіх як i
сістэмы падтрымкі прыняцця рашэнняў (СППР) і інфармацыйныя сістэмы
выканаўчы (EIS).
Нават калі канцэпцыя інфармацыйнае сховішча выглядае шматспадзеўна,
рэалізаваць i інфармацыйнае сховішча можа быць праблематычна з-за
буйнамаштабных складскіх працэсаў. Нягледзячы на
складанасць праектаў захоўвання дадзеныя, шмат пастаўшчыкоў
і складскія кансультанты дадзеныя яны сцвярджаюць, што
захоўванне дадзеныя ток не выклікае ніякіх праблем.
Аднак у пачатку гэтага даследчага праекта амаль нічога
былі праведзены незалежныя, строгія і сістэматычныя даследаванні. Ад
Таму цяжка сказаць, што адбываецца насамрэч
у прамысловасці, калі яны пабудаваны інфармацыйнае сховішча.
Гэта даследаванне даследавала практыку захоўвання дадзеныя
сучаснікаў, які накіраваны на развіццё больш багатага разумення
аўстралійскай практыкі. Аналіз літаратуры даў
кантэкст і аснова для эмпірычнага даследавання.
Ёсць шэраг высноў з гэтага даследавання. Першы
месца, гэта даследаванне паказала дзейнасць, якая адбылася
падчас распрацоўкі ст інфармацыйнае сховішча. У многіх раёнах, г.зн дадзеныя сабраліся
пацвердзіла практыку, апублікаваную ў літаратуры. Па-другое
сайт, пытанні і праблемы, якія могуць паўплываць на
Распрацоўка інфармацыйнае сховішча былі выяўленыя гэтым даследаваннем.
Нарэшце, перавагі, атрыманыя ад аўстралійскіх арганізацый, звязаных з
выкарыстанне інфармацыйнае сховішча былі выяўленыя.
Капітолій 1
Кантэкст даследавання
Канцэпцыя сховішчаў дадзеных атрымала шырокае прызнанне
экспазіцыі і ператварылася ў новую тэндэнцыю ў
90-я (McFadden 1996, TDWI 1996, Shah and Milstein 1997,
Шанкс і інш. 1997, Экерсан 1998, Адэльман і Оутс 2000). Гэта
відаць з расце колькасці артыкулаў аб дадзеных
складзіраванне ў гандлёвых выданнях (Little and Gibson 1999).
Шмат артыкулаў (гл., напрыклад, Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett and King 1996, Graham et al. 1996 год,
Сакагуці і Фролік 1996, Альварэс 1997, Брусэл 1997, Кларк
1997, Макарці 1997, О'Донэл 1997, Эдвардс 1998, TDWI
1999) паведамілі пра значныя перавагі, атрыманыя ад арганізацый
якія рэалізуюць i інфармацыйнае сховішча. Яны падтрымалі сваю тэорыю
з анекдатычнымі сведчаннямі паспяховых укараненняў, высокая прыбытковасць
аб лічбах інвестыцый (ROI), а таксама прадастаўленне рэкамендацый
даведачныя або метадалогіі для распрацоўкі інфармацыйнае сховішча
(Шэнкс і інш. 1997, Седан і Бенджамін 1998, Літл і Гібсан
1999). У крайнім выпадку Graham et al. (1996) маюць
паведаміла аб сярэдняй рэнтабельнасці трохгадовых інвестыцый у 401%.
Большая частка сучаснай літаратуры, аднак, занядбала
складанасці, звязаныя з правядзеннем такіх праектаў. Праекты а
інфармацыйнае сховішча звычайна яны складаныя і буйнамаштабныя
таму яны азначаюць высокую верагоднасць няўдачы, калі гэта не так
старанна кантралюецца (Шах і Мільштэйн 1997, Экерсан 1997,
Фолі 1997b, Цымер 1997, Борт 1998, Гібс і Клаймер 1998, Рао
1998). Яны патрабуюць велізарнай колькасці як чалавечых, так і рэсурсаў
фінансавыя, а таксама час і намаганні для іх стварэння (Hill 1998, Crofts 1998). The
тыповы час і неабходныя фінансавыя сродкі адпаведна
каля двух гадоў і двух-трох мільёнаў долараў (Braly 1995, Foley
1997b, Bort 1998, Хамфрыс і інш. 1999). Гэтыя часы і сродкі
фінансавыя ўстановы павінны кантраляваць і кансалідаваць многія аспекты
адрозненні ў сховішчах дадзеных (Cafasso 1995, Hill 1998). На баку
апаратных і праграмных меркаванняў, іншыя функцыі, якія адрозніваюцца
ад здабычы в дадзеныя да працэсаў загрузкі дадзеныя, ад
ёмістасць памяці для кіравання абнаўленнямі і метададзенымі дадзеныя
для навучання карыстальнікаў, неабходна ўлічваць.
На момант пачатку гэтага даследчага праекта было вельмі мала
акадэмічныя даследаванні, праведзеныя ў галіне сховішчаў даных,
асабліва ў Аўстраліі. Гэта было бачна па дэфіцыту тавараў
апублікаваныя ў сховішчах дадзеных у газетах або іншых артыкулах
акадэмікаў таго часу. Многія з акадэмічных твораў
даступна апісаны вопыт ЗША. Адсутнасць
акадэмічныя даследаванні ў галіне сховішча даных sl выклікалі
патрабуюць строгіх даследаванняў і эмпірычных даследаванняў (McFadden 1996,
Шанкс і інш. 1997, Літл і Гібсан 1999). У прыватнасці, вучобы
даследаванняў па працэсе ажыццяўлення інфармацыйнае сховішча
трэба праводзіць для пашырэння ведаў
агульных адносна ажыццяўлення інфармацыйнае сховішча e
паслужыць асновай для будучага даследчага даследавання (Shanks ed
іншыя. 1997, Літл і Гібсан 1999).
Такім чынам, мэта гэтага даследавання - вывучыць тое, што на самой справе
Гэта адбываецца, калі арганізацыі захоўваюць і выкарыстоўваюць даныя
склад у Аўстраліі. У прыватнасці, гэта даследаванне будзе ўключаць
аналіз усяго працэсу развіцця a інфармацыйнае сховішча,
пачынаючы ад ініцыяцыі і планавання праз дызайн і
укараненне і наступнае выкарыстанне ў арганізацыях
аўстралійскі. Акрамя таго, даследаванне таксама будзе спрыяць сучаснай практыцы
вызначэнне абласцей, дзе практыка можа быць развіта далей
палепшана, а неэфектыўнасць і рызыкі могуць быць зведзены да мінімуму або
пазбягаць. Акрамя таго, гэта паслужыць асновай для іншых даследаванняў інфармацыйнае сховішча in
Аўстралія і запоўніць прабел, які зараз існуе ў літаратуры.
Даследчыя пытанні
Мэтай дадзенага даследавання з'яўляецца вывучэнне задзейнічаных мерапрыемстваў
у ажыццяўленні інфармацыйнае сховішча і іх выкарыстанне па
Аўстралійскія арганізацыі. У прыватнасці, вывучаюцца элементы
адносна планавання праекта, распрацоўкі,
эксплуатацыя, выкарыстанне і звязаныя з гэтым рызыкі. Такім чынам, пытанне
гэтага даследавання:
«Якая цяпер практыка інфармацыйнае сховішча у Аўстраліі?"
Каб эфектыўна адказаць на гэтую праблему, а
пэўная колькасць дапаможных даследчых пытанняў. У прыватнасці, тры
з літаратуры былі вылучаны падпытанні, якія з’яўляюцца
прадстаўлены ў раздзеле 2, для кіраўніцтва гэтым даследчым праектам:
Як яны рэалізуюцца i інфармацыйнае сховішча па арганізацыях
аўстраліец? З якімі праблемамі вы сутыкнуліся?
Якія перавагі атрыманы?
Пры адказе на гэтыя пытанні выкарыстоўваўся малюнак
пошукавыя даследаванні, якія выкарыстоўваюць апытанне. Як я вучуся
пошукавыя, адказы на пастаўленыя вышэй пытанні не з'яўляюцца поўнымі
(Shanks et al. 1993, Denscombe 1998). У дадзеным выпадку гэта так
каб палепшыць рэакцыю на іх, патрабуецца трыянгуляцыя
запыты. Аднак следства дасць трывалую аснову для
будучая праца па вывучэнні гэтых пытанняў. Падрабязны
абмеркаванне абгрунтавання метаду і дызайну даследавання
прадстаўлены ў раздзеле 3.
Структура даследчага праекта
Гэты даследчы праект падзелены на дзве часткі: кантэкстуальнае даследаванне
канцэпцыі сховішчаў дадзеных і эмпірычных даследаванняў (гл
малюнак 1.1), кожны з якіх абмяркоўваецца ніжэй.
Частка I: Кантэкстуальнае даследаванне
Першая частка даследавання заключалася ў паўторным вывучэнні в
сучасная літаратура па розных тыпах сховішчаў даных, уключаючы i
сістэмы падтрымкі прыняцця рашэнняў (СППР), інфармацыйныя сістэмы
выканаўчы (EIS), тэматычныя даследаванні ст інфармацыйнае сховішча і паняцці даты
склад. Акрамя таго, вынікі форумаў інфармацыйнае сховішча і багі
сустрэчы груп для экспертаў і прафесіяналаў, якія праводзяцца групай в
Даследаванне Monash DSS унесла свой уклад у гэты этап даследавання
які прызначаўся для атрымання інфармацыі аб практыцы дадзеных
склад і вызначыць рызыкі, звязаныя з іх прыняццем.
У гэты перыяд кантэкстнага вывучэння, разумення
праблемнай вобласці была створана, каб даць веды аб
асновай для наступных эмпірычных даследаванняў. Аднак гэта
гэта быў пастаянны працэс, пакуль ішло даследаванне
даследаванні.
Частка II: Эмпірычнае даследаванне
Адносна новая канцэпцыя сховішча даных, асабліва
у Аўстраліі, стварыла неабходнасць правесці расследаванне для
атрымаць шырокую карціну вопыту выкарыстання. гэта
частка была выканана, як толькі праблемны дамен быў
быў створаны шляхам шырокага агляду літаратуры. Канцэпцыя
сховішчаў дадзеных, сфармаваных на этапе кантэкстнага даследавання
быў выкарыстаны ў якасці ўваходных дадзеных для першапачатковай анкеты гэтага даследавання.
Пасля гэтага была праведзена праверка анкеты. Вы эксперты па спатканнях
склад удзельнічаў у выпрабаванні. Мэта тэсту
Першапачатковая анкета павінна была праверыць паўнату і дакладнасць
некаторыя пытанні. Па выніках тэставання складаецца анкета
быў зменены, і змененая версія была адпраўлена
удзельнікаў апытання. Анкеты вярнуліся тады былі
прааналізаваны для i дадзеныя у табліцах, дыяграмах і іншых фарматах. THE
вынікі аналізу дадзеныя сфармаваць імгненную фатаграфію
практыка захоўвання дадзеных у Аўстраліі.
АГЛЯД СХовішча даных
Канцэпцыя сховішча даных развівалася з удасканаленнямі
камп'ютэрных тэхналогій.
Яна накіравана на пераадоленне праблем, з якімі сутыкаюцца групы
падтрымка прыкладанняў, такіх як сістэма падтрымкі прыняцця рашэнняў (DSS) e
Выканаўчая інфармацыйная сістэма (EIS).
У мінулым галоўнай перашкодай для гэтых прыкладанняў было
немагчымасць гэтых прыкладанняў забяспечыць a база дадзеных
неабходныя для аналізу.
У асноўным гэта выклікана характарам працы
кіравання. Інтарэсы кіраўніцтва кампаніі розныя
пастаянна ў залежнасці ад апрацоўванай вобласці. Таму я дадзеныя
фундаментальныя для гэтых прыкладанняў павінны быць у стане
хутка мяняюцца ў залежнасці ад часткі, якую трэба апрацаваць.
Гэта азначае, што я дадзеныя павінны быць даступныя ў форме
дастаткова для неабходных аналізаў. Фактычна групы падтрымкі в
прыкладанняў у мінулым было вельмі цяжка сабраць выд
інтэграваць дадзеныя са складаных і разнастайных крыніц.
У астатняй частцы гэтага раздзела прадстаўлены агляд канцэпцыі
сховішчы даных і займаецца тым, як інфармацыйнае сховішча можа пераадолець
Праблемы групы падтрымкі прыкладанняў.
Тэрмін "Склад дадзеных” быў выпушчаны Ўільямам Інманам у 1990 годзе.
Яго часта цытуемае вызначэнне бачыць Склад дадзеных Прыходзіць
калекцыя дадзеныя прадметна-арыентаваны, інтэграваны, энерганезалежны і варыятыўны
з часам у падтрымку кіраўніцкіх рашэнняў.
Выкарыстоўваючы гэтае вызначэнне, Inmon падкрэслівае, што i дадзеныя рэзідэнт
у ун інфармацыйнае сховішча павінны валодаць наступнымі 4
асаблівасці:
▪ Прадметна-арыентаваны
▪ Інтэграваны
▪ Энерганезалежны
▪ Зменлівы ў часе
Пад прадметна-арыентаваным Inmon маецца на ўвазе, што я дадзеныя у даце
склад у найбуйнейшых арганізацыйных галінах, якія былі
вызначаны ў мадэлі дадзеныя. Напрыклад усе дадзеныя адносна я кліенты
змяшчаюцца ў прадметнай вобласці кліенты. Гэтаксама і ўсе
дадзеныя якія адносяцца да прадуктаў, змяшчаюцца ў прадметнай вобласці
ПРАДУКТЫ.
Інтэграваны Inmon азначае, што i дадзеныя зыходзячы з розных
платформы, сістэмы і месцы аб'ядноўваюцца і захоўваюцца ў
адзінае месца. У выніку дадзеныя падобнае павінна быць ператворана
у паслядоўных фарматах, каб іх можна было дадаваць і параўноўваць
лёгка.
Напрыклад, мужчынскі і жаночы пол прадстаўлены
літарамі M і F у адной сістэме і з 1 і 0 у другой. Для
інтэграваць іх правільным чынам, адзін або абодва фарматы павінны
трансфармавацца так, каб абодва фарматы былі аднолькавымі. У гэтым
выпадку мы можам змяніць M на 1 і F на 0 ці наадварот. Арыентаваны на
прадмет і інтэграваны паказваюць, што ст інфармацыйнае сховішча ён прызначаны для
забяспечваюць функцыянальнае і папярочнае бачанне дадзеныя Гэта дае частка
кампаніі.
Пад энерганезалежнымі ён мае на ўвазе, што i дадзеныя ў інфармацыйнае сховішча яны застаюцца
паслядоўнае і абнаўленне дадзеныя гэта не трэба. Замест гэтага кожны
змяніць у дадзеныя дадаюцца арыгіналы база дадзеных даты
склад. Гэта азначае, што гістарычная дзеі дадзеныя змяшчаецца ў
інфармацыйнае сховішча.
Для зменных з часам Inmon паказвае, што i дадзеныя ў інфармацыйнае сховішча
заўсёды ўтрымліваюць індыкатары часу дадзеныя тыпe
перасекчы пэўны часавы гарызонт. Напрыклад а
інфармацыйнае сховішча можа ўтрымліваць 5-гадовыя гістарычныя каштоўнасці кліенты даў
1993 - 1997 гг. Наяўнасць гісторыі і часовага шэрагу
з дадзеныя дазваляе аналізаваць тэндэнцыі.
Un інфармацыйнае сховішча ён можа сабраць сваё дадзеныя ад сістэм
OLTP;ад вытокаў дадзеныя знешнімі для арганізацыі і/або іншымі спецыялістамі
праекты сістэмы захопу дадзеныя.
I дадзеныя экстракты могуць прайсці працэс ачысткі, ст
гэты выпадак я дадзеныя яны трансфармуюцца і інтэгруюцца, перш чым быць
захоўваецца ў база дадзеных Дэль інфармацыйнае сховішча. Затым, я дадзеныя
жыхароў у межах в база дадзеных Дэль інфармацыйнае сховішча даступныя
да сродкаў доступу і аднаўлення канчатковага карыстальніка. Выкарыстоўваючы
гэтыя інструменты канчатковы карыстальнік можа атрымаць доступ да інтэграванага выгляду
арганізацыі ст дадзеныя.
I дадзеныя жыхароў у межах в база дадзеных Дэль інфармацыйнае сховішча яны
захоўваюцца як у падрабязным, так і ў зводным фарматах.
Узровень рэзюмэ можа залежаць ад характару дадзеныя. Я дадзеныя
падрабязны можа складацца з дадзеныя бягучы e дадзеныя гісторыкі
I дадзеныя роялці не ўключаны ў інфармацыйнае сховішча пакуль я дадзеныя
ў інфармацыйнае сховішча абнаўляюцца.
У дадатак да захоўвання я дадзеныя сябе, а інфармацыйнае сховішча можа таксама
захоўваць іншы тып дата называецца METADATA, якія
апісаць я дадзеныя жыхароў у яго база дадзеных.
Ёсць два тыпу метаданых: метаданыя распрацоўкі і метаданыя распрацоўкі
аналізы.
Метададзеныя распрацоўкі выкарыстоўваюцца для кіравання і аўтаматызацыі
працэсы здабычы, ачысткі, адлюстравання і загрузкі дадзеныя ў
інфармацыйнае сховішча.
Інфармацыя, якая змяшчаецца ў метададзеных распрацоўкі, можа ўтрымліваць
дэталі аперацыйных сістэм, дэталі элементаў для здабывання,
мадэль дадзеныя Дэль інфармацыйнае сховішча і правілы кампаніі
канверсія дадзеныя.
Другі тып метададзеных, вядомы як метададзеныя аналітыкі
дазваляе канчатковаму карыстальніку даследаваць змесціва даных
склад, каб знайсці дадзеныя даступныя і што яны азначаюць у тэрмінах
ясна і нетэхнічна.
Таму метаданыя аналітыкі працуюць як мост паміж дадзенымі
склад і прыкладання для канчатковых карыстальнікаў. Гэтыя метададзеныя могуць
змяшчае бізнес-мадэль, апісанне дадзеныя карэспандэнты
у бізнес-мадэль, загадзя вызначаныя запыты і справаздачы,
інфармацыя для ўваходу карыстальнікаў і індэкс.
Метададзеныя аналізу і распрацоўкі павінны быць аб'яднаны ў адзін
інтэграванае ўтрыманне метададзеных для належнага функцыянавання.
На жаль, многія з існуючых інструментаў маюць свае ўласныя
метададзеных, і ў цяперашні час няма існуючых стандартаў, якія
дазваляюць інструментам сховішча даных інтэграваць іх
метададзеныя. Каб выправіць гэтую сітуацыю многія трэйдары
асноўныя інструменты сховішча даных сфармавалі Meta Data
Савет, які пазней стаў Кааліцыяй метададзеных.
Мэта гэтай кааліцыі - стварыць набор метададзеных
стандарт, які дазваляе выкарыстоўваць розныя інструменты для захоўвання дадзеных
канвертаваць метададзеныя
Іх намаганні прывялі да нараджэння Меты
Спецыфікацыя абмену дадзенымі (MDIS), якая дазволіць абмен
інфармацыі паміж архівамі Microsoft і адпаведнымі файламі MDIS.
Існаванне дадзеныя як абагульненыя/праіндэксаваныя, так і падрабязныя дае
карыстальніку магчымасць правесці ДРЭЛЬ ДРОВ
(свідраваць) давай дадзеныя індэксуюцца на падрабязныя і наадварот.
Існаванне дадзеныя падрабязныя гісторыі дазваляюць ствараць
аналіз тэндэнцый з цягам часу. Акрамя таго, метаданыя аналізу могуць
выкарыстоўваць у якасці каталога база дадзеных Дэль інфармацыйнае сховішча для
дапамагчы канечным карыстальнікам знайсці i дадзеныя неабходна.
У параўнанні з сістэмамі OLTP з іх здольнасцю падтрымліваць
аналіз дадзеныя і справаздачнасць, ст інфармацыйнае сховішча гэта разглядаецца як сістэма
больш падыходзіць для інфармацыйных працэсаў, такіх як стварэнне і
адказваць на запыты і складаць справаздачы. Наступны раздзел
падрабязна выдзеліць адрозненні дзвюх сістэм.
СКЛОВІШЧА ДАННЫХ СУПРАЦЬ СІСТЭМ OLTP
Многія інфармацыйныя сістэмы ў арганізацыях
Яны прызначаны для падтрымкі штодзённых аперацый. Гэтыя
сістэмы, вядомыя як OLTP SYSTEMS, захоп транзакцый
пастаянна абнаўляецца штодня.
I дадзеныя у рамках гэтых сістэм яны часта мадыфікуюцца, дадаюцца або
выдалены. Напрыклад, адрас кліента амаль не мяняецца
ён перамяшчаецца з аднаго месца ў другое. У дадзеным выпадку новы адрас
будзе зарэгістраваны шляхам змены поля адраса база дадзеных.
Галоўная задача гэтых сістэм - знізіць выдаткі
транзакцый і ў той жа час скараціць час апрацоўкі.
Прыклады сістэм OLTP ўключаюць важныя дзеянні, такія як запіс
бухгалтарскі ўлік заказаў, налічэнне заработнай платы, рахункі-фактуры, вытворчасць, інтэлектуальныя паслугі кліенты.
У адрозненне ад сістэм OLTP, якія ствараліся для кожнага працэсу
на аснове транзакцый і падзей, г.зн інфармацыйнае сховішча яны былі створаны
для забеспячэння падтрымкі працэсаў, заснаваных на аналітыцы дадзеныя і ўверх
працэсы прыняцця рашэнняў.
Звычайна гэта дасягаецца інтэграцыяй i дадзеныя з розных сістэм
OLTP і знешні ў адным «кантэйнеры». дадзеныя, як абмяркоўвалася
у папярэднім раздзеле.
Мадэль працэсу сховішча дадзеных Monash
Мадэль працэсу для інфармацыйнае сховішча Monash быў распрацаваны
Даследчыкі з Monash DSS Research Group заснаваны на
літаратур ст інфармацыйнае сховішча, аб вопыце падтрымкі в
распрацоўка сістэмных палёў, абмеркаванне з пастаўшчыкамі
прыкладання для выкарыстання на інфармацыйнае сховішча, на групу экспертаў
ва ўжытку інфармацыйнае сховішча.
Фазы: пачатак, планаванне, развіццё і эксплуатацыя
Тлумачэнні. Дыяграма тлумачыць ітэрацыйную прыроду або
эвалюцыйнае развіццё а інфармацыйнае сховішча працэс з выкарыстаннем
двухбаковыя стрэлкі, размешчаныя паміж рознымі фазамі. У гэтым
«ітэратыўны» і «эвалюцыйны» кантэкст азначае, што ў кожным
этап працэсу, дзейнасць па рэалізацыі можа быць зроблена
заўсёды распаўсюджваецца назад да папярэдняга этапу. Гэта
з-за характару праекта а інфармацыйнае сховішча нель квале
дадатковыя запыты ўзнікаюць у любы час
канчатковага карыстальніка. Напрыклад, на этапе развіцця a
працэс інфармацыйнае сховішча, адзін запытваецца канчатковым карыстальнікам
новае вымярэнне або прадметная вобласць, якая не належала да
першапачатковы план, яго трэба дадаць у сістэму. гэта
выклікае змены ў праекце. У выніку каманда в
дызайн павінен змяніць патрабаванні дакументаў, створаных да гэтага часу
на этапе праектавання. У многіх выпадках сучасны стан ст
праект павінен вярнуцца да фазы праектавання, дзе
новы запыт павінен быць дададзены і задакументаваны. Карыстальнік
канчатковы павінен быць у стане бачыць канкрэтную дакументацыю разглядаецца ei
змены, якія былі зроблены на этапе распрацоўкі. Ў канцы
гэты цыкл распрацоўкі праект павінен атрымаць выдатныя водгукі
абедзве каманды, каманда распрацоўшчыкаў і каманда карыстальнікаў. THE
зваротная сувязь потым паўторна выкарыстоўваецца для паляпшэння будучага праекта.
Планаванне магутнасці
Dw, як правіла, вельмі вялікага памеру і расце
вельмі хутка (Best 1995, Rudin 1997a) пасля
колькасць дадзеныя гісторыі, якія яны захоўваюць ад іх працягласці. там
рост таксама можа быць выкліканы дадзеныя дадатковыя элементы, запытаныя
карыстальнікаў, каб павялічыць каштоўнасць дадзеныя што ў іх ужо ёсць. Ад
такім чынам, патрабаванні да захоўвання дадзеныя possono
быць значна пашыраны (Eckerson 1997). Так яно і ёсць
неабходна забяспечыць шляхам планавання
ёмістасць, з якой можа расці сістэма, якая будзе пабудавана
рост патрэб (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
Пры планаванні маштабаванасці dw трэба ведаць
чаканы рост памеру інвентара, тыпы пытанняў
верагодна, будзе выканана, і колькасць канчатковых карыстальнікаў, якія падтрымліваюцца (лепш
1995, Rudin 1997b, Foley 1997a). Стварэнне маштабаваных прыкладанняў
патрабуе спалучэння маштабаваных серверных тэхналогій і метадаў
распрацоўкі маштабуемых прыкладанняў (Best 1995, Rudin 1997b.
Абодва неабходныя пры стварэнні прыкладання
надзвычай маштабуецца. Маштабуюцца серверныя тэхналогіі могуць
дазваляе лёгка і выгадна дадаваць сховішча, памяць і
ЦП без пагаршэння прадукцыйнасці (Lang 1997, Telephony 1997).
Ёсць дзве асноўныя маштабуемыя серверныя тэхналогіі: выліч
сіметрычная множная (SMP) і масіўная апрацоўка
паралельна (MPP) ) (IDC 1997, Humphries et al. 1999). Сервер
SMP звычайна мае некалькі працэсараў, якія падзяляюць адну памяць,
шынная сістэма і іншыя рэсурсы (IDC 1997, Humphries et al. 1999).
Для павелічэння можна дадаць дадатковыя працэсары
ла суа моц вылічальны. Яшчэ адзін спосаб павялічыць
моц вылічальнай магутнасці сервера SMP, каб аб'яднаць шматлікія
СМП машыны. Гэты метад вядомы як кластэрызацыя (Humphries
і інш. 1999). Сервер MPP, з іншага боку, мае некалькі працэсараў кожны
з уласнай памяццю, сістэмай шыны і іншымі рэсурсамі (IDC 1997,
Хамфрыс і інш. 1999). Кожны працэсар называецца вузлом. А
аументо дэла моц вылічальных можа быць дасягнута
даданне дадатковых вузлоў да сервераў MPP (Humphries et al.
1999).
Слабы бок сервераў SMP - занадта шмат аперацый уводу-вываду
(I/O) можа перагрузіць сістэму шыны (IDC 1997). гэта
праблема не ўзнікае на серверах MPP, так як кожны
працэсар мае ўласную сістэму шыны. Аднак узаемасувязі
паміж кожным вузлом яны, як правіла, значна павольней, чым шынная сістэма
СМП. Акрамя таго, серверы MPP могуць дадаваць пласт
дадатковая складанасць для распрацоўшчыкаў прыкладанняў (IDC
1997). Такім чынам можна паўплываць на выбар паміж SMP і MPP серверамі
многімі фактарамі, у тым ліку складанасцю пытанняў, узаемааднос
цана/прадукцыйнасць, патрабаваная ачышчальная здольнасць, ст
прадухілена прымяненне dw і павелічэнне памеру база дадзеных
dw і ў колькасці канчатковых карыстальнікаў.
Шматлікія метады праектавання маштабаваных прыкладанняў
можа выкарыстоўвацца пры планаванні магутнасці. адзін
выкарыстоўвае розныя перыяды апавяшчэнняў, такія як дні, тыдні, месяцы і гады.
Маючы розныя перыяды паведамлення, база дадзеных можна падзяліць на
часткі лёгка згрупаваць разам (Inmon et al. 1997). Яшчэ адзін
Тэхніка заключаецца ў выкарыстанні зводных табліц, якія пабудаваны
Падводзячы вынікі дадзеныя da дадзеныя падрабязна. Такім чынам, я дадзеныя рэзюмэ больш
кампактны, чым падрабязны, які патрабуе менш месца ў памяці.
Такім чынам дадзеныя дэталі можна захоўваць на дыску
таннейшае захоўванне, што дазваляе зэканоміць яшчэ больш месца для захоўвання.
Хоць выкарыстанне зводных табліц можа зэканоміць месца
памяці, яны патрабуюць шмат намаганняў, каб падтрымліваць іх у актуальным стане
у адпаведнасці з камерцыйнымі патрэбамі. Аднак гэтая методыка ёсць
шырока выкарыстоўваецца і часта выкарыстоўваецца ў спалучэнні з тэхнікай
папярэдні (Лепшы 1995, Інмон 1996a, Чаўдуры і Даял
1997).
вызначальны Склад дадзеных Тэхнічны
Архітэктуры Вызначэнне тэхнікі
архітэктуры dw
Першыя карыстальнікі сховішчаў даных у першую чаргу задумалі
цэнтралізаваная рэалізацыя dw, дзе ўсе дадзеныя, уключаны
i дадзеныя знешнія, былі аб'яднаны ў адзінае,
фізічнае захоўванне (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Асноўная перавага такога падыходу ў тым, што канчатковыя карыстальнікі
Я магу атрымаць доступ да прагляду ў прадпрымальніцкім маштабе
(прадпрыемства) dei дадзеныя арганізацыйныя (Ovum 1998). Іншы
Перавага ў тым, што ён прапануе стандартызацыю дадзеныя праз
арганізацыя, што азначае, што існуе толькі адна версія або
вызначэнне кожнай тэрміналогіі, якая выкарыстоўваецца ў дэпазіце dw
(reposity) метададзеныя (Flanagan and Safdie 1997, Ovum 1998). The
недахоп гэтага падыходу, з іншага боку, у тым, што ён дарагі і складаны
будзе пабудаваны (Flanagan and Safdie 1997, Ovum 1998, Inmon et al.
1998). Неўзабаве пасля архітэктуры захоўвання дадзеныя
стала папулярнай цэнтралізаваная, эвалюцыянавала канцэпцыя здабычы
найменшых падмностваў ст дадзеныя для падтрымкі патрэбаў
канкрэтныя прыкладанні (Varney 1996, IDC 1997, Berson and Smith
1997, паўліна 1998). Гэтыя невялікія сістэмы з'яўляюцца вытворнымі ад больш
вялікі інфармацыйнае сховішча цэнтралізаваны. Яны называюцца дата
залежныя ведамасныя склады або залежныя вітрыны даных.
Архітэктура залежнай вітрыны дадзеных вядомая як
трох'ярусная архітэктура, дзе першы ўзровень складаецца з даных
цэнтралізаваны склад, другая складаецца са складоў дадзеныя
ведамасны і трэці складаецца з доступу да дадзеныя і з інструментаў ст
аналізу (Demarest 1994, Inmon et al. 1997).
Вітрыны дадзеных звычайна будуюцца пасля інфармацыйнае сховішча
цэнтралізавана будавалася для задавальнення патрэб в
канкрэтных адзінак (White 1995, Varney 1996).
Вітрыны дадзеных захоўваюць дадзеныя вельмі актуальна ў дачыненні да дэталяў
адзінства (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
Перавага гэтага метаду ў тым, што не будзе дата ня
інтэграваны і што я дадзеныя яны будуць менш лішнімі ў дадзеных
marts так як усе дадзеныя яны прыходзяць са склада дадзеныя інтэграваны.
Яшчэ адна перавага ў тым, што паміж кожным будзе мала сувязяў
вітрыны дадзеных і звязаныя з імі крыніцы дадзеныя таму што кожная вітрына дадзеных мае толькі
крыніца дадзеныя. Плюс з гэтай архітэктурай на месцы, карыстальнікі
фінал усё яшчэ можа атрымаць доступ да агляду дадзеныя
карпаратыўныя арганізацыі. Гэты метад вядомы як
метад зверху ўніз, пры якім вітрыны даных будуюцца пасля даных
склад (Паўлін 1998, Гоф 1998).
Павелічэнне неабходнасці паказаць вынікі рана, некаторыя
арганізацыі пачалі будаваць незалежныя вітрыны даных
(Фланаган і Сафдзі 1997, Уайт 2000). У гэтым выпадку вітрыны дадзеных
яны бяруць сваё дадзеныя прама з асноў дадзеныя OLTP, а не ад
цэнтралізаванае і інтэграванае сховішча, што пазбаўляе ад неабходнасці
ёсць цэнтральнае сховішча на сайце.
Кожная вітрына дадзеных патрабуе хаця б адной спасылкі на яе крыніцы
di дадзеныя. Адзін недахоп - наяўнасць некалькіх спасылак на кожную дату
mart заключаецца ў тым, што ў параўнанні з дзвюма папярэднімі архітэктурамі
празмернасць дадзеныя значна павялічваецца.
Кожная вітрына дадзеных павінна захоўваць усе дадзеныя запытаны лакальна для
не ўплываюць на сістэмы OLTP. Гэта выклікае тое, што i дадзеныя
яны захоўваюцца ў розных вітрынах дадзеных (Inmon et al. 1997).
Яшчэ адным недахопам гэтай архітэктуры з'яўляецца тое, што яна вядзе да
стварэнне складаных узаемасувязяў паміж вітрынамі даных і іх
крыніцы дадзеныя якія цяжка выконваць і кантраляваць (рэд. Inmon
іншыя. 1997).
Яшчэ адным недахопам з'яўляецца тое, што канчатковыя карыстальнікі не могуць сілкавацца
атрымаць доступ да агляду інфармацыі аб кампаніі, як i дадзеныя
розных вітрын дадзеных не інтэграваныя (Ovum 1998).
Яшчэ адным недахопам з'яўляецца тое, што іх можа быць некалькі
вызначэнне для кожнай тэрміналогіі, якая выкарыстоўваецца ў вітрынах даных, якія яна стварае
неадпаведнасці ст дадзеныя у арганізацыі (Ovum 1998).
Нягледзячы на ​​​​разгледжаныя вышэй недахопы, незалежныя вітрыны дадзеных
яны па-ранейшаму прыцягваюць цікавасць многіх арганізацый (IDC 1997).
Адзін з фактараў, які робіць іх прывабнымі, - гэта тое, што яны хутчэй развіваюцца
і патрабуе менш часу і рэсурсаў (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Адпаведна, у асноўным служаць
у якасці тэставых праектаў, якія можна выкарыстоўваць для ідэнтыфікацыі
хутка выявіць перавагі і/або недахопы ў праекце (Parsaye
1995, Braly 1995, Newing 1996). У дадзеным выпадку частка ад
рэалізаваць у пілотным праекце павінна быць невялікім, але важным
для арганізацыі (Newing 1996, Mansell-Lewis 1996).
Вывучаючы прататып, канчатковыя карыстальнікі і адміністрацыя могуць
вырашыць, працягваць ці спыняць праект (Фланаган і Сафдзі
1997).
Калі рашэнне будзе працягвацца, вітрыны дадзеных для іншых сектараў
яны павінны быць пабудаваны па адным. Ёсць два варыянты для
канчатковыя карыстальнікі ў залежнасці ад іх патрэбаў у пабудове даных
незалежныя матры: інтэграваныя/федэратыўныя і неінтэграваныя (Ovum
1998)
У першым спосабе кожны новы вітрыну дадзеных павінен быць пабудаваны
на аснове сучасных вітрын дадзеных і мадэлі дадзеныя выкарыстоўваецца
фірмай (Varney 1996, Berson and Smith 1997, Peacock 1998).
Неабходнасць выкарыстання мадэлі дадзеныя кампаніі робіць гэта неабходным
гарантаваць, што існуе толькі адно вызначэнне для кожнай тэрміналогіі
выкарыстоўваецца праз вітрыны даных, гэта таксама для таго, каб даныя
Розныя кірмашы можна аб'ядноўваць, каб атрымаць агляд
карпаратыўная інфармацыя (Bresnahan 1996). Гэты метад ёсць
называецца знізу ўверх і лепш за ўсё, калі ёсць абмежаванне на
фінансавыя сродкі і час (Flanagan and Safdie 1997, Ovum 1998,
паўлін 1998, Гоф 1998). У другім метадзе - вітрыны дадзеных
пабудаваны можа задаволіць патрэбы толькі канкрэтнай адзінкі.
Разнавіднасцю аб'яднанай вітрыны дадзеных з'яўляецца інфармацыйнае сховішча distribuito
у якім база дадзеных прамежкавае праграмнае забеспячэнне хаба-сервера выкарыстоўваецца для аб'яднання многіх
вітрыны дадзеных у адным сховішчы дадзеныя распаўсюджваецца (Белы 1995). У
гэты выпадак, я дадзеныя кампаніі размеркаваны ў некалькіх вітрынах дадзеных.
Запыты канчатковых карыстальнікаў накіроўваюцца база дадзеных
прамежкавае праграмнае забеспячэнне сервернага цэнтра, якое здабывае ўсе дадзеныя запытаны дадзенымі
marts і вяртае вынікі праграмам канчатковага карыстальніка. гэта
метад прадастаўляе дзелавую інфармацыю канчатковым карыстальнікам. аднак,
Праблемы вітрын дагэтуль не ліквідаваны
незалежная. Ёсць яшчэ адна архітэктура, якую можна выкарыстоўваць
тэлефануйце інфармацыйнае сховішча віртуальны (Белы 1995). Аднак гэта
архітэктура, апісаная на малюнку 2.9, не з'яўляецца архітэктурай
захоўвання дадзеныя сапраўдны, бо ён не перамяшчае груз
ад сістэм OLTP да інфармацыйнае сховішча (Demarest 1994).
Фактычна запыты а дадзеныя канчатковымі карыстальнікамі перайшлі да
Сістэмы OLTP, якія вяртаюць вынікі пасля апрацоўкі
запыты карыстальнікаў. Хоць гэтая архітэктура дазваляе карыстальнікам
фінал для стварэння справаздач і фармулявання запытаў, не можа забяспечыць i
дадзеныя гісторыя і агляд інфармацыі аб кампаніі, як i дадзеныя
з розных сістэм OLTP не інтэграваныя. Такім чынам, гэты
архітэктуры не можа задаволіць аналіз дадзеныя складаныя такія як
прыклады прагнозаў.
Выбар праграм доступу і доступу
аднаўленне дадзеныя
Мэта пабудовы а інфармацыйнае сховішча гэта перадаваць
інфармацыя для канчатковых карыстальнікаў (Inmon et al 1997, Poe 1996,
McFadden 1996, Shanks et al 1997, Hammergren 1998); адзін або
множны доступ і аднаўленне прыкладанняў дадзеныя павінны быць прадастаўлены. каб
Сёння існуе вялікая разнастайнасць гэтых прыкладанняў на выбар
выбраць (Hammergren 1998, Humphries et al. 1999). The
выбраныя прыкладання вызначаюць поспех намаганняў
захоўвання дадзеныя у арганізацыі, таму што
прыкладання з'яўляюцца найбольш бачнай часткай інфармацыйнае сховішча да карыстальніка
канчатковы (Inmon et al. 1997, Poe 1996). Каб атрымалася спатканне
склад, павінен мець магчымасць падтрымліваць аналітычную дзейнасць дадзеныя
канчатковага карыстальніка (Poe 1996, Seddon and Benjamin 1998, Eckerson
1999). Такім чынам, «узровень» таго, што хоча канчатковы карыстальнік, павінен быць
ідэнтыфікаваны (Poe 1996, Mattison 1996, Inmon et al 1997,
Хамфрыс і інш. 1999).
Наогул кажучы, канчатковых карыстальнікаў можна падзяліць на тры групы
катэгорыі: кіраўнікі, бізнес-аналітыкі і дасведчаныя карыстальнікі (Poe
1996 г., Хамфрыс і інш., 1999 г.). Патрэбны выканаўчыя карыстальнікі
лёгкі доступ да наканаваных набораў справаздач (выд. Humphries
іншыя 1999). Гэтыя справаздачы можна лёгка атрымаць з
навігацыя па меню (Poe 1996). Акрамя таго, справаздачы павінны быць
прадставіць інфармацыю з дапамогай графічнага адлюстравання
такія як табліцы і шаблоны для хуткай транспарціроўкі
інфармацыі (Humphries et al. 1999). Бізнес-аналітыкі, якія гэтага не робяць
у іх могуць быць тэхнічныя магчымасці для развіцця адносін
нуль самастойна, яны павінны быць у стане змяніць бягучыя адносіны
задаволіць свае спецыфічныя патрэбы (Poe 1996, Humphries et al
1999). Дасведчаныя карыстальнікі, з іншага боку, - гэта тып канчатковых карыстальнікаў, якія
мець магчымасць ствараць і пісаць запыты і справаздачы з
нуль (Poe 1996, Humphries et al. 1999). Яны тыя, хто
распрацоўваць справаздачы для іншых тыпаў карыстальнікаў (Poe 1996, Humphries
і іншыя 1999).
Пасля вызначэння патрабаванняў канчатковага карыстальніка неабходна выканаць
выбар прыкладанняў доступу і аднаўлення дадзеныя сярод усіх
даступныя (Poe 1996, Inmon et al. 1997).
Доступ да дадзеныя і інструменты пошуку могуць быць
класіфікуюцца на 4 тыпу: інструмент OLAP, інструмент EIS/DSS, інструмент запытаў і
інструменты справаздачнасці і аналізу даных.
Інструменты OLAP дазваляюць карыстальнікам ствараць спецыяльныя запыты, а таксама
тых, што зроблены на база дадзеных Дэль інфармацыйнае сховішча. Плюс гэтыя прадукты
дазваляюць карыстальнікам дэталёва з дадзеныя агульныя для тых
падрабязна.
Інструменты EIS/DSS забяспечваюць справаздачнасць кіраўнікоў у выглядзе аналізу "што, калі".
і доступ да справаздач па меню. Справаздачы павінны быць
прадусталяваны і аб'яднаны з меню для палягчэння навігацыі.
Інструменты запытаў і справаздач дазваляюць карыстальнікам ствараць справаздачы
прадвызначаны і канкрэтны.
Інструменты інтэлектуальнага аналізу дадзеных выкарыстоўваюцца для выяўлення адносін, якія
можа праліць новае святло на забытыя аперацыі ў дадзеныя Дэль
сховішча дадзеных.
Разам з аптымізацыяй патрабаванняў кожнага тыпу карыстальнікаў, г.зн
Выбраныя інструменты павінны быць інтуітыўна зразумелымі, эфектыўнымі і простымі ў выкарыстанні.
Яны таксама павінны быць сумяшчальныя з іншымі часткамі архітэктуры, напрыклад
здольны працаваць з існуючымі сістэмамі. Таксама прапануецца
выбраць інструменты доступу і пошуку даных з цэнамі і прадукцыйнасцю
разумны. Іншыя крытэрыі, якія варта ўлічваць, ўключаюць прыхільнасць
пастаўшчыком інструмента для падтрымкі іх прадукту і распрацовак, якія ён
тое ж самае будзе ў будучых выпусках. Каб забяспечыць узаемадзеянне карыстальнікаў
у выкарыстанні сховішча дадзеных каманда распрацоўшчыкаў прыцягвае
карыстальнікаў у працэсе выбару інструмента. У гэтым выпадку
павінна быць праведзена практычная ацэнка карыстальніка.
Павысіць каштоўнасць сховішча дадзеных можа каманда распрацоўшчыкаў
таксама забяспечваюць вэб-доступ да сваіх сховішчаў дадзеных. А
Інтэрнэт-сховішча даных дазваляе карыстальнікам атрымліваць доступ да дадзеныя
з аддаленых месцаў або падчас падарожжа. Дадатковая інфармацыя можа
забяспечвацца з меншымі выдаткамі за кошт зніжэння выдаткаў
ды навучанне.
2.4.3 Склад дадзеных Фаза аперацыі
Гэты этап складаецца з трох дзеянняў: Вызначэнне стратэгій даты
абнаўленне, кантроль дзейнасці сховішча даных і кіраванне імі
бяспека сховішча дадзеных.
Вызначэнне стратэгій абнаўлення даных
Пасля першапачатковай загрузкі, г.зн дадзеныя ў база дадзеных сховішча дадзеных
неабходна перыядычна абнаўляць, каб гуляць
змены, зробленыя на дадзеныя арыгіналы. Таму мы павінны вырашыць
калі абнаўляць, як часта
абнавіць і як абнавіць дадзеныя. Прапануецца зрабіць
абнавіць дэі дадзеныя калі сістэму можна перавесці ў аўтаномны рэжым. там
Частата абнаўлення вызначаецца камандай распрацоўшчыкаў на аснове
на патрабаванні карыстальнікаў. Ёсць два падыходу да асвяжэння
сховішча дадзеных: поўнае абнаўленне і бесперапынная загрузка
змены.
Першы падыход, поўнае абнаўленне, патрабуе перазагрузкі
tutti i дадзеныя з нуля. Гэта азначае, што ўсе дадзеныя абавязковы павінен
быць выняты, ачышчаны, трансфармаваны і інтэграваны пры кожным абнаўленні. гэта
падыходу варта, наколькі гэта магчыма, пазбягаць, таму што
Гэта патрабуе шмат часу і сродкаў.
Альтэрнатыўны падыход - пастаянная загрузка i
змены. Гэта дадае i дадзеныя якія былі зменены
з моманту апошняга цыклу абнаўлення сховішча даных. Ідэнтыфікацыя
новых або змененых запісаў значна памяншае колькасць
дадзеныя якія павінны быць перададзены ў сховішча дадзеных у кожным
абнаўленне, так як толькі гэтыя дадзеныя будзе дададзены ў база дадзеных
сховішча дадзеных.
Ёсць як мінімум 5 падыходаў, якія можна выкарыстоўваць для зняцця
i дадзеныя новы або зменены. Каб атрымаць эфектыўную стратэгію
абнавіць дэі дадзеныя сумесь гэтых падыходаў можа быць карыснай
падхоплівае ўсе змены ў сістэме.
Першы падыход, які выкарыстоўвае часовыя пазнакі, мяркуе, што прыходзіць
прызначана ўсім дадзеныя адрэдагаваў і абнавіў пазнаку часу так
каб можна было лёгка ідэнтыфікаваць усіх дадзеныя зменены і новы.
Гэты падыход, аднак, не атрымаў шырокага прымянення ў большасці
частка сучасных аперацыйных сістэм.
Другі падыход заключаецца ў выкарыстанні дэльта-файла, згенераванага
дадатак, якое змяшчае толькі змены, унесеныя ў дадзеныя.
Выкарыстанне гэтага файла таксама павялічвае цыкл абнаўлення.
Аднак нават гэты метад не ў многіх выкарыстоўваўся
прыкладанняў.
Трэці падыход заключаецца ў сканаванні файла часопіса, які
у асноўным змяшчае інфармацыю, падобную да дэльта-файла. Адзіная
розніца ў тым, што файл часопіса ствараецца для працэсу аднаўлення і
гэта можа быць цяжка зразумець.
Чацвёрты падыход - змяніць код прыкладання.
Аднак большая частка кода прыкладання састарэла
далікатна; таму гэтай тэхнікі варта пазбягаць.
Апошні падыход - параўнаць дадзеныя крыніцы з файлам
галоўныя багі дадзеныя.
Кантроль дзейнасці сховішча даных
Пасля таго, як сховішча дадзеных было выпушчана для карыстальнікаў, гэта
неабходна сачыць за ім з цягам часу. У дадзеным выпадку адміністратар
сховішча дадзеных можа выкарыстоўваць адзін або некалькі інструментаў кіравання і
кантроль для маніторынгу выкарыстання сховішча даных. У прыватнасці
можна збіраць інфармацыю пра людзей і надвор'е
якія яны атрымліваюць доступ да сховішча дадзеных. Давай дадзеныя ураджаі могуць быць створаны
профіль выкананай працы, які можна выкарыстоўваць у якасці ўваходных дадзеных
пры ажыццяўленні вяртання плацяжоў карыстальнікам. Вяртанне плацяжу
дазваляе карыстальнікам атрымліваць інфармацыю аб кошце апрацоўкі
сховішча дадзеных.
Акрамя таго, можна таксама выкарыстоўваць кантроль сховішча дадзеных
вызначыць тыпы запытаў, іх памер, колькасць запытаў на
дзень, час адказу на запыт, дасягнутыя сектары і колькасць
di дадзеныя апрацаваны. Яшчэ адна мэта правядзення праверкі
сховішча дадзеных, каб вызначыць дадзеныя якія не выкарыстоўваюцца. Гэтыя дадзеныя
іх можна выдаліць са сховішча даных, каб палепшыць час
адказу на выкананне запытаў і сачыць за ростам
дадзеныя якія знаходзяцца ў межах база дадзеных сховішча дадзеных.
Кіраванне бяспекай сховішча даных
Сховішча дадзеных змяшчае дадзеныя інтэграваны, крытычны, адчувальны што
можна лёгка дабрацца. Па гэтай прычыне павінна
быць абаронены ад несанкцыянаваных карыстальнікаў. Адзін са спосабаў
рэалізацыя бяспекі заключаецца ў выкарыстанні функцыі del СКБД
прызначаць розныя прывілеі розным тыпам карыстальнікаў. У гэтым
Такім чынам, для кожнага тыпу карыстальнікаў неабходна весці профіль
доступ. Яшчэ адзін спосаб абараніць сховішча дадзеных - зашыфраваць яго
як напісана ў база дадзеных сховішча дадзеных. Доступ да
дадзеныя і інструменты пошуку павінны расшыфраваць дадзеныя перад адпраўкай i
вынікі для карыстальнікаў.
2.4.4 Склад дадзеных Фаза разгортвання
Гэта апошні этап у цыкле ўкаранення сховішча дадзеных. The
мерапрыемствы, якія будуць праводзіцца на гэтым этапе, уключаюць навучанне
карыстальнікам выкарыстоўваць сховішча даных і ствараць агляды
сховішча дадзеных.
Навучанне карыстальнікаў
Спачатку трэба правесці навучанне карыстальнікаў
доступу да дадзеныя сховішча даных і выкарыстанне інструментаў
пошук. Як правіла, заняткі варта пачынаць з
увядзенне ў паняцце захоўвання дадзеныя, Каб
змесціва сховішча даных, ai meta дадзеныя і асноўныя асаблівасці
інструментаў. Затым больш прасунутыя карыстальнікі таксама могуць вывучаць
фізічныя табліцы і карыстацкія функцыі доступу да даных і інструментаў
пошук.
Ёсць шмат падыходаў да навучання карыстальнікаў. Адзін з
гэта ўключае ў сябе выбар шматлікіх карыстальнікаў або аналітыкаў, выбраных a
група карыстальнікаў, заснаваная на іх лідэрстве і здольнасцях
сувязі. Яны навучаюцца ў асабістай якасці на
усё, што ім трэба ведаць, каб азнаёміцца ​​з
сістэма. Пасля заканчэння навучання яны вяртаюцца да сваёй працы
яны пачынаюць вучыць іншых карыстальнікаў карыстацца сістэмай. На ст
на аснове таго, што яны даведаліся, іншыя карыстальнікі могуць пачаць
вывучыць сховішча дадзеных.
Іншы падыход заключаецца ў навучанні многіх карыстальнікаў аднаму
час, як калі б вы праходзілі курс у класе. Гэты метад
Гэта падыходзіць, калі ёсць шмат карыстальнікаў, якіх трэба навучыць
адначасова. Яшчэ адзін спосаб - трэніравацца
кожны карыстальнік індывідуальна, адзін за адным. Гэты метад ёсць
падыходзіць, калі карыстальнікаў мала.
Мэта навучання карыстальнікаў - азнаёміць вас
з доступам да дадзеныя і інструменты пошуку, а таксама змесціва
сховішча дадзеных. Аднак некаторыя карыстальнікі могуць быць перагружаныя
па аб'ёме інфармацыі, якая прадастаўляецца падчас занятку
навучанне. Таму трэба зрабіць пэўную колькасць спраў
пастаянная падтрымка і сеансы павышэння кваліфікацыі для адказу
на канкрэтныя пытанні. У некаторых выпадках ствараецца група
карыстальнікаў, каб аказаць гэты тып падтрымкі.
Збор водгукаў
Пасля разгортвання сховішча даных карыстальнікі могуць
выкарыстоўваць i дадзеныя якія знаходзяцца ў сховішчы дадзеных для розных мэтаў.
У асноўным аналітыкі або карыстальнікі выкарыстоўваюць i дадзеныя ў
сховішча дадзеных для:
1 Вызначце тэндэнцыі кампаніі
2 Прааналізуйце профілі пакупкі кліенты
3 Падзяліце i кліенты і я
4 Забяспечце найлепшыя паслугі кліенты – наладзіць паслугі
5 Сфармулюйце стратэгіі маркетынг
6 Прапануйце канкурэнтаздольныя цэны для аналізу выдаткаў і дапамогі
кантроль
7 Падтрымка прыняцця стратэгічных рашэнняў
8 Вызначце магчымасці вылучыцца
9 Палепшыце якасць бягучых бізнес-працэсаў
10 Праверце прыбытак
Прытрымліваючыся кірунку развіцця сховішча дадзеных, яны маглі б
Правядзіце шэраг аглядаў сістэмы, каб атрымаць зваротную сувязь
як ад каманды распрацоўшчыкаў, так і ад супольнасці
канчатковыя карыстальнікі.
Атрыманыя вынікі могуць быць прыняты да ўвагі
наступны цыкл развіцця.
Паколькі сховішча даных мае паступовы падыход,
вельмі важна вучыцца на поспехах і памылках папярэдніх
распрацоўкі.
2.5 Рэзюмэ
У гэтай главе абмяркоўваліся падыходы, якія прысутнічаюць у
літаратуры. У раздзеле 1 абмяркоўвалася канцэпцыя
сховішча дадзеных і яго роля ў навуцы прыняцця рашэнняў. У ст
раздзел 2 асноўныя адрозненні паміж
сховішчы дадзеных і сістэмы OLTP. У раздзеле 3 мы абмяркоўвалі
Выкарыстаная мадэль сховішча даных Monash
у раздзеле 4 для апісання дзеянняў, якія ўдзельнічаюць у працэсе
распрацоўка сховішча дадзеных, гэтыя тэзісы не былі заснаваныя
строгія даследаванні. Тое, што адбываецца ў рэальнасці, можа быць
вельмі адрозніваецца ад таго, што паведамляе літаратура, аднак гэтыя
вынікі могуць быць выкарыстаны для стварэння базавага багажу, які
падкрэсліць канцэпцыю сховішча дадзеных для гэтага даследавання.
Капітолій 3
Метады даследавання і праектавання
У гэтай главе разглядаюцца метады даследавання і праектавання
гэта даследаванне. Першая частка паказвае агульны выгляд метадаў
даследаванняў, даступных для атрымання інфармацыі, акрамя таго
крытэрыі для выбару лепшага метаду для аднаго абмяркоўваюцца
асаблівае даследаванне. Затым у раздзеле 2 разглядаюцца два метады
адабраны па толькі што выкладзеных крытэрыях; з іх будуць выбраны і
прыняты адзін з прычынамі, выкладзенымі ў раздзеле 3, дзе яны ёсць
таксама тлумачацца прычыны выключэння іншага крытэрыю. там
раздзел 4 прадстаўляе план даследавання, а раздзел 5 прадстаўляе яго
высновы.
3.1 Даследаванні ў галіне інфармацыйных сістэм
Даследаванні ў галіне інфармацыйных сістэм не проста абмежаваныя
да тэхналагічнай сферы, але таксама павінна быць пашырана, каб уключыць
мэты адносна паводзін і арганізацыі.
Мы абавязаны гэтым тэзісам розных дысцыплін, пачынаючы ад
грамадскія навукі да прыродазнаўчых; гэта прыводзіць да неабходнасці а
пэўны спектр метадаў даследавання з выкарыстаннем колькасных метадаў
і якасныя, якія будуць выкарыстоўвацца для інфармацыйных сістэм.
Важныя ўсе даступныя метады даследавання, на самай справе некалькі
такія даследчыкі, як Джэнкінс (1985), Нунамэйкер і інш. (1991), і Galliers
(1992) сцвярджаюць, што не існуе пэўнага універсальнага метаду
праводзіць даследаванні ў розных галінах інфармацыйных сістэм; Сапраўды
метад можа быць прыдатным для канкрэтнага даследавання, але не
для іншых. Гэта прыводзіць да неабходнасці выбару метаду, які
падыходзіць для нашага канкрэтнага даследчага праекта: для гэтага
выбар Бенбасат і інш. (1987) сцвярджаюць, што іх варта ўлічваць
характар ​​і мэты даследавання.
3.1.1 Характар ​​даследавання
Могуць быць розныя метады, заснаваныя на характары даследавання
класіфікуюцца на тры шырока вядомыя ў навуцы традыцыі
інфармацыі: пазітывісцкія, інтэрпрэтацыйныя і крытычныя даследаванні.
3.1.1.1 Пазітывісцкія даследаванні
Пазітывісцкія даследаванні таксама вядомыя як навуковыя даследаванні або
эмпірычны. Ён спрабуе: «растлумачыць і прадказаць, што адбудзецца ў
сацыяльны свет, разглядаючы заканамернасці і прычынна-выніковыя сувязі
сярод элементаў, якія яго складаюць» (Shanks et al 1993).
Пазітывісцкія даследаванні таксама характарызуюцца паўтаральнасцю,
спрашчэнняў і абвяржэнняў. Акрамя таго, пазітывісцкія даследаванні прызнаюць
наяўнасць апрыёрных сувязей паміж вывучаемымі з'явамі.
Паводле Galliers (1992), таксанамія - гэта метад даследавання
уключаны ў пазітывісцкую парадыгму, якая, аднак, не абмяжоўваецца гэтым,
на самай справе ёсць лабараторныя эксперыменты, палявыя эксперыменты,
тэматычныя даследаванні, доказы тэарэм, прагнозы і мадэляванне.
З дапамогай гэтых метадаў даследчыкі прызнаюць, што з'явы
можна назіраць аб'ектыўна і строга.
3.1.1.2 Інтэрпрэтацыйнае даследаванне
Інтэрпрэтацыйнае даследаванне, якое часта называюць фенаменалогіяй або
Нойман (1994) апісвае антыпазітывізм як «аналіз
сістэмнасць сацыяльнага сэнсу дзеяння праз непасрэдныя і
дэталёвае назіранне за людзьмі ў натуральных сітуацыях, у парадку
прыйсці да разумення і інтэрпрэтацыі таго, як
людзі ствараюць і падтрымліваюць свой сацыяльны свет». Даследаванні
інтэрпрэтацыйныя метады адхіляюць дапушчэнне, што назіраныя з'явы
можна назіраць аб'ектыўна. Фактычна яны грунтуюцца
на суб'ектыўныя інтэрпрэтацыі. Акрамя таго, даследчыкі інтэрпрэтацыі гэтага не робяць
яны накладваюць апрыёрныя значэнні на з’явы, якія вывучаюць.
Гэты метад уключае ў сябе суб'ектыўныя/аргументаваныя даследаванні, дзеянні
даследаванні, апісальныя/інтэрпрэтацыйныя даследаванні, будучыя даследаванні і гульні
ролю. У дадатак да гэтых даследаванняў і тэматычных даследаванняў можа быць
уключаны ў гэты падыход, паколькі яны тычацца даследаванняў
асобы або арганізацыі ў складаных сітуацыях
рэальнага свету.
3.1.1.3 Крытычныя даследаванні
Крытычнае даследаванне - найменш вядомы падыход у навуцы
сацыяльны, але нядаўна прыцягнуў увагу даследчыкаў
у галіне інфармацыйных сістэм. Філасофскае здагадка, што ст
сацыяльная рэальнасць гістарычна вырабляецца і ўзнаўляецца людзьмі,
а таксама сацыяльныя сістэмы з іх дзеяннямі і ўзаемадзеяннямі. Іх
здольнасць, аднак, апасродкавана пэўнай колькасцю разгляду
сацыяльныя, культурныя і палітычныя.
Як і інтэрпрэтацыйнае даследаванне, крытычнае даследаванне сцвярджае, што
пазітывісцкія даследаванні не маюць нічога агульнага з сацыяльным кантэкстам і ігнаруюць яго
яго ўплыў на дзеянні чалавека.
Крытычныя даследаванні, з іншага боку, крытыкуюць інтэрпрэтацыйныя даследаванні для
быць занадта суб'ектыўным і таму, што не мае на мэце дапамагчы
людзей, каб палепшыць сваё жыццё. Самая вялікая розніца паміж
крытычнага даследавання і двух іншых падыходаў з'яўляецца яго ацэначным вымярэннем.
У той час як аб’ектыўнасць пазітывісцкіх і інтэрпрэтацыйных традыцый — за
прагназаваць або тлумачыць статус-кво або сацыяльную рэальнасць, крытычнае даследаванне
накіравана на крытычную ацэнку і трансфармацыю асноўнай сацыяльнай рэальнасці
студыя.
Крытычныя даследчыкі звычайна выступаюць супраць статус-кво, каб
ліквідаваць сацыяльныя адрозненні і палепшыць сацыяльныя ўмовы. там
крытычнае даследаванне мае прыхільнасць да працэсуальнага погляду
цікавыя з'явы і, такім чынам, звычайна з'яўляецца падоўжным.
Прыкладамі метадаў даследавання з'яўляюцца доўгатэрміновыя гістарычныя даследаванні і
этнаграфічных даследаванняў. Крытычных даследаванняў, аднак, не было
шырока выкарыстоўваецца ў даследаваннях інфармацыйных сістэм
3.1.2 Мэта даследавання
Разам з характарам пошуку можа быць выкарыстана яго мэта
арыентаваць даследчыка пры выбары таго ці іншага метаду
даследаванні. Мэта даследчага праекта цесна звязана
да пазіцыі пошуку адносна цыкла пошуку, які складаецца з
тры фазы: пабудова тэорыі, праверка тэорыі і ўдасканаленне тэорыі
тэорыі. Такім чынам, зыходзячы з імпульсу адносна цыклу пошуку, a
даследчы праект можа мець тлумачальную, апісальную, мэту
пошукавыя або прагнастычныя.
3.1.2.1 Пошукавыя даследаванні
Пошукавае даследаванне накіравана на вывучэнне тэмы
цалкам новыя і фармуляваць даследчыя пытанні і гіпотэзы
будучыню. Гэты від даследаванняў выкарыстоўваецца пры будаўніцтве
тэорыі, каб атрымаць першапачатковыя спасылкі ў новай вобласці.
Як правіла, выкарыстоўваюцца якасныя метады даследавання, напрыклад, кейсы
даследаванні або фенаменалагічныя даследаванні.
Тым не менш, таксама можна выкарыстоўваць колькасныя метады, такія як
пошукавыя даследаванні або эксперыменты.
3.1.3.3 Апісальныя даследаванні
Апісальныя даследаванні ў значнай ступені накіраваны на аналіз і апісанне
дэталізуюць канкрэтную сітуацыю або арганізацыйную практыку. гэта
падыходзіць для пабудовы тэорыі, а таксама можа выкарыстоўвацца для
пацвердзіць або аспрэчыць гіпотэзы. Апісальныя даследаванні звычайна
уключае выкарыстанне вымярэнняў і ўзораў. Найбольш прыдатныя метады даследавання
ўключаюць даследаванні і аналіз папярэднікаў.
3.1.2.3 Растлумачальныя даследаванні
Тлумачальнае даследаванне спрабуе растлумачыць, чаму так адбываецца.
Ён пабудаваны на фактах, якія ўжо вывучаны і спрабуе знайсці
прычыны гэтых фактаў.
Такім чынам, тлумачальнае даследаванне звычайна будуецца на даследаванні
даследчы або апісальны і з'яўляецца дапаможным для тэставання і ўдасканалення
тэорыі. Тлумачальныя даследаванні звычайна выкарыстоўваюць тэматычныя даследаванні
або метады даследавання на аснове апытання.
3.1.2.4 Прафілактычныя даследаванні
Прафілактычныя даследаванні накіраваны на прагназаванне падзей і паводзін
пад назіраннем, якія вывучаюцца (Маршал і Росман
1995 г.). Прадказанне - гэта стандартная навуковая праверка праўды.
У гэтым тыпе даследаванняў звычайна выкарыстоўваюцца апытанні або аналіз
дадзеныя гісторыкаў. (Інь 1989)
Прыведзенае вышэй абмеркаванне паказвае, што існуе шэраг
магчымыя метады даследавання, якія можна выкарыстоўваць у даследаванні
прыватнасці. Аднак павінен быць пэўны метад, які больш падыходзіць
іншых для пэўнага тыпу даследчага праекта. (Галіеры
1987, Інь 1989, Дэ Во 1991). Такім чынам, кожны даследчык мае
неабходна старанна ацаніць моцныя і слабыя бакі
розныя метады, каб прыйсці да прыняцця найбольш прыдатнага метаду даследавання e
сумяшчальны з даследчым праектам. (Джэнкінс 1985, Перван і Клас
1992, Баномія 1985, Інь 1989, Хімілтан і Айвз 1992).
3.2. Магчымыя метады даследавання
Мэтай гэтага праекта было вывучэнне вопыту в
Аўстралійскія арганізацыі з i дадзеныя захоўваецца з адным
Распрацоўка інфармацыйнае сховішча. Дато які, у цяперашні час, ёсць адзін
адсутнасць даследаванняў у галіне сховішчаў дадзеных у Аўстраліі,
гэты даследчы праект усё яшчэ знаходзіцца ў тэарэтычнай фазе цыкла
навукова-даследчы і мае пошукавае прызначэнне. Вывучэнне вопыту ў
Аўстралійскія арганізацыі выкарыстоўваюць сховішчы даных
патрабуе інтэрпрэтацыі рэальнага грамадства. Такім чынам,
філасофская здагадка, якая ляжыць у аснове даследчага праекта, наступная
традыцыйная інтэрпрэтацыя.
Пасля строгага вывучэння даступных метадаў яны былі ідэнтыфікаваныя
два магчымыя метады даследавання: апытанні і тэматычныя даследаванні
(case studies), якія могуць быць выкарыстаны для даследаванняў
пошукавыя (Shanks et al. 1993). Galliers (1992) сцвярджае, што
прыдатнасць гэтых двух метадаў для гэтага канкрэтнага даследавання ў
яго перагледжаная таксанамія, у якой гаворыцца, што яны прыдатныя для будаўніцтва
тэарэтычны. У наступных двух падраздзелах абмяркоўваецца кожны метад
дэталь.
3.2.1 Апытальны метад даследавання
Апытальны метад даследавання паходзіць ад старажытнага метаду в
перапіс насельніцтва. Перапіс складаецца са збору інфармацыі з
цэлае насельніцтва. Гэты спосаб дарагі і непрактычны
асабліва калі насельніцтва вялікае. Такім чынам, у параўнанні з
перапісу, апытанне звычайна сканцэнтравана на
збіраць інфармацыю для невялікай колькасці або выбаркі
прадстаўнікоў насельніцтва (Fowler 1988, Neuman 1994). А
выбарка адлюстроўвае сукупнасць, з якой яна складзена, з розн
ўзроўні дакладнасці, у адпаведнасці са структурай выбаркі,
памер і выкарыстаны метад адбору (Fowler 1988, Babbie
1982, Нёман 1994).
Метад расследавання вызначаецца як "здымкі практыкі,
сітуацыі або погляды ў пэўны момант часу, прадпрынятыя з дапамогай
анкеты або інтэрв'ю, з якіх можна зрабіць высновы
зрабіў» (Galliers 1992:153) [імгненная фатаграфія практык,
сітуацыі або погляды ў пэўны момант часу, прадпрынятыя з дапамогай
анкеты або інтэрв'ю, з якіх можна зрабіць высновы]. The
расследаванні займаюцца зборам інфармацыі па пэўных аспектах
даследавання, пэўнай колькасцю ўдзельнікаў, роб
пытанні (Fowler 1988). Нават гэтыя анкеты і інтэрв'ю, якія
уключаць асабістыя тэлефонныя і структураваныя інтэрв'ю,
з'яўляюцца метады збору ст дадзеныя найбольш часта выкарыстоўваецца ў
даследаванні (Blalock 1970, Nachmias and Nachmias 1976, Fowler
1988), можна выкарыстоўваць назіранні і аналіз (Gable
1994 г.). З усіх гэтых метадаў збору ст дадзеныя, выкарыстанне
анкетаванне - самая папулярная методыка, бо яна гарантуе, што i дадзеныя
сабраныя структураваны і адфарматаваны, і таму палягчае
класіфікацыя інфармацыі (Hwang 1987, de Vaus 1991).
Пры аналізе я дадзеныя, стратэгія расследавання часта выкарыстоўвае
колькасныя метады, такія як статыстычны аналіз, але яны могуць быць
таксама выкарыстоўваюцца якасныя метады (Galliers 1992, Pervan
і Klass 1992, Gable 1994). Звычайна, я дадзеныя сабраныя з'яўляюцца
выкарыстоўваецца для аналізу размеркаванняў і мадэляў асацыяцый
(Fowler 1988).
Хаця апытанні ў цэлым падыходзяць для даследаванняў
якія маюць справу з пытаннем "што?" (што) або ад яго
вытворныя, такія як "колькі" і "колькі", яны
можна задаць праз пытанне "чаму" (Sonquist і
Dunkelberg 1977, Yin 1989). Паводле Сонквіста і Дункельберга
(1977), даследчае даследаванне накіравана на складаныя гіпотэзы, праграму ст
ацэнкі, апісання папуляцыі і распрацоўкі мадэляў
паводзіны чалавека. Дадаткова можна выкарыстоўваць апытанні
вывучыць пэўную думку насельніцтва, умовы,
меркаванні, характарыстыкі, чаканні і нават паводзіны ў мінулым
або сучаснасць (Neuman 1994).
Даследаванні дазваляюць даследчыку выявіць адносіны паміж
насельніцтва і вынікі звычайна больш агульныя, чым
іншыя метады (Sonquist and Dunkelberg 1977, Gable 1994). The
апытанні дазваляюць даследчыкам ахапіць геаграфічную вобласць
шырэй і дасягае многіх заяўнікаў (Blalock 1970,
Сонквіст і Дункельберг 1977, Хван і Лін 1987, Гейбл 1994,
Нёман 1994). Нарэшце, апытанні могуць даць інфармацыю
якія недаступныя ў іншым месцы або ў форме, неабходнай для аналізаў
(Fowler 1988).
Аднак ёсць некаторыя абмежаванні ў правядзенні апытання. адзін
недахопам з'яўляецца тое, што даследчык не можа атрымаць шмат інфармацыі
адносна вывучаемага аб'екта. Гэта звязана з тым, што ст
даследаванні праводзяцца толькі ў пэўны час і, такім чынам,
ёсць абмежаваная колькасць зменных і людзей, якія даследчык можа
даследаванне (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Яшчэ адным недахопам з'яўляецца правядзенне апытання
вельмі дорага з пункту гледжання часу і рэсурсаў, асабліва калі
уключае інтэрв'ю тварам да твару (Fowler 1988).
3.2.2. Запытальны метад даследавання
Запытальны метад даследавання прадугледжвае паглыбленае вывучэнне в
канкрэтная сітуацыя ў яе рэальным кантэксце ў а
вызначаны перыяд часу, без умяшання з боку
даследчык (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
У асноўным гэты метад выкарыстоўваецца для апісання адносін паміж
зменныя, якія вывучаюцца ў канкрэтнай сітуацыі
(Galliers 1992). Расследаванне можа ўключаць асобныя выпадкі або
некалькі, у залежнасці ад аналізаванай з'явы (Franz and Robey 1987,
Eisenhardt 1989, Yin 1989).
Запытальны метад даследавання вызначаецца як «запыт
эмпірычнае даследаванне, якое вывучае сучасную з'яву ў межах ст
адносна рэальнага кантэксту, выкарыстоўваючы некалькі крыніц, сабраных з аднаго або
некалькі суб'ектаў, такіх як людзі, групы або арганізацыі» (Інь 1989).
Няма дакладнага падзелу паміж з'явай і яе кантэкстам e
няма кантролю або эксперыментальных маніпуляцый зменнымі (Інь
1989, Бенбасат і інш., 1987).
Існуе мноства тэхнік збору дадзеныя што яны могуць
быць выкарыстаны ў метадзе запыту, які ўключае
непасрэдныя назіранні, агляды архіўных матэрыялаў, анкетаванне,
агляд дакументацыі і структураваныя інтэрв'ю. Які мае
разнастайная тэхніка збору ўраджаю дадзеныя, расследаванні
дазваляюць даследчыкам мець справу з абодвума дадзеныя якаснае што
велічынь адначасова (Bonoma 1985, Eisenhardt 1989, Yin
1989, Гейбл 1994). Як і ў выпадку з метадам апытання, а
даследчык-запыт выступае ў якасці назіральніка або даследчыка, а не
як актыўны ўдзельнік даследуемай арганізацыі.
Бенбасат і іншыя (1987) сцвярджаюць, што метад даследавання
асабліва падыходзіць для тэорыі будаўніцтва даследаванняў, якія
пачніце з даследчага пытання і працягнуць навучанне
тэорыі ў працэсе збору дадзеныя. Быццё
таксама падыходзіць для сцэны
пабудовы тэорыі Франц і Робі (1987) мяркуюць, што
Метад запыту таксама можа быць выкарыстаны для комплексу
фаза тэорыі. Пры гэтым на падставе сабраных доказаў адзін
дадзеная тэорыя або гіпотэза праверана або абвергнута. Плюс расследаванне ідзе
таксама падыходзіць для даследаванняў, звязаных з пытаннямі "як" ці "як".
«чаму» (Інь 1989).
У параўнанні з іншымі метадамі, апытанні дазваляюць даследчыку
фіксаваць важную інфармацыю больш падрабязна (Galliers
1992, Шэнкс і інш., 1993). Акрамя таго, расследаванні дазваляюць
даследчыку зразумець прыроду і складанасць вывучаемых працэсаў
(Benbasat et al. 1987).
Ёсць чатыры асноўныя недахопы, звязаныя з метадам
расследаванне. Па-першае, гэта адсутнасць кантраляваных адлічэнняў. там
суб'ектыўнасць даследчыка можа змяніць вынікі і высновы
даследавання (Yin 1989). Другі недахоп - адсутнасць
кантраляванае назіранне. У адрозненне ад эксперыментальных метадаў, ст
Даследчык-запыт не можа кантраляваць вывучаныя з'явы
калі яны разглядаюцца ў натуральным кантэксце (Gable 1994). The
Трэці недахоп - адсутнасць тыражавання. Гэта звязана з тым
што даследчык наўрад ці будзе назіраць тыя ж падзеі, і
не можа праверыць вынікі канкрэтнага даследавання (Lee 1989).
Нарэшце, як следства немагчымасці тыражавання, гэта цяжка
абагульніць вынікі, атрыманыя ў выніку аднаго або некалькіх даследаванняў (Galliers
1992, Шэнкс і інш., 1993). Усіх гэтых праблем, аднак, няма
непераадольныя і, на самай справе, могуць быць зведзены да мінімуму
даследчык прымяняе адпаведныя дзеянні (Lee 1989).
3.3. Абгрунтуйце методыку даследавання
прыняты
З двух магчымых метадаў даследавання для гэтага даследавання вылучаецца метад
даследаванне лічыцца найбольш прыдатным. Гэта расследаванне
быў адхілены пасля ўважлівага разгляду адпаведных
вартасці і недахопы. Зручнасць або недарэчнасць кожнага
метад гэтага даследавання разглядаецца ніжэй.
3.3.1. Непрыдатнасць метаду даследавання
расследавання
Метад запыту патрабуе паглыбленага вывучэння аб адным
канкрэтная сітуацыя ў адной або некалькіх арганізацыях для a
перыяд часу (Eisenhardt 1989). У гэтым выпадку перыяд можа
перавышаць часовыя рамкі, адведзеныя для гэтага даследавання. Іншы
прычына непрыняцця метаду апытання заключаецца ў тым, што вынікі
яны могуць пакутаваць ад адсутнасці строгасці (Інь 1989). Суб'ектыўнасць
даследчыка можа паўплываць на вынікі і высновы. Іншы
прычына ў тым, што гэты метад больш падыходзіць для даследавання пытанняў
тыпу «як» або «чаму» (Інь 1989), у той час як пытанне даследавання
для гэтага даследавання гэта тып "што". І апошняе, але не менш важнае
Важна адзначыць, што цяжка абагульніць высновы толькі з аднаго або
нешматлікія даследаванні (Galliers 1992, Shanks et al 1993). На падставе в
гэта рацыянальнае тлумачэнне, метад даследавання не з'яўляецца
быў абраны, таму што ён быў непрыдатны для гэтага даследавання.
3.3.2. Зручнасць спосабу пошуку
расследаванне
Калі гэта даследаванне было праведзена, практыка захоўвання дадзеных
не атрымала шырокага распаўсюджвання
Аўстралійскія арганізацыі. Так што інфармацыі было няшмат
адносна іх рэалізацыі ў межах ст
Аўстралійскія арганізацыі. Наяўная інфармацыя прыйшла
ад арганізацый, якія ўкаранілі або выкарыстоўвалі даныя
склад. У дадзеным выпадку анкетны метад даследавання найбольш
падыходзіць, таму што дазваляе атрымаць інфармацыю, якой няма
даступны ў іншым месцы або ў форме, неабходнай для аналізу (Fowler 1988).
Акрамя таго, апытальны метад даследавання дазваляе даследчыку
атрымаць добрае ўяўленне аб практыках, сітуацыях, або
бачылі ў пэўны час (Galliers 1992, Denscombe 1998).
Для павелічэння патрабаваўся агульны выгляд
Веданне вопыту аўстралійскага сховішча даных.
Зноў жа, Sonquist і Dunkelberg (1977) сцвярджаюць, што вынікі
Апытальныя даследаванні больш агульныя, чым іншыя метады.
3.4. Дызайн даследавання абследавання
Расследаванне практыкі захоўвання дадзеных было праведзена ў 1999 годзе.

Мэтавая група складалася з арганізацый
Аўстралійцы, як і раней, зацікаўлены ў даследаваннях сховішчаў дадзеных
напэўна, ужо інфармавалі пра i дадзеныя што яны захоўваюць і,
такім чынам, гэта можа даць карысную інфармацыю для гэтага даследавання. там
мэтавая група была вызначана з дапамогай першапачатковага апытання
усе аўстралійскія члены «Інстытута сховішчаў дадзеных» (Tdwiaap).
У гэтым раздзеле абмяркоўваецца дызайн фазы даследавання
эмпірычныя доказы гэтага даследавання.
3.4.1. Тэхніка ўборкі ўраджаю дадзеныя
З трох метадаў, якія звычайна выкарыстоўваюцца ў апытальных даследаваннях
(напрыклад, паштовая анкета, тэлефоннае інтэрв'ю і інтэрв'ю
асабісты) (Nachmias 1976, Fowler 1988, de Vaus 1991), для
гэта даследаванне прыняло паштовую анкету. Першы
прычына прыняцця апошняга ў тым, што ён можа дасягнуць a
геаграфічна раскіданае насельніцтва (Blalock 1970, Nachmias e
Nachmias 1976, Hwang і Lin 1987, de Vaus 1991, Gable 1994).
Па-другое, для ўдзельнікаў падыходзіць паштовая анкета
высокаадукаваны (Fowler 1988). Для гэтага пошта анкета
даследаванне было адрасавана спонсарам праекта па сховішчы дадзеных,
дырэктараў і / або кіраўнікоў праектаў. Па-трэцяе, анкеты прэч
пошты падыходзяць, калі ў вас ёсць бяспечны спіс
адрасы (Salant and Dilman 1994). TDWI, у дадзеным выпадку, адзін
давераная асацыяцыя сховішчаў дадзеных прадставіла спіс адрасоў
яго аўстралійскіх членаў. Яшчэ адна перавага анкеты
па пошце ў параўнанні з тэлефоннай анкетай або інтэрв'ю
персанальны заключаецца ў тым, што ён дазваляе зарэгістраваным асобам больш адказваць
дакладнасць, асабліва калі зарэгістраваным неабходна пракансультавацца
нататкі або абмяркоўваць пытанні з іншымі людзьмі (Фаўлер
1988).
Патэнцыйным недахопам можа быць час, неабходны для
праводзіць анкетаванне па пошце. Як правіла, анкета прэч
пошта вядзецца ў такой паслядоўнасці: адправіць ліст, чакаць
адказы і адправіць пацвярджэнне (Fowler 1988, Bainbridge 1989).
Такім чынам, агульны час можа быць большым, чым час, неабходны для
асабістыя інтэрв'ю або для тэлефонных інтэрв'ю. Аднак, ст
агульны час можа быць вядомы загадзя (Fowler 1988,
Denscombe 1998). Час, выдаткаваны на правядзенне інтэрв'ю
персанальныя дадзеныя не могуць быць вядомыя загадзя, паколькі яны вар'іруюцца ад
адно інтэрв'ю іншаму (Fowler 1988). Тэлефонныя інтэрв'ю
можа быць хутчэй, чым паштовыя анкеты і
асабістыя інтэрв'ю, але можа мець высокі ўзровень пропускаў
адказ з-за недаступнасці некаторых людзей (Fowler 1988).
Акрамя таго, тэлефонныя інтэрв'ю звычайна абмяжоўваюцца спісамі
адносна кароткія пытанні (Bainbridge 1989).
Яшчэ адным недахопам паштовай анкеты з'яўляецца высокі паказчык
адсутнасць адказу (Fowler 1988, Bainbridge 1989, Neuman
1994 г.). Аднак контрмеры былі прынятыя, аб'яднаўшыся
гэта даследаванне з надзейнай установай у галіне дадзеных
складзіраванне (г.зн. TDWI) (Bainbridge 1989, Neuman 1994),
які адпраўляе два лісты-напаміны тым, хто не адказаў
(Fowler 1988, Neuman 1994), а таксама змяшчае ліст
дадатак, які тлумачыць мэту даследавання (Neuman 1994).
3.4.2. Адзінка аналізу
Мэтай дадзенага даследавання з'яўляецца атрыманне інфармацыі аб
рэалізацыя сховішчаў даных і іх выкарыстанне
у аўстралійскіх арганізацыях. Мэтавая група насельніцтва
складаецца з усіх аўстралійскіх арганізацый, якія маюць
рэалізаваны, або ажыццяўляюцца, г.зн інфармацыйнае сховішча. У
затым рэгіструюцца асобныя арганізацыі. Анкета
ён быў адпраўлены па пошце арганізацыям, зацікаўленым ва ўсынаўленні
di інфармацыйнае сховішча. Гэты метад гарантуе, што інфармацыя
збіраюцца з найбольш прыдатных рэсурсаў кожнай арганізацыі
удзельнік.
3.4.3. Узор апытання
«Спіс рассылкі» ўдзельнікаў апытання атрыманы з
TDWI. З гэтага спісу 3000 аўстралійскіх арганізацый
былі выбраны ў якасці асновы для выбаркі. А
дадатковы ліст з тлумачэннем праекта і мэты расследавання,
разам з бланкам адказаў і папярэдне аплачаным канвертам для
адправіць назад запоўненую анкету былі адпраўлены ўзор.
З 3000 арганізацый 198 пагадзіліся прыняць удзел у
даследаванне. Такая малая колькасць адказаў была чаканай дата il
вялікая колькасць аўстралійскіх арганізацый, якія яны тады мелі
прынялі або прымалі стратэгію даты
складзіраванне ўнутры сваіх арганізацый. Такім чынам,
Мэтавая група для гэтага даследавання складаецца толькі з 198 чалавек
арганізацый.
3.4.4. Змест анкеты
Структура анкеты была заснавана на мадэлі даты
Монаш складзіраванне (разгледжана раней у частцы 2.3). The
змест анкеты быў заснаваны на аналізе в
літаратура, прадстаўленая ў главе 2. Копія анкеты
можна знайсці, дасланыя ўдзельнікам апытання
у дадатку Б. Анкета складаецца з шасці раздзелаў, якія
наступныя фазы мадэлі абмяркоўваюцца. Наступныя шэсць абзацаў
яны коратка падсумоўваюць змест кожнага раздзела.
Раздзел A: Асноўная інфармацыя аб арганізацыі
Гэты раздзел змяшчае пытанні, звязаныя з профілем
арганізацыі-ўдзельніцы. Плюс ёсць некаторыя пытанні
якія адносяцца да стану праекта сховішча даных
удзельнік. Канфідэнцыяльная інфармацыя, такая як ваша імя
арганізацыі не былі выяўлены ў аналізе апытання.
Раздзел Б: Пач
Пытанні ў гэтым раздзеле звязаны з пачатковай дзейнасцю
сховішчы дадзеных. Задаваліся пытанні, як доўга
тычыцца ініцыятараў праектаў, гарантаў, навыкаў і ведаў
запыты, мэты распрацоўкі сховішчаў даных і ст
чаканні канчатковых карыстальнікаў.
Раздзел C: Дызайн
У гэтым раздзеле змяшчаюцца пытанні, звязаныя з дзейнасцю в
планаванне інфармацыйнае сховішча. У прыватнасці, пытанні
паведаміць пра аб'ём выканання, працягласць праекта, кошт
праекта і аналіз выдаткаў і выгод.
Раздзел D: Развіццё
У раздзеле развіцця ёсць пытанні, якія тычацца дзейнасці
Распрацоўка інфармацыйнае сховішча: збор патрабаванняў карыстальнікаў
канчатковае, крыніцы ст дадзеныя, лагічная мадэль дадзеныя, прататыпы, ст
планаванне магутнасці, тэхнічная архітэктура і выбар
сродкі распрацоўкі сховішчаў даных.
Раздзел E: Аперацыя
Аперацыя пытанні, звязаныя з аперацыяй рэд
да расцяжымасці інфармацыйнае сховішча, як гэта развіваецца ў
наступны этап развіцця. там якасць дадзеных, стратэгіі
абнавіць дэі дадзеныя, зярністасць дадзеныя, маштабаванасць дадзеных
склад і праблемы бяспекі інфармацыйнае сховішча яны былі паміж
віды зададзеных пытанняў.
Раздзел F: Развіццё
Гэты раздзел утрымлівае пытанні, звязаныя з выкарыстаннем дадзеных
склад канчатковымі карыстальнікамі. Даследчык зацікавіўся
да прызначэння і карыснасці інфармацыйнае сховішча, агляд і стратэгіі
навучання і стратэгіі кантролю дадзеных
склад прыняты.
3.4.5. Хуткасць адказу
Нягледзячы на ​​тое, што паштовыя апытанні крытыкуюць за тое, што яны маюць стаўку
нізкая рэакцыя, прыняты меры па павышэнню в
норма прыбытку (як абмяркоўвалася раней у частцы
3.4.1). Тэрмін "хуткасць адказу" адносіцца да працэнта
людзі ў канкрэтнай выбарцы апытання, якія адказваюць на
анкета (Denscombe 1998). Выкарыстоўвалася наступнае
формула для разліку частаты адказаў для гэтага даследавання:
Колькасць людзей, якія адказалі
Хуткасць адказу =
——————————————————————————— X 100
Агульная колькасць дасланых анкет
3.4.6. Пілотныя выпрабаванні
Перад тым, як анкета адпраўляецца на ўзор, задаюцца пытанні
быў правераны шляхам правядзення пілотных выпрабаванняў, як прапанаваў Лак
і Рубін (1987), Джэксан (1988) і дэ Во (1991). Мэта а
пілотныя выпрабаванні, каб выявіць усе нязграбныя, двухсэнсоўныя і выразы
пытанні, якія цяжка інтэрпрэтаваць, удакладніць якія-небудзь
азначэнні і тэрміны, якія выкарыстоўваюцца і для вызначэння прыблізнага часу
патрабуецца для запаўнення анкеты (Warwick and Lininger 1975,
Джэксан 1988, Салант і Дылман 1994). Доследныя выпрабаванні былі
ажыццяўляецца шляхам адбору прадметаў з характарыстыкамі, падобнымі да тых
выпускных прадметаў, як прапанаваў Дэвіс Э Козенца (1993). Ў
гэта даследаванне, шэсць спецыялістаў па сховішчах дадзеных былі
выбраны ў якасці пілотных прадметаў. Пасля кожнага пілотнага выпрабавання яны ёсць
унесены неабходныя выпраўленні. З праведзеных пілотных выпрабаванняў, г.зн
удзельнікі дапамаглі змяніць і скінуць
канчатковы варыянт анкеты.
3.4.7. Метады аналізу па Dati
I дадзеныя расследаванняў, сабраных з закрытых анкет
былі прааналізаваны з дапамогай пакета статыстычных праграм
называецца SPSS. Многія з адказаў былі прааналізаваны
з дапамогай апісальнай статыстыкі. Пэўная колькасць анкет
яны вярнуліся няпоўнымі. Гэтых лячылі большай
увагу, каб пераканацца, што i дадзеныя прапаў без вестак не адзін
следствам памылак пры ўводзе дадзеных, але чаму пытанні не
былі прыдатныя для заяўніка, або заяўнік вырашыў не падыходзіць
адказаць на адно ці некалькі канкрэтных пытанняў. Гэтыя адказы
адсутныя былі праігнараваныя падчас аналізу дадзеныя і яны былі
пазначаны як '- 9', каб гарантаваць іх выключэнне з працэсу
аналізы.
Пры падрыхтоўцы анкеты пытанні былі закрытыя
папярэдне закадзіраваны шляхам прысваення нумара кожнай опцыі. Колькасць
затым яго выкарыстоўвалі для падрыхтоўкі я дадзеныя падчас аналізу
(Denscombe 1998, Sapsford and Jupp 1996). Напрыклад, былі
шэсць варыянтаў, пералічаных у пытанні 1 раздзела B: парады
савет, старшы кіраўнік, ІТ-аддзел, падраздзяленне
бізнесу, кансультантаў і многае іншае. У файле в дадзеныя SPSS, ёсць
была створана зменная, каб пазначыць «ініцыятара праекта»,
з шасцю пазнакамі значэнняў: «1» для «савета дырэктараў», «2»
для «кіраўніка высокага ўзроўню» і гэтак далей. Выкарыстанне шкалы Ликертина
у некаторых закрытых пытаннях таксама дазволена
ідэнтыфікацыя, якая не патрабуе намаганняў з улікам выкарыстання значэнняў
адпаведныя нумары, уведзеныя ў SPSS. Па пытаннях з
няпоўныя адказы, якія не выключаюць адзін аднаго,
кожны варыянт разглядаўся як адна зменная з двума
меткі значэнняў: '1 ' для 'адзначаных' і '2' для 'неадзначаных'.
Адкрытыя пытанні разглядаліся інакш, чым пытанні
закрытыя. Адказы на гэтыя пытанні не ўведзеныя
SPSS. Замест гэтага яны аналізаваліся ўручную. Выкарыстанне гэтага
тып пытанняў дазваляе атрымаць інфармацыю аб ідэях
свабодна выказаны і асабісты вопыт рэспандэнтаў
(Bainbridge 1989, Denscombe 1998). Дзе было магчыма, гэта было зроблена
катэгарызацыі адказаў.
Для аналізу дадзеныявыкарыстоўваюцца простыя метады статыстычнага аналізу,
такія як частата адказаў, сярэдняе значэнне, стандартнае адхіленне
сярэдняга і медыяны (Argyrous 1996, Denscombe 1998).
Гама-тэст быў эфектыўным для атрымання колькасных вымярэнняў
асацыяцый паміж дадзеныя парадкавыя (Norusis 1983, Argyrous 1996).
Гэтыя тэсты былі прыдатнымі, таму што выкарыстоўваныя парадкавыя шкалы не падыходзілі
яны мелі шмат катэгорый і маглі быць паказаны ў табліцы
(Norusis 1983).
3.5 Рэзюмэ
У гэтай главе метадалогія даследавання і
канструкцыі, прынятыя для гэтага даследавання.
Выбар найбольш прыдатнага метаду даследавання для а
асаблівае даследаванне прымае ў
улік шэрагу правілаў, у тым ліку прыроды і тыпу
даследаванняў, а таксама вартасці і недахопы кожнага з магчымых
метад (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987,
Інь 1989, Гамільтан і Айвз 1992, Галіерс 1992, Нэйман 1994). Выгляд
адсутнасць існуючых ведаў і тэорыі пра гэта
прыняцця сховішчаў даных у Аўстраліі, гэта даследаванне пра
даследаванне патрабуе інтэрпрэтацыйнага метаду даследавання з навыкам
даследчы, каб вывучыць вопыт арганізацый
аўстралійскі. Абраны метад даследавання быў абраны для
збіраць інфармацыю аб прыняцці канцэпцыі даты
складскіх памяшканняў аўстралійскімі арганізацыямі. А
у якасці метаду збору была выбрана паштовая анкета дадзеныя,
абгрунтаванне метаду даследавання і методыкі збору дадзеныя
выбраныя будуць прадстаўлены ў гэтай главе. Таксама было
прадставіў абмеркаванне адзінкі аналізу, выбаркі
выкарыстоўваецца, працэнты адказаў, змест анкеты, ст
папярэдняе тэставанне анкеты і метад аналізу дадзеныя.

Праектаванне а Склад дадзеных:
Спалучэнне ўзаемасувязі аб'ектаў і памернага мадэлявання
РЭЗЮМЭ
Захоўванне i дадзеныя Для многіх гэта актуальная праблема
арганізацый. Ключавая праблема ў развіцці
захоўвання дадзеныя гэта яго дызайн.
Дызайн павінен падтрымліваць выяўленне паняццяў у дадзеных
склад у састарэлую сістэму і іншыя крыніцы дадзеныя а таксама адзін
лёгкае разуменне і эфектыўнасць рэалізацыі дадзеных
склад.
Значная частка захоўвання літаратуры в дадзеныя рэкамендуецца
выкарыстанне мадэлявання ўзаемаадносін суб'ектаў або размернага мадэлявання для
прадстаўляюць дызайн інфармацыйнае сховішча.
У гэтым артыкуле мы пакажам, як абодва
уяўленні можна аб'яднаць у адзін падыход для ст
малюнак інфармацыйнае сховішча. Выкарыстоўваецца сістэмны падыход
разглядаецца ў тэматычным даследаванні і вызначаецца ў шэрагу
важныя наступствы з прафесіяналамі.
СКЛОВІШЧА ДАННЫХ
Un інфармацыйнае сховішча звычайна вызначаецца як «прадметна-арыентаваны,
інтэграваны, зменлівы па часе і энерганезалежны збор даных у падтрымку
кіраўніцкіх рашэнняў” (Inmon and Hackathorn, 1994).
Прадметна-арыентаваны і інтэграваны сведчыць аб тым, што ст інфармацыйнае сховішча è
распрацаваны, каб перасекчы функцыянальныя межы старых сістэм для
прапануе комплексную перспектыву дадзеныя.
Варыянт часу ўплывае на гістарычны характар ​​або характар ​​часавых шэрагаў дадзеныя in
un інфармацыйнае сховішча, што дазваляе аналізаваць тэндэнцыі.
Энерганезалежны паказвае, што інфармацыйнае сховішча гэта не бесперапынна
абноўлены як a база дадзеных OLTP. Хутчэй абнаўляецца
перыядычна, с дадзеныя якія паступаюць з унутраных і знешніх крыніц. The
інфармацыйнае сховішча ён спецыяльна распрацаваны для даследаванняў
а не для цэласнасці абнаўленняў і прадукцыйнасці
аперацыі.
Ідэя захоўвання i дадзеныя гэта не нова, гэта была адна з мэтаў
кіравання ст дадзеныя з шасцідзесятых гадоў (The Martin, 1982).
I інфармацыйнае сховішча яны прапануюць інфраструктуру дадзеныя для кіравання
сістэмы падтрымкі. Сістэмы падтрымкі кіравання ўключаюць прыняцце рашэнняў
сістэмы падтрымкі (DSS) і выканаўчыя інфармацыйныя сістэмы (EIS).
DSS - гэта камп'ютэрная інфармацыйная сістэма, якая з'яўляецца
прызначаны для паляпшэння працэсу і, адпаведна, счаплення
чалавечае рашэнне. EIS звычайна з'яўляецца сістэмай дастаўкі
дадзеныя што дазваляе кіраўнікам прадпрыемстваў лёгка атрымаць доступ да прагляду
з дадзеныя.
Агульная архітэктура а інфармацыйнае сховішча вылучае ролю ст
інфармацыйнае сховішча у падтрымцы кіравання. У дадатак да прапановы
інфраструктура дадзеныя для EIS і DSS, інш інфармацыйнае сховішча магчыма
атрымаць доступ да яго непасрэдна праз запыты. THE дадзеныя уключаны ў дату
склад заснаваныя на аналізе інфармацыйных патрабаванняў
кіравання і атрыманы з трох крыніц: унутраных старых сістэм,
сістэмы збору даных спецыяльнага прызначэння і знешнія крыніцы даных. THE
дадзеныя ва ўнутраных старых сістэмах яны часта лішнія,
супярэчлівыя, нізкай якасці і захоўваюцца ў розных фарматах
таму іх трэба ўзгадніць і ачысціць, перш чым вы зможаце загрузіць іх у
інфармацыйнае сховішча (Inmon, 1992; McFadden, 1996). THE дадзеныя ад
з сістэм захоўвання дадзеныя ad hoc і з крыніц дадзеныя
знешнія часта выкарыстоўваюцца для павелічэння (абнаўлення, замены) i
дадзеныя са старых сістэм.
Ёсць шмат пераканаўчых прычын для развіцця а інфармацыйнае сховішча,
якія ўключаюць лепшае прыняцце рашэнняў праз выкарыстанне
больш эфектыўнай інфармацыі (Ives 1995), падтрымка фокусу
на поўны бізнес (Graham 1996), і скарачэнне выдаткаў
забеспячэнне дадзеныя для EIS і DSS (Graham 1996, McFadden
1996).
Нядаўняе эмпірычнае даследаванне паказала ў сярэднім вяртанне
інвестыцыі для i інфармацыйнае сховішча на 401% праз тры гады (Грэм,
1996 г.). Аднак іншыя эмпірычныя даследаванні в інфармацыйнае сховішча маюць
выяўлены значныя праблемы, у тым ліку цяжкасці ў вымярэнні выд
прысваенне выгод, адсутнасць выразнай мэты, яе недаацэнка
прызначэнне і складанасць працэсу захоўвання я дадзеныя, У
асабліва ў дачыненні да крыніц і чысціні дадзеныя.
Захоўванне i дадзеныя можна разглядаць як рашэнне
да праблемы кіравання ст дадзеныя паміж арганізацыямі. там
маніпуляцыі з дадзеныя як сацыяльны рэсурс ён застаўся адным з
ключавыя пытанні кіравання інфармацыйнымі сістэмамі па ўсёй
свеце на працягу многіх гадоў (Brancheau et al. 1996, Galliers et al. 1994,
Нідэрман і інш. 1990, Перван 1993).
Папулярны падыход да кіравання дадзеныя у васьмідзесятых было
распрацоўка мадэлі дадзеныя сацыяльны. мадэль дадзеныя сацыяльная была
распрацаваны, каб прапанаваць стабільную аснову для распрацоўкі новых сістэм
прыкладання e база дадзеных і аднаўленне і інтэграцыя спадчыны
сістэмы (Браншо і інш.
1989, Goodhue і інш. 1988:1992, Кім і Эверэст 1994).
Аднак ёсць шмат праблем з такім падыходам, у
у прыватнасці, складанасць і кошт кожнай задачы, а таксама працяглы час
патрабуецца, каб мець адчувальныя вынікі (Beynon-Davies 1994, Earl
1993, Гудхью і інш. 1992, Periasami 1994, Шанкс 1997).
Il інфармацыйнае сховішча гэта асобная база дадзеных, якая існуе побач са старымі
базы дадзеных, а не замяняць іх. Такім чынам, гэта дазваляе вам
кіраваць кіраваннем дадзеныя і пазбегнуць дарагой рэканструкцыі
састарэлых сістэм.
ІСНУЮЧЫЯ ПАДЫХОДЫ ДА ПРАЕКТАВАННЯ ДАННЫХ
WAREHOUSE
Працэс пабудовы і ўдасканалення а інфармацыйнае сховішча
варта разумець больш як эвалюцыйны працэс, а не як a
жыццёвы цыкл развіцця традыцыйных сістэм (Дэзіё, 1995, Шэнкс,
О'Донэл і Арнот 1997a). У а
праект а інфармацыйнае сховішча такія як ініцыялізацыя, планаванне;
інфармацыя, атрыманая з патрабаванняў, зададзеных кіраўнікам кампаніі;
крыніцы, пераўтварэнні, ачыст дадзеныя і сінхранізацыя са спадчыны
сістэмы і іншыя крыніцы ст дадзеныя; сістэмы дастаўкі ў распрацоўцы;
маніторынг інфармацыйнае сховішча; і бессэнсоўнасць працэсу
эвалюцыйная і пабудова а інфармацыйнае сховішча (Смурод, О'Донэл
і Арнот 1997b). У гэтым часопісе мы сканцэнтраваны на тым, як
намаляваць я дадзеныя захоўваецца ў кантэксце гэтых іншых працэсаў.
Ёсць некалькі падыходаў, прапанаваных для архітэктуры дадзеных
склад у літаратуры (Inmon 1994, Ives 1995, Kimball 1994
Макфадэн 1996). Кожная з гэтых метадалогій мае кароткае апісанне
агляд з аналізам іх моцных і слабых бакоў.
Інмон (1994) падыход да Склад дадзеных
дызайн
Инмон (1994) прапанаваў чатыры ітэрацыйныя крокі для малявання дадзеных
склад (гл. малюнак 2). Першы крок - распрацаваць шаблон
дадзеныя сацыяльны, каб зразумець, як я дадзеныя могуць быць інтэграваныя
праз функцыянальныя вобласці ў арганізацыі
дзяленне i дадзеныя захоўваць у раёнах. мадэль дадзеныя гэта зроблена для
захоўваць дадзеныя якія адносяцца да прыняцця рашэнняў, у т.л дадзеныя
гісторыкаў, у т.л дадзеныя выведзеныя і агрэгаваныя. Другі крок
вызначыць прадметныя вобласці для рэалізацыі. Гэтыя заснаваныя
па прыярытэтах, вызначаных канкрэтнай арганізацыяй. Трэці
крок ўключае ў сябе малюнак база дадзеных для прадметнай вобласці, поз
звярніце асаблівую ўвагу на ўключэнне адпаведных узроўняў дэталізацыі.
Inmon рэкамендуе выкарыстоўваць мадэль аб'ектаў і адносін. Па-чацвёртае
крокам з'яўляецца ідэнтыфікацыя зыходных сістэм дадзеныя патрабуецца і развіваць
працэсы трансфармацыі для захопу, ачысткі і фарматавання i дадзеныя.
Моцныя бакі падыходу Inmon у тым, што мадэль дадзеныя сацыяльны
прапануе аснову для інтэграцыі дадзеныя ўнутры арганізацыі
і падтрымка планавання ітэрацыйнай распрацоўкі дадзеных
склад. Яго недахопы складанасць і кошт малявання
мадэль дадзеныя сацыяльныя, цяжкасці ў разуменні мадэляў сутнасцяў і
адносіны, якія выкарыстоўваюцца ў абедзвюх мадэлях, што дадзеныя сацыяльныя і што з дадзеныя
захоўваюцца па прадметных абласцях, і адпаведнасць дадзеныя Дэль
малюнак інфармацыйнае сховішча для рэалізацыі база дадзеных
рэляцыйная, але не для база дадзеных шматмерны.
Айвза (1995) Падыход да Склад дадзеных
дызайн
Ives (1995) прапануе чатырохэтапны падыход да праектавання a
інфармацыйная сістэма, якую ён лічыць прыдатнай для праектавання даных
склад (гл. малюнак 3). Падыход вельмі заснаваны на
Інфармацыйная інжынерыя для распрацоўкі інфармацыйных сістэм
(Марцін 1990). Першы крок — гэта вызначэнне задач, фактараў
крытычныя і паспяховыя і ключавыя паказчыкі эфектыўнасці. THE
ключавыя бізнес-працэсы і неабходная інфармацыя
змадэляваны, каб прывесці нас да мадэлі дадзеныя сацыяльны. Крок другі
прадугледжвае распрацоўку вызначальнай архітэктуры дадзеныя
захоўваецца па раёнах, база дадзеных di інфармацыйнае сховішча, кампаненты
тэхнікі, якія неабходныя, комплекс арганізацыйнага забеспячэння
патрабуецца для рэалізацыі і працы з інфармацыйнае сховішча. Трэці
крок уключае выбар неабходных праграмных пакетаў і інструментаў.
Чацвёрты крок - дэталёвае праектаванне і будаўніцтва
інфармацыйнае сховішча. Айвз адзначае, што захоўванне дадзеныя ён падданы чалавек
ітэрацыйны працэс.
Сіла падыходу Айвза - выкарыстанне спецыяльных метадаў для
вызначаць патрабаванні да інфармацыі, выкарыстанне структур
працэс падтрымкі інтэграцыі інфармацыйнае сховішча,
адпаведнае абсталяванне і выбар праграмнага забеспячэння, а таксама выкарыстанне некалькіх
метады прадстаўлення для ст інфармацыйнае сховішча. Яго недахопы
ім уласціва складанасць. Іншыя ўключаюць цяжкасці ў
развіваць шмат узроўняў база дадзеных ўнутры ст інфармацыйнае сховішча in
разумныя тэрміны і выдаткі.
Падыход Кімбалла (1994). Склад дадзеных
дызайн
Кімбал (1994) прапанаваў пяць ітэрацыйных крокаў для малявання дадзеных
склад (гл. малюнак 4). Яго падыход асаблівы
прысвечаны дызайну толькі аднаго інфармацыйнае сховішча і аб выкарыстанні мадэляў
шматмернасць у перавагі перад мадэлямі сутнасцей і сувязяў. Кімбал
прааналізуйце гэтыя памерныя мадэлі, таму што мне іх лягчэй зразумець
здзелкі кіраўнікоў прадпрыемстваў, гэта больш эфектыўна пры здзелках
комплексныя кансультацыі і праектаванне база дадзеных фізічны больш
эфектыўна (Kimball 1994). Кімбал прызнае, што развіццё a
інфармацыйнае сховішча гэта паўтараецца, і гэта інфармацыйнае сховішча разлучаныя яны могуць
быць інтэграваны праз падзел на табліцы памераў
агульныя.
Першы крок - вызначыць канкрэтную прадметную вобласць
удасканалены. Другі і трэці крокі тычацца фармавання
габарытныя. На другім этапе вымярэння вызначаюць рэчы
цікавасць да прадметнай вобласці і згрупаваны ў табліцу фактаў.
Напрыклад, у прадметнай вобласці продажаў меры цікавасці
можа ўключаць колькасць прададзеных тавараў і долар
у якасці валюты продажаў. Трэці крок прадугледжвае ідэнтыфікацыю
памеры, якія з'яўляюцца спосабамі іх групоўкі i
факты. У сферы продажаў адпаведныя памеры
можа ўключаць прадмет, месцазнаходжанне і перыяд часу. там
табліца фактаў мае шматчасткавы ключ для спасылкі на кожную
табліц памераў і звычайна змяшчае вельмі шмат
поўны фактаў. Наадварот, табліцы памераў утрымліваюць
апісальная інфармацыя аб памерах і іншых атрыбутах, якія
можна выкарыстоўваць для групоўкі фактаў. Табліца фактаў e
памеры, звязаныя з прапановай, утвараюць тое, што называецца адным
зорчаты ўзор дзякуючы сваёй форме. Чацвёрты крок ўключае ў сябе
будаўніцтва а база дадзеных шматмерны, каб удасканаліць яго
зоркавы ўзор. Заключны крок - ідэнтыфікацыя зыходных сістэм дадзеныя
неабходныя і развіваць працэсы трансфармацыі, каб набыць, ачысціць
і фармат i дадзеныя.
Да моцных бакоў падыходу Кимбалла можна аднесці выкарыстанне мадэляў
памерны прадстаўляць я дадзеныя захоўваюцца, якія робяць гэта
лёгка зразумець і прыводзіць да эфектыўнага фізічнага дызайну. А
памерная мадэль, якая таксама лёгка выкарыстоўвае абодва
сістэмы база дадзеных рэляцыйныя могуць быць удасканалены або сістэмы
база дадзеных шматмерны. Да яго недахопаў можна аднесці адсутнасць
некаторых метадаў для палягчэння планавання або інтэграцыі
шмат узораў зорак у адным інфармацыйнае сховішча і
цяжкасці ў праектаванні з экстрэмальнай дэнармалізаванай структуры ў a
памерная мадэль а дадзеныя у састарэлай сістэме.
Макфадэн (1996) Падыход да дадзеных
Дызайн склада
McFadden (1996) прапануе пяціэтапны падыход да
намаляваць а інфармацыйнае сховішча (гл. малюнак 5).
Яго падыход заснаваны на сінтэзе ідэй з літаратуры
і арыентавана на дызайн толькі аднаго інфармацыйнае сховішча. Першы
этап ўключае ў сябе аналіз патрабаванняў. Хоць і канкрэтыка
метады не прадпісаны, нататкі Макфадэна вызначаюць
сутнасць дадзеныя спецыфікацыі і іх атрыбуты, і адносіцца да чытачоў Watson
і Frolick (1993) для захопу патрабаванняў.
На другім этапе распрацавана мадэль адносін суб'ектаў
інфармацыйнае сховішча а затым пацвярджаецца кіраўнікамі прадпрыемстваў. Трэці
этап уключае вызначэнне адлюстравання са старой сістэмы
і знешніх крыніц інфармацыйнае сховішча. Чацвёрты крок ўключае ў сябе
працэсы ў распрацоўцы, разгортванні і сінхранізацыі дадзеныя ў
інфармацыйнае сховішча. На апошнім этапе сістэма пастаўляецца
распрацаваны з асаблівым акцэнтам на карыстацкі інтэрфейс.
Макфадэн адзначае, што працэс малявання ў цэлым
ітэратыўны.
Моцныя бакі падыходу Макфадэна паказваюць на ўдзел
кіраўнікамі прадпрыемстваў пры вызначэнні патрабаванняў, а таксама
важнасць рэсурсаў дадзеныя, іх ачыстка і збор. Яе
недахопы тычацца адсутнасці працэсу падзелу а
вялікі праект ад інфармацыйнае сховішча у многіх комплексных этапах, і
цяжкасці з разуменнем мадэляў сутнасці і адносін, якія выкарыстоўваюцца пры распрацоўцы
інфармацыйнае сховішча.

    0/5 (0 водгукаў)
    0/5 (0 водгукаў)
    0/5 (0 водгукаў)

    Даведайцеся больш у Інтэрнэт-агенцтве Інтэрнэт

    Падпішыцеся, каб атрымліваць апошнія артыкулы па электроннай пошце.

    аватар аўтара
    адмін Генеральны дырэктар
    👍 Інтэрнэт-агенцтва | Эксперт вэб-агенцтва ў галіне лічбавага маркетынгу і SEO. Web Agency Online - гэта вэб-агенцтва. Для Agenzia Web Online поспех у лічбавай трансфармацыі заснаваны на асновах Iron SEO версіі 3. Спецыяльнасці: сістэмная інтэграцыя, інтэграцыя карпаратыўных прыкладанняў, сэрвіс-арыентаваная архітэктура, воблачныя вылічэнні, сховішча даных, бізнес-аналітыка, вялікія дадзеныя, парталы, інтранэт, вэб-прыкладанні Праектаванне і кіраванне рэляцыйнымі і шматмернымі базамі дадзеных Праектаванне інтэрфейсаў для лічбавых медыя: зручнасць выкарыстання і графіка. Онлайн вэб-агенцтва прапануе кампаніям наступныя паслугі: -SEO на Google, Amazon, Bing, Yandex; -Вэб-аналітыка: Google Analytics, Google Tag Manager, Yandex Metrica; -Канверсіі карыстальнікаў: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM на Google, Bing, Amazon Ads; - Маркетынг у сацыяльных сетках (Facebook, Linkedin, Youtube, Instagram).
    My Agile Privacy
    Гэты сайт выкарыстоўвае тэхнічныя і прафілявальныя файлы cookie. Націскаючы на ​​«Прыняць», вы дазваляеце ўсе прафіляваныя файлы cookie. Пры націсканні на адхіленне або X усе файлы cookie прафілявання адхіляюцца. Націснуўшы на наладзіць, можна выбраць, якія прафіляваныя файлы cookie актываваць.
    Гэты сайт адпавядае Закону аб абароне даных (LPD), Федэральнаму закону Швейцарыі ад 25 верасня 2020 г. і GDPR, Рэгламенту ЕС 2016/679, якія тычацца абароны персанальных даных, а таксама свабоднага перамяшчэння такіх даных.