fbpx

Складирање податоци и планирање на ресурси на претпријатија | DWH и ERP

АРХИВА ПОДАТОЦИ ЦЕНТРАЛНО: ИСТОРИЈА ЕД ЕВОЛУЦИИ

Двете доминантни теми на корпоративната технологија во 90-тите беа i складиште на податоци и ERP. Долго време овие две моќни струи беа дел од корпоративната ИТ без воопшто да имаат раскрсници. Речиси како да беа материја и анти-материја. Но, растот на двата феномени неизбежно доведе до нивно вкрстување. Денес компаниите се соочуваат со проблемот што да прават со ERP и складиште на податоци. Оваа статија ќе укаже кои се проблемите и како компаниите се справуваат со нив.

НА ПОЧЕТОК…

На почетокот постоеше складиште на податоци. Складиште на податоци беше создаден за да се спротивстави на системот за апликација за обработка на трансакции. Во раните денови меморирањето на податоци требаше да биде само контрапункт на апликациите за обработка на трансакции. Но, во денешно време има многу пософистицирани погледи за тоа што а складиште на податоци. Во денешниот свет, складиште на податоци тој е вметнат во структура која може да се нарече Фабрика за корпоративни информации.

ФАБРИКАТА ЗА КОРПОРАТИВНИ ИНФОРМАЦИИ (CIF)

Фабриката за корпоративни информации има стандардни архитектонски компоненти: ниво на трансформација и интеграција на код што ги интегрира податоци додека јас податоци тие се движат од околината на апликацијата кон околината на складиште на податоци на компанијата; а складиште на податоци на компанијата каде што на податоци детални и интегрирани историчари. На складиште на податоци на компанијата служи како темел врз кој може да се изградат сите други делови од животната средина складиште на податоци; оперативна продавница за податоци (ODS). ODS е хибридна структура која содржи некои аспекти на складиште на податоци и други аспекти на OLTP средина; data marts, каде што различни одделенија можат да имаат своја верзија на складиште на податоци; а складиште на податоци на истражување во кое „филозофите“ на компанијата можат да ги достават своите прашања 72 часа без штетно влијание врз складиште на податоци; и блиску линиска меморија, во која податоци стари и податоци рефус детали може да се чуваат евтино.

КАДЕ СЕ КОМБИНИРА ERP СО ФАБРИКА ЗА КОРПОРАТИВНИ ИНФОРМАЦИИ

ERP се спојува со фабриката за корпоративни информации на две места. Прво како основна апликација (основна линија) која обезбедува i податоци на апликацијата до складиште на податоци. Во овој случај јас податоци, генерирани како нуспроизвод на трансакциски процес, се интегрирани и вчитани во складиште на податоци на компанијата. Втората точка на соединување помеѓу ERP и CIF и ODS. Всушност, во многу средини ERP се користи како класичен ODS.

Во случај ERP да се користи како основна апликација, истиот ERP може да се користи и во CIF како ODS. Во секој случај, ако ERP треба да се користи во двете улоги, мора да постои јасна разлика помеѓу двата ентитета. Со други зборови, кога ERP ја игра улогата на основна апликација и ODS, двата архитектонски ентитети мора да се разликуваат. Ако една имплементација на ERP се обиде да ги изврши двете улоги истовремено, неизбежно ќе има проблеми во дизајнот и имплементацијата на таа структура.

ПОСЕБНИ КОРИСНИЦИ И ОСНОВНИ АПЛИКАЦИИ

Постојат многу причини кои водат до поделба на архитектонските компоненти. Можеби најгласното прашање за одвојување на различните компоненти на архитектурата е тоа што секоја компонента на архитектурата има свој поглед. Основната апликација служи за различна цел од ODS. Обидете се да се преклопите

основниот приказ на апликацијата за светот на ODS или обратно не е правилен начин на работа.

Следствено, првиот проблем на ERP во CIF е да потврди дали постои разлика помеѓу основните апликации и ODS.

МОДЕЛИ НА ПОДАТОЦИ ВО КОРПОРАТИВНАТА ФАБРИКА ЗА ИНФОРМАЦИИ

За да се постигне кохезија помеѓу различните компоненти на CIF архитектурата, мора да постои модел на податоци. Моделите на податоци тие служат како врска помеѓу различните компоненти на архитектурата како што се основните апликации и ODS. Моделите на податоци тие стануваат „интелектуална патоказ“ за да се добие вистинското значење од различните архитектонски компоненти на CIF.

Одејќи рака под рака со овој поим, идејата е дека треба да постои еден голем и единствен модел на податоци. Очигледно мора да има модел на податоци за секоја од компонентите и исто така мора да има разумна патека што ги поврзува различните модели. Секоја компонента на архитектурата - ODS, основни апликации, складиште на податоци на компанијата и така натаму.. – има потреба од сопствен модел податоци. И затоа мора да има прецизна дефиниција за тоа како овие модели податоци тие се поврзуваат едни со други.

ПОМЕСТИ I ПОДАТОЦИ НА ЕРП ВО ПОДАТОЦИТЕ СКУШЕН

Доколку потеклото на податоци е основна апликација и/или ODS, кога ERP го вметнува податоци во складиште на податоци, ова вметнување мора да се случи на најниско ниво на „грануларност“. Едноставно сумирајте или збирете i податоци бидејќи тие излегуваат од основната апликација на ERP или ERP ODS не е вистинската работа. НА податоци потребни се детали во складиште на податоци да ја формираат основата на процесот DSS. Таков податоци ќе бидат преобликувани на многу начини од страна на податоци марти и истражувања на складиште на податоци.

Преместувањето на податоци од основното опкружување на апликацијата ERP до складиште на податоци на компанијата се врши на разумно опуштен начин. Овој потег се случува приближно 24 часа по ажурирањето или креирањето во ERP. Фактот дека има „мрзливо“ движење на податоци во складиште на податоци на компанијата дозволува на податоци кои доаѓаат од ERP до „депонирање“. Откако јас податоци се зачувани во основната апликација, тогаш можете безбедно да ја преместите податоци на ERP во претпријатието. Уште една цел остварлива благодарение на „мрзливото“ движење на податоци тоа е јасна разграничување помеѓу оперативните процеси и DSS. Со „брзо“ движење на податоци линијата на поделба помеѓу ДСС и оперативните останува нејасна.

Движењето на податоци од ODS на ERP до складиште на податоци на компанијата се врши периодично, обично неделно или месечно. Во овој случај движењето на податоци се заснова на потребата да се „исчистат“ старите податоци историчари. Се разбира, ODS содржи i податоци кои се многу понови од податоци историчарите пронајдени во складиште на податоци.

Преместувањето на податоци во складиште на податоци речиси никогаш не се прави „продажба на големо“ (на веледрогерски начин). Копирајте табела од ERP околина во складиште на податоци нема смисла. Многу пореален пристап е да се преместат избраните единици на податоци. Само на податоци кои се сменија од последното ажурирање на складиште на податоци тие се оние кои треба да се преселат во складиште на податоци. Еден начин да се знае кои од нив податоци се сменија откако последното ажурирање е да се погледнат временските печати на податоци пронајдени во ERP околината. Дизајнерот ги избира сите промени што се случија од последното ажурирање. Друг пристап е да се користат техники за снимање промени податоци. Со овие техники, се анализираат дневници и ленти со дневници со цел да се одреди кои од нив податоци мора да се премести од ERP околината во онаа на складиште на податоци. Овие техники се најдобри бидејќи дневниците и лентите од списанија може да се читаат од ERP-датотеките без дополнително влијание врз другите ERP ресурси.

ДРУГИ КОМПЛИКАЦИИ

Едно од прашањата за ERP во CIF е што се случува со други извори на апликации или со податоци на ОДС за кои треба да придонесат складиште на податоци но тие не се дел од ERP околината. Со оглед на затворената природа на ERP, особено SAP, обидот да се интегрираат клучеви од надворешни извори на податоци кон јас податоци кои доаѓаат од ERP при преместување на податоци во складиште на податоци, тоа е голем предизвик. И точно кои се веројатностите дека и податоци на апликации или ODS надвор од околината ERP ќе бидат интегрирани во складиште на податоци? Шансите се всушност многу високи.

НАЈДЕТЕ ПОДАТОЦИ ИСТОРИСКИ ОД ERP

Друг проблем со и податоци на ERP е она што произлегува од потребата да се има податоци историчарите во рамките на складиште на податоци. Обично на складиште на податоци потреби податоци историчари. И ERP технологијата обично не ги складира овие податоци историски, барем не до степен до кој тоа е неопходно во складиште на податоци. Кога голема количина на податоци историјата почнува да се собира во ERP околината, таа околина треба да се исчисти. На пример, да претпоставиме дека а складиште на податоци мора да биде натоварен со пет години од податоци историски додека ERP задржува најмногу шест месеци од овие податоци. Се додека компанијата е задоволна со собирање на серија од податоци историчарите како што минува времето, тогаш нема проблем во користењето на ERP како извор за складиште на податоци. Но, кога на складиште на податоци тој мора да се врати во времето и да добие богови податоци истории кои претходно не биле собрани и зачувани од ERP, тогаш ERP околината станува неефикасна.

ERP И МЕТА ПОДАТОЦИ

Друго размислување за ERP e складиште на податоци е оној на метаподатоците кои постојат во ERP околината. Исто како што метаподатоците течат од ERP околината кон складиште на податоци, метаподатоците мора да се преместат на ист начин. Понатаму, метаподатоците мора да се трансформираат во формат и структура што ги бара инфраструктурата складиште на податоци. Постои голема разлика помеѓу оперативните метаподатоци и метаподатоци DSS. Оперативните метаподатоци се првенствено за развивачот и за

програмер. Метаподатоците на DSS се првенствено за крајниот корисник. Постојните метаподатоци во ERP апликациите или ODS треба да се конвертираат, и оваа конверзија не е секогаш лесна и јасна.

ИЗВОРИ НА ПОДАТОЦИТЕ ERP

Доколку ERP се користи како добавувач на податоци за складиште на податоци мора да има цврст интерфејс што го движи податоци од ERP околина до околина складиште на податоци. Интерфејсот мора:

  • ▪ да биде лесен за употреба
  • ▪ дозволи пристап до податоци на ERP
  • ▪ земете го значењето на податоци кои треба да бидат преместени во складиште на податоци
  • ▪ да ги знаете ограничувањата на ERP што може да се појават при пристап до податоци на ERP:
  • ▪ референцијален интегритет
  • ▪ хиерархиски односи
  • ▪ имплицитни логички односи
  • ▪ конвенција за апликација
  • ▪ сите структури на податоци поддржан од ERP, и така натаму…
  • ▪ бидете ефикасни во пристапот податоци, со обезбедување:
  • ▪ директно движење на податоци
  • ▪ стекнување на промена податоци
  • ▪ поддржува навремен пристап до податоци
  • ▪ разбирање на форматот на податоци, и така натаму… ИНТЕРФЕЈС СО SAP Интерфејсот може да биде од два вида, домашен или комерцијален. Некои од главните трговски интерфејси вклучуваат:
  • ▪ САС
  • ▪ Примс решенија
  • ▪ D2k, и така натаму… ПОВЕЌЕ ЕРП ТЕХНОЛОГИИ Да се ​​третира ERP околината како да е единствена технологија е голема грешка. Постојат многу ERP технологии, секоја со свои силни страни. Најпознатите продавачи на пазарот се:
  • ▪ SAP
  • ▪ Oracle Financials
  • ▪ PeopleSoft
  • ▪ Џеј Ди Едвардс
  • ▪ Баан САП SAP е најголемиот и најкомплетниот ERP софтвер. SAP апликациите вклучуваат многу видови апликации во многу области. SAP има репутација дека е:
  • ▪ многу голем
  • ▪ многу тешко и скапо за спроведување
  • ▪ потребни се многу луѓе и консултанти за да се имплементираат
  • ▪ бара специјализирани лица за имплементација
  • ▪ потребно е долго време за да се имплементира Понатаму, SAP има репутација дека го меморира своето податоци многу внимателно, што го отежнува пристапот до нив за некој надвор од областа SAP. Силата на SAP е во тоа што е способен да фати и складира голема количина на податоци. Неодамна SAP ја објави својата намера да ги прошири своите апликации на складиште на податоци. Има многу добрите и лошите страни за користење на SAP како продавач складиште на податоци. Предност е што SAP е веќе инсталиран и што повеќето консултанти веќе го знаат SAP.
    Недостатоците да се има SAP како добавувач на складиште на податоци ги има многу: SAP нема искуство во светот на складиште на податоци Доколку SAP е снабдувач на складиште на податоци, потребно е да се „извади“ т.е податоци од SAP до складиште на податоци. Дато евиденција на SAP за затворен систем, веројатно нема да биде лесно да се внесе јас од SAP во него (???). Постојат многу наследени околини кои го напојуваат SAP, како што се IMS, VSAM, ADABAS, ORACLE, DB2 итн. SAP инсистира на пристап „не измислен овде“. SAP не сака да соработува со други продавачи за да го користи или креира складиште на податоци. SAP инсистира самиот да го генерира целиот свој софтвер.

Иако SAP е голема и моќна компанија, се обидува да ја преработи технологијата на ELT, OLAP, системската администрација, па дури и основниот код на dbms тоа е само лудо. Наместо да заземе кооперативен став со добавувачите на складиште на податоци долгогодишен, SAP го следи пристапот „тие најдобро знаат“. Овој став го спречува успехот што SAP би можел да го има во областа на складиште на податоци.
Одбивањето на SAP да им дозволи на надворешните продавачи на брз и благодатен пристап до нивните податоци. Самата суштина на користење на a складиште на податоци е лесен пристап до податоци. Целата историја на SAP се заснова на тоа што го отежнува пристапот податоци.
Недостатокот на искуство на SAP во справувањето со големи количини на податоци; во полето на складиште на податоци постојат томови на податоци никогаш не видени од SAP и да управуваат со овие големи количини на податоци треба да имате соодветна технологија. SAP очигледно не е свесен за оваа технолошка бариера што постои за да влезе во полето на складиште на податоци.
Корпоративна култура на SAP: SAP направи бизнис со добивање на податоци од системот. Но, за да го направите ова треба да имате поинаков менталитет. Традиционално, софтверските компании кои беа добри во внесувањето податоци во околината не беа добри во добивањето податоци за да одат на друг начин. Доколку SAP успее да направи ваков тип на прекинувач, ќе биде првата компанија што ќе го направи тоа.

Накратко, прашање е дали една компанија треба да избере SAP за свој снабдувач складиште на податоци. Има многу сериозни ризици од една страна и многу малку награди од друга. Но, постои уште една причина што го обесхрабрува изборот на SAP за снабдувач складиште на податоци. Затоа што секоја компанија треба да го има истото складиште на податоци од сите други компании? На складиште на податоци тоа е срцето на конкурентската предност. Ако секоја компанија го усвои истото складиште на податоци би било тешко, иако не и невозможно, да се постигне конкурентска предност. Се чини дека SAP мисли дека а складиште на податоци може да се гледа како колаче и ова е дополнителен знак за нивниот менталитет на апликациите „добијте ги податоците во“.

Ниту еден друг ERP продавач не е толку доминантен како SAP. Несомнено ќе има компании кои ќе го следат патот на SAP за нивниот складиште на податоци но веројатно овие складиште на податоци SAP ќе биде голем, скап и одзема многу време за да се создаде.

Овие опкружувања вклучуваат активности како што се обработка на банкарски шалтери, процеси за резервација на авиокомпании, процеси за побарувања од осигурување и така натаму. Колку повеќе функционираше трансакцискиот систем, толку поочигледна беше потребата за одвојување помеѓу оперативниот процес и DSS (Систем за поддршка на одлуки). Меѓутоа, со системите за човечки ресурси и персонал, никогаш не се соочувате со голем обем на трансакции. И, се разбира, кога некое лице е вработено или ја напушта компанијата, ова е рекорд на трансакција. Но, во однос на другите системи, системите за човечки ресурси и персонал едноставно немаат многу трансакции. Затоа, во системите за човечки ресурси и персонал не е сосема очигледно дека има потреба од DataWarehouse. На многу начини овие системи претставуваат спојување на DSS системи.

Но, постои уште еден фактор што мора да се земе предвид ако се занимавате со складишта на податоци и PeopleSoft. Во многу средини, т.е податоци човечките и личните ресурси се споредни во однос на примарниот бизнис на компанијата. Повеќето компании се занимаваат со производство, продажба, обезбедување услуги итн. Човечките ресурси и системите за персонал обично се споредни (или поддржуваат) на главната деловна линија на компанијата. Затоа, тоа е двосмислено и незгодно складиште на податоци одвоени за човечки ресурси и кадровска поддршка.

PeopleSoft е многу различен од SAP во овој поглед. Со SAP, задолжително е да постои а складиште на податоци. Со PeopleSoft, не е толку јасно. Магацинот за податоци е опционален со PeopleSoft.

Најдоброто нешто што може да се каже за податоци PeopleSoft е дека складиште на податоци може да се користи за да се архивира i податоци кои се однесуваат на старите човечки и лични ресурси. Втора причина зошто една компанија би сакала да користи a складиште на податоци a

штета на околината PeopleSoft е да се дозволи пристап и слободен пристап до алатките за анализа, до податоци од PeopleSoft. Но, надвор од овие причини, може да има случаи каде што е подобро да нема складиште за податоци податоци PeopleSoft.

Во краток преглед

Има многу идеи во врска со изградбата на а складиште на податоци во рамките на ERP софтвер.
Некои од нив се:

  • ▪ Има смисла да се има а складиште на податоци тоа е како што било друго во индустријата?
  • ▪ Колку е флексибилен ERP складиште на податоци софтвер?
  • ▪ ERP складиште на податоци софтверот може да се справи со обем од податоци кој се наоѓа во аскладиште на податоци арена“?
  • ▪ Кое е снимањето на траги што го прави продавачот на ERP во услови на лесно и евтино, во однос на времето, податоци? (која е евиденцијата на продавачите на ERP за испорака на ефтини, навремени и лесни за пристап до податоци?)
  • ▪ Какво е разбирањето на продавачот на ERP за DSS архитектурата и фабриката за корпоративни информации?
  • ▪ Добавувачите на ERP разбираат како да постигнат податоци во рамките на животната средина, но, исто така, се разбере како да ги извезуваат?
  • ▪ Колку е отворен продавачот на ERP за алатките за складирање податоци?
    Сите овие размислувања мора да се направат при одредувањето каде да се стави складиште на податоци кој ќе биде домаќин на и податоци на ERP и други податоци. Општо земено, освен ако не постои убедлива причина да се направи поинаку, се препорачува градење складиште на податоци надвор од околината на продавачот на ERP. ПОГЛАВЈЕ 1 Преглед на клучните точки на организацијата БИ:
    Складиштата на информации работат обратно од архитектурата на деловната интелигенција (БИ):
    Корпоративната култура и ИТ може да го ограничат успехот во градењето БИ организации.

Технологијата повеќе не е ограничувачки фактор за БИ организациите. Прашањето за архитектите и планерите на проекти не е дали технологијата постои, туку дали тие можат ефективно да ја имплементираат достапната технологија.

За многу компании А складиште на податоци тоа е малку повеќе од пасивен депозит кој го дистрибуира податоци на корисниците на кои им е потребно. НА податоци тие се извлекуваат од изворните системи и се населуваат во целни структури на складиште на податоци. На податоци може да се исчистат и со секаква среќа. Сепак, не се додава или собира дополнителна вредност од податоци во текот на овој процес.

Во суштина, пасивниот Dw, во најдобар случај, обезбедува само i податоци чисти и оперативни за здруженијата на корисници. Создавањето информации и аналитичкото разбирање целосно зависи од корисниците. Судете дали DW (Складиште на податоци) е успехот е субјективен. Ако го оцениме успехот врз основа на способноста за ефикасно собирање, интегрирање и чистење на податоци корпоративно на предвидлива основа, тогаш да, DW е успех. Од друга страна, ако го погледнеме собирањето, консолидирањето и искористувањето на информациите од страна на организацијата во целина, тогаш ДВ е неуспех. DW обезбедува мала или никаква информативна вредност. Како резултат на тоа, корисниците се принудени да се задоволат, со што се создаваат информативни силоси. Ова поглавје претставува сеопфатен поглед за сумирање на архитектурата на компанијата БИ (Бизнис интелигенција). Започнуваме со опис на БИ, а потоа преминуваме на дискусии за дизајн и развој на информации, наспроти едноставно обезбедување информации. податоци на корисниците. Дискусиите потоа се фокусираат на пресметување на вредноста на вашите напори за БИ. Заклучуваме со дефинирање како IBM се справува со архитектонските барања за БИ на вашата организација.

Архитектура опис на БИ организација

Моќните информациски системи ориентирани кон трансакциите сега се вообичаени во секое големо претпријатие, ефикасно израмнувајќи го полето за игра за корпорациите ширум светот.

Меѓутоа, за да се остане конкурентен, сега се потребни аналитички ориентирани системи кои можат да ја револуционизираат способноста на компанијата повторно да ги открие и користи информациите што веќе ги поседува. Овие аналитички системи произлегуваат од разбирањето на богатството на податоци достапни. БИ може да ги подобри перформансите низ претпријатието. Компаниите можат да ги подобрат односите меѓу клиентите и добавувачите, да ја подобрат профитабилноста на производите и услугите, да генерираат нови и подобри понуди, да го контролираат ризикот и меѓу многу други придобивки драстично да ги намалат трошоците. Со БИ вашата компанија конечно почнува да ги користи информациите за клиентите како конкурентна предност благодарение на апликациите кои имаат пазарни цели.

Да се ​​има вистински бизнис алатки значи да се има дефинитивни одговори на клучните прашања како што се:

  • ▪ Кој од нашите клиенти дали нè тераат да заработуваме повеќе или нè тераат да губиме пари?
  • ▪ Каде што живеат нашите најдобри клиенти во врска со продавница/ магацин што го посетуваат?
  • ▪ Кои од нашите производи и услуги може да се продаваат најефективно и на кого?
  • ▪ Кои производи може најефективно да се продаваат и на кого?
  • ▪ Која продажна кампања е најуспешна и зошто?
  • ▪ Кои продажни канали се најефективни за кои производи?
  • ▪ Како можеме да ги подобриме односите со нашите најдобри луѓе клиенти? Повеќето компании имаат податоци груби начини за одговор на овие прашања.
    Оперативните системи генерираат големи количини на производи, клиенти и податоци пазар од продажни места, резервации, услуги на клиентите и системи за техничка поддршка. Предизвикот е да се извлечат и искористат овие информации. Многу компании профитираат само од мали фракции од нивните податоци за стратешки анализи.
    I податоци преостанати, често во комбинација со i податоци добиен од надворешни извори како што се владините извештаи и други купени информации, е златен рудник што чека да биде истражен, и податоци тие само треба да се рафинираат во информацискиот контекст на вашата организација.

Ова знаење може да се примени на неколку начини, почнувајќи од дизајнирање на севкупна корпоративна стратегија до лична комуникација со добавувачите, преку центри за повици, фактурирање, интернет и други точки. Денешното деловно опкружување налага DW и решенијата поврзани со БИ да се развиваат надвор од водење на традиционални деловни структури. податоци како што се јас податоци нормализирани на атомско ниво и „фарми со ѕвезди/коцки“.

Она што е потребно за да остане конкурентно е спој на традиционални и напредни технологии во обид да се поддржи огромен аналитички пејзаж.
Како заклучок, општото опкружување мора да го подобри знаењето на компанијата како целина, осигурувајќи дека активностите преземени како резултат на спроведените анализи се корисни за сите да имаат корист.

На пример, да речеме дека го рангирате своето клиенти во категории со висок или низок ризик.
Ако оваа информација е генерирана од извлекувач на модели или други средства, тие мора да се стават во DW и да бидат достапни за секого, со помош на која било алатка за пристап, како што се статични извештаи, табели, табели или онлајн аналитичка обработка (OLAP) .

Меѓутоа, во моментов, голем дел од овој тип на информации остануваат во силоси податоци на поединците или одделенијата кои ја генерираат анализата. Организацијата, како целина, има мала до никаква видливост за разбирање. Само со мешање на овој тип на информативна содржина во вашето претпријатие DW, можете да ги елиминирате информативните силоси и да ја подигнете вашата околина за DW.
Постојат две главни пречки за развој на БИ организација.
Прво, го имаме проблемот на самата организација и нејзината дисциплина.
Иако не можеме да помогнеме со промените во организациската политика, можеме да помогнеме во разбирањето на компонентите на БИ на една организација, нејзината архитектура и како технологијата IBM го олеснува нејзиниот развој.
Втората бариера што треба да се надмине е недостатокот на интегрирана технологија и познавање на метод кој се однесува на целиот БИ простор наспроти само мала компонента.

IBM се справува со промените во технологијата за интеграција. Ваша одговорност е да обезбедите внимателен дизајн. Оваа архитектура мора да биде развиена со технологија избрана за неограничена интеграција, или во најмала рака, со технологија која се придржува до отворените стандарди. Понатаму, менаџментот на вашата компанија мора да се погрижи заложбата за БИ да се изврши според планот и да не дозволи развивање на информативни силоси кои произлегуваат од агенди или цели кои служат само за себе.
Ова не значи дека околината на БИ не е чувствителна да реагира на различните потреби и барања на различни корисници; наместо тоа, тоа значи дека имплементацијата на тие индивидуални потреби и барања се врши во корист на целата БИ организација.
Опис на архитектурата на организацијата БИ може да се најде на страница 9 на Слика 1.1. Архитектурата демонстрира богата мешавина на технологии и техники.
Од традиционален поглед, архитектурата ги вклучува следните магацински компоненти

Атомски слој (Атомски слој).

Ова е основата, срцето на целата ДВ, а со тоа и на стратешкото известување.
I податоци складирани овде ќе го задржат историскиот интегритет, извештаите на податоци и вклучуваат изведени метрики, како и да се чистат, интегрираат и складираат со користење на екстракција на модел.
Сета последователна употреба на овие податоци а поврзаните информации се изведени од оваа структура. Ова е одличен извор за рударство податоци и за извештаи со структурирани SQL барања

Оперативен магацин на податоци или извештај основа на податоци(Складирање на оперативни податоци (ODS) или известување база на податоци.)

Ова е структура на податоци специјално дизајнирани за техничко известување.

I податоци складирани и пријавени погоре овие структури конечно можат да се пропагираат во складиштето преку просторот за поставување, каде што може да се користи за стратешко сигнализирање.

Површина за поставување.

Првата станица за повеќето податоци наменет за магацинската средина е зоната на организацијата.
Еве јас податоци се интегрираат, чистат и трансформираат во податоци профит што ќе ја насели структурата на складиштето

Датум марти.

Овој дел од архитектурата ја претставува структурата на податоци се користи специјално за OLAP. Присуството на datamarts, ако i податоци се зачувани во шемите со ѕвезди кои се преклопуваат податоци повеќедимензионални во релациона средина, или во датотеките на податоци Доверливото што се користи од специфична OLAP технологија, како што е серверот DB2 OLAP, не е релевантно.

Единственото ограничување е што архитектурата го олеснува користењето на податоци повеќедимензионални.
Архитектурата вклучува и критични Би технологии и техники кои се истакнуваат како:

Просторна анализа

Просторот е информативна неочекувана добивка за аналитичарот и е од клучно значење за целосна резолуција. Просторот може да претставува информации за луѓето кои живеат на одредена локација, како и информации за тоа каде таа локација е физички во однос на остатокот од светот.

За да ја извршите оваа анализа, мора да започнете со врзување на вашите информации со координатите на географска ширина и должина. Ова се нарекува „геокодирање“ и мора да биде дел од процесот на екстракција, трансформација и оптоварување (ETL) на атомско ниво на вашиот магацин.

Рударство на податоци.

Извлекувањето на податоци им овозможува на нашите компании да го зголемат бројот на клиенти, да ги предвиди продажните трендови и да дозволи управување со односите со клиенти (CRM), меѓу другите иницијативи на БИ.

Извлекувањето на податоци затоа мора да се интегрира со структурите на податоци на Dwhouse и поддржан од магацински процеси за да се обезбеди и ефективна и ефикасна употреба на релевантната технологија и техники.

Како што е наведено во архитектурата BI, атомското ниво на Dwhouse, како и datamarts, е одличен извор на податоци за екстракција. Истите тие капацитети мора да бидат и приматели на резултати од екстракција за да се обезбеди достапност до најшироката публика.

Агенти.

Постојат различни „агенти“ за испитување на клиентот за секоја точка, како што се оперативните системи на компанијата и самите dw. Овие агенти можат да бидат напредни невронски мрежи обучени да учат за трендовите во секоја точка, како што се идните барања за производи врз основа на продажни промоции, мотори засновани на правила за да реагираат на дато збир на околности, па дури и едноставни агенти кои известуваат за исклучоци на „врвните директори“. Овие процеси генерално се случуваат во реално време и затоа мора да бидат тесно поврзани со нивното движење податоци. Сите овие структури на податоци, технологиите и техниките гарантираат дека нема да ја поминете ноќта генерирајќи организација на вашиот БИ.

Оваа активност ќе се развива во поединечни чекори, за мали точки.
Секој чекор е независен проект напор и се нарекува повторување во вашата иницијатива DW или BI. Итерациите може да вклучуваат имплементација на нови технологии, почнувајќи со нови техники, додавање нови структури податоци , вчитување i податоци дополнителни, или со проширување на анализата на вашата околина. Овој параграф е разгледан подетално во поглавје 3.

Покрај традиционалните структури на DW и алатките за БИ, постојат и други функции на вашата организација за БИ за кои треба да дизајнирате, како што се:

Точки на допир на клиенти (допир со клиенти поени).

Како и кај секоја модерна организација, постојат голем број на допирни точки на клиентите кои покажуваат како да имате позитивно искуство за вашето клиенти. Постојат традиционални канали како што се трговците на мало, оператори на централи, директна пошта, мултимедијално и печатено рекламирање, како и повеќе актуелни канали како што се е-пошта и веб, податоци производите со одредена точка на допир мора да се набават, транспортираат, исчистат, преработат и потоа да се населат во објектите податоци на БИ.

Основи на податоци оперативни и кориснички здруженија (Оперативно

бази на податоци и кориснички заедници).
На крајот од контактните точки на клиенти се наоѓаат темелите податоци на апликацијата и корисничките заедници на компанијата. НА податоци постоечки се податоци традиционална која мора да се соедини и да се спои со податоци кои течат од контакт точките за да ги задоволат потребните информации.

Аналитичарите. (Аналитичарите)

Примарниот корисник на околината на БИ е аналитичарот. Токму тој има корист од сегашното извлекување на податоци оперативни, интегрирани со различни извори на податоци , надополнети со карактеристики како географска анализа (геокодирање) и претставени во BI технологии кои овозможуваат екстракција, OLAP, напредно SQL известување и географска анализа. Примарниот аналитичарски интерфејс за околината за известување е порталот БИ.

Сепак, аналитичарот не е единствениот кој има корист од архитектурата на БИ.
Директори, големи здруженија на корисници, па дури и членови, добавувачи и i клиенти треба да најде бенефиции во претпријатието БИ.

Задна јамка за довод.

BI архитектурата е средина за учење. Карактеристичен принцип на развој е да се дозволи упорни структури на податоци да се ажурира според користената БИ технологија и со дејствија преземени од корисникот. Пример е бодувањето на клиентите.

Ако одделот за продажба ги моделира резултатите на клиентите за да користи нова услуга, тогаш одделот за продажба не треба да биде единствената група која има корист од услугата.

Наместо тоа, екстракцијата на моделот треба да се изврши како природен дел од протокот на податоци во рамките на претпријатието и резултатите од клиентите треба да станат интегриран дел од контекстот на информации за складиштето, видлив за сите корисници. Би-bI-центричниот IBM Suite вклучувајќи DB2 UDB, DB2 OLAP сервер ги вклучува повеќето од главните технолошки компоненти, дефинирани на Слика 1.1.

Ја користиме архитектурата како што е прикажана на оваа слика од книгата за да ни даде ниво на континуитет и да покаже како секој производ на IBM се вклопува во целокупната BI шема.

Обезбедување информативна содржина (Обезбедување информативна содржина)

Дизајнирањето, развојот и имплементирањето на вашата БИ околина е застрашувачка задача. Дизајнот мора да ги опфаќа и сегашните и идните деловни барања. Архитектонскиот цртеж мора да биде целосен за да ги вклучи сите заклучоци пронајдени во фазата на дизајнирање. Извршувањето мора да остане посветено на една единствена цел: развивање на архитектурата на БИ како што е формално претставена во дизајнот и втемелена во деловните барања.

Особено е тешко да се тврди дека дисциплината ќе обезбеди релативен успех.
Ова е едноставно затоа што не развивате БИ околина одеднаш, туку тоа го правите во мали чекори со текот на времето.

Сепак, идентификувањето на компонентите на БИ на вашата архитектура е важно од две причини: Вие ќе ги водите сите последователни одлуки за техничка архитектура.
Ќе можете свесно да планирате одредена употреба на технологијата, иако можеби нема да ви се повтори технологијата неколку месеци.

Доволно разбирање на вашите деловни барања ќе влијае на видот на производи што ги добивате за вашата архитектура.
Дизајнирањето и развојот на вашата архитектура гарантира дека вашиот магацин е

не е случаен настан, туку внимателно конструиран „добро осмислен“. опера на уметноста како мозаик на мешана технологија.

Дизајнирајте информативна содржина

Целиот првичен дизајн мора да се фокусира на и да ги идентификува клучните компоненти на БИ кои ќе ѝ бидат потребни на целокупното опкружување сега и во иднина.
Познавањето на деловните барања е важно.

Дури и пред да започне каков било формален дизајн, планерот на проектот често може веднаш да идентификува една или две компоненти.
Сепак, рамнотежата на компонентите што може да бидат потребни за вашата архитектура, не може лесно да се најде. За време на фазата на дизајнирање, главниот дел од архитектурата ја поврзува сесијата за развој на апликации (JAD) со потрагата за идентификување на деловните барања.

Понекогаш овие барања може да им се доверат на алатките за пребарување и известување.
На пример, корисниците наведуваат дека ако сакаат да го автоматизираат тековниот извештај, тие мора рачно да го генерираат со интегрирање на два тековни извештаи и додавање на пресметки добиени од комбинацијата на податоци.
Иако ова барање е едноставно, дефинира одредена функционалност на функцијата што мора да ја вклучите кога купувате алатки за известување за вашата организација.

Дизајнерот, исто така, мора да следи дополнителни барања за да добие целосна слика. Дали корисниците сакаат да се претплатат на овој извештај?
Дали се генерираат подмножества на извештаи и се испраќаат по е-пошта до различни корисници? Дали сакаат да го видат овој извештај на порталот на компанијата? Сите овие барања се дел од едноставната потреба за замена на рачен извештај како што бараат корисниците. Придобивката од овие типови барања е што сите, корисници и дизајнери, имаат разбирање за концептот на извештаи.

Меѓутоа, постојат и други видови бизниси за кои треба да планираме. Кога деловните барања се наведени во форма на стратешки деловни прашања, на експертот дизајнер му е лесно да ги препознае мерките/фактите и барањата за димензии.

Ако корисниците на JAD не знаат како да ги наведат своите барања во форма на деловен проблем, дизајнерот често дава примери за да започне сесијата за собирање барања.
Експертскиот дизајнер може да им помогне на корисниците да разберат не само стратешко тргување, туку и како да го формираат.
Пристапот за собирање барања е дискутиран во поглавје 3; засега сакаме само да укажеме на потребата од дизајнирање за сите видови барања за БИ.

Стратешкиот деловен проблем не е само деловно барање, туку и дизајн. Ако треба да одговорите на повеќедимензионално прашање, тогаш треба да меморирате, презентирате i податоци димензионални, и ако треба да го запаметите податоци мултидимензионален, мора да одлучите каков тип на технологија или техника ќе употребите.

Дали имплементирате шема на резервирана коцка ѕвезда или и двете? Како што можете да видите, дури и едноставен деловен проблем може значително да влијае на дизајнот. Но, овие типови на деловни барања се вообичаени и разбрани, барем од дизајнерите и планерите со проектно искуство.

Имаше доволно дискусии за OLAP технологиите и поддршката, а достапни се широк спектар на решенија. Досега ја споменавме потребата да се спојат едноставното известување со деловните димензионални барања и како овие барања влијаат на техничките архитектонски одлуки.

Но, кои се барањата што не се лесно разбирливи од корисниците или од тимот на Dw? Дали некогаш ќе ви треба просторна анализа?
Моделите за рударство на податоци дали тие ќе бидат неопходен дел од вашата иднина? Кој знае?

Важно е да се напомене дека овие типови технологии не се добро познати кај општите заедници на корисници и членовите на тимот на Dw, делумно, тоа може да биде затоа што тие обично се ракуваат од некои внатрешни или трети технички експерти. Тоа е екстремен случај на проблемите што ги создаваат овие типови технологии. Ако корисниците не можат да ги опишат деловните барања или да ги обликуваат на начин што ќе им даде насоки на дизајнерите, тие можат да останат незабележани или, уште полошо, едноставно да се игнорираат.

Попроблематично станува кога дизајнерот и развивачот не можат да ја препознаат примената на една од овие напредни, но критични технологии.
Како што често сме слушнале како дизајнерите велат: „Па, зошто да не го оставиме настрана додека не го добиеме ова друго нешто? „Дали тие навистина се заинтересирани за приоритетите или едноставно избегнуваат барања што не ги разбираат? Најверојатно тоа е последната хипотеза. Да речеме дека вашиот тим за продажба објавил деловно барање, како што е наведено на Слика 1.3, како што можете да видите, барањето е врамено во форма на деловен проблем. Разликата помеѓу овој проблем и типичниот димензионален проблем е растојанието. Во овој случај, продажниот тим сака да ја знае, на месечна основа, вкупната продажба од производите, магацините и клиенти кои живеат на 5 милји од складиштето каде што купуваат.

За жал, дизајнерите или архитектите едноставно можат да ја игнорираат просторната компонента велејќи: „Ги имаме клиентот, производот и податоци на депозитот. Да го задржиме растојанието до уште едно повторување.

"Погрешен одговор. Овој тип на деловен проблем е за сите БИ. Тоа претставува подлабоко разбирање на нашиот бизнис и робустен аналитички простор за нашите аналитичари. BI е надвор од едноставното барање или стандардното известување, па дури и OLAP. Ова не значи дека овие технологии не се важни за вашиот БИ, но тие сами по себе не ја претставуваат околината на БИ.

Дизајн за информативен контекст (Дизајн за информативна содржина)

Сега кога ги идентификувавме деловните барања кои разликуваат различни основни компоненти, тие мора да бидат вклучени во целокупниот архитектонски дизајн. Некои од компонентите на БИ се дел од нашите првични напори, додека некои нема да бидат имплементирани неколку месеци.

Сепак, сите познати барања се рефлектираат во дизајнот, така што кога треба да имплементираме одредена технологија, ние сме подготвени да го сториме тоа. Нешто во врска со проектот ќе го одрази традиционалното размислување.

Овој сет на податоци се користи за поддршка на подоцнежните употреби на податоци димензионални водени од деловните проблеми што ги идентификувавме. Како што се генерираат дополнителни документи, како што е развојот на дизајнот на податоци, ќе почнеме да го формализираме како и податоци се шират во околината. Констатиравме потреба од застапување и податоци на димензионален начин, делејќи ги (според специфичните специфични потреби) на податочни марки.

Следното прашање на кое треба да се одговори е: како ќе се изградат овие податочни маркети?
Дали ги градите ѕвездите за да ги поддржат коцките, или само коцките или само ѕвездите? (или прави коцки, или прави ѕвезди). Создадете архитектура за зависни податоци кои бараат атомски слој за сите податоци стекнуваш? Дозволете независни податоци мартови да стекнат i податоци директно од оперативните системи?

Која технологија Cube ќе се обидете да ја стандардизирате?

Имате огромни количини на богови податоци потребни за димензионална анализа или ви требаат коцки од вашата национална продажна сила на неделно ниво или и двете? Дали градите нешто толку моќно како серверот DB2 OLAP за финансии или коцките Cognos PowerPlay за вашата продажна организација, или и двете? Ова се големите одлуки за архитектонски дизајн што ќе влијаат на вашата БИ околина од овде па натаму. Да, утврдивте потреба за OLAP. Сега како ќе го спроведете тој тип на техника и технологија?

Како некои од најнапредните технологии влијаат на вашите дизајни? Да претпоставиме дека сте идентификувале потреба од простор во вашата организација. Сега мора да се потсетите на изданијата на архитектонски цртежи дури и ако не планирате да правите просторни компоненти неколку месеци. Архитектот мора да дизајнира денес врз основа на она што е потребно. Предвидете ја потребата за просторна аналитика која генерира, складира, изведува и обезбедува пристап до податоци просторни. Ова за возврат треба да послужи како ограничување во однос на видот на софтверската технологија и спецификациите на платформата што моментално може да ги земете предвид. На пример, системот на администрација на база на податоци релациониот слој (RDBMS) што го изведувате за вашиот атомски слој мора да има достапен робустен просторен опсег. Ова ќе обезбеди максимални перформанси кога користите геометрија и просторни објекти во вашите аналитички апликации. Ако вашиот RDBMS не може да се справи со податоци (просторно-центрично) внатрешно, така што ќе мора да воспоставите a база на податоци (просторно-центрично) надворешен. Ова го комплицира управувањето со прашањата и ги загрозува вашите вкупни перформанси, а да не ги спомнуваме дополнителните проблеми создадени за вашите DBA, бидејќи тие веројатно имаат минимално разбирање за основите на податоци просторно исто така. Од друга страна, ако вашиот RDMBS мотор се справува со сите просторни компоненти и неговиот оптимизатор е свесен за посебните потреби (на пример, индексирање) на просторните објекти, тогаш вашите DBA лесно можат да се справат со управувањето со проблемите и можете да ги максимизирате перформансите.

Дополнително, треба да ја прилагодите областа за поставување и слојот на атомската средина за да вклучите чистење на адресата (а

клучен елемент за просторна анализа), како и последователно заштеда на вселенски објекти. Сукцесијата на цртачки изданија продолжува сега кога го воведовме поимот јасна насока. Како прво, оваа апликација ќе го диктира типот на софтвер потребен за вашиот напор за ETL.

Дали ви се потребни производи како Trillium за да му обезбедите чиста адреса или продавач на ETL по ваш избор за да ја обезбеди таа функционалност?
Засега е важно да го цените нивото на дизајн што мора да се заврши пред да започнете со имплементација на вашиот магацин. Горенаведените примери треба да го покажат мноштвото одлуки за дизајн што мора да го следат идентификацијата на одредено деловно барање. Доколку се донесат правилно, овие дизајнерски одлуки промовираат меѓузависност помеѓу физичките структури на вашата околина, изборот на користената технологија и протокот на ширење на информациската содржина. Без оваа конвенционална архитектура на БИ, вашата организација ќе биде предмет на хаотичен микс на постоечки технологии, во најдобар случај лабаво споени заедно за да се обезбеди привидна стабилност.

Одржувајте информациска содржина

Донесувањето на вредноста на информациите во вашата организација е многу тешка задача. Без доволно разбирање и искуство, или соодветно планирање и дизајн, дури и најдобрите тимови ќе пропаднат. Од друга страна, ако имате одлична интуиција и детално планирање, но немате дисциплина за извршување, едноставно сте ги потрошиле парите и времето затоа што вашиот напор е осуден на неуспех. Пораката треба да биде јасна: ако ви недостасуваат една или повеќе од овие вештини, разбирање/искуство или дисциплина за планирање/дизајн или спроведување, тоа ќе ја осакати или уништи зградата на организацијата БИ.

Дали вашиот тим е доволно подготвен? Дали има некој во вашиот тим за БИ кој го разбира огромниот аналитички пејзаж достапен во средини на БИ и техниките и технологиите потребни за одржување на тој пејзаж? Дали има некој во вашиот тим кој може да ја препознае разликата во апликацијата помеѓу напредните

статичко известување и OLAP, или разликите помеѓу ROLAP и OLAP? Дали еден од членовите на вашиот тим јасно препознава како се извлекува и како тоа може да влијае на складиштето или како складот ​​може да ги поддржи перформансите за извлекување? Член на тимот ја разбира вредноста на податоци вселенска или технологија базирана на агенти? Дали имате некој кој ја цени уникатната примена на ETL алатките наспроти технологијата за брокер за пораки? Ако немате, земете. BI е многу поголем од нормализиран атомски слој, OLAP, шеми со ѕвезди и ODS.

Да се ​​има разбирање и искуство за препознавање на барањата за БИ и нивните решенија е од суштинско значење за вашата способност правилно да ги формализирате потребите на корисниците и да ги дизајнирате и имплементирате нивните решенија. Ако вашата корисничка заедница има потешкотии да ги опише барањата, задачата на тимот на магацинот е да го обезбеди тоа разбирање. Но, ако тимот на магацинот

не ја препознава специфичната примена на БИ - на пример, податочно рударство - тогаш не е најдоброто што опкружувањата на БИ често се ограничени да бидат пасивни складишта. Сепак, игнорирањето на овие технологии не ја намалува нивната важност и ефектот што го имаат врз појавата на способностите за деловна интелигенција на вашата организација, како и на информацискиот пејзаж што планирате да го поттикнете.

Планирањето мора да го вклучи поимот цртање, а за двете е потребна компетентна личност. Дополнително, дизајнирањето бара тимска филозофија за складиште и придржување кон стандардите. На пример, ако вашата компанија има воспоставено стандардна платформа или има идентификувано одреден RDBMS што сакате да го стандардизирате низ платформата, одговорноста е на сите во тимот да се придржуваат до тие стандарди. Општо земено, тимот ја изложува потребата за стандардизација (на заедниците на корисници), но самиот тим не е подготвен да се придржува до стандардите, исто така воспоставени во други области во компанијата или можеби дури и во слични компании. Ова не само што е лицемерно, туку и утврдува дека компанијата не е способна да ги искористи постоечките ресурси и инвестиции. Тоа не значи дека нема ситуации кои гарантираат нестандардизирана платформа или технологија; сепак напорите на магацинот

тие треба љубоморно да ги чуваат стандардите на претпријатието додека деловните барања не диктираат поинаку.

Третата клучна компонента потребна за да се изгради организација на БИ е дисциплината.
Тоа зависи вкупно, подеднакво и од поединците и од околината. Планерите на проектите, спонзорите, архитектите и корисниците мора да ја ценат дисциплината неопходна за изградба на информацискиот пејзаж на компанијата. Дизајнерите мора да ги насочат своите дизајнерски напори на таков начин што ќе ги надополнат другите неопходни напори во општеството.

На пример, да речеме дека вашата компанија гради ERP апликација која има компонента за складиште.
Затоа, одговорност на дизајнерите на ERP е да соработуваат со тимот за опкружување на складиштето за да не се натпреваруваат или да не се дуплираат веќе започнатата работа.

Дисциплината е исто така тема на која мора да се занимава целата организација и обично е воспоставена и доверена на извршно ниво.
Дали менаџерите се подготвени да се придржуваат до дизајниран пристап? Пристап кој ветува дека ќе создаде информативна содржина која на крајот ќе донесе вредност во сите области на претпријатието, но можеби ги компромитира индивидуалните или одделенските агенди? Запомнете ја изреката „Да се ​​размислува за сè е поважно отколку да се размислува само за една работа“. Оваа изрека е точна за организациите на БИ.

За жал, многу магацини ги фокусираат своите напори на обидот да таргетираат и да донесат вредност на одреден оддел или специфични корисници, со мало внимание на организацијата во целина. Да претпоставиме дека извршната власт бара помош од тимот на магацинот. Тимот реагира со 90-дневен напор кој вклучува не само доставување на барањата за известување дефинирани од менаџерот, туку и обезбедување дека сите податоци базата се меша на атомско ниво пред да се воведе во предложената технологија на коцки.
Овој инженерски додаток гарантира дека претпријатието во магацин ќе има корист од податоци потребни на менаџерот.
Сепак, извршната власт разговараше со надворешни консултантски фирми кои предложија слична апликација со испорака за помалку од 4 недели.

Под претпоставка дека внатрешниот тим за складиште е компетентен, извршната власт има избор. Кој може да ја поддржи дополнителната инженерска дисциплина потребна за развивање на претпријатието за информативни средства или може да избере брзо да изгради сопствено решение. Се чини дека последното се избира премногу често и служи само за создавање контејнери со информации од кои корист имаат само малкумина или поединецот.

Краткорочни и долгорочни цели

Архитектите и дизајнерите на проекти мора да формализираат долгорочна визија за целокупната архитектура и плановите за раст во организацијата БИ. Оваа комбинација на краткорочна добивка и долгорочно планирање ги претставува двете страни на напорите на БИ. Краткорочната добивка е аспект на БИ што е поврзан со повторувањата на вашиот магацин.

Ова е местото каде што планерите, архитектите и спонзорите се фокусираат на исполнување на специфични комерцијални барања. На ова ниво се градат физички структури, се купува технологија и се спроведуваат техники. Тие во никој случај не се направени за да одговорат на специфичните барања како што се дефинирани од одредени заедници на корисници. Сè е направено со цел да се одговори на специфичните барања дефинирани од одредена заедница.
Меѓутоа, долгорочното планирање е другиот аспект на БИ. Ова е местото каде што плановите и дизајните гарантираа дека е изградена каква било физичка структура, избраните технологии и имплементираните техники направени со поглед кон претпријатието. Долгорочното планирање е она што ја обезбедува кохезијата потребна за да се осигури дека деловните придобивки ќе произлезат од сите пронајдени краткорочни придобивки.

Оправдајте го вашиот напор за БИ

Un складиште на податоци само по себе нема вродена вредност. Со други зборови, не постои вродена вредност помеѓу технологиите на складиштето и техниките за имплементација.

Вредноста на секој магацин напор се наоѓа во дејствијата извршени како резултат на околината на складиштето и информациската содржина култивирана со текот на времето. Ова е критична точка што треба да ја разберете пред да се обидете да ја процените вредноста на која било иницијатива.

Премногу често, архитектите и дизајнерите се обидуваат да применат вредност на физичките и техничките компоненти на складиштето кога всушност вредноста се заснова на деловните процеси кои се позитивно под влијание на складиштето и добро стекнатите информации.

Тука лежи предизвикот за основање БИ: Како ја оправдувате инвестицијата? Ако самата куќарка нема внатрешна вредност, дизајнерите на проектот мора да ги истражат, дефинираат и формализираат придобивките постигнати од оние поединци кои ќе го користат складиштето за да ги подобрат конкретните деловни процеси или вредноста на заштитените информации или и двете.

За да се комплицираат работите, секој деловен процес погоден од напорите за складирање може да обезбеди „значителни“ или „мали“ придобивки. Значителните придобивки обезбедуваат опиплива метрика за мерење на повратот на инвестицијата (ROI) - на пример, вртење на залихи дополнително време во одреден период или за пониски транспортни трошоци по пратка. Потешко е да се дефинираат суптилните придобивки, како што е подобрен пристап до информации, во смисла на опиплива вредност.

Поврзете го вашиот проект за да го знаете деловни барања

Премногу често, планерите на проекти се обидуваат да ја поврзат вредноста на складиштето со аморфните цели на претпријатието. Со изјавата дека „вредноста на магацинот се заснова на нашата способност да ги задоволиме стратешките барања“, ја отвораме дискусијата на пријатен начин. Но, само тоа не е доволно за да се утврди дали инвестирањето во залихи има смисла. Најдобро е да се поврзат повторувањата на складиштето со специфични, познати деловни барања.

Измерете ја рентабилноста

Пресметувањето на рентабилност во складиште може да биде особено тешко. Тоа е особено тешко ако предноста

принципот на одредено повторување е нешто што не е опипливо или лесно да се измери. Една студија покажа дека корисниците согледуваат две главни придобивки од иницијативите на БИ:

  • ▪ Создадете способност за креирање одлуки
  • ▪ Создадете пристап до информации
    Овие придобивки се меки (или благи) придобивки. Лесно е да се види како можеме да пресметаме рентабилност врз основа на тешка (или голема) придобивка, како што се намалените трошоци за транспорт, но како да ја измериме способноста за донесување подобри одлуки?
    Ова е дефинитивно предизвик за планерите на проекти кога се обидуваат да ја убедат компанијата да инвестира во одреден магацин. Зголемувањето на продажбата или намалувањето на трошоците повеќе не се централните теми што ја движат околината на БИ.
    Наместо тоа, ги разгледувате деловните барања за подобар пристап до информации, така што одреден оддел може да донесува побрзи одлуки. Ова се стратешки двигатели кои се подеднакво важни за претпријатието, но се понејасни и потешко да се карактеризираат во опиплива метрика. Во овој случај, пресметувањето на ROI може да биде погрешно, ако не и ирелевантно.
    Планерите на проекти мора да бидат способни да покажат опиплива вредност за директорите да одлучат дали инвестицијата во одредена повторување вреди. Сепак, нема да предложиме нов метод за пресметување на рентабилноста, ниту пак ќе даваме аргументи за или против.
    Постојат многу написи и книги кои ги разгледуваат основите на пресметувањето на рентабилноста. Постојат посебни предлози за вредност како вредност на инвестирањето (VOI), понудени од групи како Гартнер, кои можете да ги истражите. Наместо тоа, ќе се фокусираме на основните аспекти на која било рентабилност или други предлози за вредност што треба да ги земете во предвид. Примена на рентабилност Надвор од аргументот за „тешките“ придобивки наспроти „меките“ придобивки поврзани со напорите на БИ, има и други прашања што треба да се земат предвид при примена на рентабилност. На пример:

Припишете премногу заштеди на напорите на DW што сепак би дошле
Да речеме дека вашата компанија се пресели од архитектура на мејнфрејм во дистрибуирана UNIX околина. Значи, секоја заштеда што може (или можеби не) да се реализира од тој напор не треба да се припишува исклучиво, ако воопшто (?), на магацинот.

Не сметководството за се е скапо. И има многу работи што треба да се земат предвид. Размислете за следнава листа:

  • ▪ Почетна цена, вклучително и изводливост.
  • ▪ Трошоци за посветен хардвер со поврзано складирање и комуникации
  • ▪ Цена на софтверот, вклучувајќи го и управувањето податоци и екстензии на клиент/сервер, ETL софтвер, DSS технологии, алатки за визуелизација, апликации за распоред и тек на работа и софтвер за следење, .
  • ▪ Трошоци за проектирање на структурата податоци, со креирање и оптимизација на
  • ▪ Трошоци за развој на софтвер директно поврзани со напорот на БИ
  • ▪ Трошоци за поддршка на лице место, вклучувајќи оптимизација на перформансите, вклучувајќи контрола на верзијата на софтверот и операции за помош Примени „Big-Bang“ ROI. Изградбата на магацинот како единствен, огромен напор е осудена на неуспех, па дури и пресметајте го рентабилноста за иницијатива на големо претпријатие Понудата е изненадувачка, а планерите продолжуваат да прават слаби обиди да ја проценат вредноста на целиот напор. Зошто планерите се обидуваат да стават парична вредност на деловната иницијатива ако е нашироко познато и прифатено дека е тешко да се проценат конкретните повторувања? Како е можно? Тоа не е можно со неколку исклучоци. Не правете го тоа. Сега кога утврдивме што не треба да правиме при пресметување на рентабилноста, еве неколку точки што ќе ни помогнат да воспоставиме сигурен процес за проценка на вредноста на вашите напори за БИ.

Добивање консензус за рентабилност. Без оглед на вашиот избор на техника за проценка на вредноста на вашите напори за БИ, таа мора да биде договорена од сите страни, вклучувајќи ги дизајнерите на проекти, спонзорите и деловните директори.

Намалете ја рентабилноста на делови што може да се идентификуваат. Неопходен чекор кон разумно пресметување на рентабилност е да се фокусира таа пресметка на одреден проект. Ова потоа ви овозможува да ја процените вредноста врз основа на специфичните деловни барања што се исполнети

Дефинирајте ги трошоците. Како што споменавме, мора да се земат предвид бројни трошоци. Понатаму, трошоците мора да ги вклучуваат не само оние поврзани со едно повторување, туку и трошоците поврзани со обезбедување усогласеност со стандардите на претпријатието.

Дефинирајте ги придобивките. Со јасно поврзување на ROI со специфични деловни барања, треба да можеме да ги идентификуваме придобивките што ќе доведат до исполнување на барањата.

Намалете ги трошоците и придобивките во неизбежните профити. Тоа е најдобриот начин да ги засновате вашите вреднувања на нето сегашната вредност (NPV) наспроти обидот да се предвиди идната вредност на идните приходи.

Чувајте го времето на поделба на вашиот ROI на минимум. Добро е документирано во текот на долгиот временски период што се користел во вашата рентабилност.

Користете повеќе од една формула за рентабилност. Постојат бројни методи за прогнозирање на рентабилност и треба да планирате дали да користите еден или повеќе од нив, вклучувајќи нето сегашна вредност, внатрешна стапка на поврат (IRR) и враќање.

Дефинирајте повторлив процес. Ова е клучно за пресметување на која било долгорочна вредност. Треба да се документира единствен повторлив процес за да следат сите последователни секвенци на проектот.

Наведените проблеми се најчестите што ги дефинираат експерти во околината на магацините. Инсистирањето на менаџментот да испорача рентабилност на „Big-Bang“ е многу дезориентирачки. Ако ги започнете сите ваши пресметки за рентабилност со разложување на препознатливи, опипливи делови, имате добри шанси да ја процените точната оцена на рентабилност.

Прашања за придобивките од рентабилноста

Без оглед на вашите придобивки, меки или тврди, можете да користите некои основни прашања за да ја одредите нивната вредност. На пример, користејќи едноставен систем за скалирање, од 1 до 10, можете да го измерите влијанието на секој напор користејќи ги следниве прашања:

  • Како би го оцениле разбирањето на податоци го следите овој проект на вашата компанија?
  • Како би ги процениле подобрувањата на процесот како резултат на овој проект?
  • Како би го измериле влијанието на новите сознанија и заклучоци кои сега се достапни со оваа повторување
  • Какво беше влијанието на новите и перформанси компјутерски средини како резултат на наученото? Ако одговорите на овие прашања се малку, можно е компанијата да не вреди за вложената инвестиција. Прашањата со високи оценки укажуваат на значителни добивки од вредност и треба да послужат како водич за понатамошно истражување. На пример, високиот резултат за подобрувања на процесите треба да ги наведе дизајнерите да испитаат како се подобрени процесите. Може да откриете дека некои или сите остварени добивки се опипливи и затоа монетарната вредност може лесно да се примени. Извлекување на максимум од првата итерација на магацин Најголемиот резултат од напорот на вашата компанија е често во првите неколку повторувања. Овие рани напори традиционално ја воспоставуваат најкорисната информациска содржина за јавноста и помагаат да се воспостави технолошка основа за следните BI апликации. Обично секоја наредна последователна секвенца на податоци магацинските проекти носат се помалку дополнителна вредност на претпријатието во целина. Ова е особено точно ако повторувањето не додава нови теми или не ги задоволува потребите на нова корисничка заедница.

Оваа функција за складирање исто така важи и за растечките купишта податоци историчари. Како што последователните напори бараат повеќе податоци и колку повеќе податоци се влеваат во магацинот со текот на времето, повеќето од податоци станува помалку релевантен за користената анализа. Овие податоци тие често се нарекуваат податоци неактивни и секогаш е скапо да се чуваат бидејќи речиси никогаш не се користат.

Што значи ова за спонзорите на проектот? Во суштина, раните спонзори споделуваат повеќе од она што чини инвестицијата. Ова е примарно затоа што тие се поттик за воспоставување на широк технолошки и ресурсен слој на животната средина на складиштето, вклучително и органското.

Но, овие први чекори носат најголема вредност и затоа дизајнерите на проекти често мора да ја оправдаат инвестицијата.
Проектите направени по вашата иницијатива за БИ може да имаат помали (во споредба со првите) и директни трошоци, но носат помала вредност за компанијата.

И сопствениците на организации треба да почнат да размислуваат за фрлање на акумулацијата податоци и помалку релевантни технологии.

Рударство на податоци: екстракција Дати

Бројни архитектонски компоненти бараат варијации во технологиите и техниките за ископување податоци -
на пример, различните „агенти“ за испитување на точките од интерес на клиенти, оперативните системи на компанијата и за самата dw. Овие агенти може да бидат напредни невронски мрежи обучени за POT трендови, како што е идна побарувачка на производи врз основа на продажни промоции; мотори базирани на правила да реагираат на множество дато на околности, на пример, медицинска дијагноза и препораки за третман; или дури и едноставни агенти со улога на известување за исклучоци на врвни директори. Генерално овие процеси на екстракција податоци si

проверете во реално време; затоа мора целосно да се обединат со движењето на податоци стеси.

Обработка на онлајн аналитичка обработка

Онлајн аналитика

Способност за сечење, коцки, тркалање, дупчење и вршење анализа
што-ако, е во опсегот, фокусот на технолошкиот пакет на IBM. На пример, функциите за онлајн аналитичка обработка (OLAP) постојат за DB2, што внесува димензионална анализа во софтверот. база на податоци исто.

Функциите додаваат димензионална корисност на SQL додека ги искористуваат сите предности да се биде природен дел од DB2. Друг пример за интеграција на OLAP е алатката за екстракција, DB2 OLAP Server Analyzer. Оваа технологија овозможува DB2 OLAP сервер коцки да бидат брзо и автоматски анализирани за да се лоцираат и да се пријават вредностите на вредноста податоци необично или неочекувано низ целата коцка за деловниот аналитичар. И конечно, карактеристиките на DW Center обезбедуваат средства за архитектите да го контролираат, меѓу другото, профилот на коцката на серверот DB2 OLAP како природен дел од ETL процесите.

Просторна анализа Просторна анализа

Просторот претставува половина од аналитичките котви (води) потребни за панорама
аналитички широк (времето ја претставува другата половина). Атомското ниво на складиштето, прикажано на Слика 1.1, ги вклучува и временските и просторните основи. Временски печати ги зацврстуваат анализите по време и анализите на сидро за информации за адреси по простор. Временските печати спроведуваат анализа по време, а информациите за адреси спроведуваат анализа по простор. Дијаграмот покажува геокодирање - процес на конвертирање адреси во точки на мапа или точки во просторот, така што концептите како растојание и внатре/надвор може да се користат во анализата - спроведена на атомско ниво и просторна анализа што е достапна за аналитичарот. IBM обезбедува просторни проширувања, развиени со Институтот за истражување на системот за животна средина (ESRI), до база на податоци DB2 така што просторните објекти можат да се складираат како нормален дел од база на податоци релациски. db2

Просторните проширувачи, исто така, ги обезбедуваат сите екстензии на SQL за да ги искористат предностите на просторната анализа. На пример, на SQL екстензии за пребарување против
растојанието помеѓу адресите или дали точката е внатре или надвор од дефинирана полигонална област, се аналитички стандард со Spatial Extender. Видете поглавје 16 за повеќе информации.

База на податоци-Resident Tools Tools База на податоци-Жител

DB2 има многу BI-резидентни SQL карактеристики кои помагаат во дејството на анализата. Тие вклучуваат:

  • Функции на рекурзија за извршување на анализа, како што е „пронаоѓање на сите можни патеки на летот од Сан Франциско a Њујорк".
  • Аналитичките функции за рангирање, кумулативните функции, коцката и собирањето за олеснување на задачите што вообичаено се случуваат само со OLAP технологијата, сега се природен дел од моторот база на податоци
  • Способност да се креираат табели кои содржат резултати
    Продавачите на база на податоци лидерите мешаат повеќе од БИ способностите во база на податоци стесо
    Главните добавувачи на база на податоци тие мешаат повеќе од БИ способностите во база на податоци стесо
    Ова обезбедува подобри перформанси и повеќе опции за извршување за решенијата за БИ.
    Карактеристиките и функциите на DB2 V8 се детално разгледани во следните поглавја:
    Техничка архитектура и Основи за управување со податоци (Поглавје 5)
  • Основи на DB2 BI (Поглавје 6)
  • DB2 материјализирани табели за прашања (Поглавје 7)
  • Функции на DB2 OLAP (Поглавје 13)
  • Функции и функции на Подобрен BI на DB2 (Поглавје 15) Поедноставен систем за испорака на податоци Систем за испорака на податоци поедноставен

Архитектурата прикажана на Слика 1.1 вклучува бројни структури податоци физички. Едниот е магацинот на податоци оперативен. Општо земено, ODS е предмет ориентиран, интегриран и актуелен објект. Ќе изградите ODS за поддршка, на пример, канцеларијата за продажба. Продажбата на ODS би ја дополнила податоци од многу различни системи, но само би ги задржале, на пример, денешните трансакции. ODS исто така може да се ажурира многу пати на ден. Во исто време, процесите го туркаат податоци интегрирани во други апликации. Оваа структура е специјално дизајнирана да се интегрира податоци актуелни и динамични и би бил веројатен кандидат за поддршка на аналитика во реално време, како што е обезбедување на сервисни агенти клиенти тековните информации за продажба на клиентот со извлекување информации за продажните трендови од самиот магацин. Друга структура прикажана на слика 1.1 е формална состојба за dw. Не само што ова е место за извршување на потребната интеграција, квалитетот на податоци, и на трансформацијата на податоци на влезниот магацин, но исто така е сигурен и привремен простор за складирање податоци реплики кои би можеле да се користат во анализи во реално време. Ако одлучите да користите ODS или област за поставување, една од најдобрите алатки за населување на овие структури податоци користењето на различни оперативни извори е хетерогено дистрибуирано барање на DB2. Оваа способност се испорачува со опционалната функција DB2 наречена DB2 Relational Connect (само за пребарување) и преку DB2 DataJoiner (посебен производ кој обезбедува можност за барање, вметнување, ажурирање и бришење на хетерогени дистрибуирани RDBMS).

Оваа технологија им овозможува на архитектите да податоци да се врзуваат податоци производство со аналитички процеси. Не само што технологијата може да се прилагоди на речиси секое од барањата за репликација што може да се појават со аналитиката во реално време, туку може да се поврзе и со широк спектар на бази на податоци податоци најпопуларни, вклучувајќи DB2, Oracle, Sybase, SQL Server, Informix и други. DB2 DataJoiner може да се користи за пополнување на структура податоци формално како ODS или дури и постојана табела претставена во складиштето дизајнирана за брзо враќање на инстант ажурирања или за продажба. Се разбира, истите овие структури податоци може да се насели со користење

уште една важна технологија дизајнирана за репликација на податоци, IBM DataPropagator Relational. (DataPropagator е посебен производ за централни системи. DB2 UNIX, Linux, Windows и OS/2 вклучуваат услуги за репликација на податоци податоци како стандардна карактеристика).
Друг метод за движење податоци што работи околу претпријатието е интегратор на апликации за претпријатија инаку познат како брокер за пораки. Оваа уникатна технологија овозможува неспоредлива контрола за таргетирање и движење податоци околу компанијата. IBM има најшироко користен брокер за пораки, MQSeries или варијација на производот што ги вклучува барањата на е-трговија, IBM WebSphere MQ.
За повеќе дискусија за тоа како да го искористите MQ за поддршка на околината за складиште и БИ, посетете веб-страница на книгата. Засега, доволно е да се каже дека оваа технологија е одлично средство за снимање и трансформирање (со користење на MQSeries Integrator) податоци центрирани (таргетирани) оператори регрутирани за решенија за БИ. Технологијата MQ е интегрирана и спакувана во UDB V8, што значи дека редиците за пораки сега може да се управуваат како да се табели DB2. Концептот на заварување пораки во редица и универзумот на база на податоци релациона глави кон моќна средина за испорака на податоци.

Нулта латентност Нулта латентност

Крајната стратешка цел за IBM е анализа на нулта латентност. Како што е дефинирано од
Гартнер, системот на БИ мора да биде способен да заклучува, асимилира и дава информации на аналитичарите на барање. Предизвикот, се разбира, е како да се меша податоци актуелни и во реално време со потребните историски информации, како што се i податоци поврзана шема/тренд, или извлечено разбирање, како што е профилирање на клиентите.

Таквите информации вклучуваат, на пример, идентификација на клиенти висок или низок ризик или кои производи i клиенти тие најверојатно ќе купат ако веќе имаат сирење во нивните колички.

Постигнувањето на нулта латентност всушност зависи од два основни механизми:

  • Целосно соединување на податоци кои се анализирани со воспоставените техники и алатки креирани од БИ
  • Систем за испорака на податоци ефикасни за да се осигура дека аналитиката во реално време е навистина достапна Овие предуслови за нулта латентност не се разликуваат од двете цели поставени од IBM и опишани погоре. Блиското парење на податоци Тој е дел од програмата за беспрекорна интеграција на IBM. И креирајте систем за испорака на податоци ефикасен е целосно зависен од достапната технологија која го поедноставува процесот на испорака на податоци. Како резултат на тоа, две од трите цели на IBM се клучни за реализација на третата. IBM свесно ја развива својата технологија за да обезбеди нулта латентност да биде реалност за напорите во складиштето. Резиме / Синтеза Организацијата БИ обезбедува патоказ за градење на вашата околина
    итеративно. Мора да се прилагоди за да ги одразува потребите на вашиот бизнис, и сегашните и идните. Без широка архитектонска визија, повторувањата на магацинот се малку повеќе од случајни имплементации на централниот магацин што не прават малку за да создадат широко, информативно претпријатие. Првата пречка за проект менаџерите е како да ги оправдаат инвестициите потребни за развој на организацијата БИ. Додека пресметката на рентабилноста остана главен во имплементацијата на складиштето, станува се потешко да се предвиди точно. Ова доведе до други методи за одредување дали ја добивате вредноста на вашите пари. Вредноста на инвестицијата2 (VOI), на пример, се промовира како решение. Тоа е обврска на архитектите на податоци и проектните планери намерно генерираат и обезбедуваат информации на здруженијата на корисници, а не едноставно да им обезбедуваат услуга податоци. Има огромна разлика меѓу двете. Информациите се нешто што прави разлика во одлучувањето и ефективноста; релативно, т.е податоци тие се градежни блокови за изведување на тие информации.

Дури и ако е критичен кон изворот податоци За да одговори на деловните барања, околината на БИ треба да има поголема улога во креирањето на информациска содржина. Мора да преземеме дополнителни чекори за чистење, интегрирање, трансформирање или на друг начин да создадеме информативна содржина по која корисниците можат да дејствуваат, а потоа мора да се погрижиме тие дејства и одлуки, каде што е разумно, да се рефлектираат во околината на БИ. Ако го префрлиме магацинот само да служи податоци, се гарантира дека здруженијата на корисници ќе создадат информативна содржина потребна за преземање акција. Ова осигурува дека нивната заедница ќе може да носи подобри одлуки, но претпријатието страда од недостаток на знаење што го користеле. Дато Бидејќи архитектите и планерите на проекти иницираат конкретни проекти во околината на БИ, тие остануваат одговорни пред претпријатието како целина. Едноставен пример за оваа двострана карактеристика на BI повторувањата се наоѓа во изворот податоци. Сите податоци добиени за конкретни деловни барања мора да бидат пополнети во првиот атомски слој. Ова обезбедува развој на средството за информации за претпријатието, како и управување, адресирање на специфичните кориснички барања дефинирани во повторувањето.

WhatisaDataWarehouse?

Складиште на податоци тој е срцето на архитектурата на информациските системи од 1990 година и ги поддржува информациските процеси нудејќи цврста интегрирана платформа податоци историски податоци земени како основа за последователни анализи. НА складиште на податоци тие нудат леснотија на интеграција во светот на некомпатибилни апликативни системи. Складиште на податоци еволуираше во тренд. Складиште на податоци организирајте и складирајте i податоци неопходни за информациски и аналитички процеси засновани на долга историска временска перспектива. Сето ова повлекува значителна и постојана посветеност во изградбата и одржувањето на складиште на податоци.

Значи, што е а складиште на податоци? А складиште на податоци и:

  • ▪ ориентирана кон предметот
  • ▪ интегриран систем
  • ▪ време на варијанта
  • ▪ неиспарлив (не може да се избрише)

збирка на податоци се користи за поддршка на менаџерските одлуки во спроведувањето на процесите.
I податоци вметната во складиште на податоци во повеќето случаи тие произлегуваат од оперативните средини. На складиште на податоци тој е создаден од единица за складирање, физички одвоена од остатокот од системот што го содржи податоци претходно трансформирани од апликации кои работат на информации кои произлегуваат од оперативното опкружување.

Буквалната дефиниција на а складиште на податоци заслужува длабинско објаснување бидејќи има важни мотивации и основни значења кои ги опишуваат карактеристиките на складиштето.

ОРИЕНТАЦИЈА НА ПРЕДМЕТ ТЕМАТСКИ

Првата карактеристика на а складиште на податоци е тоа што е ориентирана кон главните играчи во една компанија. Водичот на испитувањата низ податоци тој е во контраст со покласичниот метод кој вклучува ориентација на апликациите кон процесите и функциите, метод кој најчесто го споделуваат повеќето поненови системи за управување.

Оперативниот свет е дизајниран околу апликации и функции како што се заеми, заштеди, банкарски картички и доверба за финансиска институција. Светот на dw е организиран околу главните теми како што се купувачот, продавачот, производот и активноста. Усогласувањето околу темите влијае на дизајнот и имплементацијата на податоци пронајден во dw. Уште поважно, главната тема влијае на најважниот дел од клучната структура.

Светот на апликацијата е под влијание и на дизајнот на базата на податоци и на дизајнот на процесот. Светот на dw е фокусиран исклучиво на моделирање податоци и на дизајнот на база на податоци. Дизајнот на процесот (во неговата класична форма) не е дел од околината на dw.

Разликите помеѓу изборот на апликација за процес/функција и изборот на тема се откриваат и како разлики во содржината на податоци на детално ниво. НА податоци del dw не вклучува i податоци кои нема да се користат за процесот на DSS додека се применуваат

оперативно ориентирани податоци содржат i податоци за веднаш да се задоволат функционалните/обработувачките барања кои може или нема да имаат корист за DSS аналитичарот.
Друг важен начин на кој оперативно-ориентирани апликации податоци се разликуваат од податоци на dw е во извештаите на податоци. На податоци операциите одржуваат континуирана врска помеѓу две или повеќе табели врз основа на деловно правило кое е активно. НА податоци на dw преминува спектар на време и врските пронајдени во dw се многу. Многу трговски правила (и соодветно, многу односи на податоци ) се застапени во залиха на податоци помеѓу две или повеќе маси.

(За детално објаснување за тоа како односите помеѓу податоци се обработуваат во ДВ, се повикуваме на Техничката тема за тоа прашање.)
Од друга перспектива освен онаа на фундаменталната разлика помеѓу избор на функционална/процесна апликација и избор на тема, дали постои поголема разлика помеѓу оперативните системи и податоци и ДВ.

ИНТЕГРАЦИЈА ИНТЕГРАЦИЈА

Најважниот аспект на dw околината е тоа што i податоци кои се наоѓаат во рамките на dw лесно се интегрираат. СЕКОГАШ. БЕЗ ИСКЛУЧОКИ. Самата суштина на dw околината е дека i податоци содржани во границите на складот ​​се интегрирани.

Интеграцијата се открива на многу различни начини - во конзистентни идентификувани конвенции, во конзистентно мерење на променливите, во конзистентни кодирани структури, во физичките атрибути на податоци конзистентна, и така натаму.

Со текот на годините, дизајнерите на различни апликации донесоа многу одлуки за тоа како треба да се развие една апликација. Стилот и индивидуализираните дизајнерски одлуки на апликациите на дизајнерите се откриваат на сто начини: во разликите во кодирањето, клучната структура, физичките карактеристики, конвенциите за идентификување итн. Колективната способност на многу дизајнери на апликации да создаваат неконзистентни апликации е легендарна. Слика 3 прикажува некои од најважните разлики во начинот на кој се дизајнирани апликациите.

Кодирање: Кодирај:

Дизајнерите на апликации го избраа кодирањето на полето – пол – на различни начини. Дизајнер го претставува сексот како „м“ и „ѓ“. Друг дизајнер го претставува полот како „1“ и „0“. Друг дизајнер го претставува сексот како „x“ и „y“. Друг дизајнер го претставува сексот како „машки“ и „женски“. Не е многу важно како сексот доаѓа во ДВ. „М“ и „Ф“ веројатно се добри како и целата претстава.

Она што е важно е дека од кое и да е потеклото на сексуалното поле, тоа поле пристигнува во ДВ во конзистентна интегрирана состојба. Следствено, кога полето е вчитано во DW од апликација каде што е претставено во форматот „M“ и „F“, податоци мора да се конвертира во формат DW.

Мерење на атрибути: Мерење на Атрибути:

Дизајнерите на апликации избраа да го мерат гасоводот на различни начини во текот на годините. Дизајнер ги складира податоци на цевководот во сантиметри. Друг дизајнер на апликации ги складира податоци на цевководот во однос на инчи. Друг дизајнер на апликации ги складира податоци на гасоводот во милиони кубни стапки во секунда. И друг дизајнер складира информации за гасоводот во однос на дворовите. Без оглед на изворот, кога информациите за гасоводот пристигнуваат во DW, тие мора да се мерат на ист начин.

Според индикациите на слика 3, прашањата за интеграција влијаат на речиси секој аспект од проектот – физичките карактеристики на податоци, дилемата да се има повеќе од еден извор на податоци, прашањето за неконзистентни идентификувани примероци, формати на податоци неконзистентни, и така натаму.

Без оглед на темата за дизајнирање, резултатот е ист – т.е податоци мора да се чуваат во DW на единствен и глобално прифатлив начин, дури и кога основните оперативни системи ги складираат поинаку податоци.

Кога аналитичарот на ДСС гледа во ДВ, целта на аналитичарот треба да биде да го искористи податоци кои се во магацинот,

наместо да се прашувам за кредибилитетот или доследноста на податоци.

ВРЕМЕНСКА ВАРИЈАНЦИЈА

Сите податоци во ДВ тие се точни до одреден момент во времето. Оваа основна карактеристика на податоци во ДВ е многу различно од податоци пронајдени во работната средина. НА податоци на работната средина се прецизни како во моментот на пристап. Со други зборови, во работната средина кога се пристапува до диск податоци, се очекува дека ќе ги одразува прецизните вредности како во моментот на пристапот. Бидејќи јас податоци во ДВ се прецизни како во одреден момент во времето (т.е. не „во моментов“), се вели дека јас податоци пронајдени во DW се „временска варијанса“.
Временската варијанса на податоци ДВ се споменува на многу начини.
Наједноставниот начин е дека јас податоци на DW претставуваат податоци на долг временски хоризонт – пет до десет години. Временскиот хоризонт претставен за оперативното опкружување е многу пократок од денешните сегашни вредности до шеесет деведесет
Апликациите кои мора да функционираат добро и мора да бидат достапни за обработка на трансакции мора да носат минимален износ од податоци доколку дозволуваат каков било степен на флексибилност. Значи, оперативните апликации имаат краток временски хоризонт, како тема за дизајн на аудио апликација.
Вториот начин на кој „временската варијанса“ се појавува во DW е во структурата на клучот. Секоја клучна структура во DW содржи, имплицитно или експлицитно, временски елемент, како што се ден, недела, месец итн. Елементот време е скоро секогаш на дното на споениот клуч што се наоѓа во DW. Во овие прилики, временскиот елемент ќе постои имплицитно, како што е случајот кога цела датотека се дуплира на крајот на месецот или кварталот.
Третиот начин на кој се прикажува временската варијанса е дека i податоци на DW, штом е правилно регистриран, не може да се ажурира. НА податоци на DW се, за сите практични цели, долга серија на снимки. Се разбира, ако снимките се направени погрешно, тогаш снимките може да се менуваат. Но, под претпоставка дека снимките се направени правилно, тие не се менуваат веднаш штом ќе се направат. Во некои

Во некои случаи може да биде неетички, па дури и невалидно, снимките во DW да се менуваат. НА податоци оперативни, прецизни како во моментот на пристапот, тие можат да се ажурираат по потреба.

НЕ СТАРЛИВИ

Четвртата важна карактеристика на DW е тоа што не е испарлива.
Ажурирањата, вметнувањата, бришењата и модификациите се прават редовно во оперативните средини на основа запис до запис. Но, основната манипулација на податоци кои се потребни во ДВ е многу поедноставно. Постојат само два вида на операции кои се случуваат во DW – првичното вчитување на податоци и пристап до податоци. Нема ажурирање на податоци (во општа смисла на ажурирање) во ДВ како нормална операција за обработка. Има некои многу моќни последици од оваа основна разлика помеѓу оперативната обработка и обработката на DW. На ниво на дизајн, потребата да се биде внимателен во врска со аномалното ажурирање не е фактор во DW, бидејќи ажурирањето на податоци не се спроведува. Ова значи дека на ниво на физички дизајн, може да се преземат слободи за да се оптимизира пристапот до податоци, особено во справувањето со темите за физичка нормализација и денормализација. Друга последица на едноставноста на операциите на DW е во основната технологија што се користи за водење на околината DW. Поддршката за ажурирања запис-по-запис (како што е често случај со оперативната обработка) бара технологијата да има многу сложена основа при очигледна едноставност.
Технологијата која поддржува резервна копија и обновување, трансакции и интегритет на податоци а откривањето и отстранувањето на состојбата на ќор-сокак е доста сложено и не е неопходно за обработка на DW. Карактеристиките на DW, дизајн ориентација, интеграција на податоци во рамките на DW, временска варијанса и едноставност на управување податоци, сето тоа води до средина која е многу, многу различна од класичната работна средина. Изворот на речиси сите податоци на DW се оперативната средина. Примамливо е да се мисли дека има огромен вишок на податоци помеѓу двете средини.
Всушност, првиот впечаток што го имаат многу луѓе е оној на големиот вишок податоци помеѓу работната средина и околината на

ДВ. Таквото толкување е површно и покажува недостиг на разбирање за тоа што се случува во ДВ.
Навистина има минимум вишок податоци помеѓу работната средина и i податоци на ДВ. Размислете за следново: I податоци тие се филтрираат дато префрлување од опкружување на работа во околина DW. Многумина податоци тие никогаш не поминуваат надвор од работната средина. Освен што јас податоци кои се неопходни за обработка на DSS го наоѓаат својот правец во околината

▪ временскиот хоризонт на податоци многу се разликува од една до друга средина. НА податоци во работната средина тие се многу свежи. НА податоци во ДВ се многу постари. Само од перспектива на временскиот хоризонт, има многу мало преклопување помеѓу оперативното опкружување и ДВ.

▪ ДВ содржи податоци резиме кои никогаш не се наоѓаат во околината

▪ Јас податоци подлежат на фундаментална трансформација додека преминуваат на Слика 3 го илустрира тоа најмногу податоци се значително изменети под услов да бидат избрани и преместени во DW. Поинаку кажано, повеќето од податоци физички и радикално се менува како што се префрла во ДВ. Од интеграциска гледна точка тие не се исти податоци кои престојуваат во оперативната средина. Во светлината на овие фактори, вишокот на податоци помеѓу двете средини е редок настан, што доведува до помалку од 1% вишок помеѓу двете средини. СТРУКТУРАТА НА МАГАЦИН DWs имаат посебна структура. Постојат различни нивоа на резиме и детали што ги разграничуваат ДВ.
Различните компоненти на DW се:

  • Метаподатоци
  • Дати тековни детали
  • Дати со стари детали
  • Дати малку сумирано
  • Дати високо сумирани

Убедливо главната грижа е за и податоци тековни детали. Тоа е главната грижа затоа што:

  • I податоци тековните детали ги одразуваат најновите настани, кои секогаш се од голем интерес и
  • i податоци тековните детали се обемни бидејќи се чуваат на најниско ниво на грануларност и
  • i податоци Тековните детали се скоро секогаш зачувани на меморијата на дискот, која е брза за пристап, но скапа и сложена за употреба податоци на детали се постари податоци кои се зачувани на некоја меморија маса. До него се пристапува спорадично и се чува на ниво на детали што е компатибилно со податоци тековни детали. Иако не е задолжително складирање на алтернативен медиум за складирање, поради големиот волумен на податоци во комбинација со спорадичен пристап на податоци, медиумот за складирање за податоци постарите детали обично не се складираат на дискот. НА податоци лесно сумирани тие се податоци кои се дестилираат од ниското ниво на детали пронајдено до сегашното ниво на детали. Ова ниво на DW е скоро секогаш зачувано на складирање на дискот. Дизајнерските проблеми со кои се соочува архитектот податоци во изградбата на ова ниво на ДВ се:
  • Која единица време е резимето направено погоре
  • Која содржина, атрибути малку ќе ја сумираат содржината на податоци Следното ниво на податоци најдена во ДВ е онаа на податоци високо сумирани. НА податоци високо сумирани се компактни и лесно достапни. НА податоци високо сумирани понекогаш се наоѓаат во околината DW и во други случаи i податоци високо сумирани се наоѓаат надвор од непосредните ѕидови на технологијата во која е сместен DW. (во секој случај, т.е податоци високо сумирани се дел од ДВ без разлика каде i податоци се физички сместени). Последната компонента на ДВ се метаподатоците. Во многу аспекти, метаподатоците се наоѓаат во различна димензија од другите податоци на ДВ, бидејќи метаподатоците не содржат никакви дато преземени директно од работната средина. Метаподатоците имаат посебна и многу важна улога во ДВ. Метаподатоците се користат како:
  • директориум кој ќе му помогне на аналитичарот на DSS да ја лоцира содржината на DW,
  • водич за мапирање на податоци за тоа како јас податоци се трансформираа од оперативна средина во околина на DW,
  • водич за алгоритмите што се користат за сумирање помеѓу податоци на тековните детали ei податоци малку сумирано, т.е податоци високо сумирано, метаподатоците играат многу поголема улога во околината на DW отколку што некогаш имале во оперативното опкружување МЕДИУМ ЗА СКЛАДИРАЊЕ СТАРИ ДЕТАЛИ За складирање на таков вид може да се користи магнетна лента податоци. Всушност, постои широк спектар на медиуми за складирање што треба да се земат предвид за старо складирање податоци на детали. Во зависност од обемот на податоци, зачестеноста на пристапот, цената на алатките и видот на пристапот, сосема е веројатно дека на другите алатки ќе им треба старото ниво на детали во DW. ТЕКОТ НА ПОДАТОЦИ Постои нормален и предвидлив тек на податоци во рамките на ДВ.
    I податоци тие влегуваат во DW од работната средина. (ЗАБЕЛЕШКА: Постојат многу интересни исклучоци од ова правило. Сепак, речиси сите податоци внесете го DW од работната средина). Дато тоа јас податоци внесете го DW од работната средина, тој се трансформира како што беше опишано претходно. Под услов да се влезе во ДВ, т.е податоци внесете го моменталното ниво на детали, како што е прикажано. Таму се наоѓа и се користи додека не се случи еден од трите настани:
  • се прочистува,
  • се сумира и/или ▪è Застарениот процес во DW се движи i податоци тековни детали а податоци на детали стари, според возраст од податоци. Процесот

сумирањето користи детали за податоци да се пресмета на податоци малку сумирани и високо сумирани нивоа на податоци. Има некои исклучоци од прикажаниот тек (ќе се дискутира подоцна). Сепак, обично, за огромното мнозинство на податоци најде во рамките на DW, протокот на податоци тоа е како што е претставено.

КОРИСТЕЊЕ НА СПОРЕДОТ НА ПОДАТОЦИ

Не е изненадувачки различните нивоа на податоци во рамките на ДВ не добиваат различни нивоа на користење. Како по правило, колку е повисоко нивото на сумирање, толку повеќе i податоци тие се користат.
Многу употреби се случуваат во податоци високо сумирани, додека стариот податоци на детали речиси никогаш не се користат. Постои добра причина да се префрли организацијата кон парадигмата за искористување на ресурсите. Повеќе сумирано з податоци, толку побрзо и поефикасно се доаѓа до него податоци. Ако продавница открива дека прави многу процеси на ниво на детали на DW, а потоа се троши соодветна голема количина машински ресурси. Во најдобар интерес на сите е да се обработи што повисоко ниво на сумирање што е можно поскоро.

За многу продавници, аналитичарот на DSS во пред-DW средина користел податоци на ниво на детали. Во многу аспекти пристигнувањето во податоци деталното резиме наликува на безбедносно ќебе, дури и кога се достапни други нивоа на резиме. Една од активностите на архитектот податоци е да се одвикне корисникот на DSS од постојана употреба на податоци на најниско ниво на детали. Постојат две мотивации на располагање на архитектот на податоци:

  • со инсталирање на систем за наплата, каде што крајниот корисник плаќа за потрошените ресурси и
  • кои укажуваат дека може да се постигне многу добро време на одговор кога однесувањето со i податоци е на високо ниво на сумирање, додека лошото време на одговор доаѓа од однесувањето на податоци на ниско ниво на ДРУГИ ПОГЛАВИ Постојат некои други размислувања за изградба и управување на DW.
    Првото разгледување е она на индексите. НА податоци на повисоките нивоа на сумирање тие можат слободно да се индексираат, додека т.е податоци

на пониски нивоа на детали тие се толку гломазни што може да се индексираат штедливо. Од истиот принцип, т.е податоци на високи нивоа на детали може релативно лесно да се реструктуира, додека обемот на податоци на пониските нивоа е толку голем што и податоци тие не можат лесно да се реновираат. Следствено, моделот на податоци и формалната работа направена од дизајнот ја постави основата за DW применета речиси исклучиво на сегашното ниво на детали. Со други зборови, активностите за моделирање на податоци тие не се однесуваат на нивоата на сумирање, речиси во секој случај. Друго структурно разгледување е она на подподелбата на податоци од ДВ.

Поделбата може да се направи на две нивоа – на ниво на dbms и на ниво на апликација. Во поделбата на ниво dbms, На dbms е информиран за поделбите и соодветно ги контролира. Во случај на поделба на ниво на апликација, само програмерот е информиран за поделбите и одговорноста за нивната администрација е препуштена на него

Под нивото dbms, многу работа се врши автоматски. Има многу нефлексибилност поврзана со автоматско администрирање на поделбите. Во случај на поделби на ниво на примена на податоци del складиште на податоци, многу работа му тежи на програмерот, но крајниот резултат е флексибилност во администрирањето на податоци во складиште на податоци

ДРУГИ АНОМАЛИИ

Додека компонентите на складиште на податоци Тие работат како што е опишано за речиси сите податоци, има некои корисни исклучоци кои треба да се дискутираат. Исклучок е оној на податоци јавни збирни податоци. Овие се податоци резимеа кои се пресметани надвор од складиште на податоци но тие се користат од општеството. НА податоци јавните резимеа се чуваат и управуваат во складиште на податоци, иако како што беше претходно споменато тие се пресметани. Сметководителите работат на производство на такви квартални податоци како приходи, квартални расходи, квартална добивка итн. Работата што ја вршат сметководителите е надворешна за складиште на податоци. Сепак, јас податоци се користат „внатрешно“ во рамките на компанијата – од маркетинг, продажба итн. Друга аномалија, за која нема да се дискутира, е онаа на податоци надворешни

Друг извонреден тип на податоци што може да се најде во а складиште на податоци е онаа на трајните детални податоци. Тие предизвикуваат потреба за трајно складирање на податоци на детално ниво од етички или правни причини. Ако компанијата ги изложува своите работници на опасни материи, постои потреба податоци детални и трајни. Ако една компанија произведува производ кој вклучува јавна безбедност, како што се делови за авиони, постои потреба податоци трајни детали, како и ако некоја компанија склучува опасни договори.

Компанијата не може да си дозволи да превиди детали бидејќи во следните неколку години, во случај на тужба, отповикување, оспорен градежен дефект итн. изложеноста на компанијата може да биде голема. Како резултат на тоа постои единствен тип на податоци познат како трајни податоци за детали.

РЕЗИМЕ

Un складиште на податоци е објектно ориентирана, интегрирана, временска варијанта, збирка на податоци нестабилна за поддршка на потребите за донесување одлуки на администрацијата. Секоја од истакнатите функции на a складиште на податоци има свои импликации. Плус има четири нивоа на податоци del складиште на податоци:

  • Стар детал
  • Тековен детал
  • Дати малку сумирано
  • Дати високо сумираните Метаподатоци се исто така важен дел од складиште на податоци. АПСТРАКТ Концептот на складирање на податоци Неодамна доби големо внимание и стана тренд на 90-тите. Ова се должи на способноста на еден складиште на податоци да се надминат ограничувањата на системите за поддршка на управувањето како што се системи за поддршка на одлуки (DSS) и извршни информациски системи (EIS). Дури и ако концептот на складиште на податоци изгледа ветувачки, имплементирајте i складиште на податоци може да биде проблематично поради процесите на складирање во големи размери. И покрај сложеноста на проектите за складирање податоци, многу добавувачи и консултанти кои акции податоци тврдат дека складирањето на податоци струјата не предизвикува никакви проблеми. Сепак, на почетокот на овој истражувачки проект, речиси и да не беше спроведено независно, ригорозно и систематско истражување. Следствено, тешко е да се каже што всушност се случува во индустријата кога тие се градат складиште на податоци. Оваа студија ја истражуваше практиката на складирање на податоци современици што има за цел да развие побогато разбирање за австралиската практика. Прегледот на литературата го даде контекстот и основата за емпириската студија. Постојат голем број на наоди од ова истражување. Прво, оваа студија ги откри активностите што се појавија во текот на развојот на складиште на податоци. Во многу области, т.е податоци собраните ја потврдија практиката објавена во литературата. Второ, прашањата и проблемите кои можат да влијаат на развојот на складиште на податоци беа идентификувани со оваа студија. Конечно, придобивките добиени од австралиските организации поврзани со употребата на складиште на податоци се откриени.

Поглавје 1

Истражувачки контекст

Концептот на складирање податоци доби широко распространета изложеност и стана тренд кој се појавува во 90-тите (McFadden 1996, TDWI 1996, Shah and Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman and Oates 2000). Ова може да се види од зголемениот број на написи за складирање на податоци во трговските публикации (Little и Gibson 1999). Многу статии (види, на пример, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett and King 1996, Graham et al. 1996, Sakaguchi and Frolick 1996, Alvarez 1997, Brousell 1997, 1997, 1997, 1997, 1998, 1999, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, Clar. , Edwards XNUMX, TDWI XNUMX) објавија значителни придобивки добиени од организациите кои спроведуваат i складиште на податоци. Тие ја поддржаа својата теорија со анегдотски докази за успешни имплементации, бројки за висок поврат на инвестицијата (ROI) и, исто така, со обезбедување насоки или методологии за развој на складиште на податоци

(Шенкс и сор. 1997, Седон и Бенџамин 1998, Литл и Гибсон 1999). Во екстремен случај, Греам и сор. (1996) пријавил просечен принос на тригодишна инвестиција од 401%.

Сепак, голем дел од тековната литература ги занемари сложеноста вклучени во преземањето такви проекти. Проектите на складиште на податоци тие се вообичаено сложени и големи и затоа носат голема веројатност за неуспех ако не се внимателно контролирани (Шах и Милштајн 1997, Екерсон 1997, Фоли 1997б, Цимер 1997, Борт 1998, Гибс и Клајмер 1998, Рао 1998). Тие бараат огромни количества и човечки и финансиски ресурси, како и време и напор за да се изградат (Хил 1998, Крофтс 1998). Типичното време и финансиски средства кои се потребни се приближно две години и два до три милиони долари, соодветно (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Ова време и финансиски средства се потребни за да се контролираат и консолидираат многу различни аспекти на складирањето податоци (Cafasso 1995, Hill 1998). Покрај хардверските и софтверските размислувања, има и други функции, кои се разликуваат од извлекувањето на податоци на процесите на вчитување на податоци, капацитетот на меморијата за управување со ажурирањата и мета податоци за обука на корисниците, мора да се земе предвид.

Во времето кога започна овој истражувачки проект, имаше многу малку академски истражувања кои се спроведуваа на полето на складирање податоци, особено во Австралија. Ова беше очигледно од недостатокот на објавени статии за складирање на податоци од списанија или други академски списи од тоа време. Многу од достапните академски списи го опишаа искуството на САД. Недостатокот на академски истражувања во областа на складирање на податоци предизвика повици за ригорозни истражувања и емпириски студии (McFadden 1996, Shanks et al. 1997, Little и Gibson 1999). Конкретно, истражувачките студии за процесот на имплементација на складиште на податоци треба да се спроведат за да се прошират општите знаења во врска со имплементацијата на складиште на податоци и ќе послужи како основа за идна истражувачка студија (Шенкс и сор. 1997, Литл и Гибсон 1999).

Затоа, целта на оваа студија е да проучи што всушност се случува кога организациите спроведуваат и користат i складиште на податоци во Австралија. Поточно, оваа студија ќе вклучи анализа на цел развоен процес на а складиште на податоци, почнувајќи од иницирање и планирање преку дизајн и имплементација и последователна употреба во австралиските организации. Дополнително, студијата ќе придонесе и за тековната практика преку идентификување области каде практиката може дополнително да се подобри и неефикасноста и ризиците може да се минимизираат или избегнат. Понатаму, ќе послужи како основа за други студии за складиште на податоци во Австралија и ќе ја пополни празнината што моментално постои во литературата.

Истражувачки прашања

Целта на ова истражување е да ги проучи активностите вклучени во спроведувањето на складиште на податоци и нивната употреба од страна на австралиските организации. Конкретно, се проучуваат елементите во врска со планирањето на проектот, развојот, работењето, употребата и вклучените ризици. Значи, прашањето на ова истражување е:

„Каква е досегашната практика складиште на податоци во Австралија?"

За ефикасно да се одговори на ова прашање, потребни се голем број дополнителни истражувачки прашања. Конкретно, три подпрашања беа идентификувани од литературата, која е претставена во поглавје 2, како водење на овој истражувачки проект: Како се складиште на податоци од австралиски организации? Со какви проблеми наидовте?

Кои се искусните придобивки?
За да се одговори на овие прашања, беше користен истражувачки дизајн кој користи анкета. Како истражувачка студија, одговорите на горенаведените прашања не се целосни (Шенкс и сор. 1993, Денскомб 1998). Во овој случај, потребна е триангулација за да се подобрат одговорите на овие прашања. Сепак, истрагата ќе обезбеди цврста основа за идната работа за испитување на овие прашања. Детална дискусија за оправдувањето и дизајнот на методот на истражување е претставена во Поглавје 3.

Структура на истражувачкиот проект

Овој истражувачки проект е поделен на два дела: контекстуална студија на концептот за складирање податоци и емпириско истражување (види Слика 1.1), од кои секоја е дискутирана подолу.

I дел: Контекстуална студија

Првиот дел од истражувањето се состоеше од преглед на тековната литература за различни видови складирање податоци, вклучувајќи системи за поддршка на одлуки (DSS), извршни информациски системи (EIS), студии на случај на складиште на податоци и концептите на складиште на податоци. Понатаму, резултатите од форумите складиште на податоци и групите за состаноци на експерти и практичари предводени од истражувачкиот тим на Монаш ДСС, придонесоа во оваа фаза од студијата која имаше за цел да добие увид во практиката на складиште на податоци и да ги идентификуваат ризиците вклучени во нивното усвојување. За време на овој контекстуален период на проучување, беше воспоставено разбирање на проблематичната област за да се обезбеди основно знаење за следните емпириски истраги. Сепак, ова беше тековен процес за време на спроведувањето на истражувачката студија.

Дел II: Емпириско истражување

Релативно новиот концепт на складирање на податоци, особено во Австралија, создаде потреба од истражување за да се добие широка слика за корисничкото искуство. Овој дел беше спроведен откако доменот на проблемот беше воспоставен преку опсежен преглед на литература. Концептот за складирање податоци формиран за време на фазата на контекстуална студија беше искористен како влез за почетниот прашалник на оваа студија. По ова, прашалникот беше испитан. Вие сте експерти за складиште на податоци учествуваше во тестот. Целта на тестирањето на првичниот прашалник беше да се провери комплетноста и точноста на прашањата. Врз основа на резултатите од тестот, прашалникот беше модифициран и изменетата верзија беше испратена до учесниците во анкетата. Повратените прашалници потоа беа анализирани за i податоци во табели, дијаграми и други формати. НА

резултатите од анализата на податоци тие формираат слика од практиката за складирање податоци во Австралија.

ПРЕГЛЕД НА СКЛАДИРАЊЕ НА ПОДАТОЦИ

Концептот на складирање податоци еволуираше со подобрувањата во компјутерската технологија.
Тој е насочен кон надминување на проблемите со кои се соочуваат групите за поддршка на апликации како што се Системот за поддршка на одлуки (DSS) и Извршниот информациски систем (EIS).

Во минатото најголемата пречка на овие апликации беше неможноста на овие апликации да обезбедат a база на податоци неопходни за анализа.
Ова главно е предизвикано од природата на работата на раководството. Интересите на менаџментот на компанијата постојано варираат во зависност од областа која е покриена. Затоа јас податоци фундаментални за овие апликации тие мора да бидат способни да се менуваат брзо во зависност од делот што треба да се третира.
Ова значи дека јас податоци мора да бидат достапни во соодветна форма за бараните анализи. Всушност, на групите за поддршка на апликациите им беше многу тешко во минатото да се соберат и интегрираат податоци од сложени и разновидни извори.

Остатокот од овој дел претставува преглед на концептот на складирање на податоци и дискутира за тоа како складиште на податоци може да ги надмине проблемите на групите за поддршка на апликации.
Терминот „Складиште на податоци“ беше популаризиран од Вилијам Инмон во 1990 година. Неговата често цитирана дефиниција го гледа Складиште на податоци како збирка на податоци субјектно ориентирани, интегрирани, нестабилни и променливи со текот на времето, како поддршка на менаџерските одлуки.

Користејќи ја оваа дефиниција, Инмон нагласува дека т.е податоци со престој во а складиште на податоци тие мора да ги поседуваат следните 4 карактеристики:

  • ▪ Субјектно ориентиран
  • ▪ Интегриран
  • ▪ Неиспарливи
  • ▪ Променлива со текот на времето Според субјектно-ориентиран Инмон значи дека i податоци во складиште на податоци во најголемите организациски области кои биле

дефинирани во моделот податоци. На пример сите податоци во врска со и клиенти се содржани во предметната област КОРИСНИЦИ. Исто и сите податоци кои се однесуваат на производите се содржани во предметната област ПРОИЗВОДИ.

Под Интегриран Инмон значи дека i податоци кои доаѓаат од различни платформи, системи и локации се комбинирани и складирани на едно место. Последователно податоци сличните мора да се трансформираат во конзистентни формати за да можат лесно да се додаваат и споредуваат.
На пример, машкиот и женскиот род се претставени со буквите M и F во еден систем, а со 1 и 0 во друг. За правилно да се интегрираат, еден или двата формати мора да се трансформираат така што двата формати се исти. Во овој случај би можеле да го смениме M во 1 и F во 0 или обратно. Предметно ориентирани и интегрирани укажуваат дека на складиште на податоци е дизајниран да обезбеди функционална и трансверзална визија на податоци од страна на компанијата.

Под Non-volatile тој мисли дека i податоци во складиште на податоци остануваат доследни и ажурирањето на податоци не е потребно. Наместо тоа, секоја промена во податоци оригиналите се додаваат на база на податоци del складиште на податоци. Тоа значи дека историскиот деи податоци е содржан во складиште на податоци.

За променливи со време Инмон покажува дека i податоци во складиште на податоци секогаш содржи индикатори за време на ei податоци тие вообичаено поминуваат одреден временски хоризонт. На пример а
складиште на податоци може да содржи 5 години историски вредности на клиенти од 1993 до 1997. Достапноста на историјата и временската серија на податоци ви овозможува да ги анализирате трендовите.

Un складиште на податоци може да си ги собере своите податоци од OLTP системи, од извори податоци надворешно на организацијата и/или со други специјални проекти на системот за фаќање податоци.
I податоци екстрактите можат да поминат низ процес на чистење, во овој случај т.е податоци се трансформираат и интегрираат пред да се складираат во база на податоци del складиште на податоци. Тогаш јас податоци

жителите во рамките на база на податоци del складиште на податоци се достапни за најавувања и алатки за обновување на крајните корисници. Користејќи ги овие алатки, крајниот корисник може да пристапи до интегрираниот приказ на организацијата на податоци.

I податоци жителите во рамките на база на податоци del складиште на податоци тие се чуваат и во детали и во формати на резиме.
Нивото на резиме може да зависи од природата на податоци. На податоци детално може да се состои од податоци струја д податоци историчари
I податоци авторските права не се вклучени во складиште на податоци додека јас податоци во складиште на податоци се ажурираат.
Покрај складирањето на i податоци самите себе, а складиште на податоци може да складира и различен тип на дато наречен МЕТА ПОДАТОЦИ кои го опишуваат податоци жителите во неговиот база на податоци.
Постојат два вида метаподатоци: развојни метаподатоци и метаподатоци за аналитика.
Развојните метаподатоци се користат за управување и автоматизирање на процесите на екстракција, чистење, мапирање и вчитување на податоци во складиште на податоци.
Информациите содржани во метаподатоците за развој може да содржат детали за оперативните системи, детали за елементите што треба да се извлечат, моделот податоци del складиште на податоци и деловните правила за конвертирање податоци.

Вториот тип на метаподатоци, познат како аналитички метаподатоци, му овозможува на крајниот корисник да ја истражува содржината на складиште на податоци да се најде на податоци достапни и нивното значење во јасни, нетехнички термини.

Затоа, аналитичките метаподатоци функционираат како мост помеѓу складиште на податоци и апликации за крајни корисници. Овие метаподатоци може да го содржат деловниот модел, описи на податоци што одговара на деловниот модел, однапред дефинирани прашања и извештаи, информации за пристап на корисниците и индекс.

Метаподатоците за анализа и развој мора да се комбинираат во единствени интегрирани метаподатоци за да функционираат правилно.

За жал, многу од постоечките алатки имаат свои метаподатоци и моментално нема постоечки стандарди за тоа

им овозможи на алатките за складирање податоци да ги интегрираат овие метаподатоци. За да се поправи оваа ситуација, многу трговци со главните алатки за складирање податоци го формираа Советот за Мета податоци, кој подоцна стана Коалиција на Мета податоци.

Целта на оваа коалиција е да изгради стандарден сет на метаподатоци што овозможува различни алатки за складирање податоци да ги конвертираат метаподатоците
Нивните напори резултираа со раѓање на Спецификацијата за размена на мета податоци (MDIS) која ќе овозможи размена на информации помеѓу архивите на Microsoft и поврзаните датотеки MDIS.

Постоењето на податоци и сумирани/индексирани и детални му даваат можност на корисникот да изврши дупчење DROWN (дупчење) од податоци индексирани на детални и обратно. Постоењето на податоци деталните истории овозможуваат создавање на анализи на трендовите со текот на времето. Дополнително, метаподатоците за аналитика може да се користат како директориум на база на податоци del складиште на податоци да им помогне на крајните корисници да го лоцираат податоци неопходни

Во споредба со OLTP системите, со нивната способност да поддржуваат анализа на податоци и известување, на складиште на податоци се смета за посоодветен систем за информациски процеси како што се правење и одговарање на прашања и изработка на извештаи. Следниот дел детално ќе ги нагласи разликите на двата системи.

СКЛАДИШТЕ НА ПОДАТОЦИ ПРОТИВ ОЛТП СИСТЕМИТЕ

Многу од информациските системи во рамките на организациите се наменети за поддршка на секојдневните операции. Овие системи познати како OLTP SYSTEMS, снимаат континуирано ажурирани дневни трансакции.

I податоци во овие системи тие често се менуваат, додаваат или бришат. На пример, адресата на клиентот се менува додека се движи од едно место до друго. Во овој случај, новата адреса ќе се регистрира со менување на полето за адреса база на податоци. Главната цел на овие системи е да ги намалат трансакциските трошоци и во исто време да го намалат времето на обработка. Примерите на OLTP системи вклучуваат критични дејства како што се внесување нарачки, платен список, фактура, производство, услуги на клиентите клиенти.

За разлика од OLTP системите, кои беа создадени за процеси базирани на трансакции и настани, т.е складиште на податоци беа создадени за да обезбедат поддршка за процеси базирани на аналитика податоци и процесите на одлучување.

Ова обично се постигнува со интегрирање на i податоци од различни OLTP и надворешни системи во еден „контејнер“ на податоци, како што беше дискутирано во претходниот дел.

Модел на процес на складирање податоци на Monash

Моделот на процесот за складиште на податоци Монаш беше развиен од истражувачи од Истражувачката група Монаш ДСС и се базира на литературата на складиште на податоци, за искуството во поддршката на развојот на системските полиња, за дискусиите со продавачите на апликации за употреба складиште на податоци, на група експерти за употреба на складиште на податоци.

Фазите се: иницирање, планирање, развој, операции и објаснувања. Дијаграмот ја објаснува итеративната или еволутивната природа на развојот на а складиште на податоци процес со користење на двонасочни стрелки поставени помеѓу различните фази. Во овој контекст, „итеративните“ и „еволутивните“ значат дека, на секој чекор од процесот, активностите за имплементација секогаш можат да се пропагираат наназад кон претходната фаза. Ова се должи на природата на проектот складиште на податоци во кој во секое време се јавуваат дополнителни барања од крајниот корисник. На пример, за време на развојната фаза на некој процес складиште на податоци, нова димензија или предметна област е побарана од крајниот корисник, која не била дел од оригиналниот план, ова мора да се додаде во системот. Ова предизвикува промена во проектот. Резултатот е дека дизајнерскиот тим мора да ги промени барањата на документите создадени досега во фазата на дизајнирање. Во многу случаи, моменталната состојба на проектот мора да се врати во фазата на дизајнирање каде што новото барање мора да се додаде и документира. Крајниот корисник мора да може да ја види прегледаната конкретна документација и промените што се направени во фазата на развој. На крајот од овој развојен циклус, проектот мора да добие одлични повратни информации и од развојниот и од корисничкиот тим. Повратните информации потоа повторно се користат за подобрување на иден проект.

Планирање на капацитети
Dw имаат тенденција да бидат многу големи по големина и растат многу брзо (Best 1995, Rudin 1997a) како резултат на количината на податоци истории кои ги задржуваат од нивното времетраење. Растот може да биде предизвикан и од податоци дополнувања побарани од корисниците за да се зголеми вредноста на податоци што веќе го имаат. Соодветно на тоа, барањата за складирање за податоци може значително да се зајакне (Eckerson 1997). Така, од суштинско значење е да се обезбеди, со спроведување на планирање на капацитетот, дека системот што се гради може да расте како што растат потребите (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
При планирањето на приспособливоста на базата на податоци, мора да се знае очекуваниот раст на големината на складиштето, типовите на прашања кои веројатно ќе се направат и бројот на поддржани крајни корисници (Best 1995, Rudin 1997b, Foley 1997a). Изградбата на скалабилни апликации бара комбинација од скалабилни технологии за сервери и техники за дизајнирање апликации што можат да се скалализираат (Best 1995, Rudin 1997b. И двете се неопходни во градењето на високо скалабилна апликација. Скалабилните серверски технологии можат да го направат лесно и поволно додавањето складирање, меморија и процесорот без да се деградира изведба (Lang 1997, Telephony 1997).

Постојат две главни скалабилни технологии за сервери: симетрично повеќекратно процесирање (SMP) и масовно паралелно процесирање (MPP) (IDC 1997, Humphries et al. 1999). SMP серверот обично има повеќе процесори кои споделуваат меморија, системска магистрала и други ресурси (IDC 1997, Humphries et al. 1999). Може да се додадат дополнителни процесори за да се зголеми неговата моќ пресметковни. Друг метод за зголемување на моќ на SMP серверот, е да се комбинираат бројни SMP машини. Оваа техника е позната како кластерирање (Humphries et al. 1999). MPP серверот, од друга страна, има повеќе процесори секој со своја меморија, магистрален систем и други ресурси (IDC 1997, Humphries et al. 1999). Секој процесор се нарекува јазол. Зголемување на моќ може да се постигне пресметковно

додавање дополнителни јазли на MPP серверите (Humphries et al. 1999).

Слабоста на SMP серверите е тоа што премногу операции на влезно-излез (I/O) можат да ја пренатрупуваат системската магистрала (IDC 1997). Овој проблем не се јавува кај MPP серверите бидејќи секој процесор има свој магистрален систем. Сепак, меѓусебните врски помеѓу секој јазол се генерално многу побавни од системот на магистрали SMP. Дополнително, MPP серверите можат да додадат дополнително ниво на сложеност на развивачите на апликации (IDC 1997). Така, изборот помеѓу SMP и MPP серверите може да биде под влијание на многу фактори, вклучувајќи ја сложеноста на апликациите, односот цена/перформанси, потребниот капацитет за обработка, спречените dw апликации и зголемувањето на големината на база на податоци од dw и во бројот на крајни корисници.

Во планирањето на капацитетот може да се применат бројни скалабилни техники за дизајнирање апликации. Еден користи различни периоди за известување како што се денови, недели, месеци и години. Имајќи различни периоди за известување, на база на податоци може да се подели на управувачки групирани парчиња (Inmon et al. 1997). Друга техника е да се користат збирни табели кои се конструирани со сумирање податоци da податоци детално. Па јас податоци сумирани се покомпактни отколку детални, што бара помалку мемориски простор. Значи на податоци деталите може да се складираат во поевтина единица за складирање, што заштедува уште повеќе складирање. Иако користењето резиме табели може да заштеди простор во меморијата, тие бараат многу напор за да бидат ажурирани и во согласност со деловните потреби. Сепак, оваа техника е широко користена и често се користи заедно со претходната техника (Best 1995, Inmon 1996a, Chauduri и Dayal
1997).

Дефинирање Складиште на податоци Технички архитектури Дефиниција на техники за архитектура dw

Раните усвојувачи на складирање податоци првенствено замислувале централизирана имплементација на dw во која сите податоци, вклучително и јас податоци надворешни, беа интегрирани во еден,
физичко складирање (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Главната предност на овој пристап е тоа што крајните корисници можат да пристапат до прегледот на целото претпријатие податоци организациски (Овум 1998). Друга предност е што нуди стандардизација на податоци преку организација, што значи дека постои само една верзија или дефиниција за секоја терминологија што се користи во складиштето на dw (метаподатоци) (Flanagan и Safdie 1997, Ovum 1998). Недостатокот на овој пристап, од друга страна, е тоа што е скап и тежок за конструирање (Flanagan and Safdie 1997, Ovum 1998, Inmon et al. 1998). Не долго по архитектурата за складирање податоци централизиран стана популарен, концептот на извлекување на помали подмножества на еволуирале податоци за поддршка на потребите на специфичните апликации (Varney 1996, IDC 1997, Berson and Smith 1997, paacock 1998). Овие мали системи се деривати на поголемиот складиште на податоци централизиран. Тие се именувани складиште на податоци зависни одделенски или зависни податоци марти. Зависната податочна архитектура е позната како тристепена архитектура каде што првото ниво се состои од складиште на податоци централизирана, втората се состои од депозитите на податоци одделенски и третиот се состои од пристап до податоци и преку алатки за анализа (Demarest 1994, Inmon et al. 1997).

Податочните маркети обично се градат по складиште на податоци централизиран беше изграден за да се задоволат потребите на одредени единици (Вајт 1995, Варни 1996).
Податоците ги чуваат податоци многу релевантни во врска со одредени единици (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

Предноста на овој метод е тоа што нема да има дато не се интегрирани и дека i податоци ќе биде помалку непотребен во рамките на податоци марти како и сите податоци доаѓаат од магацин податоци интегриран. Друга предност е тоа што ќе има малку врски помеѓу секој податочен март и неговите извори податоци бидејќи секој податочен март има само еден извор на податоци. Плус со оваа архитектура, крајните корисници сè уште можат да пристапат до прегледот на податоци

корпоративни организации. Овој метод е познат како метод од горе-надолу, каде што податочните мартови се градат по складиште на податоци (паун 1998, Гоф 1998).
Зголемувајќи ја потребата за рано прикажување на резултатите, некои организации почнаа да градат независни податоци (Flanagan and Safdie 1997, White 2000). Во овој случај, податочните маркети добиваат свои податоци директно од основите на податоци OLTP, а не од централизирано и интегрирано складиште, со што се елиминира потребата да се има централниот магацин на лице место.

Секој податочен март бара најмалку една врска до неговите извори податоци. Недостаток од повеќекратните конекции за секој податочен март е тоа што, во споредба со претходните две архитектури, прекумерното изобилство на податоци значително се зголемува.

Секој податочен март мора да ги складира сите податоци се бара локално да нема ефект врз OLTP системите. Ова предизвикува дека и податоци тие се складирани во различни податочни марки (Inmon et al. 1997). Друг недостаток на оваа архитектура е тоа што доведува до создавање на сложени меѓусебни врски помеѓу податочните маркети и нивните извори на податоци. податоци кои тешко се спроведуваат и контролираат (Inmon et al. 1997).

Друг недостаток е тоа што крајните корисници не можат да пристапат до прегледот на информациите за компанијата бидејќи i податоци од различните податоци не се интегрирани (Ovum 1998).
Уште еден недостаток е тоа што може да има повеќе од една дефиниција за секоја терминологија што се користи во маркетите за податоци што генерира недоследности на податоци во организацијата (Овум 1998).
И покрај недостатоците што беа дискутирани погоре, независните податоци сè уште го привлекуваат интересот на многу организации (IDC 1997). Еден фактор што ги прави привлечни е тоа што тие се побрзи за развој и бараат помалку време и ресурси (Bresnahan 1996, Berson and Smith 1997, Ovum 1998). Следствено, тие служат првенствено како тест проекти кои можат да се користат за брзо идентификување на придобивките и/или несовршеностите во проектот (Parsaye 1995, Braly 1995, Newing 1996). Во овој случај, делот што треба да се имплементира во пилот-проектот мора да биде мал, но важен за организацијата (Newing 1996, Mansell-Lewis 1996).

Со испитување на прототипот, крајните корисници и администрацијата можат да одлучат дали да го продолжат или прекинат проектот (Flanagan и Safdie 1997).
Ако одлуката треба да продолжи, податоците за другите индустрии треба да се градат една по една. Постојат две опции за крајните корисници врз основа на нивните потреби во градењето независни матрици за податоци: интегрирани/федерирани и неинтегрирани (Ovum 1998)

Во првиот метод, секој нов податочен март треба да се гради врз основа на тековните податоци и моделот податоци користени од компанијата (Varney 1996, Berson and Smith 1997, Peacock 1998). Потребата да се користи моделот податоци на компанијата значи дека мора да се осигура дека има само една дефиниција за секоја терминологија што се користи во маргините на податоци, тоа е исто така за да се осигури дека различните маркети на податоци може да се комбинираат за да се даде преглед на информациите за компанијата (Bresnahan 1996). Овој метод се нарекува оддолу-нагоре и е најдобар кога има ограничување на финансиските средства и време (Flanagan и Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). Во вториот метод, конструираните податоци може да ги задоволат само потребите на одредена единица. Варијанта на федеративниот податочен март е складиште на податоци дистрибуирани во кои на база на податоци Средниот софтвер на Hub Server се користи за спојување на многу податоци во едно складиште податоци дистрибуирани (White 1995). Во овој случај, i податоци компаниите се дистрибуирани во неколку податоци. Барањата на крајниот корисник се препраќаат до база на податоци среден софтвер на серверскиот центар, кој ги извлекува сите податоци побарано од data marts и ги враќа резултатите на апликациите на крајните корисници. Овој метод обезбедува деловни информации до крајните корисници. Сепак, проблемите на независните маркети за податоци сè уште не се елиминирани. Постои уште една архитектура која може да се користи која се нарекува складиште на податоци виртуелен (White 1995). Сепак, оваа архитектура, која е опишана на Слика 2.9, не е архитектура за складирање податоци. податоци реално бидејќи не го преместува вчитувањето од OLTP системите во складиште на податоци (Demarest 1994).

Всушност, барањата на податоци од крајните корисници се пренесуваат на OLTP системите кои враќаат резултати по обработката на барањата на корисниците. Иако оваа архитектура им овозможува на крајните корисници да генерираат извештаи и да поднесуваат барања, таа не може да ги обезбеди

податоци историски и преглед на информации за компанијата како и податоци од различните OLTP системи не се интегрирани. Оттука, оваа архитектура не може да ја задоволи анализата на податоци комплексни како што се прогнозите.

Избор на апликации за пристап и обновување податоци

Целта на изградбата на А складиште на податоци е да се пренесат информации до крајните корисници (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); една или повеќе апликации за пристап и обновување податоци мора да се обезбеди. До денес, постои широк спектар на овие апликации од кои корисникот може да избира (Hammergren 1998, Humphries et al. 1999). Апликациите што ќе ги изберете го одредуваат успехот на вашите напори за складирање податоци во организација бидејќи апликациите се највидливиот дел од складиште на податоци до крајниот корисник (Inmon et al. 1997, Poe 1996). Да се ​​биде успешен а складиште на податоци, мора да бидат способни да ги поддржат активностите за анализа на податоци на крајниот корисник (Poe 1996, Seddon and Benjamin 1998, Eckerson 1999). Така мора да се идентификува „нивото“ на она што крајниот корисник го сака (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

Генерално, крајните корисници може да се групираат во три категории: извршни корисници, деловни аналитичари и моќни корисници (Poe 1996, Humphries et al. 1999). На извршните корисници им треба лесен пристап до претходно дефинирани групи извештаи (Humphries et al. 1999). До овие соодноси може лесно да се пристапи со навигација во менито (Poe 1996). Дополнително, извештаите треба да прикажуваат информации користејќи графичко претставување како што се табели и шаблони за брзо пренесување на информациите (Humphries et al. 1999). Деловните аналитичари, кои можеби немаат технички способности сами да развиваат извештаи од нула, треба да бидат способни да ги менуваат тековните извештаи за да ги задоволат нивните специфични потреби (Poe 1996, Humphries et al. 1999). Моќните корисници, од друга страна, се тип на крајни корисници кои имаат способност да генерираат и пишуваат барања и извештаи од почеток (Poe 1996, Humphries et al. 1999). Тие се оние кои

тие развиваат извештаи за други типови на корисници (Poe 1996, Humphries et al. 1999).

Откако ќе се утврдат барањата на крајниот корисник, мора да се направи избор на апликации за пристап и обновување податоци меѓу сите достапни (Poe 1996, Inmon et al. 1997).
Пристап до податоци и алатките за пребарување може да се класифицираат во 4 типа: OLAP алатки, EIS/DSS алатки, алатки за пребарување и известување и алатки за податочно рударство.

Алатките OLAP им овозможуваат на корисниците да креираат ад хок прашања, како и оние направени на база на податоци del складиште на податоци. Дополнително, овие производи им овозможуваат на корисниците да дупчат од податоци општи до детални.

Алатките EIS/DSS обезбедуваат извршно известување како што е анализата „што ако“ и пристап до извештаи управувани од менито. Извештаите треба да бидат претходно дефинирани и споени со менија за полесна навигација.
Алатките за барање и известување им овозможуваат на корисниците да произведуваат предефинирани и специфични извештаи.

Алатките за ископување податоци се користат за да се идентификуваат врските што би можеле да фрлат ново светло на заборавените операции во податоци на складиштето на податоци.

Покрај оптимизирањето на барањата на секој тип на корисници, избраните алатки мора да бидат интуитивни, ефикасни и лесни за употреба. Тие исто така треба да бидат компатибилни со другите делови од архитектурата и да можат да работат со постоечките системи. Исто така, се препорачува да се изберат алатки за пристап до податоци и пребарување со разумни цени и перформанси. Други критериуми што треба да се земат предвид ја вклучуваат посветеноста на продавачот на алатки за поддршка на нивниот производ и како тој ќе се развива во идните изданија. За да се обезбеди ангажман на корисниците во користењето на складиштето на податоци, тимот за развој ги вклучува корисниците во процесот на избор на алатки. Во овој случај треба да се изврши практична проценка на корисникот.

За да се подобри вредноста на складиштето на податоци, тимот за развој може да обезбеди и веб пристап до нивниот склад за податоци. Веб-овозможено складиште за податоци им овозможува на корисниците пристап до податоци од оддалечени места или додека патувате. Дополнителни информации може

да се обезбедат по пониски трошоци преку намалување на трошоците за обука.

2.4.3 Складиште на податоци Фаза на работа

Оваа фаза се состои од три активности: дефинирање на стратегии за освежување на податоците, контрола на активностите на складиштето на податоци и управување со безбедноста на складиштето на податоци.

Дефиниција на стратегии за освежување на податоците

По првичното вчитување, т.е податоци во база на податоци на складиштето на податоци мора периодично да се освежува за да се репродуцираат промените направени на нив податоци оригинали. Затоа мора да одлучите кога да се освежува, колку често треба да се закажува освежувањето и како да се освежуваат податоците податоци. Се предлага да се освежи податоци кога системот може да биде офлајн. Фреквенцијата на освежување ја одредува развојниот тим врз основа на барањата на корисниците. Постојат два пристапа за освежување на складиштето на податоци: целосно освежување и континуирано вчитување на промените.

Првиот пристап, целосно освежување, бара повторно вчитување на сите податоци од нула. Ова значи дека сите податоци потребните мора да се извлечат, исчистат, трансформираат и интегрираат во секое освежување. Овој пристап треба, колку што е можно, да се избегнува бидејќи бара многу време и ресурси.

Алтернативен пристап е постојано да се прикачуваат промените. Ова додава i податоци кои се променети од последниот циклус на освежување на складиштето на податоци. Идентификувањето на нови или изменети записи значително го намалува износот на податоци кои мора да се пропагираат во складиштето на податоци при секое ажурирање бидејќи само овие податоци ќе се додаде на база на податоци на складиштето на податоци.

Постојат најмалку 5 пристапи кои може да се користат за повлекување i податоци нови или изменети. За да се добие ефикасна стратегија за освежување на податоците податоци мешавина од овие пристапи што ги опфаќа сите промени во системот може да биде корисна.

Првиот пристап, кој користи временски ознаки, претпоставува дека сите се доделени податоци уредиле и ажурирале временски печат за да можете лесно да ги идентификувате сите податоци изменета и нова. Овој пристап, сепак, не е широко користен во повеќето денешни оперативни системи.
Вториот пристап е да се користи делта-датотека генерирана од апликација која ги содржи само промените направени во податоци. Користењето на оваа датотека исто така го засилува циклусот на ажурирање. Сепак, дури и овој метод не се користи во многу апликации.
Третиот пристап е скенирање на датотека за евиденција, која во основа содржи информации слични на делта-датотеката. Единствената разлика е во тоа што е креирана датотека за евиденција за процесот на обновување и може да биде тешко да се разбере.
Четвртиот пристап е да се измени кодот на апликацијата. Сепак, повеќето кодови на апликацијата се стари и кревки; затоа оваа техника треба да се избегнува.
Последниот пристап е да се споредат податоци извори со главната датотека dei податоци.

Контрола на активностите на складиштето на податоци

Откако складиштето на податоци ќе биде пуштено на корисниците, тој мора да се следи со текот на времето. Во овој случај, администраторот на складиштето на податоци може да употреби една или повеќе алатки за управување и контрола за да ја следи употребата на складиштето на податоци. Конкретно, може да се собираат информации за луѓето и времето во кое тие пристапуваат до складиштето на податоци. Ајде податоци Собрани, може да се креира профил на извршената работа кој може да се користи како влез во имплементацијата на корисникот за наплата. Повратот на наплата им овозможува на корисниците да бидат информирани за трошоците за обработка на складиштето на податоци.

Понатаму, ревизијата на складиштето на податоци може да се користи и за да се идентификуваат типовите на барања, нивната големина, бројот на барања дневно, времето на реакција на барањето, досегнатите сектори и количината на податоци обработени. Друга цел на ревизија на складиштето на податоци е да се идентификува податоци кои не се во употреба. Овие податоци тие може да се отстранат од складиштето на податоци за да се подобри времето

на одговорот за извршување на барањето и следење на растот на податоци кои престојуваат во рамките на база на податоци на складиштето на податоци.

Управување со безбедноста на складиштето на податоци

Складиште на податоци содржи податоци интегриран, критичен, чувствителен до кој лесно може да се дојде. Поради оваа причина треба да биде заштитен од неовластени корисници. Еден начин да се имплементира безбедноста е да се користи функцијата del DBMS за доделување различни привилегии на различни типови на корисници. На овој начин, мора да се одржува профил за пристап за секој тип на корисник. Друг начин да се обезбеди складиштето на податоци е да се шифрира како што е напишано во база на податоци на складиштето на податоци. Пристап до податоци и алатките за пронаоѓање мора да го дешифрираат податоци пред да ги презентираат резултатите на корисниците.

2.4.4 Складиште на податоци Фаза на распоредување

Тоа е последната фаза во циклусот на имплементација на складиштето на податоци. Активностите што треба да се спроведат во оваа фаза вклучуваат обука на корисниците за користење на складиштето на податоци и вршење прегледи на складиштето на податоци.

Обука на корисници

Треба да се направи обука на корисниците пред да се пристапи до податоци на складиштето на податоци и употребата на алатки за пронаоѓање. Општо земено, сесиите треба да започнат со вовед во концептот на складирање податоци, содржината на складиштето на податоци, мета податоци и основните карактеристики на алатките. Потоа, понапредните корисници би можеле да ги проучуваат и физичките табели и корисничките карактеристики на алатките за пристап до податоци и пребарување.

Постојат многу пристапи за обука на корисници. Еден од нив вклучува избор на многу корисници или аналитичари избрани од група корисници, врз основа на нивните лидерски и комуникациски вештини. Тие се лично обучени за се што треба да знаат за да се запознаат со системот. Откако ќе заврши обуката, тие се враќаат на своите работни места и почнуваат да ги учат другите корисници како да го користат системот. На

Врз основа на она што го научиле, другите корисници можат да почнат да го истражуваат складиштето на податоци.
Друг пристап е да се обучуваат многу корисници во исто време, како да одите на курс во училница. Овој метод е погоден кога има многу корисници кои треба да бидат обучени во исто време. Друг метод е да се обучи секој корисник поединечно, еден по еден. Овој метод е погоден кога има малку корисници.

Целта на обуката на корисниците е да ве запознае со пристапот до податоци и алатки за пронаоѓање, како и содржината на складиштето на податоци. Сепак, некои корисници може да бидат преоптоварени од количината на информации обезбедени за време на сесијата за обука. Затоа, мора да се спроведат одреден број на освежувачки сесии за постојана помош и за одговор на конкретни прашања. Во некои случаи се формира група на корисници за да се обезбеди ваков тип на поддршка.

Собирање повратни информации

Откако складиштето на податоци ќе се отвори, корисниците можат да користат i податоци кои престојуваат во складиштето на податоци за различни намени. Најчесто, аналитичарите или корисниците користат i податоци во складиштето на податоци за:

  1. 1 Идентификувајте ги трендовите на компанијата
  2. 2 Анализирајте ги профилите за купување на клиенти
  3. 3 Поделете i клиенти ед јас
  4. 4 Обезбедете ги најдобрите услуги на клиенти – приспособете ги услугите
  5. 5 Формулирајте стратегии маркетинг
  6. 6 Обезбедете конкурентни понуди за анализи на трошоците и помогнете во контролата
  7. 7 Поддржете го стратегиското одлучување
  8. 8 Идентификувајте можности да се истакнете
  9. 9 Подобрете го квалитетот на тековните деловни процеси
  10. 10 Проверете ја добивката

Следејќи ја насоката за развој на складиштето на податоци, може да се спроведат серија прегледи на системот за да се добијат повратни информации

и од тимот за развој и од заедницата на крајните корисници.
Добиените резултати може да се земат предвид за следниот развојен циклус.

Бидејќи складиштето на податоци има растечки пристап, од клучно значење е да се учи од успесите и грешките на претходните случувања.

2.5 Резиме

Во ова поглавје се дискутирани пристапите присутни во литературата. Во делот 1, се дискутираше за концептот на складиште на податоци и неговата улога во науката за одлучување. Во делот 2 се опишани главните разлики помеѓу складиштата на податоци и OLTP системите. Во делот 3 разговаравме за моделот на складиште на податоци Монаш кој беше користен во делот 4 за да се опишат активностите вклучени во процесот на развој на складиште на податоци, овие тези не беа засновани на ригорозни истражувања. Она што се случува во реалноста може да биде многу различно од она што го известува литературата, но овие резултати може да се искористат за да се создаде основна позадина што го нагласува концептот на складиште на податоци за ова истражување.

Поглавје 3

Методи на истражување и дизајн

Ова поглавје се однесува на методите на истражување и дизајн за оваа студија. Првиот дел покажува генерички приказ на истражувачките методи достапни за пронаоѓање информации, понатаму се дискутираат критериумите за избор на најдобриот метод за одредена студија. Во делот 2, потоа се дискутираат два методи избрани со штотуку изложените критериуми; од нив, еден ќе биде избран и усвоен со причините наведени во дел 3 каде што се наведени и причините за исклучување на другиот критериум. Во делот 4 е претставен дизајнот на истражувањето, а во делот 5 се заклучоците.

3.1 Истражување во информациски системи

Истражувањето во информациските системи не е само ограничено на технолошкиот домен, туку мора исто така да се прошири за да ги вклучи бихејвиоралните и организациските цели.
Ова го должиме на тезите на различни дисциплини кои се движат од општествени до природни науки; ова доведува до потреба од одреден спектар на истражувачки методи кои вклучуваат квантитативни и квалитативни методи кои треба да се користат за информациските системи.
Сите достапни методи на истражување се важни, всушност неколку истражувачи како што се Џенкинс (1985), Нунмајкер и др. (1991) и Галиерс (1992) тврдат дека не постои специфичен универзален метод за спроведување на истражување во различни области на информациските системи; всушност, методот може да биде погоден за одредено истражување, но не и за други. Ова ни ја носи потребата да избереме метод кој е погоден за нашиот конкретен истражувачки проект: за овој избор Benbasat et al. (1987) наведуваат дека мора да се земат предвид природата и целта на истражувањето.

3.1.1 Природа на истражувањето

Различните методи засновани на природата на истражувањето можат да се класифицираат во три традиции нашироко познати во информатичката наука: позитивистичко, интерпретативно и критичко истражување.

3.1.1.1 Позитивистичко истражување

Позитивистичкото истражување е познато и како научна или емпириска студија. Тој се стреми да: „објасни и предвиди што ќе се случи во општествениот свет со гледање на законитостите и причинско-последичните односи помеѓу елементите што го сочинуваат“ (Шанкс и сор. 1993).

Позитивистичкото истражување се карактеризира и со повторливост, поедноставувања и побивања. Понатаму, позитивистичките истражувања го признаваат постоењето на априори односи меѓу феномените што се проучуваат.
Според Галиерс (1992) таксономијата е истражувачки метод вклучен во позитивистичката парадигма, која сепак не е ограничена на ова, всушност постојат лабораториски експерименти, теренски експерименти, студии на случај, демонстрации на теореми, предвидувања и симулации. Со користење на овие методи, истражувачите признаваат дека феномените што се проучуваат може да се набљудуваат објективно и ригорозно.

3.1.1.2 Интерпретативно истражување

Интерпретативното истражување, кое често се нарекува феноменологија или антипозитивизам, е опишано од Нојман (1994) како „систематска анализа на општественото значење на дејството преку директно и детално набљудување на луѓето во природни ситуации, со цел да се дојде до разбирање и до толкувањето на тоа како луѓето го создаваат и одржуваат својот социјален свет“. Интерпретативните студии ја отфрлаат претпоставката дека набљудуваните феномени можат објективно да се набљудуваат. Всушност, тие се засноваат на субјективни толкувања. Понатаму, толкувачките истражувачи не наметнуваат априори значења на појавите што ги проучуваат.

Овој метод вклучува субјективни/аргументативни студии, акциони истражувања, описни/интерпретативни студии, идни истражувања и играње улоги. Во прилог на овие истражувања и студии на случај може да се вклучат во овој пристап бидејќи се однесуваат на студии на поединци или организации во сложени ситуации од реалниот свет.

3.1.1.3 Критичко истражување

Критичкото истражување е најмалку познат пристап во општествените науки, но неодамна доби внимание од истражувачите на информациските системи. Филозофската претпоставка дека општествената реалност историски ја произведуваат и репродуцираат луѓето, како и општествените системи со нивните дејства и интеракции. Меѓутоа, нивната способност е посредувана од голем број општествени, културни и политички размислувања.

Како и интерпретативното истражување, критичкото истражување тврди дека позитивистичкото истражување нема никаква врска со општествениот контекст и го игнорира неговото влијание врз човековите постапки.
Критичкото истражување, од друга страна, ги критикува интерпретативните истражувања дека се премногу субјективни и дека немаат за цел да им помогнат на луѓето да го подобрат својот живот. Најголемата разлика помеѓу критичкото истражување и другите два пристапа е неговата евалуативна димензија. Додека објективноста на позитивистичката и интерпретативната традиција е да се предвиди или објасни статус кво или општествената реалност, критичкото истражување има за цел критички да ја процени и трансформира општествената реалност што се проучува.

Критичките истражувачи обично се противат на статус кво со цел да се отстранат социјалните разлики и да се подобрат социјалните услови. Критичкото истражување има посветеност на процесен поглед на феномените од интерес и, според тоа, обично е надолжно. Примери за методи на истражување се долгорочни историски студии и етнографски студии. Критичкото истражување, сепак, не е широко користено во истражувањето на информациските системи

3.1.2 Цел на истражувањето

Заедно со природата на истражувањето, неговата цел може да се користи за да го води истражувачот при изборот на одреден метод на истражување. Целта на еден истражувачки проект е тесно поврзана со позицијата на истражувањето во однос на истражувачкиот циклус кој се состои од три фази: градење теорија, тестирање на теорија и усовршување на теоријата. Така, врз основа на времето на истражувачкиот циклус, истражувачки проект може да има објаснувачка, описна, истражувачка или предвидувачка цел.

3.1.2.1 Истражувачко истражување

Истражувачките истражувања имаат за цел да истражат сосема нова тема и да формулираат прашања и хипотези за идните истражувања. Овој тип на истражување се користи во градењето теорија за да се добијат првични референци во нова област. Вообичаено, се користат квалитативни методи на истражување, како што се студии на случај или феноменолошки студии.

Сепак, можно е да се применат и квантитативни техники како што се истражувачки истражувања или експерименти.

3.1.3.3 Описно истражување

Описното истражување има за цел да анализира и опише во многу детали одредена организациска ситуација или практика. Ова е соодветно за градење теории и исто така може да се користи за да се потврдат или оспорат хипотезите. Описното истражување обично вклучува употреба на мерки и примероци. Најсоодветните истражувачки методи вклучуваат анкети и анализа на претходници.

3.1.2.3 Објаснувачко истражување

Објаснувачкото истражување се обидува да објасни зошто работите се случуваат. Таа е изградена на факти кои се веќе проучени и се обидува да ги најде причините за овие факти.
Така, објаснувачкото истражување обично се гради на истражувачко или описно истражување и е помошно за тестирање и рафинирање на теориите. Објаснувачкото истражување вообичаено користи студии на случај или истражувачки методи засновани на анкети.

3.1.2.4 Превентивно истражување

Превентивното истражување има за цел да ги предвиди настаните и однесувањата под опсервација кои се проучуваат (Маршал и Росман 1995). Предвидувањето е стандарден научен тест за вистината. Овој тип на истражување генерално користи анкети или анализи на податоци историчари. (Јин 1989)

Горенаведената дискусија покажува дека постојат голем број можни истражувачки методи кои можат да се користат во одредена студија. Сепак, мора да постои еден специфичен метод кој е посоодветен од другите за одреден тип на истражувачки проект. (Galliers 1987, Yin 1989, De Vaus 1991). Затоа, секој истражувач треба внимателно да ги процени силните и слабите страни на различните методи, за да го усвои најсоодветниот и најкомпатибилен метод на истражување со истражувачкиот проект. (Џенкинс 1985, Перван и Клас 1992, Бономија 1985, Јин 1989, Химилтон и Ајвс 1992 година).

3.2. Можни методи на истражување

Целта на овој проект беше да се проучи искуството во австралиските организации со i податоци складирани со развој на складиште на податоци. Дато дека во моментов има недостиг од истражување во областа на складирање на податоци во Австралија, овој истражувачки проект се уште е во теоретска фаза на истражувачки циклус и има истражувачка цел. Истражувањето на искуството во австралиските организации кои прифаќаат складирање податоци бара толкување на вистинското општество. Следствено, филозофската претпоставка во основата на истражувачкиот проект ја следи традиционалната интерпретација.

По ригорозното испитување на достапните методи, беа идентификувани два можни истражувачки методи: анкети и студии на случај, кои можат да се користат за истражувачко истражување (Шанкс и сор. 1993). Галиерс (1992) аргументира за соодветноста на овие два методи за оваа конкретна студија во неговата ревидирана таксономија велејќи дека тие се погодни за градење теорија. Следните два потсекции детално го разгледуваат секој метод.

3.2.1 Истражувачки метод на истражување

Истражувачкиот метод на истражување потекнува од античкиот пописен метод. Пописот се состои од собирање информации од целото население. Овој метод е скап и непрактичен, особено ако популацијата е голема. Така, во споредба со пописот, анкетата вообичаено се фокусира на собирање информации за мал број, или примерок, претставници на населението (Fowler 1988, Neuman 1994). Примерокот ја одразува популацијата од која е извлечен, со различни нивоа на точност, во зависност од структурата на примерокот, големината и методот на селекција што се користи (Fowler 1988, Babbie 1982, Neuman 1994).

Методот на анкета е дефиниран како „слики од практики, ситуации или погледи во одреден временски период, преземени со помош на прашалници или интервјуа, од кои може да се заклучат
направено“ (Galliers 1992:153) [слика од практики, ситуации или погледи во одреден момент во времето, преземени со помош на прашалници или интервјуа, од кои може да се извлечат заклучоци]. Анкетите се занимаваат со собирање информации за некој аспект од студијата, од одреден број учесници, преку поставување прашања (Fowler 1988). Овие прашалници и интервјуа, кои вклучуваат телефонски интервјуа лице в лице и структурирани, се исто така техники за собирање на податоци најчесто користени во истрагите (Blalock 1970, Nachmias and Nachmias 1976, Fowler 1988), може да се користат набљудувања и анализи (Gable 1994). Од сите овие методи на собирање на податоци, употребата на прашалник е најпопуларната техника, бидејќи гарантира дека i податоци

собраните се структурирани и форматирани, и затоа ја олеснува класификацијата на информациите (Hwang 1987, de Vaus 1991).

Кога се анализира и податоци, стратегијата за истражување често користи квантитативни техники, како што е статистичка анализа, но може да се користат и квалитативни техники (Galliers 1992, Pervan

и Клас 1992, Гејбл 1994). Нормално, т.е податоци собраните се користат за анализа на дистрибуциите и моделите на асоцијации (Fowler 1988).

Иако анкетите се генерално соодветни за истражување кое се занимава со прашањето „што? (што) или што произлегуваат од него, како што се „колку“ и „колку“, тие можат да се прашаат преку прашањето „зошто“ (Sonquist и Dunkelberg 1977, Јин 1989). Според Sonquist и Dunkelberg (1977), истражувањето за истражување има за цел да ги предизвикува хипотезите, да ги оценува програмите, да ја опише популацијата и да развие модели на човечко однесување. Понатаму, анкетите може да се користат за проучување на одредено мислење на населението, состојби, мислења, карактеристики, очекувања, па дури и минато или сегашно однесување (Neuman 1994).

Анкетите му овозможуваат на истражувачот да ги открие односите меѓу населението и резултатите се вообичаено поопшти од другите методи (Sonquist и Dunkelberg 1977, Gable 1994). Анкетите им овозможуваат на истражувачите да покријат поголема географска област и да допрат до многу испитаници (Blalock 1970, Sonquist and Dunkelberg 1977, Hwang and Lin 1987, Gable 1994, Neuman 1994). Конечно, анкетите можат да обезбедат информации кои не се достапни на друго место или во форма потребна за анализи (Fowler 1988).

Меѓутоа, постојат некои ограничувања во спроведувањето на анкетата. Недостаток е што истражувачот не може да добие многу информации за предметот што се проучува. Ова се должи на фактот што анкетите се спроведуваат само во одредено време и, според тоа, постои ограничен број на варијабли и луѓе кои истражувачот може да ги

студија (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Друг недостаток е тоа што спроведувањето на анкета може да биде многу скапо во однос на време и ресурси, особено ако вклучува интервјуа лице в лице (Fowler 1988).

3.2.2. Истражувачки метод на истражување

Истражувачкиот метод на истражување вклучува длабинско проучување на одредена ситуација во рамките на нејзиниот реален контекст во одреден временски период, без каква било интервенција од страна на истражувачот (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Главно овој метод се користи за опишување на односите помеѓу променливите што се проучуваат во одредена ситуација (Galliers 1992). Истрагите може да вклучуваат единечни или повеќе случаи, во зависност од анализираниот феномен (Franz and Robey 1987, Eisenhardt 1989, Yin 1989).

Истражувачкиот метод е дефиниран како „емпириско истражување кое проучува современ феномен во неговиот вистински контекст, користејќи повеќе извори собрани од еден или повеќе ентитети како што се луѓе, групи или организации“ (Јин 1989). Не постои јасна поделба помеѓу феноменот и неговиот контекст и не постои експериментална контрола или манипулација со променливите (Yin 1989, Benbasat et al. 1987).

Постојат различни техники за собирање на податоци што може да се користи во методот на испитување, кој вклучува директни набљудувања, прегледи на архивски записи, прашалници, преглед на документација и структурирани интервјуа. Имајќи разновиден опсег на техники на берба податоци, истрагите им овозможуваат на истражувачите да се справат со двете податоци квалитативни и квантитативни во исто време (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Како што е случајот со методот на анкета, истражувачот на анкетата служи како набљудувач или истражувач, а не како активен учесник во организацијата што се проучува.

Бенбасат и сор.

на теорија во текот на процесот на собирање податоци. Да се ​​биде погоден и за сцената

за градење теорија, Франц и Роби (1987) сугерираат дека методот на истражување може да се користи и за фазата на сложена теорија. Во овој случај, врз основа на собраните докази, дадена теорија или хипотеза се проверува или побива. Дополнително, анкетата е погодна и за истражување кое се занимава со прашања „како“ или „зошто“ (Јин 1989).

Во споредба со другите методи, анкетите му овозможуваат на истражувачот подетално да ги долови суштинските информации (Galliers 1992, Shanks et al. 1993). Понатаму, анкетите му овозможуваат на истражувачот да ја разбере природата и сложеноста на проучуваните процеси (Benbasat et al. 1987).

Постојат четири главни недостатоци поврзани со методот на анкета. Првиот е недостатокот на контролирани одбитоци. Субјективноста на истражувачот може да ги промени резултатите и заклучоците од студијата (Јин 1989). Вториот недостаток е недостатокот на контролирано набљудување. За разлика од експерименталните методи, истражувачкиот истражувач не може да ги контролира феномените што се проучуваат бидејќи тие се испитуваат во нивниот природен контекст (Гејбл 1994). Третиот недостаток е недостатокот на повторливост. Ова е затоа што истражувачот веројатно нема да ги набљудува истите настани и не може да ги потврди резултатите од одредена студија (Lee 1989). Конечно, како последица на неповторливоста, тешко е да се генерализираат резултатите добиени од едно или повеќе истражувања (Galliers 1992, Shanks et al 1993). Сите овие проблеми, сепак, не се несовладливи и, всушност, може да се минимизираат од страна на истражувачот со примена на соодветни активности (Lee 1989).

3.3. Оправдајте ја методологијата на истражување усвоен

Од двата можни истражувачки методи за оваа студија, методот на анкета се смета за најсоодветен. Истрагата беше отфрлена по внимателно разгледување на релевантните

заслуги и слабости. Соодветноста или несоодветноста на секој метод за оваа студија е дискутирана подолу.

3.3.1. Несоодветност на методот на истражување на истрагата

Методот на истражување бара длабинско проучување за одредена ситуација во една или повеќе организации во одреден временски период (Eisenhardt 1989). Во овој случај, периодот може да ја надмине временската рамка дадена за оваа студија. Друга причина за неусвојување на методот на истражување е тоа што резултатите може да страдаат од недостаток на строгост (Yin 1989). Субјективноста на истражувачот може да влијае на резултатите и заклучоците. Друга причина е тоа што овој метод е посоодветен за истражување на прашања од типот „како“ или „зошто“ (Јин 1989), додека истражувачкото прашање за оваа студија е од типот „што“. Последно, но не и најмалку важно, тешко е да се генерализираат наодите од само едно или неколку истражувања (Galliers 1992, Shanks et al. 1993). Врз основа на ова образложение, методот на истражување на анкетата не беше избран бидејќи беше несоодветен за оваа студија.

3.3.2. Погодност на методот за пребарување на истрага

Кога беше спроведено ова истражување, практиката на складирање податоци не беше широко прифатена од австралиските организации. Значи, немаше многу информации за нивното спроведување во австралиските организации. Достапните информации дојдоа од организации кои имплементирале или користеле a складиште на податоци. Во овој случај, методот на истражување на анкетата е најсоодветен бидејќи овозможува добивање информации што не се достапни на друго место или во форма потребна за анализа (Fowler 1988). Дополнително, методот на истражување со анкета му овозможува на истражувачот да стекне добар увид во практиките, ситуациите или погледите во одредено време (Galliers 1992, Denscombe 1998). Беше потребен преглед за да се зголеми знаењето за искуството во австралиското складирање податоци.

Понатаму, Sonquist и Dunkelberg (1977) наведуваат дека резултатите од анкетното истражување се поопшти од другите методи.

3.4. Дизајн за истражување на истражувањето

Истражувањето за практиките на складирање податоци беше спроведено во 1999 година. Целната популација беше формирана од австралиски организации заинтересирани за студии за складирање податоци, бидејќи тие веројатно веќе биле информирани за податоци што тие ги складираат и, според тоа, би можеле да обезбедат корисни информации за оваа студија. Целната популација беше идентификувана преку првично истражување на сите австралиски членови на Институтот за складирање податоци (Tdwi-aap). Овој дел го разгледува дизајнот на фазата на емпириско истражување на оваа студија.

3.4.1. Техника на берба податоци

Од трите техники кои вообичаено се користат во анкетното истражување (т.е. прашалник по пошта, телефонско интервју и лично интервју) (Nachmias 1976, Fowler 1988, de Vaus 1991), прашалникот за пошта беше усвоен за оваа студија. Првата причина за усвојување на второто е тоа што може да достигне географски дисперзирана популација (Blalock 1970, Nachmias and Nachmias 1976, Hwang and Lin 1987, de Vaus 1991, Gable 1994). Второ, прашалникот по пошта е погоден за високообразовани учесници (Fowler 1988). Прашалникот по пошта за оваа студија беше упатен до спонзорите на проектите за складирање податоци, директорите и/или проектните менаџери. Трето, прашалниците за пошта се соодветни кога е достапна безбедна мејлинг листа (Salant и Dilman 1994). TDWI, во овој случај, доверливо здружение за складирање податоци ја обезбеди мејлинг листата на своите австралиски членови. Друга предност на прашалникот по пошта во однос на телефонскиот прашалник или личните интервјуа е тоа што им овозможува на испитаниците да одговорат попрецизно, особено кога испитаниците мора да консултираат белешки или да разговараат за прашања со други луѓе (Fowler 1988).

Потенцијален недостаток може да биде времето потребно за спроведување на прашалници по пошта. Вообичаено, анкетата по пошта се спроведува во оваа низа: писма по пошта, чекајте одговори и испраќајте потврда (Fowler 1988, Bainbridge 1989). Така, вкупното време може да биде подолго од времето потребно за лични интервјуа или телефонски интервјуа. Сепак, вкупното време може да се знае однапред (Fowler 1988, Denscombe 1998). Времето поминато во спроведување на лични интервјуа не може однапред да се знае бидејќи варира од едно до друго интервју (Fowler 1988). Телефонските интервјуа може да бидат побрзи од поштенските прашалници и личните интервјуа, но може да имаат висока стапка на неодговор поради недостапноста на некои луѓе (Fowler 1988). Дополнително, телефонските интервјуа генерално се ограничени на релативно кратки списоци на прашања (Bainbridge 1989).

Друга слабост на прашалникот за пошта е високата стапка на неодговор (Fowler 1988, Bainbridge 1989, Neuman 1994). Сепак, преземени се контрамерки со поврзување на оваа студија со доверлива институција за складирање податоци (т.е. TDWI) (Bainbridge 1989, Neuman 1994), која испраќа две писма за потсетување до оние кои не одговараат (Fowler 1988, Neuman 1994) и исто така вклучува дополнително писмо објаснувајќи ја целта на студијата (Neuman 1994).

3.4.2. Единица за анализа

Целта на оваа студија е да се добијат информации за имплементацијата на складирањето податоци и неговата употреба во рамките на австралиските организации. Целната популација ја сочинуваат сите австралиски организации кои имплементирале, или спроведуваат, т.е складиште на податоци. Поединечните организации потоа се регистрираат на име. Прашалникот беше испратен по пошта до организациите заинтересирани да го усвојат складиште на податоци. Овој метод осигурува дека собраните информации доаѓаат од најсоодветните ресурси на секоја организација учесничка.

3.4.3. Примерок за истражување

„Поштенската листа“ на учесници во анкетата беше добиена од TDWI. Од оваа листа, 3000 австралиски организации беа избрани како основа за земање примероци. До примерокот беше испратен дополнителен допис во кој се објаснува проектот и целта на истражувањето, заедно со лист со одговор и однапред платен плик за враќање на пополнетиот прашалник. Од 3000 организации, 198 се согласија да учествуваат во студијата. Се очекуваше толку мал број одговори дато големиот број австралиски организации кои тогаш ја прифатија или ја прифаќаа стратегијата за складирање податоци во рамките на нивните организации. Така, целната популација за оваа студија се состои од само 198 организации.

3.4.4. Содржина на прашалникот

Структурата на прашалникот се заснова на Монаш моделот на складирање податоци (дискутирано претходно во дел 2.3). Содржината на прашалникот се заснова на анализата на литературата презентирана во поглавје 2. Копија од прашалникот испратен до учесниците во анкетата може да се најде во Додаток Б. Прашалникот се состои од шест делови, кои ги следат фазите на опфатениот модел. Следните шест параграфи накратко ја сумираат содржината на секој дел.

Дел А: Основни информации за организацијата
Овој дел содржи прашања кои се однесуваат на профилот на организациите-учеснички. Дополнително, некои од прашањата се поврзани со статусот на проектот за складирање податоци на учесникот. Во анализата на анкетата не беа откриени доверливи информации како што е името на организацијата.

Дел Б: Почеток
Прашањата во овој дел се поврзани со задачата за започнување на складирање на податоци. Беа поставени прашања во врска со иницијаторите на проектот, гарантите, потребните вештини и знаења, целите за развој на складирање податоци и очекувањата на крајните корисници.

Дел В: Дизајн
Овој дел содржи прашања поврзани со планирање на активностите складиште на податоци. Конкретно, прашањата беа за обемот на извршување, времетраењето на проектот, трошоците за проектот и анализата на трошоците/придобивките.

Дел Г: Развој
Во делот за развој има прашања кои се однесуваат на развојните активности на складиште на податоци: збирка на барања на крајниот корисник, извори на податоци, логичкиот модел на податоци, прототипови, планирање на капацитети, технички архитектури и избор на развојни алатки за складирање податоци.

Дел Е: Операција
Оперативни прашања поврзани со работата и проширливоста на складиште на податоци, како се развива во следната фаза на развој. Таму квалитетот на податоците, стратегиите за освежување на податоци, грануларноста на податоци, приспособливост на складиште на податоци и безбедносните прашања на складиште на податоци беа меѓу типовите поставени прашања.

Дел F: Развој
Овој дел содржи прашања поврзани со користењето на складиште на податоци од крајните корисници. Истражувачот се интересираше за целта и корисноста на складиште на податоци, усвоените стратегии за преглед и обука и стратегијата за контрола на складиште на податоци усвоен.

3.4.5. Стапка на одговор

Иако анкетите по пошта се критикувани за ниска стапка на одговор, преземени се мерки за зголемување на стапката на враќање (како што беше дискутирано претходно во дел 3.4.1). Терминот „стапка на одговор“ се однесува на процентот на луѓе во одреден примерок од анкетата кои одговараат на прашалникот (Denscombe 1998). Следната формула беше искористена за пресметување на стапката на одговор за оваа студија:

Број на луѓе кои одговориле
Стапка на одговор = ——————————————————————————– X 100 Вкупен број на испратени прашалници

3.4.6. Пилот тест

Пред да се испрати прашалникот до примерокот, прашањата беа испитани со спроведување на пилот-тестови, како што предложија Лак и Рубин (1987), Џексон (1988) и де Ваус (1991). Целта на пилот-тестовите е да се откријат какви било непријатни, двосмислени изрази и прашања кои тешко се толкуваат, да се разјаснат сите употребени дефиниции и термини и да се идентификува приближното време потребно за пополнување на прашалникот (Warwick and Lininger 1975, Jackson 1988, Salant и Дилман 1994). Пилот-тестовите беа спроведени со избирање на субјекти со карактеристики слични на оние на финалните предмети, како што беше предложено од Дејвис е Cosenza (1993). Во оваа студија, шест професионалци за складирање податоци беа избрани како пилот субјекти. По секој пилот-тест беа направени потребните корекции. Од спроведените пилот-тестови, учесниците придонесоа за преобликување и ресетирање на конечната верзија на прашалникот.

3.4.7. Методи на анализа Од Дати

I податоци анкетите собрани од прашалниците од затворен тип беа анализирани со помош на статистички програмски пакет наречен SPSS. Многу од одговорите беа анализирани со помош на описна статистика. Голем број прашалници беа вратени некомплетни. Тие беа третирани со поголемо внимание за да се осигура дека i податоци исчезнатите не биле последица на грешки во внесувањето податоци, туку затоа што прашањата не биле соодветни за регистрантот, или регистрантот одлучил да не одговори на едно или повеќе конкретни прашања. Овие одговори што недостасуваа беа игнорирани за време на анализата податоци и беа кодирани како „- 9“ за да се обезбеди нивно исклучување од процесот на анализа.

При подготовката на прашалникот, затворените прашања беа претходно кодирани со доделување број на секоја опција. Бројот потоа се користел за подготовка на податоци за време на анализата (Denscombe 1998, Sapsford и Jupp 1996). На пример, имаше шест опции наведени во прашањето 1 од делот Б: одбор на директори, виш извршен директор, оддел за ИТ, деловна единица, консултанти и друго. Во досието на податоци на SPSS, беше генерирана променлива за да се означи „иницијаторот на проектот“, со шест ознаки: „1“ за „одбор на директори“, „2“ за „висок извршен директор“ и така натаму. Употребата на Ликертиновата скала во некои од затворените прашања, исто така, овозможи идентификација без напор со оглед на употребата на соодветните нумерички вредности внесени во SPSS. За прашања со неисцрпни одговори, кои меѓусебно не се исклучуваат, секоја опција беше третирана како една променлива со две ознаки за вредности: „1“ за „означено“ и „2“ за „необележано“.

Отворените прашања беа третирани поинаку од затворените прашања. Одговорите на овие прашања не беа внесени во SPSS. Наместо тоа, тие беа анализирани рачно. Употребата на овој тип прашања ни овозможува да стекнеме информации за слободно изразените идеи и личните искуства на испитаниците (Bainbridge 1989, Denscombe 1998). Онаму каде што е можно, беше направена категоризација на одговорите.

За анализа на податоци, се користат едноставни методи за статистичка анализа, како што се фреквенција на одговор, средна вредност, стандардна девијација и медијана (Argyrous 1996, Denscombe 1998).
Тестот Гама се покажа добро за добивање на квантитативни мерки на асоцијациите помеѓу податоци редни (Норусис 1983, Аргироус 1996). Овие тестови беа соодветни затоа што употребените редни скали немаа многу категории и можеа да бидат прикажани во табела (Norusis 1983).

3.5 Сомарио

Во ова поглавје се дискутираше за методологијата и дизајнот на истражувањето усвоени за оваа студија.

Изборот на најсоодветниот метод на истражување за одредена студија го зема предвид
разгледување на голем број правила, вклучувајќи ја природата и видот на истражувањето, како и заслугите и слабостите на секој можен метод (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, yin 1989, Hamilton and ives 1992, Galliers 1992, Нојман 1994). Со оглед на недостатокот на постоечко знаење и теорија во врска со усвојувањето на складирање податоци во Австралија, оваа истражувачка студија бара интерпретативен истражувачки метод со истражувачка способност за истражување на искуствата на австралиските организации. Избраниот метод на истражување беше избран за да се соберат информации во врска со усвојувањето на концептот за складирање податоци од страна на австралиските организации. Како техника за собирање беше избран поштенски прашалник податоци. Оправдувања за методот на истражување и техниката на собирање податоци избраните ќе бидат дадени во ова поглавје. Понатаму, беше претставена дискусија за единицата за анализа, користениот примерок, процентите на одговорите, содржината на прашалникот, пред-тестот на прашалникот и методот на анализа на податоци.

Проектирање на Складиште на податоци:

Комбинирање на односи со ентитети и димензионално моделирање

ИЗВАДОК
Складирање i податоци е главно актуелно прашање за многу организации. Клучно прашање во развојот на компјутерското складирање податоци тоа е негов дизајн.
Дизајнот мора да поддржува откривање на концепти во складиште на податоци на наследниот систем и други извори на податоци а исто така лесно разбирање и ефикасност во спроведувањето на складиште на податоци.
Голем дел од литературата за складирање на податоци препорачува употреба на моделирање на односи со ентитети или димензионално моделирање за да се претстави дизајнот на складиште на податоци.
Во овој труд покажуваме како двете претстави може да се комбинираат во еден пристап за цртање складиште на податоци. Пристапот што се користи е систематски

испитани во студија на случај и се идентификувани во голем број важни импликации со практичарите.

СКЛАДИРАЊЕ НА ПОДАТОЦИ

Un складиште на податоци обично се дефинира како „субјектно ориентирана, интегрирана, временски варијанта и нестабилно собирање на податоци за поддршка на одлуките на раководството“ (Инмон и Хакаторн, 1994). Предметно ориентирано и интегрирано укажува дека на складиште на податоци е дизајниран да ги премине функционалните граници на системите Legaci за да понуди интегрирана перспектива на податоци.
Временската варијанта влијае на историската или временски сериската природа на податоци во складиште на податоци, што овозможува да се анализираат трендовите. Неиспарливите укажуваат на тоа дека складиште на податоци не се ажурира постојано како а база на податоци на OLTP. Наместо тоа, се ажурира периодично, со податоци кои доаѓаат од внатрешни и надворешни извори. На складиште на податоци тој е специјално дизајниран за пребарување наместо ажурирање на интегритетот и перформансите на работата.
Идејата за складирање на i податоци не е ново, тоа беше една од менаџерските цели на податоци од шеесеттите (The Martin, 1982).
I складиште на податоци ја нудат инфраструктурата податоци за системи за поддршка на управувањето. Системите за поддршка на управувањето вклучуваат системи за поддршка на одлуки (DSS) и извршни информациски системи (EIS). DSS е информациски систем базиран на компјутер кој е дизајниран да го подобри човечкото одлучување. EIS е типично систем за испорака на податоци што им овозможува на деловните лидери лесно да пристапат до погледот на податоци.
Општата архитектура на А складиште на податоци ја истакнува улогата на складиште на податоци во менаџмент поддршка. Како и понудата на инфраструктурата податоци за EIS и DSS, ал складиште на податоци може да се пристапи директно преку барања. НА податоци вклучени во а складиште на податоци се засноваат на анализа на барањата за информации за управување и се добиени од три извори: внатрешни наследни системи, системи за запишување податоци за специјална намена и надворешни извори на податоци. НА податоци во внатрешните наследени системи тие често се непотребни, неконзистентни, со низок квалитет и складирани во различни формати, така што мора да се усогласат и исчистат пред да можат да се вчитаат во

складиште на податоци (Инмон, 1992; Мекфејден, 1996). НА податоци кои доаѓаат од системи за складирање податоци ад хок и од извори податоци надворешните често се користат за зголемување (ажурирање, замена) i податоци од наследните системи.

Постојат многу убедливи причини да се развие а складиште на податоци, кои вклучуваат подобрено донесување одлуки преку ефективна употреба на повеќе информации (Ives 1995), поддршка за фокусирање на цели зделки (Graham 1996) и намалување на податоци за EIS и DSS (Graham 1996, McFadden 1996).

Една неодамнешна емпириска студија покажа, во просек, поврат на инвестицијата за складиште на податоци за 401% по три години (Греам, 1996). Меѓутоа, другите емпириски студии на складиште на податоци откриле значителни проблеми, вклучувајќи тешкотии во мерењето и доделувањето придобивки, недостаток на јасна цел, потценување на целта и сложеноста на процесот на складирање на придобивките податоци, особено во однос на изворите и чистотата на податоци. Складирање i податоци може да се смета како решение за проблемот со управувањето податоци помеѓу организациите. Манипулацијата со податоци како социјален ресурс, тој остана еден од клучните проблеми во управувањето со информациските системи ширум светот многу години (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Популарен пристап за управување податоци во осумдесеттите тоа беше развој на модел податоци социјални. Модел податоци social беше дизајниран да понуди стабилна основа за развој на нови апликативни системи и база на податоци и реконструкција и интеграција на наследните системи (Brancheau et al.

1989 година, Гудхју и сор. 1988:1992, Ким и Еверест 1994). Сепак, има многу проблеми со овој пристап, особено сложеноста и цената на секоја задача и долгото време потребно за да се произведат опипливи резултати (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il складиште на податоци тоа е посебна база на податоци што коегзистира со наследените бази на податоци наместо да ги заменува. Затоа ви овозможува да го насочите управувањето со податоци и избегнувајте скапа реконструкција на наследените системи.

ПОСТОЈНИ ПРИСТАПИ КОН ДИЗАЈН НА ПОДАТОЦИ

СКУШЕН

Процесот на градење и усовршување а складиште на податоци треба да се сфати повеќе како еволутивен процес отколку како развојен животен циклус на традиционалните системи (Десио, 1995, Шенкс, О'Донел и Арнот 1997а). Постојат многу процеси кои се вклучени во еден проект складиште на податоци како што се иницијализација, планирање; информации добиени од барањата побарани од менаџерите на компаниите; извори, трансформации, чистење на податоци и синхронизација од наследни системи и други извори податоци; системи за испорака во развој; следење на складиште на податоци; и бесмисленост на еволутивниот процес и конструкција на а складиште на податоци (Стинчи, О'Донел и Арнот 1997б). Во ова списание, ние се фокусираме на тоа како да го нацртаме податоци складирани во контекст на овие други процеси. Постојат голем број на предложени пристапи кон архитектурата складиште на податоци во литературата (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Секоја од овие методологии има краток преглед со анализа на нивните силни и слаби страни.

Inmon's (1994) Пристап за Складиште на податоци дизајн

Инмон (1994) предложи четири итеративни чекори за дизајнирање a складиште на податоци (види слика 2). Првиот чекор е да дизајнирате шаблон податоци социјални да се разбере како јас податоци тие можат да се интегрираат низ функционални области во рамките на една организација со поделба на податоци складирајте во области. Модел податоци тој е направен за складирање податоци кои се однесуваат на донесување одлуки, вклучувајќи податоци историчари, и вклучени податоци изведена и собрана. Вториот чекор е да се идентификуваат предметните области за имплементација. Тие се засноваат на приоритети утврдени од одредена организација. Третиот чекор вклучува цртање a база на податоци за предметната област, обрнете особено внимание на вклучување на соодветни нивоа на грануларност. Инмон препорачува користење на моделот ентитети и врски. Четвртиот чекор е да се идентификуваат изворните системи податоци потребни и развиваат процеси на трансформација за снимање, чистење и форматирање i податоци.

Јаките страни на пристапот на Инмон се дека моделот податоци социјални обезбедува основа за интеграција на податоци во рамките на организацијата и планирањето на поддржува за итеративен развој на складиште на податоци. Неговите недостатоци се тешкотијата и трошоците за дизајнирање на моделот податоци социјални, тешкотијата во разбирањето модели на ентитети и односи кои се користат во двата модели, тоа податоци социјални и тоа на податоци складирани по предметна област и соодветноста на податоци на цртежот на складиште на податоци за реализација на база на податоци релациски но не и за база на податоци повеќедимензионални.

Ајвс (1995) Пристап кон Складиште на податоци дизајн

Ајвс (1995) предлага пристап од четири чекори за дизајнирање информациски систем за кој тој верува дека е применлив за дизајнот на складиште на податоци (види слика 3). Пристапот е многу заснован на Информациско инженерство за развој на информациски системи (Мартин 1990). Првиот чекор е да се утврдат целите, критичните и успешните фактори и клучните индикатори за успешност. Клучните деловни процеси и потребните информации се моделирани за да не доведат до модел податоци социјални. Вториот чекор вклучува развој на дефинирачка архитектура податоци складирани по области, база на податоци di складиште на податоци, технолошките компоненти кои се потребни, збирот на организациска поддршка потребна за имплементација и работа со складиште на податоци. Третиот чекор вклучува избор на потребни софтверски пакети и алатки. Четвртиот чекор е детално проектирање и изградба на складиште на податоци. Ајвс забележува дека складирањето податоци тоа е ограничен итеративен процес.

Јаките страни на пристапот Ајвс се употребата на специфични техники за одредување на барањата за информации, употребата на структуриран процес за поддршка на интеграцијата на складиште на податоци, соодветен избор на хардвер и софтвер и употреба на повеќе техники за претставување за складиште на податоци. Неговите недостатоци се својствени за сложеноста. Други вклучуваат тешкотии во развојот на многу нивоа на база на податоци во складиште на податоци во разумни времиња и трошоци.

Kimball's (1994) Пристап кон Складиште на податоци дизајн

Кимбал (1994) предложи пет итеративни чекори за дизајнирање a складиште на податоци (види слики 4). Неговиот пристап е особено посветен на дизајнот на соло складиште на податоци и за употребата на димензионални модели во предност пред моделите на ентитети и односи. Кимбал ги анализира тие димензионални модели бидејќи на бизнис лидерите им е полесно да го разберат бизнисот, поефикасно е кога се занимаваат со сложени консултации и дизајнот на база на податоци физичкиот е поефикасен (Kimball 1994). Кимбал препознава дека развојот на а складиште на податоци тоа е итеративно, и тоа складиште на податоци посебните табели може да се интегрираат со нивно делење на табели со заеднички димензии.

Првиот чекор е да се идентификува одредена предметна област што треба да се усоврши. Вториот и третиот чекор се однесуваат на димензионално моделирање. Во вториот чекор мерките ги идентификуваат работите од интерес во предметната област и се групирани во табела со факти. На пример, во предметната област на продажба, мерките на интерес може да го вклучат износот на продадените артикли и доларот како продажна валута. Третиот чекор вклучува идентификување на димензиите кои се начините на кои фактите може да се групираат. Во предметната област на продажба, релевантните димензии може да вклучуваат ставка, локација и временски период. Табелата со факти има клуч од повеќе делови за да се поврзе со секоја од табелите со димензии и обично содржи многу голем број факти. Спротивно на тоа, табелите со димензии содржат описни информации за димензиите и другите атрибути кои можат да се користат за групирање факти. Придружната предложена табела за факти и димензии го формира она што се нарекува шема на ѕвезди поради неговата форма. Четвртиот чекор вклучува изградба на a база на податоци повеќедимензионални за усовршување на шаблонот на ѕвездите. Последниот чекор е да се идентификуваат изворните системи податоци потребни и развиваат процеси на трансформација за снимање, чистење и форматирање i податоци.

Јаките страни на пристапот на Кимбал вклучуваат употреба на димензионални модели за претставување на податоци складирани што го олеснуваат разбирањето и доведуваат до ефикасен физички дизајн. Димензионален модел кој исто така лесно ги користи двата системи на база на податоци релациона може да се усоврши или системи база на податоци повеќедимензионални. Неговите недостатоци вклучуваат недостаток на некои техники за да се олесни планирањето или интеграцијата на многу модели на ѕвезди во а складиште на податоци и тешкотијата на дизајнирање од екстремно денормализирана структура во димензионален модел a податоци во системот на наследство.

McFadden's (1996) Пристап кон податоците Дизајн на складиште

McFadden (1996) предлага пристап од пет чекори за дизајнирање на a складиште на податоци (види слика 5).
Неговиот пристап се заснова на синтеза на идеи од литературата и е фокусиран на дизајнот на сингл складиште на податоци. Првиот чекор вклучува анализа на барањата. Иако техничките спецификации не се пропишани, белешките на Мекфаден ги идентификуваат ентитетите податоци спецификации и нивните атрибути, и се однесува на читателите Watson и Frolick (1993) за да се доловат барањата.
Во вториот чекор, е дизајниран модел за односи со ентитетите складиште на податоци а потоа потврдени од деловните лидери. Третиот чекор вклучува одредување на мапирањето од наследни системи и надворешни извори складиште на податоци. Четвртиот чекор вклучува процеси во развој, распоредување и синхронизација податоци во складиште на податоци. Во последниот чекор, системската испорака се развива со посебен акцент на корисничкиот интерфејс. Мекфејден забележува дека процесот на цртање е генерално итеративен.

Јаките страни на пристапот на Мекфаден укажуваат на учеството на деловните лидери во одредувањето на барањата, а исто така и на важноста на ресурсите податоци, нивно чистење и собирање. Неговите недостатоци вклучуваат недостаток на процес за рушење на голем проект складиште на податоци во многу интегрирани фази, и на

тешкотии во разбирањето на моделите на ентитет и односи кои се користат при дизајнирањето на складиште на податоци.

Не нè избираат само оние кои се блиски до нас.

    0/5 (0 критики)
    0/5 (0 критики)
    0/5 (0 критики)

    Дознајте повеќе од Онлајн веб агенција

    Претплатете се за да ги добивате најновите написи по е-пошта.

    аватар на авторот
    admin Извршен директор
    👍Онлајн веб агенција | Веб агенција експерт за дигитален маркетинг и оптимизација. Web Agency Online е веб-агенција. За Agenzia Web Online успехот во дигиталната трансформација се заснова на темелите на Iron SEO верзија 3. Специјалитети: Системска интеграција, Интеграција на апликации за претпријатија, Архитектура ориентирана кон услуги, Cloud Computing, складиште на податоци, деловна интелигенција, големи податоци, портали, интранет, веб-апликација Дизајн и управување со релациони и повеќедимензионални бази на податоци Дизајнирање интерфејси за дигитални медиуми: употребливост и графика. Онлајн веб-агенција им ги нуди на компаниите следните услуги: -SEO на Google, Amazon, Bing, Yandex; -Веб аналитика: Google Analytics, Google Tag Manager, Yandex Metrica; -Кориснички конверзии: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM на Google, Bing, Amazon Ads; - Маркетинг на социјални медиуми (Фејсбук, Линкедин, Јутјуб, Инстаграм).
    Мојата агилна приватност
    Оваа страница користи технички и колачиња за профилирање. Со кликнување на Прифати ги овластувате сите колачиња за профилирање. Со кликнување на одбие или на X, сите колачиња за профилирање се отфрлаат. Со кликнување на прилагодување, можете да изберете кои колачиња за профилирање да се активираат.
    Оваа страница е во согласност со Законот за заштита на податоците (LPD), швајцарскиот федерален закон од 25 септември 2020 година и GDPR, Регулативата на ЕУ 2016/679, кои се однесуваат на заштитата на личните податоци, како и на слободното движење на таквите податоци.