fbpx

Сховища даних і ERP | ЦЕНТРАЛЬНИЙ АРХІВ ДАНИХ: ІСТОРІЯ ТА ЕВОЛЮЦІЯ

АРХІВ DATA ЦЕНТРАЛЬНИЙ : ІСТОРІЯ ТА ЕВОЛЮЦІЯ


Дві домінуючі теми корпоративних технологій у 90-х роках
держави і сховище даних і ERP. Довго ці двоє могутніх
поточні були частинами корпоративної ІТ, ніколи не маючи
перехрестя. Це було майже так, ніби вони були матерією та антиматерією. але
зростання обох явищ неминуче вело до одного
їх перетин. Сьогодні компанії стикаються з проблемою
що робити з ERP e сховище даних. Ця стаття проілюструє
які проблеми і як їх вирішують компанії.
НА ПОЧАТКУ…
На початку було сховище даних. Інформаційне сховище народився для
лічильник прикладної системи обробки транзакцій.
У перші дні запам'ятовування дані це мало бути
просто контрапункт програм для обробки електронної пошти
операції. Але в наш час є набагато витонченіші бачення
того, що може зробити сховище даних. У сучасному світі
сховище даних вставляється в структуру, яка може бути
під назвою Фабрика корпоративної інформації.
ФАБРИКА КОРПОРАТИВНОЇ ІНФОРМАЦІЇ
(CIF)
Фабрика корпоративної інформації має архітектурні компоненти
стандарт: рівень трансформації та інтеграції коду
який об'єднує i дані поки я дані вони переміщуються з середовища о
застосування до навколишнього середовища сховище даних компанії; a
сховище даних компанії, де знаходиться дані
докладні та комплексні історики. The сховище даних компанії служить як
основа, на якій можуть бути побудовані всі інші частини
середовища сховище даних; сховище оперативних даних (ODS).
ODS — це гібридна структура, яка містить деякі аспекти даних
склад та інші аспекти середовища OLTP; вітрини даних, де i
різні відділи можуть мати власну версію даних
складське приміщення; a сховище даних розвідки, в якій i
«Філософи» (мислителі) компанії можуть надсилати свої запити
72 години без шкідливого впливу на сховище даних; і пам'ять
біля лінії, в якій дані старий і дані об'ємні деталі можуть бути
зберігається дешево.
ДЕ ERP ПОЄДНУЄТЬСЯ З
ФАБРИКА КОРПОРАТИВНОЇ ІНФОРМАЦІЇ
ERP зливається з Фабрикою корпоративної інформації у двох місцях.
Насамперед як базова програма, яка забезпечує i
дані додатка до сховище даних. У цьому випадку i дані,
генерується як побічний продукт процесу транзакції,
інтегровані та завантажені в сховище даних компанії. The
друга точка об'єднання між ERP і CIF і ODS. Насправді багато
середовища ERP використовується як класичний ODS.
Якщо ERP використовується як основна програма, це
той самий ERP також може використовуватися в CIF як ODS. в
однак, якщо ERP буде використовуватися в обох ролях, там
повинно бути чітке розмежування між двома сутностями. Іншими словами,
коли ERP відіграє роль базового додатку та ODS, ле
слід розрізняти дві архітектурні сутності. Якщо єдиний
впровадження ERP намагається виконувати обидві ролі
при цьому неминуче виникнуть проблеми в
проектування та впровадження цієї структури.
ОКРЕМІ ODS ТА БАЗОВІ ЗАСТОСУВАННЯ
Є багато причин, які призводять до поділу компонентів
архітектурний. Мабуть, найбільш красномовне питання для розділення
різні компоненти архітектури полягає в тому, що кожен компонент
архітектури має свій погляд. Служить базова програма
для інших цілей, ніж для ODS. Спробуйте перекривати
базовий прикладний погляд на світ ODS або навпаки
це не правильний спосіб роботи.
Отже, першою проблемою ERP у CIF є проблема
перевірити, чи є різниця між базовими програмами та програмами
ОРВ.
МОДЕЛІ ДАНИХ В КОРПОРАТИВІ
ФАБРИКА ІНФОРМАЦІЇ
Щоб досягти згуртованості між різними компонентами
архітектури CIF повинна бути модель дані. Я
моделі дані вони служать сполучною ланкою між різними компонентами
архітектури, такої як базові програми та ODS. THE
моделі дані стати «інтелектуальною дорожньою картою», щоб мати
правильне значення з різних архітектурних компонентів CIF.
Ідучи рука об руку з цим поняттям, ідея полягає в тому, що це повинно бути
бути чудовою та унікальною моделлю дані. Звичайно, він повинен
бути моделлю дані для кожного з компонентів і далі там
це має бути розумний шлях, що з’єднує різні моделі.
Кожен компонент архітектури – ODS, базові програми,
сховище даних компанії, і так далі .. – потребує свого
модель дані. І тому має бути точне визначення
як ці моделі дані вони взаємодіють один з одним.
ПЕРЕМІСТИТИ І DATA ERP В ДАНИХ
WAREHOUSE
Якщо походження в дані є базовою програмою та/або ODS, коли
ERP вставляє i дані нель сховище даних, цей запис повинен
відбуваються на найнижчому рівні деталізації. Повторіть або
просто агрегувати i дані як вони виходять
із базової програми ERP або ERP ODS немає
правильна річ. THE дані деталі потрібні в даних
склад для створення основи процесу DSS. Такі дані
вони будуть багато в чому змінені завдяки вітринам даних і дослідженням
Дель сховище даних.
Переміщення дані із середовища базової програми
ЕРП до середовища с сховище даних компанії здійснюється в a
досить спокійним способом. Цей зсув відбувається після цього
приблизно через 24 години після оновлення або створення в ERP. Факт
мають «ліниві» рухи дані нель сховище даних
компанії дозволяє дані надходження з ЄРПН на «розрахунок».
Одного разу я дані депонуються в базовій програмі,
тоді ви можете безпечно рухатися i дані ERP
на підприємстві. Ще одна мета, якої можна досягти завдяки руху
«ліниві» боги дані є чітке розмежування операційних процесів і
Розширення DS. З «швидким» рухом дані лінія розмежування
між DSS і оперативним залишається неясним.
Рух Росії дані від ОДС ЄРП до сховище даних
компанії проводиться періодично, зазвичай
щотижня або щомісяця. У цьому випадку рух о
дані в її основі лежить необхідність «почистити» старі дані істориків.
Природно, ODS містить i дані які набагато новіші
повага до дані історики знайшли в сховище даних.
Переміщення дані нель сховище даних це майже ніколи не робиться
«оптовий» (по-оптовицькому). Скопіюйте таблицю
від середовища ERP до сховище даних це не має сенсу. Один підхід
набагато більш реалістичним є рух обраних одиниць дані.
Тільки дані які змінилися після останнього оновлення даних
warehouse – це ті, які слід перемістити в дані
склад. Один із способів дізнатися, які саме дані вони були змінені
оскільки останнє оновлення - це переглянути позначки часу дані
знайдені в середовищі ERP. Дизайнер вибирає всі зміни
які виникли після останнього оновлення. Інший підхід
полягає у використанні методів захоплення змін дані. З
ці методи аналізують журнали та журнальні стрічки, щоб
визначити які дані необхідно перемістити із середовища ERP
Що з сховище даних. Ці техніки найкраще підходять
як журнали та журнальні стрічки можна читати з файлів ERP
без подальшого впливу на інші ресурси ERP.
ІНШІ УСКЛАДНЕННЯ
Однією з проблем ERP у CIF є те, що відбувається з іншими
джерела програми або ai дані ODS, до якого вони повинні робити внесок
сховище даних але вони не є частиною середовища ERP. Дата
закритий характер ERP, особливо SAP, спроба інтегрувати в
ключі із зовнішніх джерел дані з i дані які надходять з ERP ін
час рухатися i дані нель сховище даних, це великий виклик.
І які саме ймовірності того, що i дані програм або
ODS за межами середовища ERP буде інтегровано в дані
склад? Шанси насправді дуже високі.
ЗНАЙТИ DATA ІСТОРИЧНЕ З ERP
Інша проблема з i дані ERP є результатом
від потреби мати дані історики в межах сховище даних.
Зазвичай сховище даних потреби дані істориків. І
Технологія ERP зазвичай не зберігає їх дані
історичний, принаймні не в тій мірі, в якій це необхідно в даті
склад. При великій кількості дані істориків починається реклама
щоб бути доданим до середовища ERP, це середовище має бути
прибраний. Наприклад, припустимо a сховище даних повинен
бути завантажений п'ятьма роками дані історичні, поки ERP дотримується
максимум шість місяців з них дані. Поки компанія задоволена
зібрати серію дані історія з плином часу,
тоді немає проблем з використанням ERP як джерела для
сховище даних. Але коли сховище даних мушу йти
назад у часі та візьміть богів дані істориків, яких не було
попередньо зібрані та збережені ERP, потім середовищем ERP
воно стає неефективним.
ERP ТА МЕТАДАНІ
Ще одне зауваження щодо ERP e сховище даних чи це
на існуючі метадані в середовищі ERP. А також метадані
вони переходять із середовища ERP до del сховище даних,
метадані повинні бути переміщені таким же чином. Крім того, i
метадані повинні бути перетворені у форматі та структурі
вимагається інфраструктурою сховище даних. Є великий
різниця між оперативними метаданими та метаданими DSS. Метадані
оперативні в основному для розробника та для
програміст. Метадані DSS насамперед для вас
останній. Існуючі метадані в програмах ERP або ODS
їх потрібно навернути, і це навернення не завжди легко
і прямий.
ОТРИМАННЯ ДАНИХ ERP
Якщо ERP використовується як постачальник дані за іл сховище даних ci
повинен бути надійним інтерфейсом, який рухається i дані з навколишнього середовища
ERP до середовища сховище даних. Інтерфейс повинен:
▪ бути простим у використанні
▪ дозволити доступ до дані ERP
▪ підібрати значення дані які збираються перемістити
нель сховище даних
▪ знати обмеження ERP, які можуть виникнути в
момент здійснення доступу дані ERP:
▪ посилальна цілісність
▪ ієрархічні відносини
▪ неявні логічні зв'язки
▪ умова застосування
▪ всі структури дані підтримується ERP тощо…
▪ бути ефективним у доступі дані, надаючи:
▪ прямий рух дані
▪ придбання здачі дані
▪ підтримувати своєчасний доступ до дані
▪ розуміти формат дані, і так далі…
ІНТЕРФЕЙС З SAP
Інтерфейс може бути двох типів, домашній або комерційний.
Деякі з основних комерційних інтерфейсів включають:
▪ SAS
▪ Основні рішення
▪ D2k і так далі…
КІЛЬКА ТЕХНОЛОГІЙ ERP
Ставлення до середовища ERP так, ніби це єдина технологія
велика помилка. Існує багато технологій ERP, кожна з яких своя
сильні сторони. Найвідоміші постачальники на ринку:
▪ SAP
▪ Oracle Financials
▪ PeopleSoft
Дж. Д. Едвардс
▪ Baans
SAP
SAP є найбільшим і найповнішим програмним забезпеченням ERP. Додатки
SAP охоплює багато типів програм у багатьох сферах. SAP має
репутація бути:
▪ дуже великий
▪ дуже складно і дорого реалізувати
▪ потрібно багато людей і консультантів
реалізовано
▪ потребує спеціалізованих людей для впровадження
▪ потребує багато часу для реалізації
Крім того, SAP має репутацію компанії, що зберігає свої дані дані мольто
обережно, ускладнюючи доступ до них
особа за межами зони SAP. Сила SAP — бути
здатний захоплювати та зберігати велику кількість дані.
SAP нещодавно оголосила про свій намір розширити
його застосування до сховище даних. Є багато плюсів і мінусів
використання SAP як постачальника сховище даних.
Перевагою є те, що SAP уже встановлено і більшість із них
консультанти вже знають SAP.
Недоліки SAP як постачальника сховище даних соно
багато: SAP не має досвіду в світі сховище даних
Якщо SAP є постачальником сховище даних, необхідно «винести»
i дані від SAP до сховище даних. Dato послужний список SAP
закрита система, навряд чи буде легко отримати i від SAP
це (???). Є багато застарілих середовищ, що працюють у SAP,
такі як IMS, VSAM, ADABAS, ORACLE, DB2 тощо.
SAP наполягає на підході «не винайдено тут». SAP не хоче
співпрацювати з іншими постачальниками для використання або створення сховище даних.
SAP наполягає на створенні всього власного програмного забезпечення самостійно.
Хоча SAP є великою та потужною компанією, факт
спроба переписати технології ELT, OLAP, адміністрування
системи та навіть кодової бази dbms це просто божевілля.
Замість того, щоб співпрацювати з постачальниками
di сховище даних протягом тривалого часу компанія SAP дотримується підходу, який
вони «знають найкраще». Таке ставлення стримує успіх, який
САП може мати в районі с сховище даних.
Відмова SAP надати доступ зовнішнім постачальникам
негайно та витончено до них дані. Сама суть використання
un сховище даних є легкий доступ дані. Вся історія SAP така
на основі ускладнення доступу дані.
Відсутність у SAP досвіду роботи з великими обсягами дані;
в області сховище даних є обсяги дані ніколи не бачив з тих пір
SAP і керувати цими великими обсягами дані ти повинен мати один
відповідна технологія. Очевидно, SAP про це не знає
технологічний бар'єр, який існує для входу в поле даних
склад.
Корпоративна культура SAP: SAP створила бізнес
в отриманні i дані від системи. Але для цього потрібно мати
інше мислення. Традиційно, програмні компанії, які були
добре передавати дані в середовище, у якому не вміли
отримати дані, щоб піти іншим шляхом. Якщо SAP може зробити це
Switch стане першою компанією, яка зробить це.
Коротше кажучи, питання, чи повинна компанія обирати
SAP як постачальник сховище даних. Є дуже серйозні ризики
з одного боку та дуже мало винагород з іншого. Але є й інший
причина, яка перешкоджає вибору SAP як постачальника даних
склад. Бо кожна компанія повинна мати однакову дату
склад усіх інших компаній? The сховище даних це серце
конкурентної переваги. Якби кожна компанія прийняла те саме
сховище даних це було б важко, хоча й не неможливо,
отримати конкурентну перевагу. SAP, здається, вважає, що a
сховище даних можна розглядати як бісквіт, і це а
ще одна ознака їхнього «отримання даних».
в”.
Жоден інший постачальник ERP не є таким домінуючим, як SAP.
Безсумнівно, будуть компанії, які підуть шляхом SAP
для своїх сховище даних але імовірно ці дати
Склади SAP будуть великими, дорогими і вимагатимуть багато
часу на їх створення.
Ці середовища включають такі дії, як обробка касиром банку,
процеси бронювання авіаквитків, процеси скарг
страхування і так далі. Система транзакцій була більш ефективною,
більш очевидною була потреба в розділенні операцій і процесу
DSS (Система підтримки прийняття рішень). Проте з ресурсними системами
людського та особистого, ніхто ніколи не стикається з великими обсягами
операції. І, звичайно, коли людину беруть на роботу
або залишити компанію це запис транзакції.
Але відносно інших систем, кадрові системи і
у персональних даних просто не так багато транзакцій. Тому в
людських ресурсів і кадрових систем не зовсім очевидно, що існує
потрібен DataWarehouse. Багато в чому ці системи
являють собою уніфікацію систем СППР.
Але є ще один фактор, який необхідно враховувати, якщо вам доведеться
робити зі сховищем даних і з PeopleSoft. У багатьох колах, i дані
Кадри та особисті ресурси є другорядними щодо бізнесу
керівник компанії. Більшість компаній виконують
виробництво, продаж, надання послуг тощо. THE
Системи управління персоналом і персоналом зазвичай є вторинними (або
підтримка) основного напряму діяльності компанії. Тому так і є
двозначний і незручний a сховище даних окремо для
підтримка людських і особистих ресурсів.
У цьому плані PeopleSoft сильно відрізняється від SAP. З SAP це так
обов'язкова наявність a сховище даних. З PeopleSoft це не так
тоді так ясно. Для PeopleSoft сховище даних є необов’язковим.
Найкраще, що можна сказати про дані PeopleSoft — це дані
склад можна використовувати для зберігання i дані щодо
старі людські та особисті ресурси. Друга причина для
які компанія хотіла б використовувати a сховище даних a
Недоліком середовища PeopleSoft є можливість доступу та
вільний доступ до інструментів аналізу, ai дані від PeopleSoft. Але
крім цих причин, можуть бути випадки, коли краще не робити цього
є сховище даних для дані PeopleSoft.
Підводячи підсумок
Існує багато ідей щодо створення даних
склад у програмному забезпеченні ERP.
Деякі з них:
▪ Є сенс мати a сховище даних який виглядає як будь-який
ще в галузі?
▪ Наскільки гнучким є ERP сховище даних Програмне забезпечення?
▪ ERP сховище даних програмне забезпечення може обробляти обсяг
дані який розташований в асховище даних арена"?
▪ Що таке журнал трасування, який виконує постачальник ERP
стикаються з легким і недорогим, трудомістким, ai дані? (що
це послужний список постачальників ERP щодо доставки недорогих, на
час, легкий доступ до даних?)
▪ Яке розуміння архітектури DSS та
"корпоративна інформаційна фабрика" від постачальника ERP?
▪ Постачальники ERP розуміють, як отримати дані всередині
навколишнього середовища, але також зрозуміти, як їх експортувати?
▪ Наскільки постачальник ERP відкритий для інструментів даних
складування?
Усі ці міркування необхідно враховувати при визначенні
де поставити сховище даних який прийматиме i дані ЕРП та ін
дані. Загалом, якщо для цього немає вагомих причин
інакше рекомендується побудувати сховище даних з
із середовища постачальника ERP.
РОЗДІЛ 1
Огляд організації BI
Ключові моменти:
Інформаційні сховища працюють навпаки
до архітектури бізнес-аналітики (BI):
Корпоративна культура та ІТ можуть обмежити успіх у
створення організацій BI.
Технології більше не є обмежуючим фактором для організацій BI. The
Проблема для архітекторів і планувальників полягає не в тому, чи
технології існують, але якщо їх можна ефективно реалізувати
доступна технологія.
Для багатьох компаній a сховище даних це трохи більше, ніж депозит
пасивний, хто поширює i дані користувачам, які цього потребують. THE дані
вони витягуються з вихідних систем і заповнюються цільовими структурами
di сховище даних. Я дані їх також можна чистити цілими
доля. Однак додаткова вартість також не додається
зібрані дані під час цього процесу.
По суті, пасивний Dw, у кращому випадку, забезпечує
тільки я дані чистий і оперативний для асоціацій користувачів. там
створення інформації та аналітичне розуміння залежать
повністю користувачами. Судячи з того, чи DW (Інформаційне сховище) є
успіх суб'єктивний. Якщо судити про успіх по
здатність ефективно збирати, інтегрувати та очищати i дані
на передбачуваній основі, тоді так, DW має успіх.
З іншого боку, якщо ми подивимося на колекцію, консолідацію і ось
використання інформації організацією в цілому
DW є невдалим. DW дає невелику цінність або взагалі не надає її
інформації. У результаті користувачі змушені обходитися,
таким чином створюючи накопичувачі інформації. Цей розділ представляє
комплексне уявлення про архітектуру BI (бізнес
Розвідка) компаній. Почнемо з опису БІ і
тоді ми перейдемо до обговорення дизайну та
розвиток інформації, на відміну від простого надання i дані
користувачам. Потім обговорення зосереджено на розрахунку
цінність ваших зусиль BI. На завершення ми визначимо, як IBM
нагадує архітектурні вимоги вашої організації до BI.
Опис архітектури
BI організація
Зараз є потужні інформаційні системи, орієнтовані на транзакції
на порядку денному на кожному великому підприємстві, як вони рівні
ефективне поле для корпорацій у світі.
Однак для збереження конкурентоспроможності тепер потрібні аналітичні системи
орієнтований на те, що може революціонізувати здатність компанії, заново відкривши ред
використовуючи інформацію, яку вони вже мають. Ці системи
аналітичний вивести з розуміння з багатства дані
доступний. BI може покращити продуктивність усієї інформації
підприємства. Компанії можуть покращити відносини між клієнтами
постачальників, підвищити прибуток продуктів і послуг, генерувати
нові та найкращі пропозиції, перевірити ризик та багато іншого
прибутки різко скорочують витрати. З вашим BI
компанія нарешті починає використовувати інформацію про клієнтів
як конкурентний актив завдяки програмам, які мають цілі
ринку.
Мати правильні засоби ведення бізнесу означає мати чіткі відповіді
такі ключові питання, як:
▪ Хто з наших клієнти вони змушують нас заробляти більше, або там
вони програють?
▪ Де живуть наші найкращі клієнти у зв'язку з, щодо магазин/
склад вони часто?
▪ Які з наших продуктів і послуг можна продати більше
ефективно і кому?
▪ Які продукти можна продавати найбільш ефективно і кому?
▪ Яка кампанія з продажу є більш успішною і чому?
▪ Які канали збуту для яких продуктів найбільш ефективні?
▪ Як ми можемо покращити стосунки з нашими найкращими клієнти?
Більшість компаній мають дані грубо відповідати
ці питання.
Операційні системи генерують велику кількість продукту
замовник і о дані ринку з точок продажу, з резервацій,
від систем обслуговування клієнтів і технічної підтримки. Проблема така
видобувати та використовувати цю інформацію.
Багато компаній отримують прибуток лише від невеликих частин свого капіталу дані
для стратегічного аналізу.
I дані решта, часто в поєднанні з i дані отримання зовнішніх джерел, таких як i
«урядові звіти» та інша куплена інформація є одним
золотий рудник, який тільки чекає на дослідження, наприклад дані повинен
бути уточненим лише у вашому інформаційному контексті
організації.
Ці знання можна застосовувати різними способами, варіаціями
від розробки загальної корпоративної стратегії до
особисте спілкування з постачальниками, через кол-центри,
виставлення рахунків, інтернет та інші моменти. Сьогоднішнє бізнес-середовище диктує
що DW та пов’язані з ним рішення BI розвиватимуться далі
виконання традиційних конструкцій дані такі як я дані нормалізовано до
атомного рівня та «зірко-кубових ферм».
Щоб залишатися конкурентоспроможними, необхідно злиття
традиційні та передові технології з метою підтримки a
величезний аналітичний ландшафт.
Нарешті, загальне середовище має покращувати знання
підприємства в цілому, забезпечуючи виконання дій
в результаті проведених аналізів вони стають у пригоді, щоб кожен був
користь.
Наприклад, скажімо, ви оцінюєте свій власний рейтинг клієнти в категоріях
високий або низький ризик.
Незалежно від того, чи генерується ця інформація моделлю видобутку даних або
іншими способами, його потрібно помістити в Dw і зробити доступним
будь-хто за допомогою будь-яких засобів доступу, таких як i
статичних звітів, електронних таблиць, таблиць або аналітичної обробки в
лінія (OLAP).
Проте в даний час такої інформації дуже багато
вони залишаються в силосах дані осіб або відділів, які вони створюють
аналіз. Організація в цілому мало або зовсім не помітна
для розуміння. Тільки шляхом змішування цього типу контенту
інформація у вашому підприємстві dw, яку ви можете усунути
інформації та покращуйте ваше середовище Dw.
Є дві основні перешкоди для розвитку організації
BI.
По-перше, у нас проблема самої організації
спорідненої дисципліни.
Навіть якщо ми не можемо допомогти зі змінами політики
організації, ми можемо допомогти зрозуміти компоненти
організація BI, її архітектура та як
Технологія IBM сприяє його розвитку.
Другий бар'єр, який необхідно подолати, - це відсутність технологій
інтегрований і знання методу, який викликає весь простір
BI на відміну від лише невеликого компонента.
IBM реагує на зміни в технологіях
інтегрованих. Ви відповідаєте за створення дизайну
сором'язливий. Цю архітектуру необхідно розвивати разом
технологія, обрана для інтеграції без обмежень, або, принаймні, з
технологія, яка відповідає відкритим стандартам. Крім того, ваш
Керівництво компанії повинно переконатися, що підприємство Bi
здійснювати згідно з програмою і не допускати її
розвиток інформаційних силосів, які є результатом самообслуговування
порядку денного або цілей.
Це не означає, що середовище BI нечутливе до
реагувати на різні потреби та вимоги різних користувачів; натомість це означає
що реалізація цих індивідуальних потреб і вимог є
зроблено на користь усієї організації BI.
Опис архітектури BI організації може
можна знайти на сторінці 9 на малюнку 1.1. Архітектура демонструє
багате поєднання технологій і технік.
З традиційного погляду архітектура включає в себе наступні компоненти
складу
Атомний шар(Atomic Layer).
Це основа, серце всього Dw і, отже,
стратегічна звітність.
I дані зберігається тут збереже історичну цілісність, повідомляє о
дані і включати похідну метрику, а також бути чистим,
інтегровано та зберігається за допомогою шаблонів видобутку.
Усі наступні використання цих дані і відповідна інформація є
похідні від цієї структури. Це чудове джерело для
добування дані і для звітів зі структурованими запитами SQL
Оперативний склад дані або звітної основи
дані(Сховище оперативних даних (ODS) або звітність
база даних.)
Це структура дані спеціально розроблений для
технічна звітність.
I дані зберігаються та повідомляються вище ці структури можуть нарешті
поширюватися на склад через зону постановки (постановка
області), де його можна було б використовувати для стратегічної сигналізації.
Постанова зона.
Перша зупинка для більшості дані призначений для навколишнього середовища
склад - зона організації.
Ось я дані інтегруються, очищаються та перетворюються на дані корисно що
вони заповнять структуру складу
Фінікові ринки.
Ця частина архітектури являє собою структуру дані використовується
спеціально для OLAP. Наявність вітрин даних, якщо i дані соно
зберігаються в зіркових схемах, які вони накладають дані
багатовимірний у реляційному середовищі або в картотеках
di дані запатентований, який використовується певною технологією OLAP, наприклад
Сервер OLAP DB2, це не актуально.
Єдиним обмеженням є те, що архітектура полегшує використання дані
багатовимірний.
Архітектура також включає критично важливі технології та методи Bi
які розрізняють як:
Просторовий аналіз
Простір – це надприбуток інформації для аналітика та
це критично важливо для повного вирішення. Космічна банка
представляють інформацію про людей, які живуть у певній
місцезнаходження, а також інформацію про те, де це місцезнаходження
фізично порівняно з рештою світу.
Щоб провести цей аналіз, ви повинні почати з прив’язування свого
інформацію про координати широти та довготи. Що означає
називається «геокодуванням» і має бути частиною вилучення,
перетворення, а також процесу навантаження (ETL) до рівня
атомний номер вашого складу.
Видобуток даних.
Видобуток дані дозволяє нашим компаніям розвиватися
число клієнти, щоб передбачити тенденції продажів і ввімкнути
управління відносинами с клієнти (CRM), серед інших ініціатив
BI.
Видобуток дані тому вона повинна бути інтегрована зі структурами
дані Dwhouse і підтримується складськими процесами для
перевірити як ефективне, так і ефективне використання технології та
суміжні техніки.
Як зазначено в архітектурі BI, атомарний рівень
Dwhouse, як і вітрини даних, є чудовим джерелом дані
для видобутку. Такі самі структури також повинні бути
одержувачі результатів екстракції, щоб забезпечити їх доступність
найбільша аудиторія (найширша аудиторія).
Агенти.
Існують різні "агенти", які перевіряють клієнта на будь-який момент, наприклад,
операційні системи компанії та сам dw. Ці агенти можуть
бути досвідченими нейронними мережами, навченими вивчати
тенденції кожної точки, такі як майбутній попит на продукт
про стимулювання збуту, механізми на основі правил, на які потрібно реагувати
un дате сукупність обставин або навіть простих агентів, які
вони вказують на винятки для «вищих керівників». Ці процеси так
зазвичай присутні в реальному часі і, отже, повинні
бути тісно пов'язані з їх рухом дані.
Всі ці структури з дані, технології та техніка гарантія
що ви не проведете ніч, створюючи організацію
ваш BI.
Ця діяльність розвиватиметься поетапно для маленьких
балів.
Кожен крок є незалежним проектом, про який повідомляється
як ітерацію у вашій ініціативі dw або BI. Ітерації
може включати впровадження нових технологій, для
почати з нових технік, додаючи нові структури дані ,
завантаження i дані додатковий або з розширенням аналізу
ваше оточення. Цей параграф обговорюється далі
детальніше в розділі 3.
Крім традиційних структур інструментів Dw і Bi існують інші
функції вашої організації BI, за які ви маєте борг
дизайн, наприклад:
Точки контакту з клієнтами (Customer touch
точок).
Як і в усіх сучасних організаціях, існує кілька
точки дотику клієнтів, які вказують, як отримати досвід
позитивно для вашого клієнти. Є традиційні канали, такі як i
торговці, оператори комутаторів, пряма поштова розсилка, мультимедіа та друк
реклама, а також найсучасніші канали, такі як електронна пошта та Інтернет, тобто дані
необхідно придбати продукти з певною точкою контакту,
транспортуються, очищаються, перетворюються, а потім заселяються в структури дані з
BI.
Основи дані оперативні та користувацькі асоціації (Опер
баз даних і спільнот користувачів).
В кінці контактних точок в клієнти фундаменти знайдені дані
додатків компанії та спільнот користувачів. THE дані існуючі
соно дані традиційні, які повинні бути зібрані разом і злиті з дані що
вони випливають із точок дотику, щоб виконати необхідне
інформації.
Аналітики. (Аналітики)
Основним бенефіціаром середовища BI є аналітик. Це він
вигоди від поточного видобутку дані оперативний, інтегрований з
різні джерела дані , доповнений такими функціями, як аналітика
географічні (геокодування) і представлені в BI-технологіях, що
дозволяють видобуток корисних копалин, OLAP, розширені звіти та аналіз SQL
географічний. Основний інтерфейс аналітика до середовища
звітність – портал BI.
Однак аналітик не єдиний, хто виграє від архітектури
BI.
Керівники, великі асоціації користувачів і навіть члени, постачальники тощо
клієнти повинні знайти переваги в бізнесі BI.
Петля зворотного живлення.
Архітектура BI – це навчальне середовище. Принцип
Характерною рисою розвитку є наявність стійких структур дані
оновлюватися за використовуваною технологією BI та діями
зобов'язання користувача. Прикладом є оцінка
замовник (оцінка замовника).
Якщо відділ продажів виконує модель майнінгу
клієнтів, яким подобається користуватися новою послугою, а потім
відділ продажів не повинен бути єдиною групою бенефіціарів
послуги.
Натомість модель інтелектуального аналізу слід виконувати як частину
характер потоку даних всередині компанії та бали клієнта
має стати невід'ємною частиною інформаційного середовища Росії
склад, видимий для всіх користувачів. IBM Suite, орієнтований на Bi-bI
включаючи DB2 UDB, DB2 OLAP Server містить більшість
частина важливих складових техніки, визначених на рис
1.1.
Ми використовуємо архітектуру, як вона зображена на малюнку цієї книги
дайте нам певний рівень безперервності та продемонструйте, як кожен продукт
IBM вписуються в загальну схему BI.
Надання інформаційного контенту (Надання
інформаційне наповнення)
Проектуйте, розробляйте та впроваджуйте своє середовище BI
важке завдання. Дизайн повинен охоплювати обидва
поточні та майбутні вимоги до бізнесу. Архітектурний проект
має бути повним, щоб включати всі знайдені висновки
на етапі проектування. Виконання повинно залишитися
спрямовані на єдину мету: розробити архітектуру BI
як формально представлено на кресленні та базується на вимогах
бізнес.
Особливо важко стверджувати, що дисципліна забезпечить
відносний успіх.
Це просто, оскільки ви не створите середовище BI для всіх
раптово, але це відбувається невеликими кроками з часом.
Однак ідентифікація компонентів BI вашої архітектури необхідна
важливо з двох причин: Ви будете керувати всіма наступними рішеннями
техніки архітектури.
Ви зможете свідомо спланувати конкретне використання технології
хоча ви можете не отримати повторення, яке йому потрібно
технології протягом кількох місяців.
Достатнє розуміння потреб вашого бізнесу вплине на тип
продуктів, які ви придбаєте для своєї архітектури.
Планування та розвиток вашої архітектури гарантують
що ваш склад
не випадкова подія, а скоріше «добре продумана»,
ретельно складене оголошення опера мистецтва, як мозаїка
змішана технологія.
Дизайн інформаційного наповнення
Весь початковий дизайн повинен бути зосереджений і ідентифікувати
основні компоненти BI, які знадобляться вашому середовищу
загальне в теперішньому і майбутньому.
Важливо знати бізнес-вимоги.
Ще до того, як почнеться офіційне планування,
Планувальник проекту часто може визначити один або два
компонент відразу.
Баланс компонентів, які можуть знадобитися для
однак вашу архітектуру нелегко знайти.
На етапі проектування основна частина архітектури
прив’язує сеанс розробки додатків (JAD) до пошуку
визначити бізнес-вимоги.
Іноді ці вимоги можна передати інструментам
запити та звітність.
Наприклад, користувачі заявляють, що якщо вони хочуть автоматизувати
наразі звіт потрібно створити вручну, інтегруючи
два поточних коефіцієнта та додавання отриманих розрахунків
поєднання дані.
Хоча ця вимога проста, вона визначає певну
функціональність функції, яку ви повинні включити, коли
купити інструменти звітності для організації.
Дизайнер також повинен висувати додаткові вимоги до
отримати повну картину. Користувачі хочуть підписатися на
цей звіт?
Підмножини звіту генеруються та надсилаються електронною поштою різним
користувачів? Хочете побачити цей звіт на порталі компанії?
Усі ці вимоги є частиною простої потреби
замінити ручний звіт за запитом користувачів. Вигода
з цих типів вимог є всі, користувачі та розробники
розуміння поняття звітів.
Однак існують інші типи бізнесу, які нам потрібно планувати.
Коли ділові вимоги викладені у формі
Стратегічні питання бізнесу, це легко для досвідченого планувальника
розрізняти розміри та вимоги до вимірювання/факту.
Рисунок 1.2 ілюструє розміри та розмірні компоненти a
бізнес-проблема.
Якщо користувачі JAD не знають, як оголосити свої вимоги
у формі бізнес-проблеми дизайнер часто подає
приклади пропуску та запуску сеансу збору даних
вимоги.
Досвідчений дизайнер може допомогти користувачам зрозуміти не тільки
стратегічної торгівлі, а й як її формувати.
Підхід до збору вимог розглядається в розділі 3; для
тепер ми просто хочемо вказати на необхідність дизайну для всіх
типи вимог BI
Стратегічне питання бізнесу – це не просто вимога
Бізнес, але також підказка для дизайну. Якщо треба відповісти
на багатовимірне запитання, то вам потрібно запам’ятати,
подати i дані розмірний, і якщо потрібно запам'ятати
дані багатовимірний, ви повинні вирішити, яку технологію або
техніка, яку ви збираєтеся використовувати.
Ви реалізуєте зарезервовану схему кубічної зірки чи обидва?
Як бачите, навіть проста бізнес-задача
може значно вплинути на дизайн. Проте
ці види бізнес-вимог є звичайними і, звичайно, принаймні
досвідченими проектувальниками та дизайнерами.
Було достатньо дискусій про технології та підтримку
OLAP і широкий вибір доступних рішень. Дотепер
ми згадали про необхідність об’єднати просту звітність із i
вимоги до розміру підприємства та як ці вимоги
впливати на технічні архітектурні рішення.
Але що це за вимоги, які не так легко зрозуміти
користувачами чи командою Dw? Вам коли-небудь знадобиться аналіз
просторовий (просторовий аналіз)?
Моделі майнінгу дані вони будуть вашою необхідною частиною
майбутнє? Хто знає?
Важливо відзначити, що таких технологій небагато
відомий широким спільнотам користувачів і членам команди
Dw, частково, це могло статися тому, що вони зазвичай
обробляються деякими внутрішніми або сторонніми технічними експертами. Це
граничний випадок проблем, які породжують ці типи технологій. себе
користувачі не можуть описати бізнес-вимоги або сформулювати їх
щоб надати вказівки дизайнерам, вони можуть
залишаються непоміченими або, що ще гірше, просто ігноруються.
Більш проблематично це стає, коли дизайнер і розробник зазнають невдачі
може розпізнати застосування одного з цих передових але
критичні технології.
Як ми часто чули, як дизайнери кажуть: «Ну чому
хіба ми не відкладемо це, поки не отримаємо іншу річ?
«Чи вони справді зацікавлені в пріоритетах, чи просто уникають i
вимоги вони не розуміють? Швидше за все, це останнє припущення.
Припустімо, ваша команда продажів повідомила вимогу
бізнесу, як показано на малюнку 1.3, як ви можете бачити
Вимога оформлена у формі бізнес-завдання. там
Різниця між цією проблемою та типовою розмірною проблемою полягає в тому
відстань. У цьому випадку відділ продажів хоче знати,
щомісяця загальний обсяг реалізації з продукції, складів і
клієнти які живуть у межах 5 миль від складу, де вони
вони купують.
На жаль, дизайнери чи архітектори просто можуть
ігноруйте просторовий компонент, кажучи: «у нас є клієнт,
продукт і я дані депозиту. Дотримуємося дистанції до
ще одна ітерація.
"Неправильну відповідь. Такого роду проблеми бізнесу стосуються
повністю BI. Це являє собою глибше розуміння
наш бізнес і надійний аналітичний простір для наших аналітиків.
BI також виходить за рамки простого запиту чи стандартного звітування
навіть OLAP. Це не означає, що ці технології не працюють
вони важливі для вашого BI, але самі по собі ні
середовище BI.
Дизайн для інформаційного контексту
(Дизайн інформаційного наповнення)
Тепер, коли ми визначили бізнес-вимоги, які виділяються
різні фундаментальні компоненти повинні бути включені в проект
загальноархіт. Деякі з компонентів BI є частиною
наших початкових зусиль, хоча деякі не будуть реалізовані
кілька місяців.
Проте всі відомі вимоги відображені в конструкції так, щоб
коли нам потрібно впровадити певну технологію, ми це робимо
будьте готові це зробити. Щось у проекті буде відображати мислення
традиційне.
Наприклад, на малюнку 1.1 на початку розділу показано дані
mart, який підтримує i дані габаритний.
Цей набір дані використовується для підтримки подальшого використання
дані розмірності, зумовлені бізнес-проблемами, які
ми визначили. Як додаткові документи є
генерується, наприклад, розробка дизайну дані, ми
ми почнемо формалізувати, як i дані вони поширюються в навколишньому середовищі.
Ми з’ясували необхідність представлення i дані так
розмірними, підрозділяючи їх (відповідно до конкретних потреб
визначено) на вітринах даних.
Наступне питання, на яке потрібно відповісти, — як вони будуть побудовані
ці вітрини даних?
Ви будуєте зірки, щоб підтримувати куби, чи просто куби, чи лише зірки?
(або правильні кубики, або правильні зірочки). Створіть архітектуру для даних
залежні ринки, які вимагають атомарного рівня для всіх дані
ви набуваєте? Дозволити незалежним вітринам даних отримати i дані
безпосередньо з операційних систем?
Яку технологію Cube ви спробуєте стандартизувати?
У вас величезна кількість богів дані необхідні для аналізу розмірів
або вам потрібні куби вашої національної торгової служби на одному
щотижня чи обидва? Створіть потужний предмет
наприклад DB2 OLAP Server for Finance або куби Cognos
PowerPlay для вашої торгової організації чи для обох?
Це великі архітектурні дизайнерські рішення, які
вони в майбутньому вплинуть на ваше середовище BI. так,
ви визначили потребу в OLAP. Тепер як ви збираєтеся це здійснити
вид техніки і технології?
Як деякі з найпередовіших технологій впливають на ваші
малюнки? Припустімо, ви визначили потребу
місця у вашій організації. Тепер ви повинні подзвонити
видання архітектурних креслень, навіть якщо вони незаплановані
виконувати космічні компоненти протягом кількох місяців. Архітектор повинен
дизайн сьогодні на основі того, що потрібно. Передбачити потребу в
просторовий аналіз, який створює, зберігає, виконує та доставляє
доступ до дані просторовий. Це, у свою чергу, має служити a
обмеження щодо типу технології та специфікацій
програмну платформу, яку ви зараз можете розглядати. для
Наприклад, система адміністрування с база даних реляційний
(RDBMS), який ви виконуєте для свого атомарного рівня
доступний надійний простір. Це забезпечило б
максимальна продуктивність при використанні геометрії та об'єктів
місце у ваших аналітичних програмах. Якщо ваша СУБД цього не робить
може впоратися з i дані (просторово-центричний) внутрішньо, тому вам доведеться
встановити a база даних (просторово-центричний) зовнішній. Це ускладнює
управління проблемами та впливають на вашу загальну продуктивність,
не кажучи вже про додаткові проблеми, створені для вас
Адміністратори баз даних, оскільки вони, ймовірно, мають мінімальне розуміння
основ с дані просторовий також. З іншого боку, якщо ваш двигун
RDMBS обробляє всі просторові компоненти та пов’язані з ними компоненти
оптимізатор знає про особливі потреби (наприклад,
індексування) просторових об’єктів, то ваші администратори баз даних можуть впоратися
оперативно вирішувати проблеми, і ви можете підняти їх
виконання.
Крім того, вам потрібно налаштувати область розміщення та шар
атомарного середовища для включення очищення адреси (un
ключовий елемент просторового аналізу), а також наступний
економія простору об'єктів. Послідовність видань
малювання продовжується тепер, коли ми ввели поняття очищення
адресу. З одного боку, ця програма буде диктувати тип
необхідне програмне забезпечення для ваших зусиль ETL.
Вам потрібні такі продукти, як Trillium, щоб надати вам адресу
clean, або постачальник ETL на ваш вибір, щоб надати це
функціональність?
Наразі важливо, щоб ви оцінили стандарт дизайну
має бути виконано перед тим, як почати реалізацію свого
середовище (склад). Наведені вище приклади повинні
продемонструвати безліч рішень малювання, які повинні бути наслідком
визначення будь-якої конкретної бізнес-вимоги. Якщо зроблено
правильно, ці дизайнерські рішення сприяють
взаємозалежність між фізичними структурами вашого середовища,
вибір використовуваної технології та потоку розмноження
інформаційне наповнення. Без цієї звичайної архітектури
BI, ваша організація буде об’єднана
хаос існуючих технологій, у кращому випадку об’єднаних певним чином
неточні для забезпечення видимої стабільності.
Підтримувати інформаційне наповнення
Принесення цінності інформації до вашої організації
дуже важка операція. Без достатнього розуміння
і досвід, або належне планування та дизайн, навіть
кращі команди зазнають невдачі. З іншого боку, якщо у вас відмінно
інтуїція та детальне планування, але відсутність дисципліни
виконання, ви просто витратили гроші та час
тому що ваші зусилля неминучі. Повідомлення повинно
будьте чіткі: якщо вам не вистачає одного або кількох із них
навички, розуміння/досвід або планування/малювання o
виконання дисципліни, це призведе до паралізації або
зруйнувати будівлю організації BI.
Чи достатньо підготовлена ​​ваша команда? На вашому є хтось
Команда BI, яка розуміє широкий доступний аналітичний ландшафт
в середовищах BI, у необхідних техніках і технологіях
створити цей пейзаж? Є хтось у вашій команді
який може розпізнавати різницю між розширеними програмами
статичні звіти та OLAP, чи відмінності між ROLAP та OLAP? Один з
члени вашої команди чітко розпізнають шлях
витяг і як це може вплинути на склад або як
чи може склад підтримувати продуктивність майнінгу? член
команди розуміє цінність дані космос чи техніка
на основі агента? У вас є хтось, хто цінує унікальне застосування
інструментів ETL проти брокерської технології
повідомлення? Якщо у вас його немає, придбайте його. BI – це набагато більше
великий нормалізований атомарний шар, OLAP, схеми a
зірка та ODS.
Майте розуміння та досвід, щоб розпізнавати вимоги
BI та їхніх рішень має важливе значення для ваших здібностей
правильно формалізувати потреби користувачів і проектувати
і реалізовувати свої рішення. Якщо ваша спільнота користувачів має
складність опису вимог, це завдання команди
склад надати це розуміння. Але якщо команда в
склад
не розпізнає конкретне застосування BI - наприклад, дані
видобуток корисних копалин – тоді це не найкраще, що роблять середовища BI
часто обмежуються пасивними депозитами. Однак ігноруйте ці
технологій не применшує їх значення та ефекту, який вони мають
на появу власних можливостей бізнес-аналітики
організацію, а також інформаційну структуру, яку ви проектуєте
просувати.
Планування повинно включати поняття креслення під ред
обидва потребують компетентної особи. Плюс проектування
це вимагає командної філософії та спостережливості
стандартів. Наприклад, якщо ваша компанія створила a
стандартну платформу або визначив певну RDBMS, яку ви
хочете стандартизувати всю платформу, це неминуче
усі в команді дотримуються цих стандартів. Загалом один
команда виявляє необхідність нормалізації (користувачу
спільноти), але сама команда не бажає приєднатися до
стандарти також встановлені в інших сферах компанії або, можливо, навіть у
подібні компанії. Це не тільки лицемірство, але й підтверджує, що фірма цього не робить
здатний використовувати наявні ресурси та інвестиції. Це не означає
що немає ситуацій, які гарантують платформу або a
нестандартизована технологія; однак зусиллями складу
повинні ревниво охороняти стандарти підприємства до
щоб бізнес-вимоги не вимагали іншого.
Третій ключовий компонент, необхідний для створення BI
організація - це дисципліна.
Загалом це залежить як від окремих людей, так і від середовища.
Розробники проектів, спонсори, архітектори та користувачі повинні оцінити
дисципліни, необхідної для побудови інформаційної структури компанії.
Дизайнери повинні спрямовувати свої дизайнерські зусилля таким чином, щоб
завершити інші необхідні справи в суспільстві.
Наприклад, скажімо, ваша компанія будує
ERP-додаток, який має складський компонент.
Таким чином, розробники ERP зобов’язані співпрацювати з
команда середовища складу, щоб не конкурувати або
дублювати вже розпочату роботу.
Дисципліна – це теж тема, якою потрібно зайнятися
усією організацією і зазвичай встановлюється та доручається a
виконавчий рівень.
Чи готові керівники дотримуватися розробленого підходу? А
підхід, який обіцяє створити інформаційний контент, тобто
зрештою це принесе цінність усім сферам діяльності підприємства, але можливо
Чи ставить це під загрозу індивідуальні чи відомчі плани? Пригадайте приказку
«Думати про все важливіше, ніж думати про одну річ».
Цей вислів справедливий для організацій BI.
На жаль, багато складів зосереджують свої зусилля
прагнуть стимулювати та приносити цінність певному відділу чи a
конкретних користувачів, не звертаючи уваги на організацію
загальний. Припустимо, менеджер просить допомоги у команди в
будиночок. Команда відповідає 90-денною роботою
включає не лише доставку вимог щодо сповіщення, визначених
менеджер, але гарантує, що всі дані основи змішуються з рівнем
atomic до впровадження в технологію Cube
пропозиція.
Це інженерне доповнення гарантує, що подвиг
будиночок буде корисним дані необхідні керівнику.
Однак виконавчий директор поспілкувався із зовнішніми консалтинговими фірмами про це
запропонували подібну програму з доставкою менш ніж за 4
тижнів.
Якщо припустити, що внутрішня команда бойовиків є компетентною,
менеджер має вибір. Хто може підтримувати дисципліну
додаткові інженерні роботи, необхідні для розвитку активу
інформаційний бізнес або ви можете створити власний
рішення швидко. Останнє здається справді обраним
занадто часто і служить лише для створення інформаційних контейнерів
що приносить користь лише небагатьом або окремій людині.
Короткострокові та довгострокові цілі
Архітектори та дизайнери повинні формалізувати a
довгострокове бачення загальної архітектури та планів на
рости в організації BI. Ця комбінація
короткостроковий прибуток і довгострокове планування
представляють дві сторони зусиль BI. Короткостроковий прибуток
крайній термін – це аспект BI, який пов’язаний з ітераціями
ваш склад.
Саме на цьому зосереджуються проектувальники, архітектори та спонсори
відповідати конкретним вимогам бізнесу. Саме на цьому рівні
будуються фізичні структури, закуповуються технології та
техніки реалізовано. З ними взагалі не створено справу
конкретні вимоги, визначені конкретними спільнотами користувачів.
Все зроблено для того, щоб задовольнити конкретні визначені вимоги
від певної спільноти.
Однак довгострокове планування є іншим аспектом
BI. Це те, де плани і проекти забезпечили це
побудована будь-яка фізична структура, вибрані технології та
реалізованих технологій, зроблених з прицілом на підприємство. І
довгострокове планування, що забезпечує згуртованість
необхідні для того, щоб бізнес-вигоди отримували всі
знайдені короткострокові прибутки.
Обґрунтуйте свої зусилля з BI
Un сховище даних сам по собі він не має внутрішньої цінності. В інших
словами, серед технологій немає внутрішньої цінності
склад і техніка реалізації.
Цінність будь-яких складських зусиль виявляється в діях
виконується відповідно до складського середовища та змісту
інформативність культивована з часом. Це критичний момент для розуміння
перш ніж спробувати оцінити цінність будь-якої ініціативи
wherehouse.
Дуже часто архітектори та дизайнери намагаються застосувати цінність до
фізико-технічні компоненти складу, коли фактично вартість
базується на бізнес-процесах, на які позитивно впливає
склад і добре засвоєна інформація.
Ось у чому полягає проблема створення BI: як ви виправдовуєте інвестиції?
Якщо дехаус сам по собі не має внутрішньої цінності, дизайнери з
проект повинен дослідити, визначити та формалізувати вигоди
досягається тими особами, які будуть використовувати склад для
покращити конкретні бізнес-процеси або вартість
захищену інформацію або обидва.
Щоб ускладнити справу, будь-який бізнес-процес
під впливом складських зусиль може принести переваги
«значний» або «незначний». Значні переваги надає a
матеріальний показник для вимірювання рентабельності інвестицій (ROI) – напр
Наприклад, перетворення запасів на додатковий час протягом періоду
конкретні або для нижчої вартості доставки за відправлення. Це більше
Важко визначити незначні переваги, такі як покращений доступ до
інформації, з точки зору матеріальної цінності.
Підключіть свій проект, щоб дізнатися про
Ділові запити
Надто часто дизайнери проектів намагаються поєднати значення
складу з аморфними цілями компанії. Заявляючи, що
«Цінність складу залежить від нашої здатності
задовольняти стратегічні запити» ми відкриваємо
мова. Але одного цього недостатньо, щоб визначити, чи є
інвестування в інвентар має сенс. Краще підключати повтори
складів з конкретними і відомими запитами бізнесу.
Вимірювання ROI
Розрахувати рентабельність інвестицій у складських умовах можна
особливо важко. Особливо важко, якщо перевага
принципом конкретного повторення є щось нематеріальне або
легко виміряти. Дослідження показало, що користувачі сприймають
дві головні переваги ініціатив BI:
▪ Створити здатність приймати рішення
▪ Створити доступ до інформації
Ці переваги є м’якими (або помірними). Це легко побачити
як ми можемо розрахувати рентабельність інвестицій на основі твердого висновку (або
більше), наприклад, зниження вартості транспорту, але як
чи ми вимірюємо здатність приймати кращі рішення?
Це, безперечно, виклик для дизайнерів проектів
вони намагаються переконати компанію інвестувати в певну
зусилля складу. Збільшення продажів або зменшення витрат
вони більше не є центральними темами, які керують середовищем BI.
Натомість ви переглядаєте бізнес-запити на доступ
найкраще до інформації, щоб певний відділ міг
швидше приймати рішення. Це стратегічні драйвери a
які однаково важливі для бізнесу, але є
більш неоднозначний і його важче охарактеризувати у відчутній метриці.
У цьому випадку розрахунок рентабельності інвестицій може бути оманливим, якщо не недоречним.
Розробники проекту повинні мати можливість продемонструвати цінність
матеріальні для керівників, щоб вирішити, чи інвестувати в них
застосовується певне повторення. Однак ми не будемо пропонувати новий
метод розрахунку рентабельності інвестицій, ми також не будемо наводити жодних аргументів на користь або
проти цього.
Існує багато статей і книг, які обговорюють основи
розрахувати ROI. Існують спеціальні ціннісні пропозиції як цінність
щодо інвестування (VOI), які пропонують такі групи, як Gartner, які ви можете
досліджувати. Натомість ми зосередимося на основних аспектах будь-якого
Рентабельність інвестицій або інші ціннісні пропозиції, які потрібно враховувати.
Застосування ROI
Окрім аргументу «тверді» переваги проти «м’яких» переваг
пов’язаних із зусиллями BI, є й інші питання, які слід розглянути
коли ми застосовуємо ROI. Наприклад:
Приписуйте надто багато заощаджень зусиллям DW, які прийдуть
у будь-якому випадку
Скажімо, ваша компанія перейшла з архітектури
мейнфрейма в розподілене середовище UNIX. Так будь-який
заощадження, які можуть (або не можуть) бути реалізовані в результаті цих зусиль
не слід відносити виключно, якщо взагалі (?), до
склад.
Не враховувати все – це дорого. А справ є чимало
брати до уваги. Розглянемо наступний список:
▪ Початкова вартість, включаючи техніко-економічне обґрунтування.
▪ Вартість виділеного обладнання з відповідним сховищем e
комунікацій
▪ Вартість програмного забезпечення, включаючи управління дані і розширення
клієнт/сервер, програмне забезпечення ETL, технології DSS, інструменти
візуалізація, програмування та потокові додатки
програмне забезпечення для роботи та моніторингу, .
▪ Вартість проектування конструкції дані, з реалізацією, і
оптимізація
▪ Вартість розробки програмного забезпечення, безпосередньо пов’язана з зусиллями
BI
▪ Вартість обслуговування будинку, включаючи оптимізацію
продуктивність, включаючи контроль версій програмного забезпечення та
довідкові операції
Застосуйте рентабельність інвестицій «Великого вибуху».
Створення складу як єдине і гігантське зусилля
неминуче зазнає невдачі, тому також розрахуйте рентабельність інвестицій для ініціативи
великого підприємства Пропозиція дивує, і що дизайнери
продовжувати робити слабкі спроби оцінити цінність цілого
зусилля.
Тому що дизайнери намагаються дати грошову оцінку
з ділової ініціативи, якщо це загальновідомо і прийнято
Чи складно оцінити конкретні повторення? Як це можливо? Це не
можливо за невеликими винятками. Не робіть цього.
Тепер, коли ми встановили, чого не можна робити під час розрахунку
ROI, тут є деякі моменти, які допоможуть нам у визначенні
надійний процес для оцінки вартості ваших зусиль BI.
Отримання консенсусу щодо ROI. Незалежно від вашого
вибір техніки для оцінки вартості ваших зусиль BI
узгоджені всіма сторонами, включаючи розробників проекту,
спонсори та керівництво компанії.
Зменште ROI на частини, які можна ідентифікувати. Необхідний крок назустріч
розумний розрахунок ROI полягає в тому, щоб зосередити цей розрахунок на a
конкретний проект. Це дозволить вам оцінити значення
на основі конкретних бізнес-вимог, які виконуються
Визначте витрати. Як уже згадувалося, мають бути численні витрати
розглядається. Крім того, витрати повинні включати не тільки супутні витрати
до однієї ітерації, а також до пов’язаних з цим витрат
забезпечення відповідності стандартам компанії.
Визначте переваги. Чітке пов’язування ROI з вимогами
конкретні підприємства, ми повинні мати змогу ідентифікувати
переваги, які призведуть до задоволення вимог.
Зменшіть витрати та вигоди в неминучому прибутку. Це шлях
найкраще базувати свої оцінки на чистій поточній вартості
(NPV) на відміну від спроби передбачити майбутню вартість
майбутні заробітки.
Зведіть до мінімуму час розподілу рентабельності інвестицій. І'
добре задокументований протягом тривалого періоду часу, протягом якого він використовувався у вашому
ROI.
Використовуйте більше однієї формули ROI. Існує безліч методів для
Прогноз рентабельності інвестицій, і ви повинні планувати, чи використовувати один або
плюс, включаючи чисту поточну вартість, внутрішню швидкість повернення
(IRR) і відновлення.
Визначте повторюваний процес. Це важливо для розрахунку
будь-яка довгострокова вартість. Це має бути задокументовано a
єдиний повторюваний процес для всіх підпослідовностей проекту a
слідувати.
Перераховані проблеми є найпоширенішими, визначеними експертами
навколишнього середовища. Наполягання з боку керівництва с
отримання «великого вибуху» ROI дуже заплутане. Якщо почати все
ваші розрахунки рентабельності інвестицій, зводячи їх до ідентифікованих і відчутних частин
хороший шанс оцінити точну оцінку рентабельності інвестицій.
Питання щодо переваг ROI
Якими б не були ваші переваги, м’якими чи жорсткими, ви можете їх використовувати
деякі основні запитання, щоб визначити їх цінність. до
Наприклад, використовуючи просту систему масштабування від 1 до 10, ви
ви можете відстежити вплив будь-яких зусиль за допомогою наступного
домене:
▪ Як би ви оцінили розуміння дані слідом за цим
проект вашої компанії?
▪ Як би ви оцінили покращення процесу в результаті
цей проект?
▪ Як би ви зараз виміряли вплив нових ідей і висновків
стала доступною завдяки цій ітерації
▪ Яким був вплив нових комп'ютерних середовищ e
виконання в результаті того, що було вивчено?
Якщо відповідей на ці питання небагато, можливо, що
компанія не варта вкладених інвестицій. Питання з високою
оцінка вказує на значне підвищення цінності та повинна
служать орієнтирами для подальшого дослідження.
Наприклад, висока оцінка за вдосконалення процесу
це повинно змусити дизайнерів вивчити, якими є процеси
було вдосконалено. Ви можете виявити, що деякі або всі прибутки ви отримуєте
вони відчутні, тому їх можна легко отримати в грошовому еквіваленті
застосовується.
Отримати максимум від першої ітерації
склад
Найбільший результат ваших ділових зусиль часто полягає в
перші кілька ітерацій. Ці перші спроби традиційно
створити найбільш корисний інформаційний контент для громадськості та
створює технологічну основу допомоги для наступних
BI-додатки.
Зазвичай кожна наступна підпослідовність дані проекту
склади приносять компанії все менше додаткової вартості
загальний. Це особливо вірно, якщо ви не повторюєте
додає нові теми або не відповідає потребам нової
спільнота користувачів.
Ця особливість зберігання стосується і акумуляторів
зростання дані істориків. Оскільки подальших зусиль потрібно більше
дані та ще як дані з часом зливаються на склад більша частина
дані стає менш актуальним для використовуваного аналізу. Ці дані соно
часто називають дані у стані спокою, і утримувати їх завжди дорого, тому що
ними майже не користуються.
Що це означає для спонсорів проекту? По суті, я
Ранні спонсори розповідають більше про вартість інвестицій.
Це первинно, тому що вони є поштовхом для заснування пласту
широке технологічне середовище та складські ресурси,
в тому числі органічні.
Але ці перші кроки приносять найвищу цінність і, отже, дизайнерам
проекти часто повинні виправдовувати інвестиції.
Проекти, виконані після вашої ініціативи BI, можуть мати витрати
неповноцінні (порівняно з першими) і прямі, але приносять меншу цінність
до компанії.
І власники організацій повинні почати думати
викинути накопичення дані і менш актуальні технології.
Інтелектуальний аналіз даних: видобуток Давати
Численні архітектурні компоненти вимагають варіацій
технології та методи інтелектуального аналізу даних—
наприклад, різні «агенти» для вивчення об’єктів інтересу
клієнти, операційних систем компанії та для самої dw. Ці
агентів можна навчати на передових нейронних мережах
тенденції, такі як майбутній попит на продукт на основі
стимулювання збуту; двигуни на основі правил для
реагувати на набір дате обставин, наприклад, діагноз
медичні та лікувальні рекомендації; або навіть простих агентів
з роллю звітування про винятки для вищого керівництва (верх
керівники). Зазвичай ці процеси екстракції дані si
перевірити в реальному часі; тому вони повинні бути єдиними
повністю з рухом дані стессі.
Онлайн аналітична обробка Обробка
Аналітика онлайн
Здатність нарізати, нарізати кубиками, розгортати, докладати
і провести аналіз
що-якщо, входить у сферу застосування, ціль набору
Технологія IBM. Наприклад, функції аналітичної обробки
онлайн (OLAP) існує для DB2, що забезпечує розмірний аналіз
двигун від база даних те ж саме.
Функції додають розмірну корисність до SQL
вони використовують усі переваги природної частини DB2. інший
прикладом інтеграції OLAP є засіб вилучення DB2
Аналізатор сервера OLAP. Ця технологія дозволяє кубики
Сервер DB2 OLAP буде швидким і автоматичним
проаналізовано для виявлення та звіту про значення дані незвичний або несподіваний
по всьому кубу до бізнес-аналітика. І, нарешті, функції
Центр DW надає архітекторам засоби для перевірки, зокрема
інші речі, профіль серверного куба DB2 OLAP як частину
природний характер процесів ЕТЛ.
Просторовий аналіз. Просторовий аналіз
Простір представляє половину аналітичних прив’язок (лідів).
необхідні для панорами
аналітичний широкий (час представляє іншу половину). Атомний рівень
(атомний рівень) складу, представленого на малюнку 1.1,
містить основи як для часу, так і для простору. Записи
Аналіз прив’язки часу для інформації про час і адресу
якірні аналізи з космосу. Мітки часу
вони проводять аналіз вчасно, а інформація про напрямок веде
аналіз простору. На діаграмі показано процес геокодування
перетворення адрес в точки на карті або точки в просторі
щоб такі поняття, як відстань і всередині/зовні, могли бути
використовується в аналізі – проводиться на атомному рівні та просторовому аналізі
який надається аналітику. IBM надає розширення
космос, розроблений спільно з Інститутом дослідження систем навколишнього середовища (ESRI),
al база даних DB2, щоб космічні об'єкти могли бути
зберігається як звичайна частина база даних реляційний. DB2
Просторові розширювачі також надають усі розширення SQL для
використовувати просторовий аналіз. Наприклад, розширення SQL від
питання про
відстань між адресами або чи знаходиться точка всередині чи поза межами області
визначені полігональними, є аналітичним стандартом із просторовим
Подовжувачі. Додаткову інформацію див. у розділі 16.
Database-Resident Tools Інструменти Database-
Резидент
DB2 має багато постійних BI-функцій SQL, які допомагають
в дії аналізу. До них належать:
▪ Функції рекурсії для виконання аналізу, наприклад «знайти
всі можливі маршрути польоту з Сан Франциско a Нью-Йорк".
▪ Аналітичні функції для ранжування, кумулятивні функції, куб
і зведення для полегшення завдань, які зазвичай виникають
тільки з технологією OLAP, тепер вони є природною частиною
двигун від база даних
▪ Можливість створювати таблиці, що містять результати
Продавці база даних лідери змішують більше, ніж можливості BI
нель база даних стессо.
Основні постачальники база даних вони змішуються більше ніж
Функціональність BI в база даних стессо.
Це забезпечує кращу продуктивність і більше можливостей для роботи
BI рішення.
Обговорюються особливості та функції DB2 V8
детально в наступних розділах:
Технічна архітектура та основи управління даними
(Розділ 5)
▪ Основи DB2 BI (розділ 6)
▪ Таблиці матеріалізованих запитів DB2
Таблиці) (Розділ 7)
▪ Функції OLAP DB2 (Розділ 13)
▪ DB2 Enhanced BI можливості та функції (Enhanced BI
Особливості та функції) (Розділ 15)
Спрощена система доставки даних
Система доставки дані спрощений
Архітектура, зображена на малюнку 1.1, включає численні
структур дані фізичний. Один – склад ім дані оперативні.
Як правило, ODS є об’єктно-орієнтованим,
комплексний і поточний. Ви б створили ODS для підтримки, напр
Наприклад, офіс продажів. Продажі ОРВ доповнять дані
походить від багатьох різних систем, але збереже лише, напр
наприклад, сьогоднішні операції. ODS можна оновлювати
навіть багато разів на день. Водночас процеси
вони штовхають дані інтегровані в інші програми. Ця структура є
спеціально розроблений для інтеграції дані поточний і динамічний e
буде ймовірним кандидатом для підтримки аналітики в реальному часі,
як надавати сервісні агенти клієнти інформація про продажі
поточні тенденції клієнта шляхом вилучення інформації про тенденції продажів
з самого складу. Ще одна структура, показана на малюнку 1.1
офіційний статус dw. Це не тільки місце для
виконання необхідної інтеграції, якість даніІ
перетворення дані запасів незабаром, але це також
надійне та тимчасове місце зберігання для дані відповісти на це
можна використовувати в аналізі в реальному часі. Якщо ви вирішите
використовуйте ODS або зону відпочинку, один
найкращих інструментів для заповнення цих структур дані використання
різні операційні джерела - це гетерогенний розподілений запит DB2.
Ця можливість надається додатковою функцією DB2
під назвою DB2 Relational Connect (лише запит) і через DB2
DataJoiner (окремий продукт, який надає додаток,
вставлення, оновлення та можливість видалення a
Гетерогенні розподілені РСУБД).
Ця технологія дозволяє архітекторам дані щоб зв'язати дані di
виробництво з аналітичними процесами. Не тільки техніка
адаптуватися практично до будь-якого запиту реплікації, який
вони можуть відображатися з аналітикою в реальному часі, але це
Вони також можуть підключатися до різноманітних баз дані більше
популярні, включаючи DB2, Oracle, Sybase, SQL Server,
Informix та ін. Для заповнення можна використовувати DB2 DataJoiner
структура дані формальний, як ODS або навіть стіл
постійно знаходиться на складі, призначеному для реставрації
швидко для миттєвих оновлень або для продажу. природно,
ці самі структури дані можна заповнити за допомогою
ще одна важлива технологія, призначена для відтворення дані, IBM
DataPropagator Relational. (DataPropagator є окремим продуктом
для центральних систем. DB2 UNIX, Linux, Windows і OS/2 включають
служби реплікації дані як стандартна функція).
Ще один спосіб пересування дані діючи навколо
для підприємства є інтегратором корпоративних програм в іншому випадку
відомий як брокер повідомлень. Це
Унікальна технологія забезпечує неперевершений контроль центрування
(націлювання) і рухатися дані навколо компанії. IBM має посередника
найпоширенішого повідомлення, MQSeries або його варіації
продукту, який містить вимоги e-commerce, IBM
WebSphere MQ.
Щоб дізнатися більше про те, як використовувати MQ для підтримки a
magazzino e un ambiente BI, visitare веб-сайт del libro. Per ora, è
Досить сказати, що ця технологія є чудовим засобом для
захоплення та перетворення (за допомогою MQSeries Integrator) дані
центровані (цільові) оператори, набрані для рішень BI. Там
Технологія MQ була інтегрована та упакована в UDB V8, який
означає, що тепер можна керувати чергами повідомлень
ніби це були таблиці DB2. Поняття про зварювання
повідомлення в черзі та всесвіт база даних реляційна спрямована
до потужного середовища доставки дані.
Нульова затримка. Нульова затримка
Кінцевою стратегічною метою для IBM є аналітика з нульовою затримкою (нульовою затримкою).
Як визначено
Gartner, система BI повинна вміти робити висновки, асимілювати
і надавати інформацію для аналітиків на запит. Змагання,
звичайно, це в тому, як змішувати дані поточний і в режимі реального часу
з необхідною історичною інформацією, такою як i дані пов’язані моделі(и).
тенденція, або витягнуте розуміння, як окреслення
клієнта
Така інформація включає, наприклад, ідентифікацію клієнти ad
високий чи низький ризик або які продукти i клієнти вони купуватимуть багато
можливо, якщо вони вже мають сир у своїх візках
придбання.
Отримання нульової затримки насправді залежить від двох
основні механізми:
▪ Повне об'єднання дані які аналізуються за допомогою
усталені техніки та інструменти, створені BI
▪ Система доставки дані ефективний, щоб забезпечити це
аналіз у реальному часі справді доступний
Ці передумови для нульової затримки нічим не відрізняються від двох
цілі, встановлені IBM і описані вище.
Близьке спаровування дані є частиною програми
бездоганна інтеграція, організована IBM. І створити систему
доставки дані ефективність повністю залежить від
доступна технологія, яка спрощує процес доставки
дані. У результаті дві з трьох цілей IBM є критично важливими
зробити третій. IBM свідомо розвиває власні
технологія для забезпечення нульової затримки є реальністю для користувачів
складські зусилля.
Анотація / Узагальн
Організація BI надає дорожню карту для
створіть своє середовище
ітеративно. Він повинен бути скоригований відповідно до потреб
ваш бізнес, як поточний, так і майбутній. Без архітектурного бачення
широкий, склад повторень трохи більше
випадкові реалізації центрального складу, які мало допомагають
створити широке, інформативне підприємство.
Першою перешкодою для керівників проектів є те, як обґрунтувати
інвестиції, необхідні для розвитку організації BI.
Хоча розрахунок рентабельності інвестицій залишається основною підтримкою для
складати досягнення, стає все складніше
передбачити точно. Це призвело до інших методів
визначення того, чи варті ви своїх грошей. The
наприклад, закуповується вартість інвестицій2 (VOI).
як розчин.
Це покладено на архітекторів с дані та планувальники проектів
навмисно генерувати та надавати інформацію асоціаціям
користувачів, а не просто надавати їм послугу дані. Є
величезна різниця між ними. Інформація – це те, що людина робить
різниця в процесах прийняття рішень та ефективності; відносно, я
дані вони є будівельними блоками для отримання цієї інформації.
Навіть якщо я критично ставлюся до джерела дані для вирішення запитів
комерційне середовище BI має відігравати більшу роль
у створенні інформаційного контенту. Ми повинні взяти
додаткові заходи для очищення, інтеграції, перетворення або
інакше створити інформаційний контент, згідно з яким
користувачі можуть діяти, тому ми повинні переконатися, що ті
дії та рішення, якщо це розумно, підтримуються
в середовищі BI. Якщо ми перемістимо склад лише для обслуговування дані,
гарантовано, що асоціації користувачів створять вміст
інформацію, необхідну для вжиття заходів. Це гарантує, що їх
громада зможе приймати кращі рішення, але підприємство
страждає від браку знань, які вони використали.
Dato що архітектори та планувальники ініціюють проекти
специфічні для середовища BI, вони залишаються підзвітними підприємству
за великим рахунком. Простий приклад цих двох функцій
грані ітерацій BI знайдено в джерелі дані. Всі
дані повинні бути отримані для конкретних комерційних запитів
заселені в перший атомний шар. Це забезпечує розвиток
корпоративної інформації, а також управляти, направляти
Запити користувача, визначені в ітерації.

W hatisa Data W arehouse ?
Інформаційне сховище це серце архітектури інформаційних систем
з 1990 р. і підтримує інформаційні процеси, пропонуючи тверду
інтегрована платформа дані історики взяли за основу наступні
аналізи. THE сховище даних пропонують легкість інтеграції в a
світ прикладних систем, які несумісні одна з одною. Дата
склад перетворився на тренд. Інформаційне сховище
організувати та зберігати i дані необхідні для інформаційних процесів e
аналітичний, заснований на тривалій історичній часовій перспективі. все
це передбачає значну й постійну відданість будівництву та
в обслуговуванні сховище даних.
Отже, що таке a сховище даних? сховище даних і:
▪ предметно-орієнтований
▪ інтегрована система
▪ варіант часу
▪ енергонезалежний (не можна стерти)
колекція дані використовується для підтримки управлінських рішень в
реалізація процесів.
I дані вставляється в сховище даних виникають у більшості
випадки з оперативних середовищ. The сховище даних це зроблено одним
блок зберігання, фізично відокремлений від решти
система, яка містить дані раніше перетворений
програми, які працюють на основі інформації, отриманої з середовища
оперативні.
Дослівне визначення a сховище даних заслуговує на глибоке вивчення
пояснення, оскільки існують важливі мотивації та значення
фон, який описує характеристики складу.
ПРЕДМЕТНА ОРІЄНТАЦІЯ ОРІЄНТАЦІЯ
ТЕМАТИЧНИЙ
Перша характеристика a сховище даних полягає в тому, що він орієнтований на
основні гравці в компанії. Керівництво випробувань через
дані він відрізняється від більш класичного методу, який він пропонує
орієнтація програм на процеси та функції,
метод, який переважно поділяє більшість
старіші системи управління.
Операційний світ розроблений навколо програм і функцій
таких як позики, заощадження, банківські картки та траст для установи
фінансовий. Світ dw організовано навколо предметів
принципи, такі як клієнт, продавець, продукт і бізнес.
Вирівнювання за темами впливає на дизайн і
на реалізацію дані знайдено в dw. Що ще більш важливо,
основна тема зачіпає найважливішу частину
ключова структура.
На світ програми впливає як дизайн даних
на основі дизайну процесу. Світ
dw зосереджена виключно на моделюванні дані Це включено
малювання база даних. Дизайн процесу (за його формою
classical) не є частиною середовища dw.
Відмінності між вибором процесу/функції та застосування
вибір за предметом також виявляються як відмінності у змісті
з дані на детальному рівні. THE дані dw не включають i дані що
не буде використовуватися для процесу DSS під час додатків
оперативна орієнтація дані містять i дані задовільняти
негайно функціональні вимоги/вимоги до обробки, які можуть o
менше користі від аналітика DSS.
Ще один важливий спосіб, у якому оперативні орієнтовані програми
ai дані відрізняються від дані dw є в звітах dei дані. Я дані
оперативно підтримувати безперервний зв'язок між двома або більше таблицями
на основі активного бізнес-правила. THE дані від dw
вони охоплюють спектр часу, і зв’язки, знайдені в dw, є такими
багато. Багато правил торгівлі (і, відповідно, багато
звіти про дані ) представлені на складі дані між двома о
кілька столів.
(Для детального пояснення того, як взаємозв’язки між дані соно
обробляється в DW, ми посилаємося на цю тему в технічну тему
питання.)
З іншої точки зору, окрім точки зору відмінності
фундаментальним між вибором функціонального/процесного застосування та
вибір предмета, існує більша різниця між системами
оперативний ei дані і DW.
ІНТЕГРАЦІЯ ІНТЕГРАЦІЯ
Найважливішим аспектом середовища dw є те, що i дані знайдено
в dw вони легко інтегруються. ЗАВЖДИ. БЕЗ
ВИНЯТКИ. Сама суть середовища dw полягає в тому, що i дані
що містяться в складських межах, інтегровані.
Інтеграція проявляється багатьма різними способами – у конвенціях
ідентифікований узгоджений, у вимірюванні узгоджених змінних, в
кодифіковані структури, що складаються з фізичних атрибутів дані
послідовний і так далі.
Протягом багатьох років розробники різних додатків зробили це
володіння багатьма рішеннями щодо застосування
розвиватися. Індивідуальний стиль і дизайнерські рішення
додатків дизайнерів розкривають себе сотнею способів: у
відмінності кодування, ключова структура, фізичні характеристики,
визначення конвенцій тощо. Колективна здатність багатьох
Розробники програм створюють неузгоджені програми
це легендарно. Малюнок 3 показує деякі відмінності
важливий у способах розробки програм.
Кодування: Кодування:
Розробники додатків обрали кодування полів –
секс- різними способами. Дизайнер представляє секс як
«м» і «ж». Інший дизайнер представляє секс на «1»
і «0». Інший дизайнер представляє секс як «х» і
"y". Інший дизайнер представляє стать як «чоловічий» і
"жіночий". Не має великого значення, яким чином стать потрапляє в DW. «М»
і "F", мабуть, такі ж хороші, як і всі інші
представництво.
Важливо те, що з якого б джерела не виникло поле статі,
це поле надходить у DW у узгодженому інтегрованому стані. Від
наслідок, коли поле завантажується в DW з
додаток, де він був представлений у форматі
«M» і «F», i дані необхідно конвертувати у формат DW.
Вимірювання атрибутів: вимірювання
Атрибути:
Розробники програми вирішили вимірювати трубопровід
різноманітні способи в курсі
Кілька років. Дизайнер зберігає дані трубопроводу в
сантиметрів. Інший дизайнер програми зберігає дані
трубопроводу в дюймах. Ще один дизайнер
магазини програм i дані трубопроводу в мільйонах кубічних футів
в секунду. І інший дизайнер зберігає інформацію про
трубопроводу в плані ярдів. Незалежно від джерела, коли
інформація про конвеєр надходить у DW, це має бути
вимірюється таким же чином.
Згідно з показаннями на малюнку 3, інтеграція питань
вони впливають майже на кожен аспект проекту – функції
фізичні боги дані, дилема мати більше одного джерела дані, то
випуск невідповідних виявлених зразків, форматів дані
непослідовний тощо.
Незалежно від теми дизайну, результат однаковий –
i дані має зберігатися в DW в однині e
глобально прийнятним способом, навіть якщо операційні системи
внизу вони зберігають по-різному i дані.
Коли аналітик DSS дивиться на DW, мета аналітика
це має бути експлуатація дані які знаходяться на складі,
а не сумніватися в достовірності чи послідовності
дані.
ЧАСОВА ВАРІАНЦІЯ
Все дані у DW вони точні до певного моменту часу.
Ця основна характеристика в дані у DW дуже відрізняється від тих дані
знайдені в робочому середовищі. THE дані операційного середовища є
так само точно, як і на момент доступу. Іншими словами,
в операційному середовищі під час доступу до диска дані, Але і
зачекайте, доки він не відобразить точні значення на момент доступу.
Чому я дані у DW такі ж точні, як у певний момент у
час (тобто не «прямо зараз»), сказано, що i дані знайдено в DW
це «часові відхилення».
Часова дисперсія дані DW згадується різними способами.
Найпростіший спосіб полягає в тому, що i дані DW представляють дані це
довгий часовий горизонт – п’ять-десять років. Горизонт
часові рамки, представлені для операційного середовища, набагато коротші
▪ від сьогоднішніх поточних значень від до шістдесяти дев'яноста
Програми, які повинні добре працювати і повинні бути такими
доступні для обробки транзакцій повинні принести
мінімальна кількість дані якщо вони визнають будь-який ступінь
гнучкість. Отже, оперативні програми мають горизонт
короткий термін, як тема дизайну
аудіо додатки.
Другий спосіб появи «часової дисперсії» в DW полягає в
ключова структура. Кожна ключова структура в DW містить,
імпліцитно чи експліцитно, елемент часу, наприклад
день, тиждень, місяць тощо. Елемент часу присутній майже завжди
у нижній частині об’єднаного ключа, знайденого в DW. У цих
У деяких випадках елемент часу буде існувати неявно, як випадковість
де весь файл дублюється в кінці місяця або кварталу.
Третій спосіб відображення дисперсії часу полягає в тому, що i дані Дель
DW, як тільки належним чином зареєстрований, не може бути
оновлено. THE дані DW для всіх практичних цілей є довгим
серія знімків. Звичайно, якщо знімки є
були зроблені неправильно, то знімки можуть бути
змінений. Але припустимо, що знімки зроблені
правильно, вони не змінюються відразу після створення. В деяких
випадках це може бути неетичним або навіть недійсним, що знімки в
DW змінено. THE дані оперативний, будучи точним, як в
момент входу в систему, їх можна оновлювати в міру появи
потреба.
ЕНЕРГОНЕТКИЙ
Четвертою важливою характеристикою DW є його енергонезалежність.
Виконуються оновлення, вставки, видалення та зміни
регулярно для операційних середовищ запис за записом. Але
основні маніпуляції з дані які потрібні в DW набагато більше
простий. Є лише два види операцій, які відбуваються в
DW – початкове завантаження дані і доступ до дані. Немає
немає оновлення дані (в загальному розумінні
оновлення) у DW як звичайну операцію обробки.
Є кілька дуже потужних наслідків цієї різниці
між оперативною обробкою та обробкою DW. На рівні
за задумом, необхідно бути обережним щодо оновлення
ненормальний не є фактором у DW після оновлення дані це не так
здійснюється. Це означає, що на рівні фізичного дизайну,
можна дозволити собі оптимізувати доступ до дані,
зокрема в питаннях стандартизації та
фізична денормалізація. Ще один наслідок простоти
операцій DW полягає в базовій технології, для якої використовується
запустити середовище DW. Потрібно підтримувати оновлення
запис за записом у рядку (як це часто буває з
оперативна обробка) технологія повинна мати деякі
дуже складні основи при видимій простоті.
Технологія, яка підтримує резервне копіювання та відновлення, транзакції
і цілісність дані а також виявлення та усунення стану тупикової блокування
досить складний і не потрібен для обробки DW.
Характеристики DW, спрямованість дизайну,
інтеграція дані в межах DW, дисперсія часу та простота
управління с дані, все веде до середовища, яке дуже, дуже
відрізняється від класичного операційного середовища. Джерело майже всіх
дані DW є робочим середовищем. Спокусливо подумати
що існує величезна надмірність дані між двома середовищами.
Насправді, перше враження багатьох людей – це враження
велика надмірність дані між робочим середовищем і середовищем о
DW. Таке тлумачення є поверховим і свідчить про одне
відсутність розуміння того, що відбувається в DW.
Фактично є мінімум надмірності дані між робочим середовищем
і дані DW. Розглянемо наступне:
▪ Я дані їх фільтрують дате що виходить із робочого середовища
до середовища DW. багато дані вони ніколи не проходять назовні
з операційного середовища. Крім того, що я дані які необхідні для
Обробка DSS знаходить свій напрямок у середовищі
▪ часовий горизонт дані воно дуже відрізняється від навколишнього середовища
до іншого. THE дані в робочому середовищі вони дуже свіжі. THE дані
у DW вони набагато старші. Просто з точки зору
часового горизонту дуже мало перекриваються
між робочим середовищем і DW.
▪ DW містить дані резюме, які ніколи не знайдені
в середовищі
▪ Я дані зазнають фундаментальної трансформації з
момент, коли вони переходять до малюнку 3, це найбільше ілюструє
частина дані істотно змінені за станом
для вибору та переміщення до DW. Іншими словами,
більшість дані є фізично зміненим і
радикально, як це перенесено в DW. З точки зору
інтеграції не однакові дані які проживають
в робочому середовищі.
У світлі цих факторів надмірність о дані між двома середовищами є
рідкісна подія, що призводить до менш ніж 1% надмірності між двома
середовищ.
СТРУКТУРА СКЛАДУ
DW мають чітку структуру. Існують різні рівні резюме та
деталі, які розмежовують DW.
Різні компоненти DW:
▪ Метадані
Давати актуальні деталі
Давати старих деталей
Давати трохи узагальнено
Давати високо узагальнено
Безумовно, головна турбота про дані деталізації
течії. Це головне занепокоєння, оскільки:
▪ Я дані поточні деталі відображають останні події,
які завжди викликають великий інтерес і
▪ i дані поточних деталей є об'ємними, тому що це так
зберігається на найнижчому рівні деталізації e
▪ i дані Поточні дані майже завжди зберігаються на
дискове сховище, доступ до якого швидкий, але дорогий
комплекс від
I дані чим старше вони дані які зберігаються на
деякі спогади про маса. Він має доступ спорадично і є
зберігається на рівні деталізації, сумісному з дані докладно
течії. Хоча зберігати на носії не обов'язково
альтернативне зберігання, завдяки великому об'єму дані об'єднані с
спорадичний доступ до дані, підтримка пам'яті для дані di
Більш старі деталі зазвичай не зберігаються на диску.
I дані узагальнено трохи є дані які переганяються знизу
рівень деталізації, знайдений на поточному рівні деталізації. Це
Рівень DW майже завжди зберігається на дисковому сховищі. THE
проблеми проектування, які виникають перед архітектором дані
у побудові цього рівня DW є:
▪ За яку одиницю часу складається підсумок, зроблений вище
▪ Який вміст, атрибути будуть трохи узагальнювати
зміст дані
Наступний рівень дані знайдено в DW, це те, що з дані високо
резюме. THE дані високо узагальнені компактні та легкі
доступний. THE дані іноді зустрічаються дуже узагальнені
у середовищі DW та в інших випадках i дані високо узагальнені є
знаходиться за межами безпосередніх стін технології, яка містить DW.
(у будь-якому випадку, я дані дуже узагальнені є частиною DW
незалежно від того, де я дані фізично розміщені).
Останнім компонентом DW є метадані. Багато в чому
метадані знаходяться в іншому вимірі, ніж інші дані
DW, оскільки метадані не містять жодних дате безпосередньо
взяті з операційного середовища. Метадані відіграють особливу роль e
дуже важливо в DW. Метадані використовуються як:
▪ каталог, який допоможе аналітику DSS знайти
вміст DW,
▪ посібник із картографування дані про те, як я дані Вони були
перетворено з робочого середовища на середовище DW,
▪ посібник з алгоритмів, що використовуються для підсумовування між дані di
поточна деталь ei дані злегка узагальнено, i дані високо
резюме,
Метадані відіграють набагато більшу роль у середовищі DW
ніж вони коли-небудь мали в оперативному середовищі
СТАРИЙ НОСІЙ ДЕТАЛЕЙ
Для зберігання такого роду можна використовувати магнітну стрічку
дані. Насправді існує велика різноманітність інструментів для зберігання
їх слід враховувати для збереження старих дані di
деталь.
Залежно від обсягу дані, частота доступу, вартість
інструментів і типу доступу цілком ймовірно
що інші інструменти потребуватимуть старого рівня деталізації
в DW.
ПОТОК ДАНИХ
Є нормальний і передбачуваний перебіг дані всередині DW.
I дані вони потрапляють у DW з операційного середовища. (ПРИМІТКА: є
деякі дуже цікаві винятки з цього правила. Проте майже
всі дані введіть DW з операційного середовища). Dato що я дані
вони потрапляють у DW з операційного середовища, воно перетворюється, як було
описані раніше. За умови введення DW, i дані вони входять в
поточний рівень деталізації, як показано. Він знаходиться там і використовується
поки не відбудеться одна з трьох подій:
▪ очищений,
▪ узагальнюється та/або
▪ є
Застарілий процес всередині DW переміщується i дані актуальні деталі
a дані старих деталей, виходячи з вік дані. Процес
резюме використовує деталізацію дані обчислити i дані
злегка узагальнений і дуже узагальнений рівні дані. Існує
деякі винятки з показаного потоку (будуть обговорені пізніше).
Однак, зазвичай, для переважної більшості дані знайдено
в межах DW, потік дані це як зображено.
ВИКОРИСТАННЯ СХОВИЩА ДАНИХ
Не дивно, що різні рівні дані в межах DW немає
отримати різні рівні використання. Як правило, чим вище рівень
резюме, плюс i дані вони використовуються.
Багато застосувань зустрічається в дані дуже узагальнені, тоді як старі
дані деталей майже не використовуються. Є вагома причина в
перевести організацію на парадигму використання ресурсів. Тим більше він має
резюме i дані, тим швидше й ефективніше дістатися до дані. Це
un магазин виявити, що він виконує багато обробки на рівні деталей DW,
тоді відповідна велика кількість машинних ресурсів
споживається. Притягнення до відповідальності відповідає інтересам кожного
як у високому рівні підбиття підсумків якомога швидше.
Для багатьох магазинів використовувався аналітик DSS у середовищі до DW
дані на рівні деталізації. Багато в чому прибуття о дані докладно
це нагадує ковдру безпеки, навіть коли вони доступні
інші рівні резюме. Одним із напрямків діяльності архіт дані è
відучити користувача DSS від постійного використання дані на найвищому рівні
низька деталізація. Існує дві причини
архітектора с дані:
▪ встановлення системи повернення платежів, де платить кінцевий користувач
спожиті ресурси e
▪ які вказують на те, що час відповіді може бути дуже хорошим
отримано, коли поведінка з i дані це на високому рівні
резюме, тоді як низький час відповіді походить від
поведінка дані на низькому рівні
ІНШІ РОЗУМИ
Існують деякі інші міркування щодо будівництва та управління
DW.
Перше міркування стосується індексів. THE дані на найвищих рівнях
резюме можна вільно індексувати, тоді як i дані
на нижчих рівнях деталізації вони настільки об’ємні, наскільки це можливо
економно індексовані. З тієї ж лексеми, i дані на високих рівнях
деталь можна відносно легко відремонтувати,
при цьому обсяг дані на нижчих рівнях він настільки великий, що i дані НЕ
їх можна легко відремонтувати. Відповідно, модель
з дані і формальна робота, виконана дизайном
основа для DW застосовується майже виключно до рівня
деталь поточна. Іншими словами, модельна діяльність в
дані вони не застосовуються до рівнів підсумовування майже в кожному випадку.
Іншим структурним міркуванням є підрозділ на
дані від DW.
Перегородку можна зробити на двох рівнях – на рівні dbms і ін
рівень застосування. У дивізії на рівні dbms, то dbms è
інформує про підрозділи та контролює їх відповідно. У випадку
поділ на прикладному рівні, тільки програміст
поінформовані про підрозділи та відповідальність їх
управління залишається за ним
Нижче рівня dbms, багато роботи виконується автоматично. Існує
багато негнучкості, пов'язаної з автоматичним адмініструванням
підрозділи. У разі поділів на прикладному рівні дані Дель
сховище даних, на програміста лягає багато роботи, але
кінцевим результатом є гнучкість в адмініструванні дані в даті
склад
АЛТРЕ АНОМАЛІЯ
У той час як компоненти в сховище даних Вони працюють, як описано
майже для всіх дані, є деякі корисні винятки, які повинні
обговорюватися. Виняток становить о дані публічні резюме
(публічні зведені дані). Це дані резюме, які були
розраховано з сховище даних але вони використовуються суспільством. THE дані
Публічні резюме зберігаються та керуються в сховище даних,
хоча, як зазначалося раніше, вони розраховані. THE
бухгалтери працюють, щоб виробляти їх щокварталу дані як
дохід, квартальні витрати, квартальний прибуток тощо. Робота
зроблене бухгалтерами є зовнішнім сховище даних. Проте, я дані соно
використовується «внутрішньо» всередині компанії – від marketing , продажі тощо.
Ще одна аномалія, про яку ми не будемо говорити, це аномалія дані зовнішній.
Ще один винятковий вид дані які можна знайти в даному
склад — це сховище постійних детальних даних. Вони викликають
необхідно постійно зберігати i дані на одному рівні
деталізовано з етичних чи юридичних причин. Якщо компанія бере участь у виставці i
працівників, пов’язаних з небезпечними речовинами дані
докладний і постійний. Якщо компанія виробляє продукт, який
стосується громадської безпеки, які частини літака є
потреба в дані докладний постійний, а також якщо компанія
укладає небезпечні контракти.
Суспільство не може дозволити собі не помічати деталей, тому що
протягом наступних кількох років, у разі судового позову, відкликання, a
спірний будівельний дефект тощо. експозиція компанії
це може бути великим. В результаті виходить унікальний вид дані
відомі як постійні детальні дані.
ПІДСУМОК
Un сховище даних є об'єктно-орієнтованим інтегрованим варіантом
час, збірник дані енергонезалежний для підтримки потреб
рішення адміністрації. Кожна з основних функцій
un сховище даних має свої наслідки. Плюс їх чотири
рівнів дані Дель сховище даних:
▪ Стара деталь
▪ Поточні деталі
Давати трохи узагальнено
Давати високо узагальнено
Метадані також є важливою частиною сховище даних.
АНОТАЦІЯ
Поняття про зберігання дані нещодавно отримані
багато уваги і став трендом 90-х
завдяки місткості a сховище даних їх подолати
обмеження систем підтримки адміністрування, таких як i
системи підтримки прийняття рішень (СППР) та інформаційні системи
виконавчий (ЕІС).
Навіть якщо концепція сховище даних виглядає багатообіцяюче,
реалізувати i сховище даних може бути проблематично через
великомасштабних складських процесів. Незважаючи на
складність проектів зберігання дані, багато постачальників
та консультанти зі складського господарства дані вони стверджують, що
зберігання дані струм не викликає проблем.
Однак на початку цього дослідницького проекту майже жодного
були проведені незалежні, ретельні та систематичні дослідження. Від
Тому важко сказати, що відбувається насправді
у промисловості, коли вони будуються сховище даних.
У цьому дослідженні вивчалася складська практика компанії дані
сучасників, яка спрямована на розвиток більш глибокого розуміння
австралійської практики. Аналіз літератури забезпечив
контекст і основа для емпіричного дослідження.
Є ряд результатів цього дослідження. Перший
місце, це дослідження виявило діяльність, яка відбулася
під час розвитку сховище даних. У багатьох областях, i дані зібралися
підтвердила практику, описану в літературі. По друге
сайту, проблеми та проблеми, які можуть вплинути на
розвиток сховище даних були виявлені цим дослідженням.
Нарешті, переваги, отримані від австралійських організацій, пов'язаних з
використання сховище даних були виявлені.
Капітоло 1
Контекст дослідження
Концепція сховищ даних отримала широке визнання
експозиції та перетворився на нову тенденцію в
90-ті (McFadden 1996, TDWI 1996, Shah and Milstein 1997,
Шанкс та ін. 1997, Екерсон 1998, Адельман і Оутс 2000). Тобто
можна побачити зі зростаючої кількості статей про дані
складування в торгових виданнях (Little and Gibson 1999).
Багато статей (див., наприклад, Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett and King 1996, Graham et al. 1996 рік,
Сакагучі та Фролік 1996, Альварес 1997, Брусел 1997, Кларк
1997, Маккарті 1997, О'Доннелл 1997, Едвардс 1998, TDWI
1999) повідомили про значні переваги, отримані від організацій
що реалізують i сховище даних. Вони підтримали свою теорію
з неофіційними свідченнями успішних реалізацій, висока віддача
щодо показників інвестицій (ROI), а також надання вказівок
довідкові або методології для розробки сховище даних
(Шенкс та ін. 1997, Седдон і Бенджамін 1998, Літтл і Гібсон
1999). У крайньому випадку Graham et al. (1996) мають
повідомили про середню прибутковість трирічної інвестиції в 401%.
Однак значна частина сучасної літератури нехтує цим
складності, пов’язані з виконанням таких проектів. Проекти
сховище даних зазвичай вони складні та масштабні
тому вони означають високу ймовірність невдачі, якщо це не так
ретельно контролюється (Шах і Мільштейн 1997, Екерсон 1997,
Фолі 1997b, Циммер 1997, Борт 1998, Гіббс і Клаймер 1998, Рао
1998). Вони потребують величезної кількості як людських, так і ресурсів
фінанси, час і зусилля для їх створення (Hill 1998, Crofts 1998). The
типовий час і необхідні фінансові кошти відповідно
близько двох років і двох або трьох мільйонів доларів (Braly 1995, Foley
1997b, Bort 1998, Humphries et al. 1999). Ці часи і засоби
фінансові установи повинні контролювати та консолідувати багато аспектів
відмінності в сховищах даних (Cafasso 1995, Hill 1998). На стороні
апаратне та програмне забезпечення, інші функції, які відрізняються
з видобутку дані до процесів завантаження дані, від
обсяг пам'яті для керування оновленнями та метаданими дані
для навчання користувачів, необхідно враховувати.
На момент початку цього дослідницького проекту було дуже мало
наукові дослідження, проведені в галузі сховищ даних,
особливо в Австралії. Це було видно з браку речей
опубліковані на сховищі даних у газетах чи інших публікаціях
академіків того часу. Багато наукових праць
доступно описаний досвід США. Нестача
академічні дослідження в області сховищ даних sl спричинили
вимагають ретельних досліджень та емпіричних досліджень (McFadden 1996,
Шанкс та ін. 1997, Літтл і Гібсон 1999). Зокрема, навч
дослідження процесу впровадження сховище даних
необхідно проводити для розширення знань
загальні щодо виконання сховище даних e
слугуватиме основою для майбутнього наукового дослідження (Shanks ed
інші. 1997, Літтл і Гібсон 1999).
Метою цього дослідження, таким чином, є вивчення того, що насправді
Це відбувається, коли організації зберігають і використовують дані
склад в Австралії. Зокрема, це дослідження включатиме
аналіз усього процесу розробки a сховище даних,
починаючи від ініціації та планування до проектування та
впровадження та подальше використання в організаціях
Австралійський. Крім того, дослідження також сприятиме поточній практиці
визначення областей, де практика може бути вдосконалена
покращено, а неефективність і ризики можна мінімізувати або
уникати. Крім того, це стане основою для інших досліджень сховище даних in
Австралія і заповнить прогалину, яка зараз існує в літературі.
Питання дослідження
Метою цього дослідження є вивчення задіяних видів діяльності
в реалізації сховище даних та їх використання
Австралійські організації. Зокрема, вивчаються елементи
щодо планування проекту, розробки,
експлуатація, використання та пов'язані ризики. Отже питання
цього дослідження є:
«Яка нинішня практика сховище даних в Австралії?"
Щоб ефективно вирішити цю проблему, а
певну кількість допоміжних дослідницьких питань. Зокрема, три
з літератури були виділені підпитання, які є
представлені в розділі 2, щоб керувати цим дослідницьким проектом:
Як вони реалізуються i сховище даних організаціями
Австралійський? З якими проблемами ви зіткнулися?
Які переваги ви отримали?
Відповідаючи на ці питання, використовувався малюнок
розвідувальні дослідження, які використовують опитування. Як я вчуся
пошуковий, відповіді на вищезазначені запитання не є повними
(Shanks et al. 1993, Denscombe 1998). В даному випадку це так
для покращення відповідей на них необхідна тріангуляція
запити. Проте розслідування дасть міцну основу для
майбутньої роботи з вивчення цих питань. Детальний
обговорення обґрунтування та дизайну методу дослідження
представлено в розділі 3.
Структура дослідницького проекту
Цей дослідницький проект розділений на дві частини: контекстне дослідження
концепції сховищ даних та емпіричних досліджень (див
малюнок 1.1), кожен з яких обговорюється нижче.
Частина I: Контекстуальне дослідження
Перша частина дослідження полягала в повторному розгляді
сучасну літературу про різні типи сховищ даних, включаючи i
системи підтримки прийняття рішень (СППР), інформаційні системи
виконавця (EIS), приклади в сховище даних і поняття дати
склад. Крім того, результати форумів сховище даних і богів
засідання груп експертів і професіоналів, які проводить група в
Дослідження Monash DSS сприяло цьому етапу дослідження
який мав на меті отримати інформацію про практику даних
складу та визначити ризики, пов’язані з їх прийняттям.
У цей період відбувається контекстуальне вивчення, розуміння
проблемної області було створено для надання знань про
підставою для наступних емпіричних досліджень. Однак це
це був постійний процес, поки проходило дослідження
Дослідження.
Частина ІІ: Емпіричні дослідження
Відносно нова концепція сховищ даних, особливо
в Австралії виникла необхідність провести опитування для
отримати широке уявлення про досвід використання. Це
частину було виконано, коли проблемний домен був
було встановлено завдяки обширному огляду літератури. Концепція
сховищ даних, сформованих на етапі контекстного дослідження
було використано як вихідні дані для початкової анкети цього дослідження.
Після цього була проведена перевірка анкети. Ви знавці побачень
склад брав участь у випробуванні. Мета тесту
Початкова анкета повинна була перевірити повноту та точність
деякі питання. За результатами тестування складається анкета
було змінено, і змінену версію було надіслано до
учасників опитування. Повернуті тоді анкети були
проаналізовано для i дані в таблицях, діаграмах та інших форматах. THE
результати аналізу дані створити миттєву фотографію
практика зберігання даних в Австралії.
ОГЛЯД СХОЖИЩ ДАНИХ
Концепція сховищ даних розвивалася з удосконаленнями
комп'ютерних технологій.
Вона спрямована на подолання проблем, з якими стикаються групи
підтримка додатків, наприклад система підтримки прийняття рішень (DSS) e
Виконавча інформаційна система (EIS).
У минулому основною перешкодою для цих програм було
нездатність цих програм забезпечити a база даних
необхідні для аналізу.
В основному це пов'язано з характером роботи
управління. Інтереси керівництва компанії різні
постійно залежно від обробленої ділянки. Тому я дані
фундаментальними для цих програм повинні бути в змозі
швидко змінюється залежно від частини, яка підлягає обробці.
Це означає, що я дані повинні бути доступні у формі
достатній для необхідних аналізів. Насправді групи підтримки
додатків було дуже важко зібрати в минулому ред
інтеграція дані зі складних і різноманітних джерел.
Решта цього розділу представляє огляд концепції
сховищ даних і займається тим, як сховище даних може подолати
Проблеми групи підтримки програми.
Термін "Інформаційне сховище” був випущений Вільямом Інмоном у 1990 році.
Його часто цитоване визначення бачить Інформаційне сховище Приходити
колекція дані предметно-орієнтований, інтегрований, енергонезалежний і варіативний
з часом на підтримку управлінських рішень.
Використовуючи це визначення, Інмон підкреслює, що i дані жителів
в а сховище даних повинен володіти наступними 4
особливості:
▪ Предметно-орієнтований
▪ Інтегрований
▪ Енергонезалежний
▪ Змінна протягом часу
Під предметно-орієнтованим Inmon має на увазі, що i дані в даті
склад у найбільших організаційних областях, які були
визначені в моделі дані. Наприклад все дані щодо і клієнти
містяться в предметній області КЛІЄНТИ. Так само всі
дані які стосуються продуктів, містяться в предметній області
ПРОДУКЦІЯ.
Інтегрований Inmon означає, що i дані похідні з різних
платформи, системи та місця об’єднуються та зберігаються в
єдине місце. Як наслідок дані подібні повинні бути перетворені
у узгоджених форматах, щоб їх можна було додавати та порівнювати
легко.
Наприклад, представлені чоловіча та жіноча стать
літерами M і F в одній системі та 1 і 0 в іншій. для
інтегрувати їх у правильний спосіб, один або обидва формати повинні
трансформувати таким чином, щоб обидва формати були однаковими. У цьому
у випадку ми можемо змінити M на 1 і F на 0 або навпаки. Орієнтований на
предмет і Інтегрований вказують на те, що сховище даних він призначений для
забезпечують функціональне та поперечне бачення дані осторонь
компанії.
Під енергонезалежним він має на увазі, що i дані нель сховище даних залишаються
послідовним і оновлюваним дані це не потрібно. Натомість кожен
змінитися дані оригінали додається до база даних дати
склад. Це означає, що історичні деї дані міститься в
сховище даних.
Для змінних із часом Inmon вказує, що i дані нель сховище даних
завжди містять індикатори часу дані Normalmente
перетинають певний часовий горизонт. Наприклад a
сховище даних може містити 5 років історичних цінностей клієнти дав
1993-1997 рр. Наявність історії та динамічного ряду
з дані дозволяє аналізувати тенденції.
Un сховище даних він може зібрати своє дані від систем
OLTP; з джерел дані сторонні по відношенню до організації та/або інші спеціалісти
захоплення системних проектів дані.
I дані екстракти можуть пройти процес очищення, в
цей випадок я дані вони трансформуються та інтегруються, перш ніж бути
зберігається в база даних Дель сховище даних. Потім я дані
мешканці в межах с база даних Дель сховище даних доступні
для доступу кінцевого користувача та інструментів відновлення. Використання
ці інструменти кінцевий користувач може отримати доступ до інтегрованого подання
організації дані.
I дані мешканці в межах с база даних Дель сховище даних соно
зберігаються як у детальному, так і у зведеному форматах.
Рівень резюме може залежати від характеру дані. Я дані
детальний може складатися з дані струм e дані істориків
I дані роялті не включені в сховище даних поки я дані
нель сховище даних оновлюються.
На додаток до зберігання i дані самі, а сховище даних Можна також
зберігати інший тип дате які називаються МЕТАДАНИМИ
описати я дані жителів у його база даних.
Існує два типи метаданих: метадані розробки та метадані розробки
аналізи.
Метадані розробки використовуються для керування та автоматизації
процеси вилучення, очищення, картографування та завантаження дані нель
сховище даних.
Інформація, що міститься в метаданих розробки, може містити
деталі операційних систем, деталі елементів для вилучення,
модель дані Дель сховище даних і правила компанії для
перетворення дані.
Другий тип метаданих, відомий як аналітичні метадані
дозволяє кінцевому користувачеві досліджувати вміст даних
склад, щоб знайти дані доступні та що вони означають у термінах
зрозумілий і нетехнічний.
Тому метадані аналітики працюють як міст між даними
додатки для складів і кінцевих користувачів. Ці метадані можуть
містять бізнес-модель, описи дані відповідність
до бізнес-моделі, попередньо визначених запитів і звітів,
інформація для входу користувачів та індекс.
Метадані аналізу та розробки мають бути об’єднані в одне ціле
інтегроване зберігання метаданих для належного функціонування.
На жаль, багато з існуючих інструментів мають свої власні
метаданих, і наразі не існує стандартів, які
дозволяють інструментам сховища даних інтегрувати їх
метадані. Щоб виправити цю ситуацію, багато трейдерів
Основними інструментами сховища даних є Meta Data
Рада, яка згодом стала Коаліцією метаданих.
Метою цієї коаліції є створення набору метаданих
стандарт, який дозволяє використовувати різні засоби зберігання даних
конвертувати метадані
Результатом їхніх зусиль стало народження Мети
Специфікація обміну даними (MDIS), яка дозволить здійснювати обмін
інформації між архівами Microsoft і відповідними файлами MDIS.
Існування дані як узагальнені/індексовані, так і детальні дані
користувачеві надається можливість здійснити УТОПЛЕННЯ БУРА
(свердління) давай дані індексовані до детальних і навпаки.
Існування дані докладні історії дозволяють створювати
аналіз тенденцій у часі. Крім того, метадані аналізу можуть
використовувати як каталог база даних Дель сховище даних для
допомогти кінцевим користувачам знайти i дані необхідно.
Порівняно з системами OLTP, з їх здатністю підтримувати
аналіз дані і звітності, в сховище даних воно розглядається як система
більше підходить для інформаційних процесів, таких як виготовлення та
відповідати на запити та складати звіти. Наступний розділ
детально висвітлить відмінності двох систем.
ІНФОРМАЦІЙНЕ СХОВИЩЕ ПРОТИ OLTP СИСТЕМ
Багато інформаційних систем в організаціях
Вони призначені для підтримки щоденних операцій. Ці
системи, відомі як OLTP SYSTEMS, записують транзакції
постійно оновлюється щодня.
I дані в рамках цих систем вони часто змінюються, додаються або
видалено. Наприклад, адреса клієнта майже не змінюється
він переходить з одного місця на інше. У цьому випадку нова адреса
буде зареєстровано шляхом зміни поля адреси база даних.
Основна мета цих систем – скоротити витрати
транзакцій і в той же час скоротити час обробки.
Приклади систем OLTP включають такі критичні дії, як запис
облік замовлень, нарахування заробітної плати, рахунки, виробництво, послуги ін клієнти.
На відміну від систем OLTP, які створювалися для кожного процесу
на основі операцій і подій, i сховище даних вони були створені
для забезпечення підтримки процесів на основі аналітики дані є U
процеси прийняття рішень.
Зазвичай це досягається шляхом інтегрування i дані з різних систем
OLTP і зовнішні в одному «контейнері». дані,як обговорювалося
у попередньому розділі.
Модель процесу сховища даних Monash
Модель процесу для сховище даних Monash був розроблений
дослідники з Monash DSS Research Group, базується на
літератури о сховище даних, про досвід підтримки в
розробки системних полів, на обговореннях з вендорами
програми для використання на сховище даних, на групу експертів
у використанні сховище даних.
Ці фази: початок, планування, розробка та експлуатація
Пояснення. Діаграма пояснює ітераційний характер або
еволюційний розвиток а сховище даних процес за допомогою
двосторонні стрілки, розміщені між різними фазами. У цьому
«ітеративний» і «еволюційний» контекст означають, що в кожному
на етапі процесу можна виконати дії щодо впровадження
завжди поширюється назад до попереднього етапу. Це
через характер проекту a сховище даних у якому
додаткові запити виникають у будь-який час
кінцевого користувача. Наприклад, під час фази розвитку a
процес сховище даних, один запитує кінцевий користувач
новий вимір або предметна область, яка не належала до
оригінальний план, його потрібно додати до системи. Це
викликає зміни в проекті. Результатом є те, що команда в
дизайн повинен змінити вимоги документів, створених до цього часу
на етапі проектування. У багатьох випадках поточний стан
проект має повернутися до фази проектування, де
новий запит необхідно додати та задокументувати. Користувач
остаточний повинен мати можливість бачити конкретну переглянуту документацію ei
зміни, внесені на етапі розробки. В кінці
від цього циклу розробки проект повинен отримати чудовий відгук
обидві команди, команда розробників і команда користувачів. THE
зворотній зв'язок потім повторно використовується для покращення майбутнього проекту.
Планування потужностей
Dw, як правило, дуже великі за розміром і ростуть
дуже швидко (Бест 1995, Рудін 1997a) слідом за
кількість дані історії, які вони зберігають від своєї тривалості. Там
зростання також може бути викликано дані додаткові предмети за запитом
користувачів, щоб збільшити цінність дані що вони вже мають. Від
отже, вимоги до зберігання для дані possono
бути значно покращеним (Eckerson 1997). Так воно і є
необхідно забезпечити шляхом планування
потужність, з якою може розвиватися система, що буде побудована
зростання потреб (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
Плануючи масштабованість dw, необхідно знати
очікуване зростання розміру запасів, типи питань
і кількість підтримуваних кінцевих користувачів (найкраще
1995, Rudin 1997b, Foley 1997a). Створюйте масштабовані програми
вимагає поєднання масштабованих серверних технологій і методів
проектування масштабованих програм (Бест 1995, Рудін 1997b.
Обидва необхідні під час створення програми
надзвичайно масштабована. Масштабовані серверні технології можуть
зробити легким і зручним додавання сховища, пам’яті та
ЦП без зниження продуктивності (Lang 1997, Telephony 1997).
Існує дві основні масштабовані серверні технології: обчислення
симетрична множинна (SMP) і масивна обробка
паралельно (MPP)) (IDC 1997, Humphries et al. 1999). Сервер
SMP зазвичай має кілька процесорів, які спільно використовують одну пам’ять,
система шин та інші ресурси (IDC 1997, Humphries et al. 1999).
Для розширення можна додати додаткові процесори
його Potenza обчислювальний. Ще один спосіб збільшити
Potenza обчислювальної потужності SMP-сервера, полягає в поєднанні численних
машини SMP. Ця техніка відома як кластеризація (Humphries
та ін. 1999). З іншого боку, сервер MPP має кілька процесорів
з власною пам'яттю, системою шини та іншими ресурсами (IDC 1997,
Humphries та ін. 1999). Кожен процесор називається вузлом. А
збільшення в Potenza обчислення можна досягти
додавання додаткових вузлів до серверів MPP (Humphries et al.
1999).
Слабка сторона SMP-серверів — забагато операцій введення-виведення
(I/O) може перевантажувати шинну систему (IDC 1997). Це
проблема не виникає на серверах MPP, оскільки кожен
Процесор має власну шинну систему. Однак взаємозв'язки
між кожним вузлом вони, як правило, набагато повільніші, ніж шинна система
СМП. Крім того, сервери MPP можуть додавати шар
додаткова складність для розробників додатків (IDC
1997). Таким чином можна вплинути на вибір між серверами SMP і MPP
багатьма факторами, в тому числі складністю питань, взаємозв'язком
ціна/продуктивність, необхідна очисна потужність, т
запобігти dw програми та збільшення розміру база даних
dw і в кількості кінцевих користувачів.
Численні методи розробки програм, що масштабуються
можна використовувати для планування потужності. Один
використовує різні періоди повідомлень, такі як дні, тижні, місяці та роки.
Маючи різні періоди сповіщення, база даних можна розділити на
частини легко згруповані разом (Inmon et al. 1997). Інший
Техніка полягає у використанні зведених таблиць, які побудовані
Підводячи підсумки дані da дані докладно. Так я дані резюме більше
компактніший, ніж детальний, який потребує менше місця в пам’яті.
Отже дані деталей можна зберігати на накопичувачі
дешевше зберігання, що економить ще більше місця.
Хоча використання зведених таблиць може заощадити місце
пам’яті, вони вимагають багато зусиль, щоб підтримувати їх в актуальному стані
відповідно до комерційних потреб. Однак ця методика є
широко використовується і часто використовується в поєднанні з технікою
попередній (Best 1995, Inmon 1996a, Chauduri and Dayal
1997).
Визначення Інформаційне сховище технічний
Архітектури Визначення технік
архітектури dw
Перші користувачі сховищ даних спочатку задумали
централізована реалізація dw, де всі дані, включені
i дані зовнішні, були об'єднані в єдине,
фізичне зберігання (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Головною перевагою такого підходу є те, що кінцеві користувачі
Я можу отримати доступ до перегляду в підприємницькому масштабі
(загальний вигляд підприємства) dei дані організаційний (Ovum 1998). інший
перевага полягає в тому, що він пропонує стандартизацію дані через
організації, що означає, що існує лише одна версія або
визначення для кожної термінології, яка використовується в депозиті dw
(reposity) метаданих (Flanagan and Safdie 1997, Ovum 1998). The
недолік цього підходу, з іншого боку, полягає в тому, що він дорогий і складний
буде побудовано (Flanagan and Safdie 1997, Ovum 1998, Inmon et al.
1998). Незабаром після архітектури зберігання дані
стала популярною централізована, еволюціонувала концепція видобутку
найменших підмножин дані для підтримки потреб
специфічні програми (Varney 1996, IDC 1997, Berson and Smith
1997, павич 1998). Ці маленькі системи є похідними від більшої
великий сховище даних централізований. Їх називають датою
залежні відомчі склади або залежні вітрини даних.
Залежна архітектура вітрини даних відома як
трирівнева архітектура, де перший рівень складається з даних
централізований склад, другий складається зі складів дані
відомчий і третій складається з доступу до дані і від знарядь праці
аналізу (Demarest 1994, Inmon et al. 1997).
Вітрини даних зазвичай будуються після сховище даних
централізоване було побудовано для задоволення потреб с
конкретні одиниці (White 1995, Varney 1996).
Вітрини даних зберігають дані дуже доречно щодо деталей
єдність (Інмон та ін. 1997, Інмон та ін. 1998, IA 1998).
Перевага цього методу в тому, що не буде дате НЕ
інтегрований і що i дані вони будуть менш зайвими в межах даних
marts оскільки всі дані вони надходять зі складу дані інтегрований.
Ще одна перевага полягає в тому, що між ними буде мало зв’язків
вітрини даних і відповідні джерела дані тому що кожна вітрина даних має лише
джерело дані. Крім того, з цією архітектурою користувачі
фінал все ще може отримати доступ до огляду дані
корпоративні організації. Цей метод відомий як
метод зверху вниз, у якому вітринки даних будуються після даних
склад (Peacock 1998, Goff 1998).
Збільшення потреби показувати результати на ранній стадії, деякі
організації почали будувати незалежні вітрини даних
(Flanagan and Safdie 1997, White 2000). У цьому випадку вітрини даних
вони беруть своє дані прямо з основ дані OLTP, а не з
централізоване та інтегроване зберігання, таким чином усуваючи потребу в
мати центральне сховище на місці.
Кожна вітрина даних потребує принаймні одного посилання на її джерела
di дані. Один недолік — наявність кількох посилань на кожну дату
mart полягає в тому, що, порівняно з двома попередніми архітектурами,
надлишок дані значно збільшується.
Кожна вітрина даних повинна зберігати всі дані за запитом на місці
не впливають на системи OLTP. Це призводить до того, що i дані
вони зберігаються в різних вітринах даних (Inmon et al. 1997).
Іншим недоліком цієї архітектури є те, що вона призводить до
створення складних взаємозв’язків між вітринами даних та їх
джерела дані які важко виконувати та контролювати (ред. Inmon
інші. 1997).
Іншим недоліком є ​​те, що кінцеві користувачі не можуть живити
отримати доступ до огляду інформації про компанію, як i дані
різних вітрин даних не інтегровані (Ovum 1998).
Ще одним недоліком є ​​те, що їх може бути більше одного
визначення для кожної термінології, яка використовується у створених ним вітринах даних
невідповідності дані в організації (Ovum 1998).
Незважаючи на недоліки, розглянуті вище, незалежні вітрини даних
вони все ще привертають інтерес багатьох організацій (IDC 1997).
Одним із факторів, який робить їх привабливими, є те, що вони швидше розвиваються
і вимагають менше часу та ресурсів (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). Відповідно, в основному служать
як тестові проекти, які можна використовувати для ідентифікації
швидко виявити переваги та/або недоліки проекту (Parsaye
1995, Braly 1995, Newing 1996). У цьому випадку частина від
реалізувати в пілотному проекті має бути невеликим, але важливим
для організації (Newing 1996, Mansell-Lewis 1996).
Вивчаючи прототип, кінцеві користувачі та адміністрація можуть
вирішити, продовжувати чи зупиняти проект (Фланаган і Сафді
1997).
Якщо рішення буде продовжено, вітринки даних для інших секторів
їх слід будувати по одному. Є два варіанти для
кінцевих користувачів на основі їхніх потреб у створенні даних
незалежні матр.: інтегровані/об’єднані та неінтегровані (Ovum
1998)
У першому методі необхідно створити кожну нову вітрину даних
на основі поточних вітрин даних і моделі дані використовується
фірмою (Varney 1996, Berson and Smith 1997, Peacock 1998).
Необхідність використання моделі дані компанії робить це необхідним
забезпечити наявність лише одного визначення для кожної термінології
використовується через вітрини даних, це також для забезпечення того, що дані
Різні торгові точки можна об’єднати, щоб отримати огляд
корпоративна інформація (Bresnahan 1996). Цей метод є
називається «знизу вгору» і є найкращим, коли існує обмеження
фінансові засоби та час (Flanagan and Safdie 1997, Ovum 1998,
павич 1998, Гоф 1998). У другому методі — вітрини даних
побудований може задовольнити лише потреби конкретної одиниці.
Варіантом федеративної вітрини даних є сховище даних розповсюджується
в якому база даних Проміжне програмне забезпечення хаб-сервера використовується для об’єднання багатьох
вітрини даних в єдиному сховищі дані поширений (White 1995). в
цей випадок, i дані компанії розподілені в кількох вітринах даних.
Запити кінцевих користувачів пересилаються база даних
проміжне програмне забезпечення концентратора сервера, яке витягує всі дані запитувані даними
marts і повертає результати до програм кінцевого користувача. Це
метод надає бізнес-інформацію кінцевим користувачам. однак,
Проблеми вітрин даних досі не усунені
незалежний. Існує ще одна архітектура, яку можна використовувати
дзвоніть сховище даних віртуальний (White 1995). Однак це
Архітектура, яка описана на малюнку 2.9, не є архітектурою
зберігання дані справжній, оскільки він не переміщує вантаж
від систем OLTP до сховище даних (Demarest 1994).
Власне, запити в дані кінцевими користувачами перейшли до
Системи OLTP, які повертають результати після обробки
запити користувачів. Хоча ця архітектура дозволяє користувачам
фінал для створення звітів і формулювання запитів, не може надати i
дані історія та огляд інформації про компанію, як i дані
з різних систем OLTP не інтегровані. Отже, цей
архітектура не може задовольнити аналіз дані складні такі як
приклади прогнозів.
Вибір програм доступу та доступу
відновлення дані
Мета будівництва а сховище даних це передати
інформації для кінцевих користувачів (Інмон та інші 1997, По 1996,
McFadden 1996, Shanks та інші 1997, Hammergren 1998); один або
множинний доступ і програми відновлення дані повинні бути надані. до
Сьогодні існує широкий вибір цих додатків на вибір користувача
вибрати (Hammergren 1998, Humphries et al. 1999). The
вибрані програми визначають успіх зусиль
зберігання дані в організації, тому що
програми є найпомітнішою частиною сховище даних до користувача
остаточний (Inmon et al. 1997, Poe 1996). Для успіху побачення
склад, повинен бути в змозі підтримувати аналіз діяльності дані
кінцевого користувача (Poe 1996, Seddon and Benjamin 1998, Eckerson
1999). Отже, має бути «рівень» того, що хоче кінцевий користувач
ідентифіковано (Poe 1996, Mattison 1996, Inmon et al 1997,
Хамфріс та ін., 1999).
Загалом, кінцевих користувачів можна поділити на три групи
категорії: керівники, бізнес-аналітики та досвідчені користувачі (Poe
1996, Хамфріс та ін., 1999). Потрібні виконавчі користувачі
легкий доступ до попередньо визначених наборів звітів (вид. Хамфріса
інші 1999). Ці звіти можна легко отримати за допомогою
навігація по меню (Poe 1996). Крім того, звіти повинні
представляти інформацію за допомогою графічного зображення
наприклад таблиці та шаблони для швидкого транспортування
інформації (Humphries et al. 1999). Бізнес-аналітики, які цього не роблять
вони можуть мати технічні можливості для розвитку відносин
нуль самостійно, вони повинні мати можливість змінити поточні стосунки
задовольнити свої специфічні потреби (Poe 1996, Humphries et al
1999). З іншого боку, досвідчені користувачі — це тип кінцевих користувачів, які
мати можливість створювати та писати запити та звіти з
нуль (Poe 1996, Humphries et al. 1999). Це ті, хто
розробляти звіти для інших типів користувачів (Poe 1996, Humphries
та інші 1999).
Після визначення вимог кінцевого користувача потрібно виконати
вибір програм доступу та відновлення дані серед усіх
доступні (Poe 1996, Inmon et al. 1997).
Доступ до дані і інструменти пошуку можуть бути
класифікується на 4 типи: інструмент OLAP, інструмент EIS/DSS, інструмент запиту та
засоби звітності та аналізу даних.
Інструменти OLAP дозволяють користувачам створювати спеціальні запити, а також
зроблені на база даних Дель сховище даних. Плюс ці продукти
дозволити користувачам переходити вниз дані загальні до тих
докладно.
Інструменти EIS/DSS забезпечують звітність керівників як аналіз «що, якщо».
і доступ до звітів, організованих за допомогою меню. Звіти повинні бути
попередньо визначені та об’єднані з меню для полегшення навігації.
Інструменти запитів і звітів дозволяють користувачам створювати звіти
заздалегідь визначені та специфічні.
Інструменти інтелектуального аналізу даних використовуються для виявлення зв’язків, які
може пролити нове світло на забуті операції в дані Дель
інформаційне сховище.
Поряд з оптимізацією вимог кожного типу користувачів, i
Вибрані інструменти мають бути інтуїтивно зрозумілими, ефективними та простими у використанні.
Вони також повинні бути сумісними з іншими частинами архітектури e
здатний працювати з існуючими системами. Також пропонується
виберіть інструменти доступу та пошуку даних із цінами та продуктивністю
розумно. Інші критерії, які слід враховувати, включають відданість
постачальника інструменту для підтримки свого продукту та його розробок
те саме буде в наступних випусках. Щоб забезпечити залучення користувачів
у використанні сховища даних команда розробників залучає
користувачів у процесі вибору інструменту. В цьому випадку
має бути проведена практична оцінка користувача.
Підвищити цінність сховища даних може команда розробників
також надають веб-доступ до своїх сховищ даних. А
Веб-сховище даних дозволяє користувачам отримувати доступ до дані
з віддалених місць або під час подорожі. Додаткова інформація може
надаватися з меншими витратами через скорочення витрат
ді навчання.
2.4.3 Інформаційне сховище Фаза операції
Ця фаза складається з трьох дій: Визначення стратегії дати
оновлення, контроль діяльності сховища даних і управління ним
безпека сховища даних.
Визначення стратегій оновлення даних
Після початкового завантаження, i дані нель база даних сховища даних
необхідно періодично оновлювати для відтворення
зміни внесені на дані оригінали. Тому ми повинні вирішити
коли оновлювати, як часто
refresh і як оновити дані. Пропонується зробити
оновити деі дані коли систему можна перевести в автономний режим. там
Частота оновлення визначається командою розробників
на вимоги користувача. Є два підходи до оновлення
сховище даних: повне оновлення та постійне завантаження
зміни.
Перший підхід, повне оновлення, вимагає перезавантаження
всі дані з нуля. Це означає, що всі дані необхідний повинен
вилучати, очищати, трансформувати та інтегрувати під час кожного оновлення. Це
підходу слід, наскільки це можливо, уникати, оскільки
Це потребує багато часу та ресурсів.
Альтернативним підходом є безперервне завантаження i
зміни. Це додає i дані які були змінені
з моменту останнього циклу оновлення сховища даних. Ідентифікація
нових або змінених записів значно зменшує кількість
дані які повинні бути передані до сховища даних у кожному
оновлення, оскільки лише ці дані буде додано до база даних
сховища даних.
Існує принаймні 5 підходів, які можна використовувати для виведення
i дані новий або модифікований. Щоб отримати ефективну стратегію
оновити деі дані поєднання цих підходів може бути корисним
фіксує всі зміни в системі.
Перший підхід, який використовує мітки часу, передбачає, що приходить
призначено всім дані відредагував і оновив позначку часу так
щоб можна було легко ідентифікувати всіх дані змінені та нові.
Однак цей підхід не отримав широкого застосування в більшості
частиною сучасних операційних систем.
Другий підхід полягає у використанні дельта-файлу, створеного
програма, яка містить лише зміни, внесені до дані.
Використання цього файлу також збільшує цикл оновлення.
Однак навіть цей метод не у багатьох застосовувався
програми.
Третій підхід полягає у скануванні файлу журналу, який
в основному містить інформацію, подібну до дельта-файлу. Єдиний
Різниця полягає в тому, що файл журналу створюється для процесу відновлення та
це може бути важко зрозуміти.
Четвертий підхід полягає у зміні коду програми.
Однак більшість програмного коду застаріла
крихкий; тому слід уникати цієї техніки.
Останній підхід полягає у порівнянні дані джерела з файлом
головні боги дані.
Контроль діяльності сховища даних
Щойно сховище даних було надано користувачам, воно доступне
необхідно контролювати його з часом. В даному випадку адміністратор
сховища даних може використовувати один або кілька інструментів керування та
контроль для моніторингу використання сховища даних. Зокрема
можна збирати інформацію про людей і погоду
які вони мають доступ до сховища даних. Давай дані культури можна створювати
профіль виконаної роботи, який можна використовувати як вхідні дані
у здійсненні повернення коштів користувачам. Відкликання платежу
дозволяє користувачам отримувати інформацію про вартість обробки
інформаційне сховище.
Крім того, можна також використовувати контроль сховища даних
визначити типи запитів, їх розмір, кількість запитів на
день, час відповіді на запит, охоплені сектори та кількість
di дані оброблені. Ще одна мета перевірки
сховище даних для ідентифікації дані які не використовуються. Ці дані
їх можна видалити зі сховища даних, щоб скоротити час
відповіді на виконання запиту та стежити за зростанням
дані які знаходяться в межах база даних сховища даних.
Управління безпекою сховища даних
Сховище даних містить дані комплексний, критичний, чутливий що
можна легко дістатися. З цієї причини слід
бути захищеним від неавторизованих користувачів. Один із способів
реалізація безпеки полягає у використанні функції del СУБД
для призначення різних привілеїв різним типам користувачів. У цьому
Таким чином, профіль потрібно підтримувати для кожного типу користувача
доступу. Ще один спосіб захистити своє сховище даних — зашифрувати його
як написано в база даних сховища даних. Доступ до
дані і інструменти пошуку повинні розшифрувати дані перед подачею i
результати користувачам.
2.4.4 Інформаційне сховище Фаза розгортання
Це останній етап у циклі впровадження сховища даних. The
заходи, які будуть виконуватися на цьому етапі, включають навчання
користувачам використовувати сховище даних і створювати огляди
сховища даних.
Навчання користувачів
Спочатку слід провести навчання користувачів
доступу до дані сховища даних і використання інструментів
пошук. Загалом, заняття слід починати з
ознайомлення з поняттям зберігання дані, al
вміст сховища даних, ai meta дані і основні риси
інструментів. Тоді більш досвідчені користувачі також зможуть вивчати
фізичні таблиці та користувацькі функції доступу до даних та інструменти
пошук.
Існує багато підходів до навчання користувачів. Один з
вони включають вибір багатьох користувачів або аналітиків, обраних a
групи користувачів, виходячи з їх лідерства та здібностей
спілкування. Вони навчаються в особистій якості на
все, що їм потрібно знати, щоб ознайомитися з
система. Після закінчення навчання вони повертаються до своєї роботи
вони починають навчати інших користувачів, як користуватися системою. На
на основі того, що вони дізналися, інші користувачі можуть почати
вивчити сховище даних.
Інший підхід полягає в тому, щоб навчити багатьох користувачів цьому ж
час, ніби ви проходите курс у класі. Цей метод
Це підходить, коли є багато користувачів, яких потрібно навчити
в той самий час. Ще один метод - тренування
кожен користувач окремо, один за одним. Цей метод є
підходить, коли користувачів мало.
Метою навчання користувачів є ознайомлення
з доступом до дані і інструменти пошуку, а також вміст
інформаційне сховище. Однак деякі користувачі можуть бути перевантажені
за обсягом інформації, що надається під час заняття
навчання. Тому потрібно зробити певну кількість речей
постійна підтримка та сеанси підвищення кваліфікації для відповіді
на конкретні питання. У деяких випадках формується група
користувачів для надання такого типу підтримки.
Збір відгуків
Після розгортання сховища даних користувачі можуть
використовувати i дані які знаходяться в сховищі даних для різних цілей.
Здебільшого аналітики чи користувачі використовують i дані нель
сховище даних для:
1 Визначте тенденції компанії
2 Проаналізуйте профілі купівлі клієнти
3 Розділіть i клієнти і
4 Надайте найкращі послуги клієнти – налаштувати послуги
5 Сформулюйте стратегії marketing
6 Надайте конкурентоспроможні пропозиції для аналізу витрат і допомоги
контроль
7 Підтримка прийняття стратегічних рішень
8 Визначте можливості виділитися
9 Підвищення якості поточних бізнес-процесів
10 Перевірте прибуток
Слідуючи напрямку розвитку сховища даних, вони могли б
Проведіть ряд перевірок системи, щоб отримати відгук
як від команди розробників, так і від спільноти
кінцеві користувачі.
Отримані результати можуть бути прийняті до уваги
наступний цикл розвитку.
Оскільки сховище даних має поступовий підхід,
важливо вчитися на успіхах і помилках попередніх
розробки.
2.5 Підсумок
У цьому розділі обговорювалися підходи, наявні в
література. У розділі 1 обговорювалася концепція
сховище даних і його роль у науці прийняття рішень. В
розділ 2 основні відмінності між
системи сховища даних і OLTP. У розділі 3 ми обговорили
Використана модель сховища даних Monash
у розділі 4, щоб описати дії, залучені до процесу
розробки сховища даних, ці тези не базувалися
ретельне дослідження. Те, що відбувається в реальності, може бути
дуже відрізняється від того, що повідомляє література, проте ці
Результати можна використовувати для створення основного багажу, який
підкреслити концепцію сховища даних для цього дослідження.
Капітоло 3
Методи дослідження та проектування
У цьому розділі розглядаються методи дослідження та проектування
це дослідження. У першій частині показано загальне уявлення про методи
досліджень, доступних для отримання інформації, крім того
обговорюються критерії вибору найкращого методу для одного
конкретне дослідження. Потім у розділі 2 обговорюються два методи
обрані за щойно викладеними критеріями; з них буде обрано і
прийнято один із причинами, викладеними в розділі 3, де вони є
також пояснюються причини виключення іншого критерію. там
розділ 4 представляє план дослідження, а розділ 5 представляє його
висновки.
3.1 Дослідження в інформаційних системах
Дослідження інформаційних систем не обмежуються просто
до технологічної сфери, але також має бути розширено, щоб включити
цілі щодо поведінки та організації.
Ми завдячуємо цим дисертаціям різних дисциплін, починаючи від
суспільні науки до природничих; це призводить до необхідності a
певний спектр методів дослідження із залученням кількісних методів
і якісні для використання в інформаційних системах.
Важливі всі доступні методи дослідження, насправді декілька
дослідники, такі як Дженкінс (1985), Нунамейкер та ін. (1991), і Galliers
(1992) стверджують, що не існує конкретного універсального методу
проводити дослідження в різних областях інформаційних систем; Дійсно
метод може підходити для певного дослідження, але ні
для інших. Це призводить до необхідності вибору методу, який
підходить для нашого конкретного дослідницького проекту: для цього
вибір Benbasat та ін. (1987) стверджують, що їх слід враховувати
характер і мета дослідження.
3.1.1 Характер дослідження
Можуть бути різні методи, засновані на характері дослідження
поділяють на три широко відомі в науці традиції
інформації: позитивістські, інтерпретаційні та критичні дослідження.
3.1.1.1 Позитивістські дослідження
Позитивістське дослідження також відоме як наукове дослідження або
емпіричний. Він намагається: «пояснити і передбачити, що станеться в
соціального світу, розглядаючи закономірності та причинно-наслідкові зв’язки
серед елементів, які його утворюють» (Шенкс та ін., 1993).
Позитивістське дослідження також характеризується повторюваністю,
спрощення і спростування. Крім того, позитивістські дослідження визнають
наявність апріорних зв'язків між досліджуваними явищами.
Згідно з Galliers (1992), таксономія є методом дослідження
входить до позитивістської парадигми, яка, однак, не обмежується цим,
фактично є лабораторні експерименти, польові експерименти,
тематичні дослідження, докази теорем, прогнози та моделювання.
За допомогою цих методів дослідники визнають, що явища
досліджувані можна спостерігати об'єктивно і строго.
3.1.1.2 Інтерпретаційне дослідження
Інтерпретаційне дослідження, яке часто називають феноменологією або
Нойман (1994) описує антипозитивізм як «аналіз
системність соціального сенсу дії через безпосереднє і
детальне спостереження за людьми в природних ситуаціях, в порядку
прийти до розуміння та тлумачення того, як
люди створюють і підтримують свій соціальний світ». Дослідження
Інтерпретаційні методи відкидають припущення, що спостережувані явища
можна спостерігати об'єктивно. Насправді вони засновані
на суб'єктивні тлумачення. Крім того, дослідники-інтерпретатори цього не роблять
вони накладають апріорні значення на явища, які вивчають.
Цей метод включає суб'єктивні/аргументовані дослідження, дії
дослідження, описові/інтерпретаційні дослідження, майбутні дослідження та ігри
роль. На додаток до цих розслідувань і тематичних досліджень можуть бути
включені в цей підхід, оскільки вони стосуються досліджень
особи чи організації в складних ситуаціях
реального світу.
3.1.1.3 Критичні дослідження
Критичне дослідження є найменш відомим підходом у науці
соціальна, але нещодавно привернула увагу дослідників
у сфері інформаційних систем. Філософське припущення, що
соціальна реальність історично виробляється і відтворюється людьми,
а також соціальні системи з їх діями та взаємодіями. їх
здатність, однак, опосередковується певною мірою уваги
соціальні, культурні та політичні.
Як і інтерпретаційне дослідження, критичне дослідження стверджує, що
позитивістські дослідження не мають нічого спільного з соціальним контекстом і ігнорують його
його вплив на вчинки людини.
Критичне дослідження, з іншого боку, критикує інтерпретаційне дослідження
бути надто суб'єктивним і тому, що не має на меті допомогти
людей, щоб покращити своє життя. Найбільша різниця між
критичне дослідження та два інші підходи є його оціночним виміром.
У той час як об’єктивність позитивістської та інтерпретаційної традицій є за
прогнозувати або пояснювати статус-кво або соціальну реальність, критичне дослідження
спрямований на критичну оцінку та трансформацію соціальної реальності, що лежить в її основі
студія.
Критично налаштовані дослідники зазвичай виступають проти статус-кво, щоб
усунення соціальних відмінностей і поліпшення соціальних умов. там
критичне дослідження має прихильність до процесуального погляду
явища, що представляють інтерес, і, отже, зазвичай є поздовжнім.
Прикладами методів дослідження є багаторічні історичні дослідження та
етнографічні дослідження. Критичних досліджень, однак, не було
широко використовується в дослідженнях інформаційних систем
3.1.2 Мета дослідження
Поряд з характером пошуку може використовуватися його мета
орієнтувати дослідника у виборі того чи іншого методу
дослідження. Мета дослідницького проекту тісно пов’язана
до позиції пошуку відносно циклу пошуку, який складається з
три фази: побудова теорії, перевірка теорії та уточнення теорії
теорія. Отже, виходячи з імпульсу щодо циклу пошуку, a
Дослідницький проект може мати пояснювальну, описову, мету
пошуковий або прогнозний.
3.1.2.1 Пошукові дослідження
Пошукове дослідження спрямоване на дослідження теми
абсолютно нові та формулюють дослідницькі питання та гіпотези
майбутнє. Цей вид дослідження використовується при побудові
теорії, щоб отримати початкові посилання в новій області.
Як правило, використовуються якісні методи дослідження, наприклад кейси
дослідження або феноменологічні дослідження.
Однак також можна використовувати кількісні методи, такі як
пошукові дослідження або експерименти.
3.1.3.3 Описове дослідження
Описове дослідження значною мірою спрямоване на аналіз і опис
деталізуйте конкретну ситуацію чи організаційну практику. Це
підходить для створення теорії, а також може бути використаний для
підтвердити або спростувати гіпотези. Зазвичай описове дослідження
включає використання вимірювань і зразків. Найбільш прийнятні методи дослідження
включають дослідження та аналіз попередніх подій.
3.1.2.3 Пояснювальні дослідження
Пояснювальні дослідження намагаються пояснити, чому все відбувається.
Він побудований на фактах, які вже вивчені та намагаються знайти
причини цих фактів.
Отже, пояснювальні дослідження зазвичай будуються на дослідженні
дослідницький або описовий і є допоміжним для тестування та вдосконалення
теорії. Пояснювальні дослідження зазвичай використовують тематичні дослідження
або методи дослідження, засновані на опитуванні.
3.1.2.4 Профілактичні дослідження
Профілактичні дослідження спрямовані на прогнозування подій і поведінки
під спостереженням, які вивчаються (Маршалл і Россман
1995). Прогноз — це стандартна наукова перевірка правди.
Цей тип дослідження зазвичай передбачає опитування або аналіз
дані істориків. (Інь 1989)
Наведене вище обговорення показує, що існує ряд
можливі методи дослідження, які можна використати в дослідженні
зокрема. Однак повинен бути конкретний метод, який є більш придатним
інших для певного типу дослідницького проекту. (Галієри
1987, Інь 1989, Де Во 1991). Отже, кожен дослідник має
необхідно ретельно оцінити сильні і слабкі сторони
різні методи, щоб прийти до прийняття найбільш прийнятного методу дослідження e
сумісні з дослідницьким проектом. (Дженкінс 1985, Перван і Клас
1992, Бономія 1985, Інь 1989, Гімілтон і Айвз 1992).
3.2. Можливі методи дослідження
Метою цього проекту було вивчення досвіду в
Австралійські організації з i дані зберігається з одним
розвиток сховище даних. Dato який, на даний момент, є один
відсутність досліджень у сфері сховищ даних в Австралії,
цей дослідницький проект все ще знаходиться в теоретичній фазі циклу
дослідження і має пошукову мету. Вивчення досвіду в
Австралійські організації використовують сховища даних
вимагає інтерпретації реального суспільства. Отже,
філософське припущення, що лежить в основі дослідницького проекту, випливає з цього
традиційне тлумачення.
Після ретельного вивчення доступних методів вони були ідентифіковані
два можливі методи дослідження: опитування та тематичні дослідження
(кейси), які можуть бути використані для дослідження
пошуковий (Шенкс та ін., 1993). Galliers (1992) стверджує, що
придатність цих двох методів для цього конкретного дослідження
його переглянуту таксономію стверджує, що вони придатні для будівництва
теоретичний. У наступних двох підрозділах розглядається кожен метод
деталь.
3.2.1 Опитовий метод дослідження
Опитовий метод дослідження походить від античного методу с
перепис населення. Перепис складається зі збору інформації з
ціле населення. Цей спосіб дорогий і непрактичний
особливо якщо населення велике. Отже, порівняно з
перепису, опитування зазвичай зосереджено на
збирати інформацію для невеликої кількості або вибірки
представники населення (Fowler 1988, Neuman 1994). А
Вибірка відображає сукупність, з якої вона взята, з різн
рівні точності, відповідно до структури вибірки, в
розмір і використаний метод відбору (Fowler 1988, Babbie
1982, Нойман 1994).
Метод дослідження визначається як «моментальні знімки практик,
ситуації або погляди в певний момент часу, здійснені за допомогою
опитувальників або інтерв'ю, з яких можна зробити висновки
зробив» (Galliers 1992:153) [миттєва фотографія практик,
ситуації або погляди в певний момент часу, здійснені за допомогою
анкети чи інтерв’ю, з яких можна зробити висновки]. The
розслідування займаються збором інформації про певні аспекти
дослідження певною кількістю учасників, внесення
запитання (Fowler 1988). Навіть ці анкети та співбесіди, які
включають особисті телефонні та структуровані інтерв’ю,
є методи збору дані найчастіше використовується в
дослідження (Blalock 1970, Nachmias and Nachmias 1976, Fowler
1988), можна використовувати спостереження та аналіз (Gable
1994). З усіх цих методів збору дані, використання
опитувальник є найпопулярнішим методом, оскільки він гарантує, що i дані
зібрані структуровані та відформатовані, а тому полегшують
класифікація інформації (Hwang 1987, de Vaus 1991).
При аналізі i даністратегія розслідування часто використовує
кількісні методи, такі як статистичний аналіз, але вони можуть бути
також використовуються якісні методи (Galliers 1992, Pervan
і Клас 1992, Гейбл 1994). Зазвичай, i дані зібрані є
використовується для аналізу розподілів і моделей асоціацій
(Fowler 1988).
Хоча опитування взагалі підходять для дослідження
які стосуються питання "що?" (чого) або з нього
похідні, такі як «скільки» і «скільки», вони
можна поставити через запитання «чому» (Sonquist і
Dunkelberg 1977, Yin 1989). За Сонквістом і Дункельбергом
(1977), дослідницьке дослідження спрямоване на складні гіпотези, програму
оцінка, опис популяції та розробка моделей
людська поведінка. Крім того, можна використовувати опитування
вивчити певну думку населення, умови,
думки, характеристики, очікування і навіть поведінку в минулому
або сьогодення (Neuman 1994).
Дослідження дозволяють досліднику виявити взаємозв’язок між
популяції, і результати зазвичай є більш загальними, ніж
інші методи (Sonquist and Dunkelberg 1977, Gable 1994). The
опитування дозволяють дослідникам охопити географічну територію
ширше та охопити багатьох заявників (Blalock 1970,
Сонквіст і Дункельберг 1977, Хван і Лін 1987, Гейбл 1994,
Нойман 1994). Нарешті, опитування можуть надати інформацію
які недоступні в іншому місці або у формі, необхідній для аналізу
(Fowler 1988).
Однак існують деякі обмеження в проведенні опитування. Один
Недоліком є ​​те, що дослідник не може отримати багато інформації
щодо досліджуваного об'єкта. Це пов'язано з тим, що в
розслідування проводяться тільки в певний час і, отже,
існує обмежена кількість змінних і людей, яких може дослідник
дослідження (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Іншим недоліком є ​​проведення опитування
дуже дорого з точки зору часу та ресурсів, особливо якщо
передбачає особисті інтерв’ю (Fowler 1988).
3.2.2. Запитовий метод дослідження
Запитовий метод дослідження передбачає поглиблене вивчення
конкретна ситуація в її реальному контексті в a
визначений період часу, без будь-якого втручання з боку
дослідник (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
В основному цей метод використовується для опису зв'язків між
змінні, які вивчаються в конкретній ситуації
(Gallers 1992). Розслідування можуть стосуватися окремих випадків або
множинний, залежно від аналізованого явища (Franz and Robey 1987,
Eisenhardt 1989, Yin 1989).
Запитовий метод дослідження визначається як «запит
емпіричне дослідження, яке вивчає сучасне явище в межах
відносного реального контексту, використовуючи кілька джерел, зібраних з одного або
кілька сутностей, таких як люди, групи або організації» (Yin 1989).
Немає чіткого розмежування між явищем і його контекстом e
немає контролю або експериментального маніпулювання змінними (Інь
1989, Бенбасат та ін., 1987).
Існує різноманітна техніка збору дані че поссоно
бути використані в методі запиту, який включає
безпосередні спостереження, огляди архівних матеріалів, анкетування,
перегляд документації та структуровані інтерв'ю. мати
різноманітна техніка збирання врожаю дані, розслідування
дозволяють дослідникам мати справу з обома дані якісне що
кількостей одночасно (Bonoma 1985, Eisenhardt 1989, Yin
1989, Гейбл 1994). Як і у випадку з методом опитування, a
запит дослідник виступає як спостерігач або дослідник і ні
як активний учасник досліджуваної організації.
Бенбасат та інші (1987) стверджують, що метод опитування є
особливо підходить для теоретичних досліджень, які
починайте з дослідницького питання і продовжуйте навчання
теорії в процесі збирання дані. Буття
також підходить для сцени
побудови теорії Франц і Робі (1987) припускають, що
Для комплексу також можна використовувати метод запиту
теоретичний етап. При цьому, на підставі зібраних доказів, один
дана теорія або гіпотеза перевіряється або спростовується. Крім того, розслідування є
також підходить для досліджень, що стосуються питань «як» або «як».
«чому» (Yin 1989).
Порівняно з іншими методами, опитування дозволяють досліднику
фіксувати важливу інформацію більш детально (Galliers
1992, Шанкс та інші 1993). Крім того, розслідування дозволяють
досліднику зрозуміти природу і складність досліджуваних процесів
(Benbasat et al. 1987).
Метод має чотири основні недоліки
розслідування. Перший – це відсутність контрольованих відрахувань. Там
Суб'єктивність дослідника може змінити результати і висновки
дослідження (Yin 1989). Другим недоліком є ​​відсутність
контрольоване спостереження. На відміну від експериментальних методів, в
Дослідник-дослідник не може контролювати досліджувані явища
оскільки вони розглядаються в їх природному контексті (Gable 1994). The
третім недоліком є ​​​​відсутність повторюваності. Це пов'язано з тим
що дослідник навряд чи спостерігатиме ті самі події, і
не може перевірити результати певного дослідження (Lee 1989).
Нарешті, як наслідок невідтворюваності, це важко
узагальнити результати, отримані в результаті одного або кількох досліджень (Galliers
1992, Шанкс та інші 1993). Усіх цих проблем, однак, немає
є непереборними і, по суті, можуть бути зведені до мінімуму
дослідник застосовує відповідні дії (Lee 1989).
3.3. Обґрунтуйте методику дослідження
прийнято
З двох можливих методів дослідження для даного дослідження метод о
дослідження вважається найбільш прийнятним. Це розслідування
було відхилено після ретельного розгляду відповідних
переваги і недоліки. Зручність чи недоречність кожного
Метод цього дослідження обговорюється нижче.
3.3.1. Невідповідність методу дослідження
розслідування
Метод опитування вимагає поглибленого вивчення одного
конкретна ситуація в одній або кількох організаціях для a
період часу (Eisenhardt 1989). У цьому випадку період може
перевищити часові рамки, надані для цього дослідження. інший
Причиною відмови від використання методу опитування є результати
вони можуть страждати від недостатньої строгості (Yin 1989). Суб'єктивність
дослідника може впливати на результати та висновки. інший
причина полягає в тому, що цей метод більше підходить для дослідження питань
типу «як» або «чому» (Yin 1989), тоді як дослідницьке питання
для цього дослідження це тип «що». І останнє, але не менш важливе
Важливо, що важко узагальнити висновки лише з одного або
кілька досліджень (Galliers 1992, Shanks et al 1993). На базі
цим раціональним поясненням метод дослідження не є
було обрано, оскільки воно було непридатним для цього дослідження.
3.3.2. Зручність способу пошуку
розслідування
Коли було проведено це дослідження, практика сховищ даних
не було широко прийнято
Австралійські організації. Отже, інформації було небагато
щодо їх реалізації в межах ст
Австралійські організації. Наявна інформація прийшла
від організацій, які впровадили або використовували дані
склад. В даному випадку опитувальний метод дослідження є найбільш
підходить, оскільки дозволяє отримати інформацію, яка не є такою
доступні в іншому місці або у формі, необхідній для аналізу (Fowler 1988).
Крім того, опитувальний метод дослідження дозволяє досліднику
отримати гарне уявлення про практики, ситуації або
побачити в певний час (Galliers 1992, Denscombe 1998).
Для збільшення потрібен був загальний вигляд
Знання австралійського досвіду сховищ даних.
Знову ж таки, Сонквіст і Дункельберг (1977) стверджують, що результати
Опитування є більш загальним, ніж інші методи.
3.4. Дизайн дослідження опитування
Розслідування практики сховищ даних було проведено в 1999 році.

Цільова аудиторія складалася з організацій
Австралійці зацікавлені в дослідженнях сховищ даних, як і раніше
напевно вже повідомили про я дані що вони зберігають і,
отже, це може надати корисну інформацію для цього дослідження. там
Цільову групу було визначено за допомогою первинного опитування
усі австралійські члени «Інституту сховищ даних» (Tdwiaap).
У цьому розділі обговорюється дизайн етапу дослідження
емпіричні докази цього дослідження.
3.4.1. Техніка збирання врожаю дані
З трьох методів, які зазвичай використовуються в опитуванні
(тобто поштова анкета, телефонне співбесіда та співбесіда
особистого) (Nachmias 1976, Fowler 1988, de Vaus 1991), для
у цьому дослідженні була використана поштова анкета. Перший
Причиною прийняття останнього є те, що він може досягти a
географічно розсіяне населення (Blalock 1970, Nachmias e
Nachmias 1976, Hwang і Lin 1987, de Vaus 1991, Gable 1994).
По-друге, поштова анкета підходить для учасників
високоосвічений (Fowler 1988). Поштова анкета для цього
дослідження було адресовано спонсорам проекту зі сховищ даних,
директорів та/або керівників проектів. По-третє, анкети геть
пошти підходять, якщо у вас є безпечний список
адреси (Salant and Dilman 1994). TDWI, в даному випадку, один
довірена асоціація сховищ даних надала список адрес
її австралійських членів. Ще одна перевага анкети
поштою, а не телефонним опитуванням або співбесідами
персональний полягає в тому, що це дозволяє реєстрантам відповідати більше
точність, особливо коли реєстрантам потрібно проконсультуватися
нотатки або обговорення питань з іншими людьми (Фаулер
1988).
Потенційним недоліком може бути час, необхідний для
проводити анкетування поштою. Як правило, анкета геть
Пошта ведеться в такій послідовності: надсилати листи, чекати
відповіді та надіслати підтвердження (Fowler 1988, Bainbridge 1989).
Таким чином, загальний час може бути довшим, ніж час, необхідний для
особисті інтерв'ю або для телефонних інтерв'ю. Однак,
загальний час може бути відомий заздалегідь (Fowler 1988,
Denscombe 1998). Час, витрачений на проведення інтерв'ю
персональні дані не можуть бути відомі заздалегідь, оскільки вони відрізняються від
одне інтерв’ю іншому (Fowler 1988). Телефонні інтерв'ю
може бути швидшим, ніж поштові анкети та
особистих співбесід, але може мати високий рівень пропусків
відповідь через недоступність деяких людей (Fowler 1988).
Крім того, телефонні інтерв’ю зазвичай обмежуються списками
відносно короткі питання (Bainbridge 1989).
Іншим недоліком поштової анкети є висока швидкість
відсутність відповіді (Fowler 1988, Bainbridge 1989, Neuman
1994). Проте були вжиті контрзаходи, об'єднання
це дослідження з перевіреною установою в галузі даних
складування (тобто TDWI) (Bainbridge 1989, Neuman 1994),
який надсилає два листи-нагадування тим, хто не відповів
(Fowler 1988, Neuman 1994), а також містить лист
додаток, що пояснює мету дослідження (Neuman 1994).
3.4.2. Одиниця аналізу
Метою даного дослідження є отримання інформації про
впровадження сховищ даних та їх використання
в австралійських організаціях. Цільова популяція
складається з усіх австралійських організацій, які мають
реалізовані або реалізуються, i сховище даних, в
потім реєструються окремі організації. Анкета
його було надіслано поштою організаціям, зацікавленим у усиновленні
di сховище даних. Цей метод гарантує, що інформація
зібрані з найбільш підходящих ресурсів кожної організації
учасник.
3.4.3. Зразок опитування
«Список розсилки» учасників опитування отримано з
TDWI. З цього списку 3000 австралійських організацій
були обрані як основа для відбору проб. А
додатковий лист з поясненнями проекту та мети розслідування,
разом із бланк відповідей та попередньо оплачений конверт для
відправити назад заповнену анкету було надіслано за зразком.
З 3000 організацій 198 погодилися взяти участь у
вивчення. Така невелика кількість відповідей була очікуваною дате il
велика кількість австралійських організацій, які вони тоді мали
прийняли або прийняли стратегію побачень
складування всередині своїх організацій. Отже,
Цільова популяція для цього дослідження складається лише з 198 осіб
організацій.
3.4.4. Зміст анкети
В основу структури анкети покладено модель дати
Монаш складування (розглядалося раніше в частині 2.3). The
Зміст анкети було засновано на аналізі
література, представлена ​​в розділі 2. Копія анкети
надіслані учасникам опитування можна знайти
у додатку Б. Анкета складається з шести розділів, які
наступні фази моделі, що обговорюється. Наступні шість абзаців
вони коротко підсумовують зміст кожного розділу.
Розділ А: Основна інформація про організацію
Цей розділ містить запитання, пов’язані з профілем
організації-учасники. Крім того, є деякі питання
щодо стану проекту сховища даних
учасник. Конфіденційна інформація, наприклад ваше ім’я
організації не були виявлені в аналізі опитування.
Розділ Б: Початок
Питання в цьому розділі стосуються початкової діяльності
сховище даних. Питання задавали як довго
стосується ініціаторів проекту, гарантів, умінь і знань
запити, цілі розробки сховищ даних і
очікування кінцевих користувачів.
Розділ C: Дизайн
У цьому розділі містяться питання, пов'язані з діяльністю
планування сховище даних. Зокрема, питання такі
вказати обсяги виконання, тривалість проекту, вартість
проекту та аналізу витрат і вигод.
Розділ D: Розвиток
У розділі розробки є питання, що стосуються діяльності
розвиток сховище даних: збірник вимог користувачів
фінал, джерела дані, логічна модель дані, прототипи,
планування потужностей, технічні архітектури та вибір
засоби розробки сховищ даних.
Розділ E: Операція
Операційні питання, пов'язані з операцією ред
до розширюваності сховище даних, як це розвивається
наступний етап розвитку. там якість даних, стратегії
оновити деі дані, зернистість дані, масштабованість даних
склад і проблеми безпеки сховище даних вони були між
типи поставлених питань.
Розділ F: Розвиток
Цей розділ містить запитання, пов’язані з використанням даних
складу кінцевими користувачами. Дослідник зацікавився
до призначення та корисності сховище даних, огляд і стратегії
прийнятого навчання та стратегії контролю даних
склад прийнято.
3.4.5. Швидкість відповіді
Хоча опитування поштою критикують за те, що вони мають показник
низький відгук, вжито заходів щодо підвищення
норма прибутку (як обговорювалося раніше частково
3.4.1). Термін «відповідь» означає відсоток
людей у ​​певній вибірці опитування, які відповідають на
опитувальник (Denscombe 1998). Було використано наступне
формула для розрахунку частоти відповідей для цього дослідження:
Кількість людей, які відповіли
Частота відповідей =
———————————————————————————– X 100
Загальна кількість надісланих анкет
3.4.6. Пілотне випробування
Перед тим, як анкета відправляється на вибірку, складаються питання
було досліджено шляхом проведення пілотних випробувань, як запропонував Лак
і Рубін (1987), Джексон (1988) і де Во (1991). Мета
Пілотні тести повинні виявити всі незграбні, двозначні вирази
питання, які важко витлумачити, прояснити будь-які
визначень і термінів, що використовуються, і для визначення приблизного часу
необхідно заповнити анкету (Warwick and Lininger 1975,
Джексон 1988, Салант і Ділман 1994). Пілотні випробування були
здійснюється шляхом відбору предметів із схожими характеристиками
кінцевих предметів, як припустив Davis e Козенца (1993). В
У цьому дослідженні взяли участь шість спеціалістів із сховищ даних
обрані в якості пілотних предметів. Після кожного пілотного випробування вони є
внесено необхідні виправлення. З проведених пілотних випробувань, тобто
учасники допомогли змінити форму та скинути
остаточний варіант анкети.
3.4.7. Методи аналізу за Давати
I дані дослідження, зібраного із закритих анкет
були проаналізовані за допомогою пакета статистичного програмного забезпечення
називається SPSS. Багато відповідей було проаналізовано
використання описової статистики. Певна кількість анкет
вони повернулися неповними. Ці лікувалися більшою
увагу, щоб переконатися, що i дані пропали не один
наслідок помилок у введенні даних, але чому запитання не роблять
були придатними для декларанта, або декларант вирішив не підходити
відповісти на одне або кілька конкретних запитань. Ці відповіді
відсутні були проігноровані під час аналізу дані і вони були
кодується як «- 9», щоб гарантувати їх виключення з процесу
аналізи.
При підготовці анкети питання були закриті
попередньо закодований шляхом присвоєння номера кожному параметру. Кількість
потім його використовували для приготування і дані під час аналізу
(Denscombe 1998, Sapsford and Jupp 1996). Наприклад, були
шість варіантів, перерахованих у питанні 1 розділу B: порада
правління, старший керівник, ІТ відділ, од
бізнесу, консультантів тощо. У файлі дані SPSS, є
була створена змінна, яка вказує на «ініціатора проекту»,
із шістьма мітками значень: «1» для «ради директорів», «2»
для «виконавчої влади високого рівня» тощо. Використання шкали Лікертіна
в деяких закритих питаннях також дозволено
ідентифікація, яка не потребує зусиль з огляду на використання значень
відповідні номери, введені в SPSS. Для питань з
невичерпні відповіді, які не були взаємовиключними,
кожен варіант розглядався як одна змінна з двома
мітки значень: '1 ' для 'позначених' і '2 ' для 'непозначених'.
Відкриті запитання трактувалися інакше, ніж запитання
ЗАЧИНЕНО. Відповіді на ці запитання не надано
SPSS. Натомість їх аналізували вручну. Використання цього
Тип питань дозволяє отримати інформацію про ідеї
вільно висловлені та особисті переживання респондентів
(Bainbridge 1989, Denscombe 1998). Там, де це було можливо, це було зроблено
категоризація відповідей.
Для аналізу данівикористовуються прості методи статистичного аналізу,
такі як частота відповідей, середнє значення, стандартне відхилення
середнє значення та медіана (Argyrous 1996, Denscombe 1998).
Гамма-тест був ефективним для отримання кількісних вимірювань
асоціацій між дані порядкові (Norusis 1983, Argyrous 1996).
Ці тести були доцільними, оскільки використані порядкові шкали не підходили
вони мали багато категорій і могли бути показані в таблиці
(Norusis 1983).
3.5 Підсумок
У цьому розділі методологія дослідження та
конструкції, прийняті для цього дослідження.
Вибір найбільш підходящого методу дослідження для a
бере участь конкретне дослідження
врахування ряду правил, включаючи характер і тип
дослідження, а також переваги та недоліки кожного з можливих
метод (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987,
yin 1989, Hamilton and Ives 1992, Galliers 1992, Neuman 1994). Переглянути
відсутність існуючих знань і теорії про це
впровадження сховищ даних в Австралії, це дослідження
дослідження вимагає інтерпретаційного методу дослідження з навиком
дослідницький для вивчення досвіду організацій
Австралійський. Обраний метод дослідження було обрано для
збирати інформацію щодо прийняття концепції дати
складування австралійськими організаціями. А
Методом збору було обрано поштову анкету дані.
обґрунтування методу дослідження та техніки збору дані
вибрані будуть надані в цьому розділі. Також це було
представила дискусію про одиницю аналізу вибірку
використані, відсотки відповідей, зміст анкети, в
попереднє тестування анкети та метод аналізу дані.

Проектування a Інформаційне сховище:
Поєднання зв’язків сутностей і розмірного моделювання
РЕЗЮМЕ
Зберігання i дані Для багатьох це актуальна проблема
організацій. Ключова проблема розвитку
зберігання дані це його дизайн.
Дизайн повинен підтримувати виявлення концепцій у даних
склад до застарілої системи та інші джерела дані а також один
легке розуміння та ефективність реалізації даних
склад.
Значна частина зберігання літератури с дані рекомендує
використання моделювання зв’язків сутностей або розмірного моделювання для
представляють дизайн сховище даних.
У цій статті ми покажемо, як обидва
Уявлення можна об'єднати в один підхід для в
малювання сховище даних. Використовується системний підхід
розглядається в тематичному дослідженні та ідентифікується в ряді
важливі наслідки з професіоналами.
СКЛОЩИЩЕ ДАНИХ
Un сховище даних зазвичай визначається як «предметно-орієнтований,
інтегрований, змінний у часі та енергонезалежний збір даних для підтримки
управлінських рішень» (Інмон і Хакаторн, 1994).
Предметно-інтегроване вказує на те, що сховище даних è
призначений для перетинання функціональних меж застарілих систем для
пропонують інтегровану перспективу дані.
Варіант часу впливає на історичний або часовий характер дані in
un сховище даних, що дозволяє аналізувати тенденції.
Енергонезалежний вказує на те, що сховище даних це не безперервно
оновлено як a база даних OLTP. Скоріше оновлюється
періодично, с дані надходять із внутрішніх і зовнішніх джерел. The
сховище даних він спеціально розроблений для досліджень
а не для цілісності оновлень і продуктивності
операції.
Ідея зберігання i дані це не нове, це була одна з цілей
управління с дані з шістдесятих (The Martin, 1982).
I сховище даних вони пропонують інфраструктуру дані для управління
системи підтримки. Системи підтримки управління включають рішення
системи підтримки (СППР) та виконавчі інформаційні системи (ЕІС).
DSS — це комп’ютерна інформаційна система, яка є
призначений для покращення процесу та, як наслідок, зчеплення
людське рішення. EIS зазвичай є системою доставки
дані що дозволяє керівникам компаній легко отримати доступ до перегляду
з дані.
Загальна архітектура а сховище даних висвітлює роль
сховище даних в управлінській підтримці. На додаток до пропозиції
інфраструктура дані для EIS і DSS, ін сховище даних можливо
доступ до нього безпосередньо через запити. THE дані включені в дату
складу базуються на аналізі інформаційних вимог
управління та отримані з трьох джерел: внутрішні застарілі системи,
системи збору даних спеціального призначення та зовнішні джерела даних. THE
дані у внутрішніх застарілих системах вони часто зайві,
непослідовні, низької якості та зберігаються в різних форматах
тому їх потрібно звірити та очистити, перш ніж ви зможете завантажити їх у
сховище даних (Inmon, 1992; McFadden, 1996). THE дані від
від систем зберігання дані ad hoc і з джерел дані
зовнішні часто використовуються для доповнення (оновлення, заміни) i
дані із застарілих систем.
Є багато вагомих причин для розвитку a сховище даних,
які включають прийняття кращих рішень шляхом використання
ефективне більше інформації (Ives 1995), підтримка фокусу
на повний бізнес (Graham 1996) і зниження витрат
забезпечення дані для EIS і DSS (Graham 1996, McFadden
1996).
Нещодавнє емпіричне дослідження виявило в середньому повернення
інвестиції для i сховище даних на 401% через три роки (Грем,
1996). Однак інші емпіричні дослідження сховище даних мають
виявлено значні проблеми, включаючи труднощі з вимірюванням ed
присвоєння благ, відсутність чіткої мети, недооцінка її
призначення та складність процесу зберігання i данів
особливо щодо джерел і чистоти дані.
Зберігання i дані можна розглядати як рішення
до проблеми управління в дані між організаціями. там
маніпуляції з дані як соціальний ресурс він залишився одним із
ключові проблеми в управлінні інформаційними системами в усьому
у світі протягом багатьох років (Brancheau та ін. 1996, Galliers та ін. 1994,
Нідерман та ін. 1990, Перван 1993).
Популярний підхід до управління дані у вісімдесятих було
розробка моделі дані соціальні. Модель дані соціальний був
розроблений, щоб запропонувати стабільну основу для розробки нових систем
програми e база даних а також відновлення та інтеграція спадщини
системи (Brancheau та ін.
1989, Goodhue та ін. 1988:1992, Кім і Еверест 1994).
Однак у цьому підході є багато проблем
Зокрема, складність і вартість кожного завдання, а також тривалий час
вимагає відчутних результатів (Beynon-Davies 1994, Earl
1993, Goodhue та ін. 1992, Періасамі 1994, Шанкс 1997).
Il сховище даних це окрема база даних, яка існує разом із застарілими
баз даних, а не замінювати їх. Тому це дозволяє вам
керувати управлінням дані і уникнути дорогої реконструкції
застарілих систем.
ІСНУЮЧІ ПІДХОДИ ДО ПРОЕКТУВАННЯ ДАНИХ
WAREHOUSE
Процес побудови та вдосконалення a сховище даних
слід розуміти більше як еволюційний процес, а не як
життєвий цикл розробки традиційних систем (Дезіо, 1995, Шенкс,
О'Доннелл і Арнотт 1997a ). У a
проект о сховище даних такі як ініціалізація, планування;
інформація, отримана з вимог, поставлених керівникам компанії;
джерела, перетворення, очищення о дані і синхронізація зі спадщини
систем та інших джерел о дані; системи доставки в розробці;
моніторинг сховище даних; і безглуздість процесу
еволюційна та конструкція a сховище даних (Смердюче, О'Доннелл
і Арнотт 1997b). У цьому журналі ми зосереджуємося на тому, як
малювати я дані зберігаються в контексті цих інших процесів.
Існує ряд підходів, запропонованих для архітектури даних
склад у літературі (Інмон 1994, Айвз 1995, Кімбол 1994
Макфадден 1996). Кожна з цих методологій має короткий опис
огляд з аналізом їх сильних і слабких сторін.
Підхід Інмона (1994). Інформаційне сховище
дизайн
Інмон (1994) запропонував чотири ітераційні кроки для отримання даних
склад (див. рис. 2). Першим кроком є ​​розробка шаблону
дані соціальні, щоб зрозуміти, як я дані можна інтегрувати
між функціональними сферами всередині організації
ділення i дані зберігати в районах. Модель дані це створено для
зберігати дані що стосуються прийняття рішень, в т.ч дані
істориків, і вкл дані вираховується та агрегується. Другий крок
визначити тематику для впровадження. Ці засновані
за пріоритетами, визначеними конкретною організацією. Третій
етап передбачає малювання a база даних для предметної області, поз
зверніть особливу увагу на відповідні рівні деталізації.
Inmon рекомендує використовувати модель сутностей і зв’язків. Четверте
крок полягає в ідентифікації вихідних систем дані потрібно і розвивати
процеси перетворення для захоплення, очищення та форматування i дані.
Сильні сторони підходу Інмона полягають у тому, що модель дані соціальний
пропонує основу для інтеграції дані всередині організації
і підтримка планування для ітеративної розробки даних
склад. Його недоліки - складність і вартість малювання
модель дані соціальні, труднощі в розумінні моделей сутностей і
відносини, що використовуються в обох моделях, що дані соціальна та о дані
зберігаються за предметними областями та відповідність дані Дель
малювання сховище даних для реалізації база даних
реляційний, але не для база даних багатовимірний.
Айвз (1995) Підхід до Інформаційне сховище
дизайн
Айвз (1995) пропонує чотириетапний підхід до розробки a
інформаційну систему, яку він вважає придатною для розробки даних
склад (див. рис. 3). Підхід дуже заснований на
Інформаційна інженерія для розробки інформаційних систем
(Мартін 1990). Перший крок – визначити цілі, фактори
критичні та успішні та ключові показники ефективності. THE
ключові бізнес-процеси та необхідна інформація
змодельований, щоб привести нас до моделі дані соціальні. Другий крок
передбачає розробку визначальної архітектури дані
зберігається за областями, база даних di сховище даних, компоненти
техніки, які необхідні, набір організаційного забезпечення
необхідні для впровадження та роботи сховище даних. Третій
крок включає вибір необхідних пакетів програмного забезпечення та інструментів.
Четвертий крок – детальне проектування та будівництво
сховище даних. Айвз зазначає, що зберігання дані він зв'язаний чоловік
ітераційний процес.
Сильна сторона підходу Айвза полягає у використанні спеціальних методів для
визначення вимог до інформації, використання структурованої
процес підтримки інтеграції сховище даних,
відповідний вибір апаратного та програмного забезпечення та використання кількох
техніки репрезентації для сховище даних. Його недоліки
їм притаманна складність. Інші включають труднощі в
розвивати багато рівнів база даних в межах сховище даних in
розумні терміни та витрати.
Підхід Кімболла (1994). Інформаційне сховище
дизайн
Кімбол (1994) запропонував п'ять ітераційних кроків для отримання даних
склад (див. рис. 4). Його підхід особливий
присвячений дизайну лише одного сховище даних і про використання моделей
розмірності надають перевагу моделям сутностей і зв’язків. Кімбол
проаналізуйте ці розмірні моделі, тому що мені їх легше зрозуміти
бізнес-менеджери угод, це ефективніше під час угод
комплексні консультації та проектування база даних фізичне більше
ефективним (Kimball 1994). Кімбол визнає, що розвиток a
сховище даних це повторюється, і це сховище даних розділені вони можуть
інтегрувати через поділ на таблиці розмірів
поширений.
Першим кроком є ​​визначення конкретної предметної області
вдосконалений. Другий і третій кроки стосуються формування
габаритний. На другому кроці вимірювання ідентифікують речі
інтерес до предметної області та згруповані в таблицю фактів.
Наприклад, у предметній області продажів показники інтересу
може включати кількість проданих товарів і долар
як валюта продажу. Третій крок передбачає ідентифікацію
розміри, які є способами їх групування i
факти. У сфері продажу відповідні розміри
може включати предмет, місцезнаходження та період часу. там
Таблиця фактів має багатокомпонентний ключ для посилання на кожну
таблиць розмірів і зазвичай містить дуже багато
повний фактів. Навпаки, таблиці розмірів містять
описова інформація про розміри та інші атрибути, які
можна використовувати для групування фактів. Таблиця фактів e
розміри, пов'язані з пропозицією, утворюють те, що називається одним
зірчастий візерунок завдяки своїй формі. Четвертий крок передбачає
будівництво a база даних багатовимірний, щоб удосконалити його
зірчастий візерунок. Останнім кроком є ​​ідентифікація вихідних систем дані
необхідні та розвивати процеси трансформації для придбання, очищення
і формат i дані.
Сильні сторони підходу Кімболла включають використання моделей
мірний для представлення i дані зберігаються, що роблять це
легко зрозуміти та веде до ефективного фізичного проектування. А
розмірну модель, яка також легко використовує обидва
систем база даних реляційні можуть бути вдосконалені або системи
база даних багатовимірний. До її недоліків відноситься відсутність
деяких методів для полегшення планування або інтеграції
багато візерунків зірок в одному сховище даних і
труднощі в проектуванні з крайньої денормализованої структури в a
розмірна модель a дані у застарілій системі.
Підхід Макфаддена (1996) до даних
Дизайн складів
Макфадден (1996) пропонує п'ятиетапний підхід
малювати а сховище даних (див. Малюнок 5).
Його підхід заснований на синтезі ідей з літератури
і орієнтована на дизайн лише одного сховище даних. Перший
крок передбачає аналіз вимог. Хоча конкретика
техніки не встановлені, нотатки Макфаддена ідентифікують
сутність дані специфікації та їхні атрибути, а також стосується читачів Watson
і Фролік (1993) щодо запису вимог.
На другому кроці розробляється модель відносин сутності
сховище даних а потім підтверджено керівниками підприємств. Третій
крок включає визначення відображення із застарілої системи
і зовнішні джерела сховище даних. Четвертий крок передбачає
процеси розробки, розгортання та синхронізації дані нель
сховище даних. На останньому етапі система поставляється
розроблено з особливим акцентом на інтерфейс користувача.
Макфедден зазначає, що процес малювання, як правило, є
ітеративний.
Сильні сторони підходу Макфаддена вказують на участь
керівниками підприємств у визначенні вимог, а також
важливість ресурсів дані, їх очищення та збір. її
недоліки стосуються відсутності процесу поділу a
чудовий проект від сховище даних у багатьох інтегрованих етапах, і
труднощі з розумінням моделей сутностей і зв’язків, які використовуються при проектуванні
сховище даних.

    0/5 (0 відгуків)
    0/5 (0 відгуків)
    0/5 (0 відгуків)

    Дізнайтеся більше в Online Web Agency

    Підпишіться на отримання останніх статей електронною поштою.

    аватар автора
    адмін CEO
    👍Інтернет-агентство | Експерт веб-агенції з цифрового маркетингу та SEO. Web Agency Online — це веб-агентство. Успіх Agenzia Web Online у ​​цифровій трансформації базується на засадах Iron SEO версії 3. Спеціалізації: системна інтеграція, інтеграція корпоративних додатків, сервіс-орієнтована архітектура, хмарні обчислення, сховище даних, бізнес-аналітика, великі дані, портали, інтранети, веб-додатки Проектування та управління реляційними та багатовимірними базами даних Проектування інтерфейсів для цифрових медіа: зручність використання та графіка. Інтернет-веб-агентство пропонує компаніям такі послуги: -SEO на Google, Amazon, Bing, Yandex; -Веб-аналітика: Google Analytics, Google Tag Manager, Yandex Metrica; -Конверсії користувачів: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM на Google, Bing, Amazon Ads; -Маркетинг у соціальних мережах (Facebook, Linkedin, Youtube, Instagram).
    Моя конфіденційність Agile
    Цей сайт використовує технічні та профілюючі файли cookie. Натиснувши «Прийняти», ви дозволяєте всі файли cookie для профілювання. Якщо натиснути «Відхилити» або «X», усі файли cookie профілювання буде відхилено. Натиснувши на налаштування, можна вибрати, які файли cookie для профілювання активувати.
    Цей сайт відповідає Закону про захист даних (LPD), Федеральному закону Швейцарії від 25 вересня 2020 року та GDPR, Регламенту ЄС 2016/679, що стосується захисту персональних даних, а також вільного переміщення таких даних.