fbpx

Хранилище данных и ERP | ЦЕНТРАЛЬНЫЙ АРХИВ ДАННЫХ: ИСТОРИЯ И ЭВОЛЮЦИЯ

Архив ДАННЫЕ ЦЕНТРАЛЬНЫЙ: ИСТОРИЯ И ЭВОЛЮЦИЯ


Две доминирующие темы корпоративных технологий в 90-е годы:
заявляет я информационное хранилище и ЭРП. Долгое время эти два могучих
течения были частью корпоративных ИТ, никогда не
перекрестки. Как будто они были материей и антиматерией. Но
рост обоих явлений неизбежно вел к одному
их пересечение. Сегодня компании сталкиваются с проблемой
что делать с ERP e информационное хранилище. Эта статья проиллюстрирует
какие проблемы и как они решаются компаниями.
В НАЧАЛЕ…
В начале была информационное хранилище. Хранилище данных был рожден для
противодействовать прикладной системе обработки транзакций.
В первые дни запоминание дать она должна была быть
просто контрапункт приложениям для обработки электронной почты
транзакции. Но в наши дни есть гораздо более изощренные видения
что можно сделать информационное хранилище. В современном мире
информационное хранилище встраивается в структуру, которая может быть
под названием «Фабрика корпоративной информации».
ФАБРИКА КОРПОРАТИВНОЙ ИНФОРМАЦИИ
(СИФ)
Фабрика корпоративной информации имеет архитектурные компоненты
стандартный: уровень трансформации и интеграции кода
который объединяет я дать тогда как i дать они перемещаются из среды
приложение к окружающей среде информационное хранилище компании; а
информационное хранилище компании, где находится дать
подробные и комплексные историки. информационное хранилище компании выступает в качестве
фундамент, на котором могут быть построены все остальные части
окружающей среды информационное хранилище; хранилище оперативных данных (ODS).
ODS представляет собой гибридную структуру, которая содержит некоторые аспекты данных.
хранилище и другие аспекты среды OLTP; витрины данных, где я
разные отделы могут иметь свою версию данных
склад; а информационное хранилище разведки, в которой я
компании «философы» (мыслители) могут представить свои запросы
72 часа без вредного воздействия на информационное хранилище; и память
ближняя линия, в которой дать старый и дать объемные детали могут быть
хранится дешево.
ГДЕ ERP СОЧЕТАЕТСЯ С
ФАБРИКА КОРПОРАТИВНОЙ ИНФОРМАЦИИ
ERP объединяется с Фабрикой корпоративной информации в двух местах.
В первую очередь в качестве базового приложения, которое обеспечивает i
дать заявки на информационное хранилище, В этом случае i дать,
генерируются как побочный продукт процесса транзакции,
интегрируются и загружаются в информационное хранилище компании.
вторая точка соединения между ERP и CIF и ODS. На самом деле многие
средах ERP используется как классическая ODS.
Если ERP используется в качестве основного приложения,
ту же ERP можно также использовать в CIF в качестве ODS. В
однако, если ERP будет использоваться в обеих ролях,
должно быть четкое различие между двумя сущностями. Другими словами,
когда ERP играет роль базового приложения и ODS, т.е.
необходимо различать два архитектурных объекта. Если один
внедрение ERP пытается выполнить обе роли
в то же время неизбежно возникнут проблемы в
проектирование и реализация этой структуры.
ОТДЕЛЬНЫЕ ODS И ОСНОВНЫЕ ПРИМЕНЕНИЯ
Есть много причин, которые приводят к разделению компонентов
архитектурный. Пожалуй, самый красноречивый вопрос, чтобы отделить
различных компонентов архитектуры заключается в том, что каждый компонент
архитектуры имеет свой собственный взгляд. Базовое приложение служит
для другой цели, чем у ODS. Попробуйте перекрыть
базовое представление приложения о мире ODS или наоборот
это неправильный способ работы.
Следовательно, первая проблема ERP в CIF заключается в том, что
проверьте, есть ли разница между базовыми приложениями и
ОРВ.
МОДЕЛИ ДАННЫХ В КОРПОРАТИВНОЙ
ИНФОРМАЦИОННАЯ ФАБРИКА
Для достижения сплоченности между различными компонентами
архитектуры CIF должна существовать модель дать.
модели дать они служат связующим звеном между различными компонентами
такой архитектуры, как базовые приложения и ODS. НАШИ
модели дать стать «интеллектуальной дорожной картой» для
правильное значение различных архитектурных компонентов CIF.
Идя рука об руку с этим понятием, идея состоит в том, что должны
быть великой и уникальной моделью дать. Конечно, он должен
быть образцом дать для каждого из компонентов и, кроме того, существует
это должен быть разумный путь, соединяющий разные модели.
Каждый компонент архитектуры — ODS, базовые приложения,
информационное хранилище компании и т.д.. – нужен собственный
модель дать. Поэтому должно быть точное определение
как и эти модели дать они взаимодействуют друг с другом.
ДВИГАТЬСЯ Я ДАННЫЕ ERP В ДАННЫХ
СКЛАД
Если происхождение дать является базовым приложением и/или ODS, когда
ERP вставляет я дать в информационное хранилище, эта запись должна
происходят на самом низком уровне детализации. Резюме или
просто объединить я дать как они выходят
из базового приложения ERP или ERP ODS отсутствует
правильное дело. НАШИ дать подробности нужны в данных
склад, чтобы сформировать основу процесса DSS. Такой дать
они будут во многом изменены витринами данных и исследованиями
из информационное хранилище.
Перемещение дать из базовой среды приложения
ERP в среду информационное хранилище компании осуществляется в
достаточно расслабленным способом. Этот сдвиг происходит после этого
около 24 часов с момента обновления или создания в ERP. Факт
обладают «ленивым» движением дать в информационное хранилище
компании позволяет дать поступающие из ERP для «урегулирования».
Однажды я дать депонируются в базовом приложении,
то вы можете смело двигаться я дать ERP
на предприятии. Еще одна цель, которую можно достичь благодаря движению
«ленивые» боги дать четкое разграничение между операционными процессами и
Расширение ДС. При «быстром» движении дать демаркационная линия
между DSS и операционным остается неясным.
Движение дать из ODS ERP в информационное хранилище
компании делается периодически, обычно
еженедельно или ежемесячно. В этом случае движение
дать она основана на необходимости «чистить» старые дать историки.
Естественно, ODS содержит i дать которые намного позже
по сравнению с дать историки нашли в информационное хранилище.
Перемещение дать в информационное хранилище это почти никогда не делается
«оптом» (оптовым способом). Скопируйте таблицу
из среды ERP в информационное хранилище это не имеет смысла. Один подход
гораздо более реалистичным является движение отдельных отрядов дать.
Только я дать которые изменились с момента последнего обновления данных
хранилища - это те, которые должны быть перемещены в данные
склад. Один из способов узнать, какие дать они были изменены
с момента последнего обновления нужно посмотреть временные метки дать
находится в среде ERP. Дизайнер выбирает все изменения
которые возникли с момента последнего обновления. Другой подход
заключается в использовании методов захвата изменений дать, с
эти методы анализируют журналы и журнальные ленты, чтобы
определить, какие дать должны быть перемещены из среды ERP в
Что из информационное хранилище. Эти техники лучше всего
как журналы и журнальные ленты могут быть прочитаны из файлов ERP
без дальнейшего воздействия на другие ресурсы ERP.
ДРУГИЕ ОСЛОЖНЕНИЯ
Одна из проблем с ERP в CIF заключается в том, что происходит с другими
исходники приложения или ИИ дать ОРВ, которые они должны внести
информационное хранилище но они не являются частью среды ERP. Дата
закрытый характер ERP, особенно SAP, попытка интегрировать
ключи из внешних источников дать с дать которые приходят из ERP al
время двигаться я дать в информационное хранилище, это большая проблема.
И какова вероятность того, что я дать приложений или
ODS за пределами среды ERP будут интегрированы в данные
склад? Шансы на самом деле очень высоки.
НАХОДИТЬ ДАННЫЕ ИСТОРИЯ ОТ ERP
Еще одна проблема со мной дать ERP является результирующим
от необходимости иметь дать историки в информационное хранилище.
Обычно информационное хранилище ему нужно дать историки. И
Технология ERP обычно не хранит эти дать
исторический, по крайней мере, не в той мере, в какой это необходимо в дате
склад. Когда большое количество дать историки начинают объявление
для добавления в среду ERP эта среда должна быть
очищен. Например, предположим, информационное хранилище должен
быть загруженным пятью годами дать исторический, в то время как ERP придерживается
максимум шесть месяцев из них дать. пока компания довольна
собрать серию дать история, как время идет,
тогда нет проблем с использованием ERP в качестве источника для
информационное хранилище. Но когда информационное хранилище должен идти
вернуться в прошлое и взять богов дать историки, которых не было
ранее собранные и сохраненные ERP, затем среда ERP
он становится неэффективным.
ERP-система и метаданные
Еще одно соображение, касающееся ERP e информационное хранилище это то, что
на существующие метаданные в среде ERP. А также метаданные
они переходят из среды ERP в среду del информационное хранилище, то
метаданные должны быть перемещены таким же образом. Кроме того, я
метаданные должны быть преобразованы по формату и структуре
этого требует инфраструктура информационное хранилище. есть большой
разница между операционными метаданными и метаданными DSS. Метаданные
в основном для разработчика и для
программист. Метаданные DSS в первую очередь для вас
финал. Существующие метаданные в приложениях ERP или ODS
они должны быть преобразованы, и это преобразование не всегда легко
и прямой.
ПОЛУЧЕНИЕ ДАННЫХ ERP
Если ERP используется в качестве поставщика дать для информационное хранилище ci
должен быть надежный интерфейс, который перемещает i дать dall'ambiente
ERP для окружающей среды информационное хранилище. Интерфейс должен:
▪ быть простым в использовании
▪ разрешить доступ к дать ERP
▪ подобрать значение дать которые собираются переместить
в информационное хранилище
▪ знать ограничения ERP, которые могут возникнуть в
момент, когда осуществляется доступ дать из ERP:
▪ ссылочная целостность
▪ иерархические отношения
▪ неявные логические отношения
▪ соглашение о применении
▪ все структуры дать поддерживается ERP и так далее…
▪ быть эффективным в доступе дать, предоставляя:
▪ прямое движение дать
▪ получение сдачи дать
▪ поддерживать своевременный доступ к дать
▪ понимать формат дать, и так далее…
ИНТЕРФЕЙС С SAP
Интерфейс может быть двух типов, доморощенный или коммерческий.
Некоторые из основных коммерческих интерфейсов включают в себя:
▪ САС
▪ Основные решения
▪ D2k и так далее…
НЕСКОЛЬКО ТЕХНОЛОГИЙ ERP
Отношение к среде ERP как к единой технологии
большая ошибка. Существует множество технологий ERP, каждая из которых имеет свои особенности.
сильные стороны. Наиболее известные производители на рынке:
▪ САП
▪ Оракл Финансы
▪ ПиплСофт
Джей Ди Эдвардс
▪ Баанс
SAP
SAP — крупнейшее и наиболее полное программное обеспечение ERP. Приложения
SAP охватывают множество типов приложений во многих областях. SAP имеет
репутация:
▪ очень большой
▪ очень сложно и дорого реализовать
▪ нуждается в большом количестве людей и консультантов,
реализованы
▪ нужны специализированные люди для реализации
▪ требуется много времени для реализации
Также SAP славится тем, что хранит свои дать очень
тщательно, что затрудняет доступ к ним
человек за пределами зоны SAP. Сила SAP заключается в том, чтобы быть
возможность захвата и хранения большого количества дать.
Недавно SAP объявила о своем намерении расширить
его приложения к информационное хранилище. Есть много плюсов и минусов
в использовании SAP в качестве поставщика информационное хранилище.
Преимущество заключается в том, что SAP уже установлен и что большинство
консультанты уже знают SAP.
Недостатки использования SAP в качестве поставщика информационное хранилище соно
много: SAP не имеет опыта в мире информационное хранилище
Если SAP является поставщиком информационное хранилище, надо "вынуть"
i дать из САП в информационное хранилище. Данный послужной список SAP
закрытая система, вряд ли будет легко получить i из SAP в
это (???). Существует множество устаревших сред, поддерживающих SAP,
такие как IMS, VSAM, ADABAS, ORACLE, DB2 и т.д.
SAP настаивает на подходе «изобретено не здесь». САП не хочет
сотрудничать с другими поставщиками для использования или создания информационное хранилище.
SAP настаивает на том, чтобы самостоятельно создавать все свое собственное программное обеспечение.
Хотя SAP — крупная и мощная компания, факт
попытка переписать технологии ELT, OLAP, администрирования
система и даже кодовая база СУБД это просто безумие.
Вместо принятия отношения сотрудничества с поставщиками
di информационное хранилище SAP уже давно придерживается подхода, который
они «знают лучше». Такое отношение сдерживает успех, который
SAP может иметь в области информационное хранилище.
Отказ SAP разрешить доступ внешним поставщикам
быстро и изящно к ним дать. Сама суть использования
un информационное хранилище легкий доступ к дать. Вся история SAP
на основе затруднения доступа дать.
Отсутствие у SAP опыта работы с большими объемами дать;
в области информационное хранилище есть объемы дать никогда не видел с тех пор
SAP и управлять этими большими объемами дать у тебя должен быть один
подходящая технология. SAP видимо не знает об этом
технологический барьер, который существует для входа в поле данных
склад.
Корпоративная культура SAP: SAP создал бизнес
в получении я дать из системы. Но для этого нужно иметь
другое мышление. Традиционно компании-разработчики программного обеспечения,
хороши в получении данных в среде, не были хороши в
получение данных, чтобы пойти другим путем. Если SAP может сделать это
Switch будет первой компанией, которая сделает это.
Короче говоря, сомнительно, должна ли компания выбирать
SAP как поставщик информационное хранилище. Есть очень серьезные риски
с одной стороны и очень мало наград с другой. Но есть еще один
причина, препятствующая выбору SAP в качестве поставщика данных
склад. Потому что у каждой компании должна быть одна и та же дата
склад всех остальных компаний? информационное хранилище это сердце
конкурентного преимущества. Если бы каждая компания приняла одно и то же
информационное хранилище было бы трудно, хотя и не невозможно,
добиться конкурентного преимущества. SAP, похоже, считает, что
информационное хранилище можно рассматривать как печенье, и это
еще один признак того, что они «получают данные
в".
Ни один другой поставщик ERP не занимает такого доминирующего положения, как SAP.
Несомненно, найдутся компании, которые пойдут по пути SAP.
для их информационное хранилище но предположительно эти даты
Склады SAP будут большими, дорогими и требуют много
время их создания.
Эти среды включают в себя такие действия, как обработка кассира банка,
процессы бронирования авиабилетов, процессы подачи жалоб
страховка и так далее. Система транзакций стала более эффективной,
более очевидной была необходимость разделения операционных и технологических процессов.
DSS (система поддержки принятия решений). Однако с ресурсными системами
человеческого и личного, никто никогда не сталкивался с большими объемами
транзакции. И, конечно же, когда человека нанимают
или выйти из компании это запись сделки.
Но по отношению к другим системам, системам управления персоналом и
у личных просто не так много транзакций. Следовательно, в
человеческих ресурсов и кадровых систем не совсем очевидно, что существует
нужно хранилище данных. Во многом эти системы
представляют собой унификацию систем DSS.
Но есть еще один фактор, который необходимо учитывать, если вам нужно
сделать с хранилищем данных и с PeopleSoft. Во многих кругах я дать
HR и личные ресурсы вторичны по отношению к бизнесу
Руководитель компании. Большинство компаний выполняют
производство, продажа, предоставление услуг и так далее. НАШИ
Кадровые и кадровые системы обычно вторичны (или второстепенны).
поддержки) к основному направлению деятельности компании. Следовательно, это
двусмысленный и неудобный a информационное хранилище отдельно для
поддержка человеческих и личных ресурсов.
В этом отношении PeopleSoft сильно отличается от SAP. С SAP это
обязательно наличие информационное хранилище. С PeopleSoft это не
тогда и так понятно. Хранилище данных является необязательным для PeopleSoft.
Лучшее, что можно сказать о дать PeopleSoft заключается в том, что данные
склад можно использовать для хранения я дать связанных с
старые человеческие и личные ресурсы. Вторая причина для
который компания хотела бы использовать информационное хранилище a
недостатком среды PeopleSoft является возможность доступа и
бесплатный доступ к инструментам анализа, ИИ дать от PeopleSoft. Но
Помимо этих причин, могут быть случаи, когда предпочтительнее не
иметь хранилище данных для дать ЛюдиСофт.
В итоге
Существует много идей относительно построения данных.
склад в программном обеспечении ERP.
Вот некоторые из них:
▪ Имеет смысл иметь информационное хранилище который выглядит как любой
еще в отрасли?
▪ Насколько гибкой является ERP информационное хранилище Программное обеспечение?
▪ ERP информационное хранилище программное обеспечение может обрабатывать объем
дать который находится винформационное хранилище арена"?
▪ Какая трассировка ведется поставщиком ERP?
столкнулся с простым и недорогим, трудоемким, ИИ дать? (что
является послужным списком поставщиков ERP по доставке недорогих, на
время, легко получить доступ к данным?)
▪ Каково понимание архитектуры DSS и
"фабрика корпоративной информации" поставщика ERP?
▪ Поставщики ERP понимают, как получить дать в
среды, но и понять, как их экспортировать?
▪ Насколько открыт поставщик ERP для инструментов обработки данных
складирование?
Все эти соображения необходимо учитывать при определении
куда поставить информационное хранилище который будет принимать меня дать ERP и др.
дать. Как правило, если нет веской причины
в противном случае рекомендуется построить информационное хранилище из
из среды поставщика ERP.
КАПИТОЛО 1
Обзор организации BI
Ключевые моменты:
Информационные хранилища работают наоборот
к архитектуре бизнес-аналитики (BI):
Корпоративная культура и ИТ могут ограничить успех в
создание BI-организаций.
Технология больше не является ограничивающим фактором для организаций BI.
проблема для архитекторов и проектировщиков заключается не в том,
технология существует, но если они могут эффективно реализовать
доступная технология.
Для многих компаний информационное хранилище это не более чем залог
пассивный кто распространяет я дать пользователям, которым это необходимо. НАШИ дать
они извлекаются из исходных систем и заносятся в целевые структуры
di информационное хранилище. дать их также можно чистить целиком
удача. Однако никакой дополнительной ценности также не добавляется.
собрано дать во время этого процесса.
По сути, пассивный Dw в лучшем случае обеспечивает
только я дать чистым и оперативным для пользовательских ассоциаций. Там
создание информации и аналитическое понимание зависят
полностью пользователями. Судя по тому, является ли DW (Хранилище данных) либо
успех субъективен. Если судить об успехе по
способность эффективно собирать, интегрировать и очищать дать
корпоративный на предсказуемой основе, то да, DW это успех.
С другой стороны, если мы посмотрим на сбор, консолидацию и т.д.
использование информации организацией в целом, а затем
ДВ - провал. Хранилище данных практически не имеет ценности
информация. В результате пользователи вынуждены обходиться,
тем самым создавая бункеры информации. В этой главе представлены
комплексный обзор архитектуры BI (Business
Интеллект) компаний. Начнем с описания BI и
затем мы перейдем к обсуждению дизайна и
разработка информации, а не просто предоставление дать
пользователям. Затем обсуждение сосредоточится на расчете
ценность ваших усилий в области BI. В заключение мы определим, как IBM
напоминает требования вашей организации к архитектуре бизнес-аналитики.
Описание архитектуры
BI-организация
Мощные транзакционно-ориентированные информационные системы сейчас
на повестке дня каждого крупного предприятия, поскольку они выравнивают
фактически игровое поле для корпораций в мире.
Однако, чтобы оставаться конкурентоспособными, теперь требуются аналитические системы.
ориентированный на то, что может произвести революцию в возможностях компании, заново открыв для себя
используя уже имеющуюся у них информацию. Эти системы
аналитические вытекают из понимания из богатства дать
доступный. BI может повысить производительность по всей информации
предприятия. Компании могут улучшить отношения между клиентами
поставщиков, повышать прибыльность продуктов и услуг, генерировать
новые и лучшие предложения, проверить риск и среди многих других
доходы резко сокращают расходы. С BI ваш
компания, наконец, начинает использовать информацию о клиентах
в качестве конкурентного актива благодаря приложениям, которые имеют цели
рынок.
Иметь правильные средства ведения бизнеса означает иметь четкие ответы на
ключевые вопросы, такие как:
▪ Кто из наших клиентов они заставляют нас зарабатывать больше, или там
они проигрывают?
▪ Где живут наши лучшие клиентов в отношении магазин/
склад они частые?
▪ Какие из наших продуктов и услуг могут быть проданы больше
эффективно и кому?
▪ Какие продукты можно продавать наиболее эффективно и кому?
▪ Какая кампания по продажам более успешна и почему?
▪ Какие каналы продаж для каких продуктов наиболее эффективны?
▪ Как мы можем улучшить отношения с нашими лучшими клиентов?
Большинство компаний имеют дать грубо ответить
эти вопросы.
Операционные системы генерируют большое количество продукта,
клиент и дать рынка из точек продаж, из резерваций,
от системы обслуживания клиентов и технической поддержки. Задача
извлечь и использовать эту информацию.
Многие компании получают прибыль только от небольшой части своей дать
для стратегического анализа.
I дать остальные, часто в сочетании с i дать получение внешних источников, таких как i
«правительственные отчеты» и другая купленная информация являются одним из
золотой рудник просто ждет, чтобы его исследовали, ei дать должен
уточняйте только в информационном контексте вашего
организация.
Эти знания можно применять разными способами, вариациями.
от разработки общей корпоративной стратегии до
личное общение с поставщиками, через call-центры,
выставление счетов, Интернет и другие моменты. Современная бизнес-среда диктует
что Хранилище данных и связанные с ним решения бизнес-аналитики развиваются дальше
выполнение традиционных конструкций из дать который я дать нормализовано до
атомарного уровня и «звездные/кубические фермы».
Чтобы оставаться конкурентоспособными, необходимо слияние
традиционные и передовые технологии в попытке поддержать
огромный аналитический ландшафт.
Наконец, общая среда должна улучшать знания
предприятия в целом, гарантируя, что предпринимаемые действия
как следствие проведенных анализов они пригодятся чтобы всем было
выгода.
Например, допустим, вы классифицируете свои клиентов в категориях
высокий или низкий риск.
Генерируется ли эта информация моделью майнинга или
другими способами, его необходимо поместить в Dw и сделать доступным для
любой, с помощью любых средств доступа, таких как я
статические отчеты, электронные таблицы, таблицы или аналитическая обработка в
линия (OLAP).
Однако в настоящее время много информации такого рода
они остаются в силосах дать отдельных лиц или отделов, которые они создают
Анализ. Организация в целом мало или совсем не видна
для понимания. Только путем смешивания этого типа контента
информации на вашем предприятии dw вы можете устранить разрозненность
информацию и поднять вашу среду Dw.
Есть два основных препятствия на пути развития организации.
из БИ.
Во-первых, у нас есть проблема самой организации.
родственной дисциплины.
Даже если мы не можем помочь с изменением политики
организации, мы можем помочь понять компоненты
BI-организация, ее архитектура и способы
Технология IBM облегчает его развитие.
Второй барьер, который необходимо преодолеть, — это отсутствие технологий.
комплексное и знание метода, вызывающего все пространство
BI, а не только небольшой компонент.
IBM реагирует на изменения в технологиях
интегрированных. Вы несете ответственность за предоставление дизайна
осознанный. Эта архитектура должна быть разработана с
технология, выбранная для интеграции без ограничений или, по крайней мере, с
технология, которая придерживается открытых стандартов. Кроме того, ваш
руководство компании должно обеспечить, чтобы предприятие Би
осуществляется по программе и не допускать ее
развитие информационных бункеров, которые происходят из корыстных
повестки дня или цели.
Это не означает, что среда BI не чувствительна к
реагировать на разные потребности и требования разных пользователей; вместо этого это означает
что реализация этих индивидуальных потребностей и потребностей
делается на благо всей организации BI.
Описание архитектуры BI организации может
можно найти на стр. 9 на рисунке 1.1 Архитектура демонстрирует
богатое сочетание технологий и приемов.
С традиционной точки зрения, архитектура включает в себя следующие компоненты
склада
Атомный слой (Atomic Layer).
Это основа, сердце всего Дв и, следовательно,
стратегическая отчетность.
I дать хранящиеся здесь сохранят историческую целостность, отчеты о
дать и включать производную метрику, а также быть чистым,
интегрированы и хранятся с использованием шаблонов майнинга.
Все последующее использование этих дать и соответствующая информация
производные от этой структуры. Это отличный источник для
извлечение дать и для отчетов со структурированными запросами SQL
Оперативный склад дать или сообщить на основе
дать(Хранилище оперативных данных (ODS) или отчетность
база данных.)
Это структура дать специально разработан для
техническая отчетность.
I дать хранящиеся и сообщаемые выше, эти структуры могут, наконец,
распространяться на склад через промежуточную зону (промежуточная
области), где его можно было бы использовать для стратегической сигнализации.
Плацдарм.
Первая остановка для большинства дать предназначен для окружающей среды
склад - зона организации.
Здесь я дать интегрируются, очищаются и превращаются в дать полезно, что
они будут заполнять структуру склада
Витрины свиданий.
Эта часть архитектуры представляет структуру дать usata
специально для OLAP. Наличие витрин данных, если я дать соно
хранятся в звездных схемах, которые они накладывают дать
многомерный в реляционной среде или в картотеке
di дать собственность, используемая конкретной технологией OLAP, такой как
Сервер OLAP DB2, это не имеет значения.
Единственным ограничением является то, что архитектура облегчает использование дать
многомерный.
Архитектура также включает критически важные технологии и методы Bi.
которые различают как:
Пространственный анализ
Космос — это информационная находка для аналитика и
это критично для полного разрешения. Космос может
представляют информацию о людях, проживающих в определенной
местоположение, а также информацию о том, где это место находится
физически по сравнению с остальным миром.
Для проведения этого анализа необходимо начать с привязывания своего
информация о координатах широты и долготы. Это означает, что
называется «геокодирование» и должно быть частью извлечения,
трансформации, а процесса загрузки (ETL) до уровня
атомный номер вашего склада.
Сбор данных.
Добыча дать позволяет нашим компаниям развивать
количество клиентов, прогнозировать тенденции продаж и обеспечивать
управление отношениями с клиентов (CRM), среди прочих инициатив
БИ.
Добыча дать поэтому он должен быть интегрирован со структурами
дать Dwhouse и поддерживается складскими процессами для
удостовериться как в эффективном, так и в рациональном использовании технологий и
сопутствующие техники.
Как указано в архитектуре BI, атомарный уровень
Dwhouse, как и витрины данных, является отличным источником дать
для добычи. Эти же структуры должны быть
получателей результатов извлечения для обеспечения доступности для
самая большая аудитория (самая широкая аудитория).
Агенты.
Существуют различные «агенты», которые проверяют клиента по любому поводу, например, я
операционные системы компании и сами dw. Эти агенты могут
быть продвинутыми нейронными сетями, обученными узнавать о
тенденции каждой точки, такие как будущий спрос на продукт на основе
о рекламных акциях, механизмах, основанных на правилах, чтобы реагировать на
un дата стечение обстоятельств или даже простых агентов, которые
они указывают на исключения для «высших руководителей». Эти процессы да
обычно присутствует в режиме реального времени и, следовательно, должен
быть тесно связанным с их движением дать.
Все эти структуры из дать, технологии и методики гарантируют
что вы не будете проводить ночь, создавая организацию
ваш БИ.
Эта деятельность будет развиваться поэтапно, для небольших
точек.
Каждый шаг является независимой работой проекта и сообщается
как итерация в вашей инициативе dw или BI. Итерации
может включать внедрение новых технологий, для
начать с новых методов, добавляя новые структуры дать ,
загрузка я дать дополнительный, или с расширением анализа
ваша среда. Этот абзац обсуждается подробнее
подробно в главе 3.
Помимо традиционных структур инструментов Dw и Bi есть и другие.
функции вашей организации BI, за которые вы обязаны
дизайн, например:
Точки взаимодействия с клиентом (контакт с клиентом
точки).
Как и во всех современных организациях, существует ряд
точки соприкосновения с клиентом, которые указывают, как получить опыт
позитив для вас клиентов. Есть традиционные каналы, такие как я
продавцы, операторы коммутаторов, прямая почтовая рассылка, мультимедиа и печать
реклама, а также самые современные каналы, такие как электронная почта и Интернет, я дать
продукты с некоторой точкой соприкосновения должны быть приобретены,
транспортируются, очищаются, трансформируются, а затем заселяются в сооружения дать из
БИ.
Базы дать операционные и пользовательские ассоциации (Operational
базы данных и сообщества пользователей).
В конце контактных точек клиентов основы найдены дать
приложения компании и сообществ пользователей. НАШИ дать существующий
соно дать традиционные, которые должны быть сведены воедино и объединены с дать что
они вытекают из точек соприкосновения для выполнения необходимых
информация.
Аналитики. (Аналитики)
Основным бенефициаром среды BI является аналитик. Это он
выгоды от текущей добычи дать действующий, интегрированный с
различные источники дать , дополненный такими функциями, как аналитика
географические (геокодирование) и представленные в технологиях BI, которые
разрешить майнинг, OLAP, расширенные отчеты и анализ SQL
географический. Основной интерфейс для аналитика со средой
отчетности является портал BI.
Однако аналитик не единственный, кто извлекает выгоду из архитектуры
БИ.
Руководители, крупные ассоциации пользователей и даже члены, поставщики и я
клиентов должны найти преимущества в корпоративной BI.
Петля обратной подачи.
Архитектура бизнес-аналитики — это среда обучения. Принцип
Характерной чертой развития является возможность сохранения устойчивых структур дать
обновляться по используемой технологии BI и по действиям
обязательства пользователя. Примером может служить оценка
клиент (оценка клиента).
Если отдел продаж реализует модель майнинга
оценки клиента, как использовать новую услугу, то
отдел продаж не должен быть единственной группой бенефициаров
обслуживания.
Вместо этого модель интеллектуального анализа данных должна выполняться как часть
характер потока данных внутри компании и оценки клиентов
должна стать неотъемлемой частью информационной среды
склад, видимый всем пользователям. Bi-bI-ориентированный IBM Suite
включая DB2 UDB, DB2 OLAP Server включает большинство
часть важных компонентов техники, обозначенных на рисунке
1.1.
Мы используем архитектуру, показанную на этом рисунке книги, для
дать нам уровень преемственности и продемонстрировать, как каждый продукт
IBM вписывается в общую схему BI.
Предоставление информационного контента (предоставление
информационное наполнение)
Спроектировать, разработать и внедрить среду бизнес-аналитики — это
трудная задача. Дизайн должен охватывать как
текущие и будущие потребности бизнеса. Архитектурный дизайн
должен быть полным, чтобы включать все найденные выводы
на этапе проектирования. Исполнение должно оставаться
привержены единственной цели: разработать архитектуру BI
как формально представлено на чертеже и основано на требованиях
бизнес.
Особенно трудно утверждать, что дисциплина обеспечит
относительный успех.
Это просто, потому что вы не создаете среду BI для всех.
внезапно, но это происходит небольшими шагами с течением времени.
Однако идентификация компонентов бизнес-аналитики в вашей архитектуре
важно по двум причинам: вы будете руководить всеми последующими решениями
приемы архитектуры.
Вы сможете сознательно проектировать конкретное использование технологии
хотя вы можете не получить повторение, которое ему нужно
техники на несколько месяцев.
Достаточное понимание ваших бизнес-требований повлияет на тип
продуктов, которые вы приобретете для своей архитектуры.
Планирование и разработка вашей архитектуры гарантируют
что ваш склад
не случайное событие, а скорее "продуманное",
тщательно сконструированное объявление opera искусства, как мозаика
смешанная технология.
Информационное содержание дизайна
Весь первоначальный дизайн должен фокусироваться и определять
основные компоненты BI, которые потребуются вашей среде
вообще в настоящем и будущем.
Важно знать бизнес-требования.
Еще до начала формального планирования
Планировщик проекта часто может определить один или два
компонент сразу.
Баланс компонентов, которые могут понадобиться для
вашу архитектуру, однако, нелегко найти.
На этапе проектирования основная часть архитектуры
привязывает сеанс разработки приложений (JAD) к поиску
для определения бизнес-требований.
Иногда эти требования могут быть переданы на аутсорсинг инструментам
запросы и отчеты.
Например, пользователи заявляют, что если они хотят автоматизировать
в настоящее время отчет приходится генерировать вручную, интегрируя
два коэффициента текущей ликвидности и добавление расчетов, полученных из
комбинация дать.
Хотя это требование простое, оно определяет определенный
функциональность функции, которую вы должны включить, когда
купить инструменты отчетности для организации.
Дизайнер также должен предъявлять дополнительные требования к
получить полную картину. Пользователи хотят подписаться на
этот отчет?
Подмножества отчета генерируются и отправляются по электронной почте в различные
пользователи? Хотите увидеть этот отчет на портале компании?
Все эти требования являются частью простой необходимости
заменить ручной отчет по запросу пользователей. Выгода
из этих типов требований заключается в том, что все, пользователи и разработчики, имеют
понимание концепции отчетов.
Однако есть и другие виды бизнеса, которые нам необходимо планировать.
Когда бизнес-требования сформулированы в форме
Стратегические вопросы бизнеса, это легко для опытного планировщика
различать размерные требования и требования измерения/факта.
На рис. 1.2 показаны размеры и размеры компонентов
бизнес проблема.
Если пользователи JAD не знают, как заявить о своих требованиях
в виде бизнес-задачи дизайнер часто ставит
примеры пропуска-запуска сеанса сбора данных
требования.
Дизайнер-эксперт может помочь пользователям понять не только
стратегическая торговля, но и как ее формировать.
Подход к сбору требований обсуждается в главе 3; Для
сейчас мы просто хотим указать на необходимость дизайна для всех
типы требований BI
Стратегический вопрос бизнеса — это не просто требование
Бизнес, но и ключ к дизайну. Если вы должны ответить
на многоплановый вопрос, то надо запоминать,
отправить я дать размерный, и если вам нужно запомнить
дать многомерный, вы должны решить, какая технология или
техника, которую вы собираетесь использовать.
Вы реализуете зарезервированную схему куба-звезды или и то, и другое?
Как видите, даже простая бизнес-задача
может существенно повлиять на конструкцию. Однако
эти типы бизнес-требований являются обычными и, конечно, по крайней мере
опытными проектировщиками и дизайнерами.
Было достаточно споров о технологиях и поддержке
OLAP и широкий спектр доступных решений. До настоящего времени
мы упомянули о необходимости объединить простую отчетность с i
требования к размеру бизнеса и как эти требования
влиять на технические архитектурные решения.
Но каковы требования, которые не всегда понятны
пользователями или командой Dw? Вам когда-нибудь понадобится анализ
пространственный (пространственный анализ)?
Модели майнинга дать они будут необходимой частью вашего
будущее? Кто знает?
Важно отметить, что такие технологии не очень
известен широкому кругу пользователей и членам команды
Dw, отчасти это могло произойти из-за того, что они обычно
обрабатываются некоторыми внутренними или сторонними техническими экспертами. Это
пограничный случай проблем, которые создают эти типы технологий. Себя
пользователи не могут описать бизнес-требования или сформулировать их
чтобы предоставить рекомендации дизайнерам, они могут
остаются незамеченными или, что еще хуже, просто игнорируются.
Более проблематичным становится, когда дизайнер и разработчик терпят неудачу
может распознать применение одного из этих продвинутых, но
критические технологии.
Как мы часто слышали от дизайнеров, «ну почему
Разве мы не отложим это, пока не получим эту другую вещь?
«Искренне ли они заинтересованы в приоритетах или просто избегают
требования, которые они не понимают? Вероятнее всего последнее предположение.
Допустим, ваш отдел продаж сообщил о требовании
бизнеса, как указано на рис. 1.3, как видите,
требование оформлено в виде бизнес-задачи. Там
разница между этой задачей и типичной задачей размерности
Расстояние. В этом случае отдел продаж хочет знать,
ежемесячно общий объем продаж продукции, складов и
клиентов которые живут в пределах 5 миль от склада, где они
они покупают.
К сожалению, дизайнеры или архитекторы просто могут
игнорировать пространственный компонент, говоря: «у нас есть клиент,
продукт и я дать депозита. Мы держимся на расстоянии, пока
еще одна итерация.
"Неверный ответ. Этот вид бизнес-проблем касается
полностью БИ. Он представляет собой более глубокое понимание
наш бизнес и надежное аналитическое пространство для наших аналитиков.
BI — это не только простые запросы или стандартные отчеты.
даже ОЛАП. Это не значит, что эти технологии терпят неудачу.
они важны для вашего BI, но сами по себе они не
среду BI.
Дизайн для информационного контекста
(Дизайн информационного контента)
Теперь, когда мы определили бизнес-требования, которые выделяются
различные основные компоненты должны быть включены в проект
общий архитектурный. Некоторые из компонентов BI являются частью
наших первоначальных усилий, в то время как некоторые не будут реализованы в течение
несколько месяцев.
Однако все известные требования отражены в конструкции так, чтобы
когда нам нужно внедрить ту или иную технологию, мы
будьте готовы сделать это. Что-то в проекте будет отражать мысль
Традиционный.
Например, на рис. 1.1 в начале главы показаны данные
магазин который поддерживает я дать размерный.
Этот набор дать используется для поддержки последующего использования
дать размерность, обусловленная бизнес-проблемами, которые
мы определили. Так как дополнительные документы
созданных, таких как разработка дизайна датьмы
мы начнем формализовать, как я дать они распространяются в окружающей среде.
Мы установили необходимость представления i дать так
размерные, подразделяя их (в соответствии с конкретными потребностями
определено) на витринах данных.
Следующий вопрос, на который нужно ответить, — как они будут построены.
эти витрины данных?
Вы строите звезды для поддержки кубов, или только кубы, или только звезды?
(или правильные кубики, или правильные звезды). Создайте архитектуру для данных
зависимые витрины, которым требуется атомарный слой для всех дать
вы приобретаете? Разрешить независимым витринам данных получать i дать
напрямую из операционных систем?
Какую технологию Cube вы попытаетесь стандартизировать?
У вас есть огромное количество богов дать требуется для размерного анализа
или вам нужны кубы вашего национального торгового персонала на одном
еженедельно или и то, и другое? Создайте мощный предмет
например, DB2 OLAP Server for Finance или кубы Cognos
PowerPlay для вашей организации продаж или для обоих?
Это большие архитектурно-дизайнерские решения, которые
они повлияют на вашу среду BI в будущем. Да,
вы определили потребность в OLAP. Теперь, как вы собираетесь выполнять это
Тип техники и технологии?
Как некоторые из самых передовых технологий влияют на вас
рисунки? Предположим, вы определили потребность
место в вашей организации. Теперь вам нужно позвонить в
выпуски архитектурных чертежей, даже если они незапланированы
выполнять космические компоненты в течение нескольких месяцев. Архитектор должен
дизайн сегодня на основе того, что необходимо. Предвидеть потребность в
пространственный анализ, который генерирует, хранит, выполняет и доставляет
доступ к дать пространственный. Это, в свою очередь, должно служить
ограничение по типу технологии и спецификациям
программная платформа, которую вы, возможно, сейчас рассматриваете. Для
Например, система управления база данных реляционный
(RDBMS), которую вы выполняете для своего атомарного уровня, должны иметь
доступная надежная пространственная протяженность. Это обеспечило бы
максимальная производительность при использовании геометрии и объектов
места в ваших аналитических приложениях. Если ваша СУБД не
могу справиться со мной дать (пространственно-ориентированный) внутри, поэтому вам придется
стабилизировать уна база данных (пространственно-центрический) внешний. Это усложняет
управление проблемами и влияет на вашу общую производительность,
не говоря уже о дополнительных проблемах созданных для ваших
администраторы баз данных, поскольку они, вероятно, имеют минимальное понимание
основ дать также пространственный. С другой стороны, если ваш двигатель
RDMBS обрабатывает все пространственные компоненты и связанные с ними
оптимизатор знает об особых потребностях (например,
индексирование) пространственных объектов, тогда ваши администраторы баз данных смогут обрабатывать
оперативно управлять проблемами, и вы можете поднять их
производительность.
Кроме того, вам необходимо настроить область подготовки и слой
атомарной среды, чтобы включить очистку адресов (un
ключевой элемент пространственного анализа), а также следующий
спасение космических объектов. Последовательность выпусков
рисунок продолжается теперь, когда мы ввели понятие очистки
адрес. Во-первых, это приложение будет диктовать тип
необходимое программное обеспечение для ваших усилий ETL.
Вам нужны такие продукты, как Trillium, чтобы предоставить вам адрес
clean или поставщика ETL по вашему выбору, чтобы обеспечить это
функциональность?
На данный момент важно, чтобы вы оценили стандарт дизайна
должны быть завершены до того, как вы начнете реализовывать свои
окружающая среда (склад). Приведенные выше примеры должны
продемонстрировать множество рисуночных решений, которые должны последовать
выявление каких-либо конкретных бизнес-требований. Если сделано
Правильно, эти дизайнерские решения способствуют
взаимозависимость между физическими структурами вашей среды,
выбор используемой технологии и поток распространения
информационное наполнение. Без этой традиционной архитектуры
BI, ваша организация будет подвергаться сочетанию
хаотичность существующих технологий, в лучшем случае, объединенных таким образом
неточны для обеспечения кажущейся стабильности.
Поддерживать информационный контент
Повышение ценности информации для вашей организации
очень сложная операция. Без достаточного понимания
и опыт, или надлежащее планирование и проектирование, даже
лучшие команды потерпят неудачу. С другой стороны, если у вас большой
интуиция и детальное планирование, но отсутствие дисциплины для
исполнение, вы только зря потратили деньги и время
потому что ваши усилия обречены на провал. Сообщение должно
быть ясным: если вам не хватает одного или нескольких из этих
навыки, понимание/опыт или планирование/рисование o
исполнительской дисциплины, это приведет к параличу или
разрушить здание организации BI.
Достаточно ли подготовлена ​​ваша команда? есть кто-то на твоем
Команда бизнес-аналитики, которая разбирается в обширном доступном аналитическом ландшафте
в BI-средах, в необходимых техниках и технологиях
произвести этот пейзаж? В вашей команде есть кто-то
которые могут распознать разницу приложений между передовыми
статическая отчетность и OLAP или различия между ROLAP и OLAP? Один из
Члены вашей команды четко распознают способ
экстракт и как это может повлиять на склад или как
может ли склад поддерживать производительность майнинга? Участник
команда понимает ценность дать космос или техника
на основе агента? У вас есть кто-то, кто ценит уникальное приложение
ETL-инструментов против брокерской технологии
сообщение? Если у вас его нет, получите его. БИ — это гораздо больше
объем нормализованного атомарного слоя, OLAP, схем
звезда и ODS.
Иметь понимание и опыт для распознавания требований
BI и их решения важны для вашей способности
правильно формализовать потребности пользователей и оформить
и реализовывать их решения. Если в вашем сообществе пользователей есть
сложности с описанием требований, это задача команды
склад обеспечить это понимание. Но если команда из
склад
не распознает конкретное приложение BI — например, данные
майнинг - тогда это не лучшее, что делают среды BI
часто ограничиваются тем, что являются пассивными депозитами. Однако игнорировать эти
технологий не умаляет их значения и эффекта, который они оказывают
о появлении собственных возможностей бизнес-аналитики
организация, а также информационная структура, которую вы проектируете
продвигать.
Планирование должно включать понятие чертежа, ред.
оба требуют компетентного человека. Плюс проектирование
для этого требуется командная складская философия и наблюдательность
стандартов. Например, если ваша компания создала
стандартной платформы или определил конкретную СУБД, которую вы
хотите стандартизировать платформу, неизбежно
все в команде придерживаются этих стандартов. Обычно один
команда выявляет необходимость нормализации (пользователю
общается), но сама команда не хочет присоединяться к
стандарты, также установленные в других областях в компании или, возможно, даже в
подобные компании. Это не только лицемерно, но и подтверждает, что фирма не
может использовать существующие ресурсы и инвестиции. Это не значит
что нет ситуаций, гарантирующих платформу или
нестандартизированная технология; однако усилиями склада
должны ревностно охранять стандарты предприятия до
что бизнес-требования не диктуют иного.
Третий ключевой компонент, необходимый для построения BI
организация — это дисциплина.
Это зависит в целом, в равной степени от индивидуумов и от окружающей среды.
Планировщики проектов, спонсоры, архитекторы и пользователи должны ценить
дисциплина, необходимая для построения информационной структуры компании.
Дизайнеры должны направлять свои проектные усилия таким образом, чтобы
выполнять другие необходимые начинания в обществе.
Например, предположим, что ваша компания строит
Приложение ERP с компонентом склада.
Таким образом, дизайнеры ERP несут ответственность за сотрудничество с
команда складской среды, чтобы не конкурировать или
дублировать уже начатую работу.
Дисциплина — это тоже тема, которой нужно заниматься
всей организацией и обычно устанавливается и возлагается на
исполнительный уровень.
Готовы ли руководители придерживаться разработанного подхода? А
подход, который обещает создать информационный контент,
в конечном итоге это принесет пользу всем областям предприятия, но, возможно,
Компрометирует ли это планы отдельных лиц или подразделений? Помните поговорку
«Думать обо всем важнее, чем думать только об одном».
Это высказывание верно для BI-организаций.
К сожалению, многие склады сосредотачивают свои усилия
стремясь управлять и приносить пользу определенному отделу или
конкретных пользователей, мало заботясь об организации в
общий. Предположим, менеджер просит помощи у команды в
склад. Команда отвечает 90-дневным заданием, которое
включает не только выполнение требований об уведомлении, определенных
менеджер, но гарантирует, что все дать база смешивается с уровнем
атомный до внедрения в кубическую технологию
предложение.
Это техническое дополнение гарантирует, что подвиг
склад выиграет от дать нужно менеджеру.
Тем не менее, исполнительный директор говорил с внешними консалтинговыми фирмами, которые
предложили аналогичное приложение с доставкой менее чем за 4
сеттиман.
Предполагая, что внутренняя команда склада компетентна,
у менеджера есть выбор. Кто может поддержать дисциплину
дополнительные инженерные работы, необходимые для выращивания скважины
информационное предприятие или может сделать свой собственный
решение быстро. Последнее, кажется, выбрано верно
слишком часто и служит только для создания информационных контейнеров
от чего выигрывают немногие или отдельные лица.
Краткосрочные и долгосрочные цели
Архитекторы и проектировщики должны формализовать
долгосрочное видение общей архитектуры и планы на
расти в BI-организации. Эта комбинация
краткосрочная прибыль и долгосрочное планирование
представляют два лица усилий BI. Краткосрочная прибыль
истечение срока действия — это аспект BI, связанный с итерациями
ваш склад.
На этом сосредоточены проектировщики, архитекторы и спонсоры.
соответствовать конкретным бизнес-требованиям. Именно на этом уровне происходит
строятся физические структуры, закупаются технологии и
техники реализуются. Они ни в коем случае не созданы лицом к лицу
конкретные требования, определенные конкретными сообществами пользователей.
Все делается для того, чтобы удовлетворить определенные конкретные требования
из определенного сообщества.
Однако долгосрочное планирование — это другой аспект
БИ. Вот где планы и проекты обеспечили это
построили любую физическую структуру, выбранные технологии и
реализованные методы, сделанные с прицелом на предприятие. И
долгосрочное планирование, обеспечивающее сплоченность
необходимо для того, чтобы бизнес-выгоды доставались всем
обнаружены краткосрочные выгоды.
Обоснуйте свои усилия по BI
Un информационное хранилище само по себе оно не имеет внутренней ценности. В других
словами, нет внутренней ценности между технологиями
склад и техника реализации.
Ценность любых складских усилий заключается в действиях
выполнено в результате складской среды и содержания
информация, культивируемая с течением времени. Это критический момент для понимания
прежде чем пытаться оценить ценность какой-либо инициативы
дом.
Слишком часто архитекторы и проектировщики пытаются придать ценность
складские физические и технические компоненты, когда на самом деле стоимость
основывает бизнес-процессы, на которые положительно влияет
склад и общепризнанная информация.
В этом заключается проблема создания BI: как вы оправдываете инвестиции?
Если сам по себе дом не имеет внутренней ценности, проектировщики
проект должен исследовать, определить и формализовать преимущества
достигается теми лицами, которые будут использовать склад для
улучшить конкретные бизнес-процессы или ценность
защищенная информация или и то, и другое.
Чтобы усложнить темы, любой бизнес-процесс
затронутые складскими усилиями, могут принести пользу
«значительный» или «незначительный». Значительные преимущества обеспечивают
ощутимая метрика для измерения возврата инвестиций (ROI) — например,
например, оборот инвентаря дополнительный раз в течение периода
конкретные или для более низкой стоимости транспортировки за партию. Это более
Трудно определить небольшие преимущества, такие как улучшенный доступ к
информация с точки зрения материальной ценности.
Подключите свой проект, чтобы узнать
деловые запросы
Слишком часто разработчики проектов пытаются связать ценность
склада с аморфными задачами предприятия. заявив, что
«Ценность склада основана на нашей способности
удовлетворять стратегические запросы» приятно открываем
речь. Но одного этого недостаточно, чтобы определить,
инвестиции в склад имеют смысл. Лучше подключать повторы
склада с конкретными коммерческими запросами и примечаниями.
Измерить рентабельность инвестиций
Расчет рентабельности инвестиций в условиях склада может быть
особенно сложно. Особенно трудно, если ведущий
Принцип конкретного повторения есть что-то неосязаемое или
легко измерить. Исследование показало, что пользователи воспринимают
два основных преимущества инициатив BI:
▪ Создайте способность принимать решения
▪ Создать доступ к информации
Эти льготы являются мягкими (или мягкими) льготами. Это легко увидеть
как мы можем рассчитать рентабельность инвестиций на основе жесткого края (o
больше), такие как снижение стоимости транспорта, но как
измеряем ли мы способность принимать лучшие решения?
Это, безусловно, вызов для планировщиков проектов, когда
они пытаются заставить компанию инвестировать в одну конкретную
складские усилия. Увеличение продаж или снижение затрат
они больше не являются центральными темами, управляющими средой BI.
Вместо этого вы ищете доступ в бизнес-запросах
наилучшим образом к информации, чтобы конкретный отдел мог
быстрее принимать решения. Это стратегические факторы
которые одинаково важны для фирмы, но
более неоднозначны и их труднее охарактеризовать в материальной метрике.
В этом случае расчет ROI может ввести в заблуждение, если вообще не иметь значения.
Разработчики проекта должны быть в состоянии продемонстрировать ценность
материальных для руководителей, чтобы решить, являются ли инвестиции в
конкретное повторение имеет значение. Тем не менее, мы не будем предлагать новый
метод расчета ROI, и мы не будем приводить никаких аргументов в пользу
против этого.
Существует множество статей и книг, в которых обсуждаются основы
рассчитать рентабельность инвестиций. Существуют специальные ценностные предложения, такие как ценность
об инвестициях (VOI), предлагаемых такими группами, как Gartner, что вы можете
исследовать. Вместо этого мы сосредоточимся на основных аспектах любого
ROI или другие ценностные предложения, которые вам необходимо учитывать.
Применение ROI
В дополнение к аргументу о «жестких» преимуществах против «мягких» преимуществ
В связи с усилиями BI есть и другие вопросы, которые следует учитывать
когда мы применяем ROI. Например:
Приписывание слишком большой экономии усилиям DW, которые придут
comunque
Допустим, ваша компания перешла от архитектуры
мейнфрейм в распределенную среду UNIX. Так что любой
экономия, которая может (или не может) быть реализована за счет этих усилий
не следует относить исключительно, если ко всем (?), к
склад.
Не учитывать все дорого. И есть много вещей, чтобы
примите во внимание. Рассмотрим следующий список:
▪ Стоимость запуска, включая технико-экономическое обоснование.
▪ Стоимость выделенного оборудования с соответствующим хранилищем e
связь
▪ Стоимость программного обеспечения, включая управление дать Эд Эстенсиони
клиент/сервер, программное обеспечение ETL, технологии DSS, инструменты
визуализация, планирование и потоковые приложения
программное обеспечение для работы и мониторинга, .
▪ Стоимость проектирования конструкции дать, с реализацией и
оптимизация
▪ Затраты на разработку программного обеспечения, непосредственно связанные с усилиями
BI
▪ Стоимость поддержки на дому, включая оптимизацию
производительность, включая контроль версий программного обеспечения e
операции помощи
Примените «большой взрыв» ROI.
Реализация склада как единого и гигантского усилия
обязательно потерпит неудачу, так что также рассчитайте рентабельность инвестиций для инициативы
крупного предприятия Предложение удивительно, и дизайнеры
продолжать предпринимать слабые попытки оценить стоимость всего
усилие.
Потому что дизайнеры пытаются дать денежную оценку
по инициативе предприятия, если широко известно и признано, что
трудно ли оценить конкретные повторения? Как это возможно? Это не
возможно за редким исключением. Не делай этого.
Теперь, когда мы установили, чего не следует делать при расчете
ROI, вот некоторые моменты, которые помогут нам определить
надежный процесс оценки ценности ваших усилий по BI.
Получение согласия на возврат инвестиций. Независимо от вашего
выбор метода для оценки ценности ваших усилий BI, должен
быть согласовано всеми сторонами, включая планировщиков проекта,
корпоративные спонсоры и руководители.
Разбейте рентабельность инвестиций на идентифицируемые части. Необходимый шаг на пути к
разумный расчет ROI состоит в том, чтобы сконцентрировать этот расчет на
конкретный проект. Затем это позволяет оценить значение
на основе конкретных бизнес-требований, которые выполняются
Определите расходы. Как уже упоминалось, многочисленные расходы должны быть
обдуманный. Кроме того, затраты должны включать не только сопутствующие расходы.
на одну итерацию, но и на связанные с этим затраты
обеспечить соблюдение корпоративных стандартов.
Определите преимущества. Четко связывая рентабельность инвестиций с требованиями
конкретных профессий, мы должны быть в состоянии идентифицировать
преимущества, которые приведут к удовлетворению требований.
Сократите затраты и выгоды в неизбежных выгодах. это путь
лучший способ основывать свои оценки на чистой приведенной стоимости
(NPV), в отличие от попыток предсказать будущую стоимость
будущие заработки.
Сведите к минимуму время, необходимое для разделения ROI. И'
хорошо задокументировано в течение длительного времени, когда оно использовалось в вашем
ROI.
Используйте более одной формулы ROI. Существует множество методов для
Прогноз рентабельности инвестиций, и вы должны спланировать, использовать ли его или
плюс, включая чистую текущую стоимость, внутреннюю скорость обратной связи
(IRR) и восстановление.
Дайте определение повторяемому процессу. Это имеет решающее значение для расчета
любое долгосрочное значение. Это должно быть задокументировано как
единый повторяемый процесс для всех подпоследовательностей проекта
следовать.
Перечисленные проблемы являются наиболее распространенными, определенными экспертами.
складской среды. Настаивание руководства на
получение «большого взрыва» рентабельности инвестиций очень сбивает с толку. Если начать все
ваши расчеты рентабельности инвестиций, разбив их на идентифицируемые, материальные части, у вас есть
хороший шанс оценить точную оценку ROI.
Вопросы о рентабельности инвестиций
Какими бы ни были ваши преимущества, мягкие или жесткие, вы можете использовать
некоторые фундаментальные вопросы, чтобы определить их ценность. К
Например, используя простую систему шкалы от 1 до 10, вы
вы можете отслеживать влияние любых усилий, используя следующие
доманд:
▪ Как бы вы оценили понимание дать следуя этому
проект вашей компании?
▪ Как бы вы оценили улучшения процесса в результате
этот проект?
▪ Как бы вы сейчас оценили влияние новых идей и выводов?
стало доступным в этой итерации
▪ Какое влияние оказала новая компьютерная среда?
выполнение в результате того, что было изучено?
Если ответов на эти вопросы мало, возможно,
предприятие не стоит вложенных средств. Вопросы с высоким
оценка указывает на значительный прирост стоимости и должна
служить ориентиром для дальнейшего исследования.
Например, высокий балл за улучшение процессов
это должно побудить дизайнеров взглянуть на то, как устроены процессы.
были улучшены. Вы можете обнаружить, что некоторые или все достижения сделаны
они осязаемы, и поэтому их денежная стоимость может быть легко
применяемый.
Получение максимальной отдачи от первой итерации
склад
Величайший результат ваших деловых усилий часто находится в
первые несколько итераций. Эти ранние попытки традиционно
установить наиболее полезный информационный контент для публики
устанавливает помощь в фундаменте технологии для последующего
BI-приложения.
Обычно каждая последующая подпоследовательность дать проекта
склады приносят все меньше и меньше дополнительной ценности предприятию
общий. Это особенно верно, если итерация не удалась.
добавляет новые аргументы или не удовлетворяет потребности в новом
сообщество пользователей.
Эта функция хранения также относится к стекам
растет на дать историки. Поскольку последующие усилия требуют большего
дать и как еще дать заливаются на склад с течением времени, большая часть
дать он становится менее релевантным для используемого анализа. Эти дать соно
часто называют дать спят, а содержать их всегда дорого, потому что
они почти не используются.
Что это значит для спонсоров проекта? По существу, я
первые спонсоры разделяют больше, чем инвестиционные затраты.
Это первично, потому что они являются толчком для основания слоя
большие складские ресурсы и технологическая среда,
в том числе органические.
Но эти первые шаги имеют наивысшую ценность, и поэтому проектировщики
проекта часто должны оправдывать инвестиции.
Проекты, выполненные после вашей инициативы BI, могут иметь затраты
низшие (по сравнению с первыми) и прямые, но несут меньшую ценность
на предприятие.
И владельцы организаций должны начать рассматривать
бросать накопление дать и менее актуальные технологии.
Интеллектуальный анализ данных: извлечение Давать
Многочисленные архитектурные компоненты требуют вариаций
технологии и методы интеллектуального анализа данных —
например, различные «агенты» для изучения достопримечательностей
клиентов, операционные системы компании и для того же dw. Эти
агенты могут быть продвинутыми нейронными сетями, обученными
тренды марихуаны, такие как будущий спрос на продукцию, основанный на
стимулирование сбыта; основанные на правилах механизмы для
реагировать на набор дата обстоятельств, например, диагноз
медицинские и лечебные рекомендации; или даже простые агенты
с ролью сообщения об исключениях старшим менеджерам (высшим
руководители). Как правило, эти процессы экстракции дать si
проверить в режиме реального времени; поэтому они должны быть объединены
полностью с движением дать сами по себе.
Аналитическая онлайн-обработка
Онлайн аналитика
Возможность нарезать, нарезать кубиками, катить, детализировать
и сдать анализ
что-если, входит в рамки, цель пакета
Технология IBM. Например, функции аналитической обработки
Online (OLAP) существуют для DB2, что делает многомерный анализ более
двигатель база данных stesso.
Функции добавляют размерную полезность в SQL, в то время как
воспользуйтесь всеми преимуществами естественной части DB2. Другой
Примером интеграции OLAP является инструмент извлечения DB2.
Сервер OLAP-анализатора. Эта технология позволяет кубикам
Сервер OLAP DB2 будет быстро и автоматически
проанализированы, чтобы найти и сообщить о значениях дать необычный или неожиданный
за весь куб торговому аналитику. И, наконец, функции
DW Center предоставляет архитекторам средства для проверки, среди
другие вещи, профилируйте куб сервера OLAP DB2 как часть
характер процессов ETL.
Пространственный анализ Пространственный анализ
Пространство представляет половину аналитических якорей (проводников).
нужно для панорамы
широкий аналитический (время представляет другую половину). Атомный уровень
(атомарный уровень) склада, представленного на рис. 1.1,
включает в себя основы как для времени, так и для пространства. Записи
Анализ якоря на основе времени для информации о времени и адресе
анализ якоря из космоса. Временные метки
вовремя проводить анализ, и обращаться к информационным лидам
пространственный анализ. На диаграмме показан процесс геокодирования
преобразование адресов в точки на карте или точки в пространстве
так что такие понятия, как расстояние и внутри/снаружи, могут быть
используется в анализе - проводится на атомном уровне и пространственном анализе
который предоставляется аналитику. IBM предоставляет расширения
космос, разработанный совместно с Институтом исследования экологических систем (ESRI),
al база данных DB2, чтобы пространственные объекты могли быть
хранится как обычная часть база данных относительный. db2
Spatial Extenders, они также предоставляют все расширения SQL для
воспользоваться пространственным анализом. Например, расширения SQL из
Вопрос о
расстояние между адресами или если точка находится внутри или вне области
полигональные, являются аналитическим стандартом с параметром Spatial
удлинители. Дополнительную информацию см. в главе 16.
База данных-Резидентные инструменты Инструменты База данных-
Резидент
DB2 имеет множество встроенных в SQL BI вспомогательных функций.
в аналитическом действии. К ним относятся:
▪ Функции рекурсии для выполнения анализа, такие как «найти
все возможные траектории полета из Сан-Франциско a New York».
▪ Аналитические функции ранжирования, кумулятивные функции, куб
и сводки для облегчения задач, которые обычно возникают
только с технологией OLAP, теперь являются естественной частью
двигатель база данных
▪ Возможность создавать таблицы, содержащие результаты
Продавцы база данных лидеры смешивают не только возможности BI
в база данных то же самое.
Основные поставщики база данных они смешиваются больше, чем
функциональность BI в база данных то же самое.
Это обеспечивает наилучшую производительность и больше возможностей для выполнения файлов.
BI-решения.
Обсуждаются особенности и функции DB2 V8.
подробно в следующих главах:
Основы технической архитектуры и управления данными
(Глава 5)
▪ Основы BI DB2 (глава 6)
▪ Материализованные таблицы запросов DB2 (Материализированные таблицы запросов)
Таблицы) (Глава 7)
▪ Функции OLAP DB2 (глава 13)
▪ Возможности и функции DB2 Enhanced BI (Enhanced BI
Характеристики и функции) (Глава 15)
Упрощенная система доставки данных
Система доставки дать упрощенный
Архитектура, изображенная на рис. 1.1, включает в себя несколько
структур дать физ. Один из них - склад дать оперативный.
Как правило, ODS является объектно-ориентированным.
комплексная и актуальная. Вы бы создали ODS для поддержки, например
Например, офис продаж. Продажа ОРВ дополнит дать
из множества различных систем, но сохранит только, например,
например, сегодняшние сделки. ODS можно обновить
даже несколько раз в день. В то же время процессы
подтолкнуть меня дать интегрируется в другие приложения. Этот объект
специально разработан для интеграции дать текущий и динамический e
будет вероятным кандидатом на поддержку аналитики в реальном времени,
как предоставлять сервисные агенты клиентов информация о продажах
потоки клиентов путем извлечения информации о тенденциях продаж
с самого склада. Другая структура, показанная на рисунке 1.1,
формальный статус для dw. Это место не только для
выполнение необходимой интеграции, качество дать, и
преобразования дать на складе, но это также
надежный и временный склад для дать повторил это
могут быть использованы в аналитике в реальном времени. Если вы решите
использовать ODS или плацдарм, один
из лучших инструментов для заполнения этих структур дать использование
различные операционные источники — это гетерогенный распределенный запрос DB2.
Эта возможность предоставляется дополнительной функцией DB2.
называется DB2 Relational Connect (только запросы) и через DB2
DataJoiner (отдельный продукт, который доставляет вопрос,
вставка, обновление и возможность отмены
гетерогенно распределенные СУБД).
Эта технология позволяет архитекторам дать связать дать di
производство с аналитическими процессами. Технология может не только
адаптироваться практически к любым запросам репликации,
они могут придумать анализ в реальном времени, но это
они также могут подключаться к широкому спектру баз дать больше
популярные, включая DB2, Oracle, Sybase, SQL Server,
Информикс и другие. DB2 DataJoiner можно использовать для заполнения
структура дать формальный, как ODS или даже таблица
постоянно представленный на складе предназначенный для реставрации
быстро мгновенных обновлений или для продажи. Естественно,
эти самые структуры дать можно заполнить с помощью
еще одна важная технология, предназначенная для воспроизведения дать, IBM
Реляционный распространитель данных. (DataPropagator — это отдельный продукт
для центральных систем. DB2 UNIX, Linux, Windows и OS/2 включают
службы репликации дать как стандартная функция).
Еще один способ перемещения дать работая вокруг
для предприятия является интегратором корпоративных приложений, в противном случае
известный как брокер сообщений.
Уникальная технология обеспечивает непревзойденный контроль в центре
(нацеливание) и перемещение дать вокруг компании. У IBM есть брокер
наиболее широко используемого сообщения, MQSeries или варианта
продукта, который включает в себя требования электронная коммерция, IBM
Вебсфера MQ.
Для получения дополнительной информации о том, как использовать MQ для поддержки
склад и среду BI, посетите сайт книги. На данный момент это
достаточно сказать, что эта технология является отличным средством для
захват и преобразование (с помощью MQSeries Integrator) дать
целевых оперативников, набранных для решений BI. Там
Технология MQ была интегрирована и упакована в UDB V8, который
означает, что очередями сообщений теперь можно управлять
как если бы они были таблицами DB2. Концепция сварки
сообщения в очереди и вселенная база данных реляционные главы
к мощной среде доставки дать.
Нулевая задержка
Конечной стратегической целью IBM является анализ нулевой задержки.
Как определено
Gartner, система BI должна уметь делать выводы, ассимилировать
и предоставлять информацию аналитикам по запросу. Соревнование,
конечно, дело в том, как смешивать дать актуально и в режиме реального времени
с необходимой исторической информацией, такой как я дать родственная модель/из
тенденция, или извлеченное понимание, как очерчивание
клиент.
Такая информация включает, например, идентификацию клиентов ad
высокий или низкий риск или какие продукты я клиентов они купят много
наверное, если у них уже есть сыр в тележках
приобрести
Получение нулевой задержки на самом деле зависит от двух
фундаментальные механизмы:
▪ Полное слияние дать которые анализируются с помощью
установленными методами и с помощью инструментов, разработанных BI
▪ Система доставки дать эффективным, чтобы гарантировать, что
реально доступен анализ в реальном времени
Эти предпосылки для нулевой задержки ничем не отличаются от двух
цели, установленные IBM и описанные выше.
Тесная связь дать является частью
бесшовная интеграция, организованная IBM. И создать систему
доставки дать эффективность полностью зависит от
доступные технологии, упрощающие процесс доставки
дать. В результате две из трех целей IBM являются критически важными.
сделать третий. IBM сознательно разрабатывает собственные
Технология, обеспечивающая нулевую задержку, стала реальностью для
складские усилия.
Резюме / Синтез
Организация BI предоставляет дорожную карту для
создать свою среду
итеративно. Он должен быть скорректирован с учетом потребностей
вашего бизнеса, как настоящего, так и будущего. Без архитектурного видения
широкий, складские представители чуть больше, чем
случайные реализации центрального хранилища, которые мало что делают для
создать широкое информационное предприятие.
Первым препятствием для менеджеров проектов является то, как обосновать
инвестиции, необходимые для развития организации BI.
В то время как расчет рентабельности инвестиций остается основой для
складские достижения, становится все труднее
предсказать точно. Это привело к другим методам
определение того, стоит ли вы своих денег.
стоимость инвестиций2 (VOI), например, приобретается
как решение.
Это возлагается на архитекторов дать и о планировщиках проектов
преднамеренно генерировать и предоставлять информацию ассоциациям
пользователей, а не просто дать суй услугу дать. Eсть
огромная разница между ними. Информация – это то, что человек делает
разница в процессах принятия решений и эффективности; относительно, я
дать они являются строительными блоками для получения этой информации.
Даже при критическом отношении к источнику дать для удовлетворения запросов
бизнеса среда BI должна играть более важную роль
в создании информационного контента. мы должны взять
дополнительные меры по очистке, интеграции, преобразованию или
иным образом создать информационный контент, в соответствии с которым
пользователи могут действовать, и поэтому мы должны убедиться, что эти
действия и те решения, где они разумны, имеют обратную связь
в среде БИ. Если мы передаем склад для обслуживания только на дать,
уверен, что ассоциации пользователей создадут контент
информация, необходимая для принятия мер. Это гарантирует, что их
сообщество сможет принимать лучшие решения, но предприятие
страдает от недостатка знаний, которые они использовали.
Данный что архитекторы и проектировщики инициируют проекты
характерные для среды BI, они по-прежнему подотчетны предприятию.
в общем и целом. Простой пример этой парной функции
грани итераций BI найдены в исходниках дать, все
дать полученные по конкретным коммерческим запросам, должны быть
заселены в первом атомном слое. Это обеспечивает развитие
корпоративный информационный актив, а также управлять, маршрутизировать
конкретные пользовательские запросы, определенные в итерации.

Что такое хранилище данных?
Хранилище данных это сердце архитектуры информационных систем
с 1990 года и поддерживает информационные процессы, предлагая надежную
интегрированная платформа дать исторические взяты за основу для более поздних
анализы. НАШИ информационное хранилище предлагают простоту интеграции в
мир несовместимых прикладных систем. Дата
склад превратился в причуду. Хранилище данных
организовать и запомнить я дать необходимые для информационных процессов e
аналитический на основе длительной исторической временной перспективы. Все
это требует значительных и постоянных усилий в строительстве и
в обслуживании информационное хранилище.
Итак, что такое информационное хранилище? информационное хранилище является:
▪ предметная направленность
▪ интегрированная система
▪ изменение времени
▪ энергонезависимый (не отменяет)
коллекция дать используется для поддержки управленческих решений в
реализация процессов.
I дать вставлен в информационное хранилище возникают в большинстве
случаи из оперативной среды. информационное хранилище производится одним
единица хранения, физически отделенная от остальной части
система, которая содержит дать предварительно обработанный
приложения, работающие с информацией, полученной из окружающей среды
оперативный.
Буквальное определение информационное хранилище заслуживает тщательного расследования
объяснение, поскольку существуют важные мотивы и значения
фонда, которые описывают характеристики склада.
ПРЕДМЕТНАЯ ОРИЕНТАЦИЯ ОРИЕНТАЦИЯ
ТЕМАТИЧЕСКИЙ
Первая особенность информационное хранилище заключается в том, что оно направлено на
крупные игроки в компании. Руководство процессами через
дать это контрастирует с более классическим методом, который предусматривает
ориентация приложений на процессы и функции,
метод, в основном разделяемый большинством
старые направленные системы.
Операционный мир разработан вокруг приложений и функций
такие как кредиты, сбережения, банковские карты и траст для учреждения
финансовый. Мир dw организован вокруг предметов
таких как клиент, продавец, продукт и деятельность.
Выравнивание по темам влияет на дизайн и
на изготовление дать нашел в дв. В частности,
основная тема затрагивает наиболее важную часть
ключевая структура.
На мир приложения влияет как дизайн данных,
основе, чем от процесса проектирования. Мир
dw ориентирован исключительно на видеомоделирование дать и
рисунок база данных. Оформление процесса (в его форме
classic) не является частью среды dw.
Различия между выбором приложения процесса/функции и
выбор темы выявляются также как различия в содержании
из дать на детальном уровне. НАШИ дать del dw не включает i дать что
они не будут использоваться для процесса DSS, в то время как приложения
оперативный дать содержать я дать удовлетворять
сразу функциональные/технологические требования, которые могут
меньше всего использовать для аналитики DSS.
Еще один важный способ, с помощью которого операционно-ориентированные приложения
ai дать отличаться от дать dw находится в отчетах дать. дать
операторы поддерживают постоянную связь между двумя или более таблицами
на основе активного бизнес-правила. НАШИ дать по дв
они охватывают спектр времени, и отношения, найденные в dw, равны
много. Многие торговые правила (и, соответственно, многие
доклады дать ) представлены на складе дать между двумя или
несколько таблиц.
(Для подробного объяснения того, как отношения между дать соно
управляемый в DW, мы ссылаемся на технический раздел по этому
вопрос.)
Ни с какой другой точки зрения, кроме как с точки зрения различия
принципиальное значение между выбором функционала/процесса и применением
выбор субъекта, существует большая разница между системами
оперативное и дать и ДВ.
ИНТЕГРАЦИЯ ИНТЕГРАЦИЯ
Наиболее важным аспектом среды dw является то, что я дать найденный
в dw они легко интегрируются. ВСЕГДА. БЕЗ
ИСКЛЮЧЕНИЯ. Сама суть среды dw заключается в том, что я дать
содержащиеся в пределах склада интегрированы.
Интеграция проявляется по-разному – в соглашениях
идентифицированы согласованными, в пределах согласованных переменных, в
согласованные кодифицированные структуры, в физических атрибутах дать
последовательный и так далее.
За прошедшие годы разработчики нескольких приложений сделали это
владение многими решениями о том, как приложение должно
быть развитым. Стиль и индивидуальные дизайнерские решения
приложения дизайнеров раскрываются сотнями способов: в
различия в кодировании, ключевая структура, физические характеристики,
соглашения об идентификации и так далее. Коллективная способность многих
дизайнеры приложений для создания противоречивых приложений
это легендарно. На рис. 3 показаны некоторые из дополнительных различий.
важны в способах разработки приложений.
Кодировка: Кодировать:
Разработчики приложений выбрали полевое кодирование –
секс - по-разному. Дизайнер представляет секс как
«м» и «ф». Другой дизайнер представляет пол как «1».
и «0». Другой дизайнер представляет гендер как «x» и
"у". Другой дизайнер представляет гендер как «мужской» и
"женский". На самом деле не имеет значения, как секс попадает в DW. Их"
и "F", вероятно, так же хороши, как и все
представление.
Важно то, что из какого бы источника ни возникло половое поле,
это поле поступает в ХД в непротиворечивом интегрированном состоянии. От
последствие, когда поле загружается в ХД из
приложение, где это было вычислено в формате
«М» и «Ж», я дать необходимо преобразовать в формат DW.
Измерение атрибутов: измерение
Атрибуты:
Разработчики приложения решили измерять конвейер в
различные способы в течение курса
Несколько лет. Дизайнерские магазины я дать трубопровода в
сантиметры. Другой дизайнер приложений хранит дать
трубопровода в дюймах. Еще один дизайнер из
магазины приложений я дать трубопровода в миллионах кубических футов
в секунду. А другой конструктор хранит информацию о
трубопровод в ярдах. Каким бы ни был источник, когда
Информация о конвейере поступает в ХД, они должны быть
измеряется таким же образом.
По показаниям рисунка 3 вопросы интеграции
они влияют почти на каждый аспект дизайна — особенности
физические боги дать, дилемма наличия более чем одного источника дать,
дело в несоответствующих идентифицированных образцах, форматах дать
непоследовательный и так далее.
Какими бы ни были аргументы в пользу дизайна, результат один –
i дать должны храниться в DW в единственном числе e
глобально приемлемым способом, даже если операционные системы
фонд хранить по-другому я дать.
Когда аналитик DSS смотрит на DW, линза аналитика
должна быть эксплуатация дать которые находятся на складе,
вместо того, чтобы задаваться вопросом о достоверности или последовательности
дать.
ОТКЛОНЕНИЕ ПО ВРЕМЕНИ
Все дать в ДГ они точны до некоторого момента времени.
Эта основная черта дать в DW сильно отличается от дать
обнаружены в операционной среде. НАШИ дать операционной среды являются
точно на момент доступа. Другими словами,
в операционной среде при доступе к блоку дать, Но также
подождите, пока он отобразит точные значения на момент доступа.
Почему я дать в DW точны, как когда-то в
время (т. е. не «прямо сейчас»), i дать нашел в ДВ
они являются «дисперсией во времени».
Разница во времени дать DW упоминается по-разному.
Самый простой способ - я дать ХД представляют дать на
долгосрочный горизонт – от пяти до десяти лет. Горизонт
время, представленное для операционной среды, намного короче
▪ от текущих текущих значений до шестидесяти девяноста
Приложения, которые должны работать хорошо и должны быть
доступные для обработки транзакций, должны принести
минимальное количество дать если они допускают какую-либо степень
гибкость. Таким образом, оперативные приложения имеют горизонт
короткие сроки, как аргумент дизайна
звуковые приложения.
Второй способ появления «изменчивости времени» в ХД – это
ключевая структура. Каждая ключевая структура в DW содержит:
неявно или явно, элемент времени, такой как
день, неделя, месяц и т. Элемент времени почти всегда
в нижней части объединенного ключа, найденного в DW. В этих
случаях элемент времени будет существовать неявно, например, случайность
где весь файл дублируется в конце месяца или квартала.
Третий способ отображения временной дисперсии заключается в том, что i дать из
DW, просто правильно зарегистрированный, не может быть
обновлено. НАШИ дать DW, для всех практических целей, длинный
серия снимков (снимок). Конечно, если снимки
были сделаны неправильно, то снимки могут быть
модифицированный. Но при условии, что снимки сделаны
правильно, они не меняются, как только они сделаны. В некоторых
случаях может быть неэтичным или даже недействительным то, что снимки в
ДВ изменены. НАШИ дать оперативный, будучи точным, как в
момент доступа, они могут обновляться по мере появления
потребность.
НЕ ЭЛЕМЕНТАРНЫЙ
Четвертой важной характеристикой DW является его энергонезависимость.
Обновления, вставки, удаления и изменения сделаны
регулярно для операционных сред «запись за записью». Но
основные манипуляции с дать нужно в ХД гораздо больше
простой. Есть только два вида операций, которые происходят в
DW – начальная загрузка дать и доступ к дать. Нет
нет обновления дать (в общем смысле
update) в DW в качестве обычной операции обработки.
Есть некоторые очень сильные последствия этой разницы
основе между оперативной обработкой и обработкой DW. На уровне
по замыслу нужно быть осторожным при обновлении
ненормальный не является фактором в DW, так как обновление дать не
выполненный. Это означает, что на физическом уровне проектирования
свободы могут быть приняты для оптимизации доступа к дать,
особенно при рассмотрении вопросов стандартизации и
физическая денормализация. Еще одно следствие простоты
операций DW заключается в базовой технологии, используемой для
запустить среду DW. Необходимость поддерживать обновления
запись за записью в строке (как это часто бывает с
оперативная обработка) требуется, чтобы технология обладала некоторой
очень сложные основы под кажущейся простотой.
Технология, поддерживающая резервное копирование и восстановление, транзакции
и целостность дать и открытие и выход из тупика
довольно сложный и не необходимый для обработки DW.
Характеристики ХД, конструктивная ориентация,
интеграция дать внутри DW, временная дисперсия и простота
управления дать, все приводит к среде, которая очень и очень
отличается от классической операционной среды. Источник почти всех
дать DW является операционной средой. Заманчиво думать
что существует массовая избыточность дать между двумя средами.
На самом деле, первое впечатление, которое у многих возникает,
большая избыточность дать между операционной средой и окружающей средой
Расширение ДВ. Такая интерпретация поверхностна и доказывает
непонимание того, что происходит в DW.
Действительно есть минимум избыточности дать между операционной средой
и дать из ДВ. Мы рассматриваем следующее:
▪ я дать они фильтруются дата которые вы переходите из операционной среды
в среду DW. Много дать они никогда не теряют сознание
из операционной среды. Только то, что я дать которые нужны для
Обработка DSS находит свое направление в среде
▪ временной горизонт дать это очень отличается от окружающей среды
к другому. НАШИ дать в операционной среде они очень свежие. НАШИ дать
в DW они намного старше. Только с точки зрения
временного горизонта, очень мало перекрытий
между операционной средой и ХД.
▪ ХД содержит дать резюме, которые никогда не были найдены
в окружающей среде
▪ я дать подвергнуться коренным преобразованиям, поскольку
момент, когда они переходят к рисунку 3, показывает, что большинство
часть дать существенно изменяются при условии
быть выбранным и перемещенным в ХД. Другими словами,
наиболее дать физически модифицирован e
радикально так как его перенесли на DW. С точки зрения
интеграции не одно и то же дать кто проживает
в операционной среде.
Учитывая эти факторы, избыточность дать между двумя средами есть
редкое явление, приводящее к менее чем 1% избыточности между двумя
среды.
СТРУКТУРА СКЛАДА
ДС имеют четкую структуру. Существуют различные уровни обобщения и
детали, разграничивающие ДС.
Различные компоненты DW:
▪ Метаданные
Давать текущие детали
Давать старой детали
Давать слегка резюмированный
Давать очень кратко
Безусловно, главная проблема для меня дать деталей
токи. Это основная проблема, потому что:
▪ я дать текущие детали отражают самые последние события,
которые всегда вызывают большой интерес и
▪ я дать текущих подробностей являются объемными, потому что они
хранится на самом низком уровне детализации e
▪ я дать текущие данные почти всегда хранятся на
дисковая память, доступ к которой быстрый, но дорогой и
комплекс из
I дать детали старше дать которые хранятся на
некоторые воспоминания о масса. Он имеет доступ спорадически, и это
хранится на уровне детализации, совместимом с дать детализированный
токи. Хотя не обязательно хранить на носителе
альтернативная память, из-за большого объема дать объединенный с
спорадический доступ дать, носитель информации для дать di
более старые детали обычно не сохраняются на диске.
I дать легко резюмировать они дать которые перегоняют снизу
уровень детализации найден на текущем уровне детализации. Этот
Уровень DW почти всегда хранится в памяти диска. НАШИ
проблемы дизайна, которые встают перед архитектором дать
в построении этого уровня ХД являются:
▪ За какую единицу времени выполнено обобщение выше
▪ Какое содержание, атрибуты будут немного резюмировать
содержание дать
Следующий уровень дать найденный в DW, это то, что дать высоко
резюмировал. НАШИ дать очень кратко, компактны и легко
доступный. НАШИ дать иногда встречаются сильно обобщенные
в среде DW и других случаях i дать очень кратко они
находится за пределами непосредственных стен технологического корпуса DW.
(во всяком случае я дать высоко обобщенные являются частью DW
независимо от того, где я дать находятся физически).
Последним компонентом DW является компонент метаданных. Во многих отношениях
метаданные находятся в другом измерении, чем другие дать
ХД, потому что метаданные не содержат никаких дата непосредственно
взяты из операционной среды. Метаданные играют особую роль e
очень важно в ДВ. Метаданные используются как:
▪ каталог, который поможет аналитику DSS найти
содержимое ДВ,
▪ руководство по картированию дать как я дать были
трансформируется из операционной среды в среду DW,
▪ руководство по алгоритмам, используемым для суммирования между i дать di
текущая деталь ei дать немного подытожил, я дать высоко
резюмировать,
Метаданные играют гораздо большую роль в среде DW.
по сравнению с тем, что они когда-либо имели в операционной среде
СРЕДСТВО ДЛЯ ХРАНЕНИЯ СТАРЫХ ДЕТАЛЕЙ
Магнитную ленту можно использовать для хранения такого рода
дать. Действительно, существует большое разнообразие носителей информации,
следует рассмотреть вопрос о сохранении старых дать di
подробно.
В зависимости от объема дать, частота доступа, стоимость
инструментов и типа доступа, вполне вероятно,
что другим инструментам потребуется старый уровень детализации
в ДВ.
ПОТОК ДАННЫХ
Существует нормальный и предсказуемый поток дать внутри ДВ.
I дать они попадают в ХД из операционной среды. (ПРИМЕЧАНИЕ: есть
некоторые очень интересные исключения из этого правила. Однако почти
все дать войти в ХД из операционной среды). Данный че я дать
они попадают в ХД из операционной среды, она трансформируется как была
описано ранее. Если вы войдете в DW, я дать они входят в
текущий уровень детализации, как показано. Он находится там и используется
пока не произойдет одно из трех событий:
▪ очищается,
▪ обобщается и/или
▪ есть
Устаревший процесс внутри ХД перемещает i дать текущие детали
a дать детали старые, по возрасту дать. Процесс
обобщение использует детали дать рассчитать дать
малообобщенные и высокообобщенные уровни дать. Есть
некоторые исключения из показанного потока (будут обсуждаться позже).
Однако, как правило, для подавляющего большинства дать найденный
внутри ДВ поток дать это так, как представлено.
ИСПОЛЬЗОВАНИЕ ХРАНИЛИЩА ДАННЫХ
Неудивительно, что различные уровни дать в ДВ нет
получить различные уровни использования. Как правило, чем выше уровень
подведение итогов, плюс я дать Они используются.
Многие виды использования встречаются в дать очень кратко, в то время как старый
дать деталей практически не используются. Есть веская причина в
перевести организацию на парадигму использования ресурсов. Еще есть
резюме я дать, тем быстрее и эффективнее будет достигнуть дать. Это
un магазин найти, что он выполняет многоуровневую обработку DW,
то соответствующее большое количество машинных ресурсов
потребляется. Судиться в интересах всех
как можно скорее на высоком уровне обобщения.
Для многих магазинов аналитик DSS в среде до DW использовал
дать на уровне детализации. Во многом приход в дать детализированный
напоминает защитное одеяло, даже когда они доступны
другие уровни обобщения. Одно из направлений деятельности архитектора дать è
отучить пользователя СПР от постоянного использования дать на уровне плюс
низкая детализация. Возможны две причины
архитектора дать:
▪ установка системы возвратных платежей, при которой конечный пользователь оплачивает
потребляемые ресурсы e
▪ указание на то, что очень хорошее время отклика может быть
получается, когда поведение с i дать это на высоком уровне
подведения итогов, в то время как плохое время отклика связано с
поведение дать на низком уровне
ДРУГИЕ СООБРАЖЕНИЯ
Есть несколько других соображений по строительству и управлению.
DW.
Первое соображение касается индексов. НАШИ дать на самых высоких уровнях
обобщение может быть свободно проиндексировано, в то время как я дать
на более низких уровнях детализации они настолько громоздки, что могут
экономно индексируется. Из того же токена я дать на высоких уровнях
деталь может быть относительно легко восстановлена,
в то время как объем дать на нижних уровнях она настолько велика, что я дать нет
их можно легко отремонтировать. Следовательно, модель
из дать и формальная работа, проделанная дизайном, представляет собой
фундамент для DW применяется почти исключительно на уровне
Деталь ток. Другими словами, деятельность по моделированию
дать они не применяются к уровням суммирования почти во всех случаях.
Еще одним структурным соображением является подразделение
дать по ДВ.
Раздел можно сделать на двух уровнях – на уровне СУБД и
прикладной уровень. В дивизии на уровне СУБД, то СУБД è
информируется о подразделениях и контролирует их соответствующим образом. В случае
разделение на прикладном уровне, только программист
проинформированы о подразделениях и ответственности за них
управление остается за ним
Ниже уровня СУБД, большая часть работы выполняется автоматически. Есть
большая негибкость, связанная с автоматическим администрированием
подразделения. В случае применения на уровне подразделения дать из
информационное хранилище, на программиста ложится много работы, но
конечным результатом является гибкость в управлении дать в дату
склад
ДРУГИЕ АНОМАЛИИ
В то время как компоненты информационное хранилище они работают как описано
почти для всех дать, есть несколько полезных исключений, которые необходимо
обсуждаться. Исключение составляет тот, дать публичные сводки
(общедоступные сводные данные). Это дать резюме, которые были
рассчитано из информационное хранилище но они используются обществом. НАШИ дать
общедоступные сводки хранятся и управляются в информационное хранилище,
хотя, как было сказано выше, они вычислены. НАШИ
бухгалтеры работают над выпуском таких ежеквартальных дать как
доход, квартальные расходы, квартальная прибыль и так далее. Работа
делается бухгалтерами вне информационное хранилище. Однако я дать соно
используется «внутри» внутри компании – от маркетинга, продажи и т. д.
Еще одна аномалия, о которой мы не будем говорить, связана с дать внешний.
Еще один выдающийся тип дать которые можно найти в данных
хранилище - это хранилище постоянных подробных данных. Это вызывает
нужно хранить постоянно я дать на одном уровне
подробно по этическим или юридическим причинам. Если компания отображает i
работников, имеющих отношение к опасным веществам, требуется дать
подробно и постоянно. Если компания производит продукт, который
касается общественной безопасности, какие части самолета, есть
Нужно дать постоянная подробная, а также если компания
заключать опасные контракты.
Компания не может позволить себе игнорировать конкретные причины
в течение следующих нескольких лет, в случае судебного иска, отзыва,
спорный строительный дефект и др. экспозиция компании
он может быть большим. В результате возникает уникальный тип дать
известные как постоянные подробные данные.
РЕЗЮМЕ
Un информационное хранилище это объектно-ориентированный интегрированный вариант
время, сборник дать энергонезависимой поддержки потребностей
решение администрации. Каждая из характерных особенностей
un информационное хранилище имеет свои последствия. Плюс есть четыре
уровни дать из информационное хранилище:
▪ Старые детали
▪ Текущая деталь
Давать слегка резюмированный
Давать очень кратко
Метаданные также являются важной частью информационное хранилище.
АННОТАЦИЯ
Концепция хранения дать недавно получил
много внимания и это стало тенденцией 90-х годов.
благодаря способности А. информационное хранилище преодолеть
ограничения систем поддержки управления, таких как i
системы поддержки принятия решений (СППР) и информационные системы
руководителей (ИСС).
Несмотря на то, что концепция информационное хранилище выглядит многообещающе,
реализовать я информационное хранилище может быть проблематично, потому что
крупномасштабных складских процессов. Несмотря на
сложность складских проектов дать, много поставщиков
и консультанты, которые продают дать они утверждают, что
хранение дать представить не проблема.
Однако в начале этого исследовательского проекта почти никто
были проведены независимые, тщательные и систематические исследования. От
Следовательно, трудно сказать, что происходит на самом деле
в промышленности, когда они строят информационное хранилище.
В этом исследовании изучалась складская практика дать
современников, целью которого является развитие более глубокого понимания
австралийской практики. Обзор литературы дал
контекст и основу для эмпирического исследования.
Есть ряд результатов этого исследования. Первый
место, это исследование выявило деятельность, которая происходила
во время разработки информационное хранилище. Во многих областях я дать собрал
подтвердили практику, описанную в литературе. Второй
сайт, вопросы и проблемы, которые он может затронуть
развитие информационное хранилище были выявлены этим исследованием.
Наконец, преимущества, полученные от австралийских организаций, связанных с
использование информационное хранилище были раскрыты.
Глава 1
Контекст поиска
Концепция хранилища данных получила широкое признание.
воздействия и превратилась в новую тенденцию в
90-е (Макфадден, 1996, TDWI, 1996, Шах и Мильштейн, 1997,
Шанкс и др. 1997 г., Экерсон 1998 г., Адельман и Оутс 2000 г.). То есть
видно из растущего числа статей по данным
складирование в отраслевых изданиях (Литтл и Гибсон, 1999).
Многие статьи (см., например, Fisher 1995, Hackathorn 1995,
Моррис, 1995а, Брамблетт и Кинг, 1996, Грэм и др. 1996 г.,
Сакагучи и Фролик 1996, Альварес 1997, Браусел 1997, Кларк
1997, Маккарти 1997, О'Доннелл 1997, Эдвардс 1998, TDWI
1999) сообщили о значительных преимуществах для организаций
которые реализуют я информационное хранилище. Они поддержали свою теорию
с неофициальными свидетельствами успешных внедрений, высокая отдача
на показатели инвестиций (ROI), а также предоставление руководства
ссылки или методологии для разработки информационное хранилище
(Шэнкс и др., 1997; Седдон и Бенджамин, 1998; Литтл и Гибсон).
1999). В крайнем случае Graham et al. (1996) есть
сообщили о средней доходности трехлетних инвестиций в размере 401%.
Однако большая часть современной литературы упускает из виду
сложности, связанные с осуществлением таких проектов. Проекты
информационное хранилище как правило, сложны и масштабны и
поэтому они подразумевают высокую вероятность отказа, если они не
тщательно проверены (Shah and Milstein 1997, Eckerson 1997,
Фоули 1997b, Циммер 1997, Борт 1998, Гиббс и Клаймер 1998, Рао
1998). Они требуют огромного количества как человеческих, так и человеческих ресурсов.
деньги, время и усилия для их создания (Hill 1998, Crofts 1998).
типичные затраты времени и финансовых средств составляют, соответственно,
около двух лет и двух-трех миллионов долларов (Braly 1995, Foley
1997b, Борт 1998, Хамфрис и др. 1999). Эти времена и средства
финансовые инструменты необходимы для контроля и консолидации многих аспектов
отличается от хранения данных (Cafasso 1995, Hill 1998). В сторону
аппаратных и программных соображений, других функций, которые различаются
от добычи дать к процессам загрузки дать, С
объем памяти для управления обновлениями и предоставления мета дать
необходимо учитывать для обучения пользователей.
На момент начала этого исследовательского проекта было очень мало
академические исследования, проводимые в области хранилищ данных,
особенно в Австралии. Это было видно по нехватке предметов.
опубликовано в хранилищах данных газетами или другими писаниями
академиков того времени. Многие академические труды
имеется описанный опыт США. Отсутствие
академические исследования в области хранилищ данных SL привели к
требовались тщательные исследования и эмпирические исследования (McFadden 1996,
Шанкс и др. 1997, Литтл и Гибсон, 1999). В частности, исследования
исследование процесса реализации информационное хранилище
необходимо сделать, чтобы расширить знания
вообще о реализации информационное хранилище e
послужит основой для будущего исследования (под редакцией Шэнкса
другие. 1997, Литтл и Гибсон, 1999).
Таким образом, цель настоящего исследования состоит в том, чтобы изучить, что же это такое на самом деле.
это происходит, когда организации поддерживают и используют данные
склад в Австралии. В частности, это исследование будет включать
анализ всего процесса разработки информационное хранилище,
начиная с инициации и проектирования через проектирование и
внедрение и последующее использование в организациях
австралийский. Кроме того, исследование также внесет свой вклад в текущую практику.
определение областей, в которых практика может быть продолжена
улучшены, а неэффективность и риски могут быть сведены к минимуму или
избегали. Кроме того, он послужит основой для других исследований по информационное хранилище in
Австралии и заполнит тот пробел, который в настоящее время существует в литературе.
Вопросы исследования
Целью данного исследования является изучение деятельности, связанной с
в реализации информационное хранилище и их использование
Австралийские организации. В частности, изучаются элементы
относительно планирования проекта, разработки, al
эксплуатация, использование и сопутствующие риски. Отсюда вопрос
этого исследования является:
«Как обстоят дела с нынешней практикой информационное хранилище в Австралии?"
Чтобы эффективно реагировать на эту проблему,
количество вспомогательных исследовательских вопросов. В частности, три
подвопросы были определены из литературы, т.
представлено в главе 2, чтобы направлять этот исследовательский проект:
Как реализованы я информационное хранилище по организациям
Австралиец? Какие проблемы возникают?
Каковы преимущества?
При ответе на эти вопросы использовался рисунок
исследовательское исследование, в котором используется исследование. Как я учусь
исследовательский, ответы на вышеуказанные вопросы не являются полными
(Шэнкс и др., 1993; Денскомб, 1998). В данном случае это
Триангуляция необходима для улучшения ответов на эти
Запросы. Тем не менее, расследование заложит прочную основу для
будущая работа по изучению этих вопросов. Подробный
обсуждение обоснования метода исследования и дизайна
представлена ​​в главе 3.
Структура исследовательского проекта
Этот исследовательский проект разделен на две части: контекстуальное исследование
концепции хранения данных и эмпирических исследований (см.
рис. 1.1), каждый из которых обсуждается ниже.
Часть I: Контекстное исследование
Первая часть исследования заключалась в обзоре
Текущая литература по различным типам хранилищ данных, включая i
системы поддержки принятия решений (СППР), информационные системы
руководителей (EIS), тематические исследования информационное хранилище и понятия даты
склад. Кроме того, результаты форумов на информационное хранилище и
группы встреч для экспертов и профессионалов во главе с группой
Исследование Monash DSS внесло свой вклад в этот этап исследования.
который был предназначен для получения информации о практике данных
складе и выявить риски, связанные с их принятием.
В этот период контекстуального изучения понимание
проблемной области было установлено, чтобы обеспечить знание
базу для последующих эмпирических исследований. Однако это
был непрерывным процессом, поскольку исследование проводилось
исследования.
Часть II: Эмпирическое исследование
Относительно новая концепция хранения данных, особенно
в Австралии, возникла необходимость провести расследование
получить общую картину использования опыта. Этот
часть была сделана после того, как проблемный домен был
были установлены в результате обширного обзора литературы. Концепт
формата хранилища данных на этапе контекстуального исследования.
был использован в качестве исходных данных для начальной анкеты этого исследования.
После этого анкета была рассмотрена. Вы эксперты по свиданиям
склад участвовал в тесте. Цель тестирования
первоначальный вопросник должен был проверить на полноту и точность
некоторые вопросы. По результатам тестирования составляется анкета.
отредактировано, и отредактированная версия отправлена
участников опроса. Анкеты возвращены тогда были
проанализировано для меня дать в таблицах, диаграммах и других форматах. НАШИ
результаты анализа дать сформировать моментальный снимок
практика хранения данных в Австралии.
ОБЗОР ХРАНИЛИЩА ДАННЫХ
Концепция хранилища данных эволюционировала с улучшениями
компьютерной техники.
Он направлен на преодоление проблем, с которыми сталкиваются группы
поддержка приложений, таких как система поддержки принятия решений (DSS) e
Исполнительная информационная система (EIS).
В прошлом самым большим препятствием для этих приложений было
неспособность этих приложений обеспечить база данных
необходимые для анализа.
В основном это связано с характером работы.
лидерство. Интересы руководства компании различны.
постоянно в зависимости от обрабатываемой области. Поэтому я дать
фундаментальные для этих приложений, должны быть в состоянии
быстро меняются в зависимости от обрабатываемой части.
Это означает, что я дать должен быть доступен в виде
достаточно для необходимых анализов. На самом деле, группы поддержки
приложения нашли много трудностей в прошлом, чтобы собрать ed
интеграция дать из сложных и разнообразных источников.
В оставшейся части этого раздела представлен обзор концепции
хранилища данных и как информационное хранилище может превышать я
Проблемы группы поддержки приложений.
Термин "Хранилище данныхбыл выпущен Уильямом Инмоном в 1990 году.
Его часто цитируемое определение Хранилище данных как
коллекция дать предметно-ориентированный, интегрированный, энергонезависимый и вариативный
со временем, в поддержку управленческих решений.
Используя это определение, Инмон указывает, что я дать жилая
в информационное хранилище должен обладать следующими 4
особенности:
▪ Предметно-ориентированный
▪ Интегрированный
▪ Энергонезависимый
▪ Переменная во времени
Под предметно-ориентированным Инмон подразумевает, что я дать в дату
склад в крупнейших организационных областях, которые были
определено в модели дать. например все дать относительно i клиентов
содержатся в предметной области КЛИЕНТЫ. Аналогично все
дать относящиеся к продуктам, содержатся в предметной области
ПРОДУКТЫ.
Под Integrated Inmon подразумевается, что я дать исходящие из разных
платформы, системы и локации объединяются и хранятся в
только место. Следовательно дать подобное должно быть преобразовано
в согласованных форматах для добавления и сравнения
легко.
Например, мужской и женский пол представлены
буквами М и Ф в одной системе и с 1 и 0 в другой. Для
интегрировать их правильно, один или оба формата должны
преобразовать так, чтобы оба формата были одинаковыми. В этом
случае мы могли бы изменить M на 1 и F на 0 или наоборот. Ориентируйтесь на
предмет и Интегрированный указывают, что информационное хранилище предназначен для
обеспечивают функциональное и трансверсальное видение дать дает часть
компания.
Под энергонезависимой он подразумевает, что я дать в информационное хранилище римангоно
последовательное и обновление дать это не обязательно. Вместо этого каждый
изменение в дать оригиналы добавлены в база данных даты
склад. Это означает, что историк дать содержится в
информационное хранилище.
Для переменных со временем Inmon указывает, что i дать в информационное хранилище
всегда содержат индикаторы темпа ei дать нормально
охватывают определенный временной горизонт. Например
информационное хранилище может содержать 5 лет исторических значений клиентов от
с 1993 по 1997 год. Наличие истории и временного ряда
из дать позволяет анализировать тенденции.
Un информационное хранилище он может сам собрать дать из систем
OLTP; из источников дать внешними по отношению к организации и/или другими специалистами
захват системных проектов дать.
I дать экстракты могут пройти процесс очистки, в
это дело я дать они трансформируются и интегрируются до того, как
Хранится в база данных из информационное хранилище. Затем я дать
проживающие в пределах база данных из информационное хранилище доступны
доступ конечных пользователей и средства восстановления. С использованием
эти инструменты конечный пользователь может получить доступ к интегрированному представлению
организации дать.
I дать проживающие в пределах база данных из информационное хранилище соно
хранятся как в подробном, так и в сводном форматах.
Уровень обобщения может зависеть от характера дать. дать
подробное может состоять из дать текущий и дать исторический
I дать реальные не входят в информационное хранилище пока я дать
в информационное хранилище повторно обновляются.
В дополнение к хранению дать сами, а информационное хранилище может также
хранить разного рода дата называемые МЕТАДАННЫМИ, которые
опиши меня дать проживающий в его база данных.
Существует два типа метаданных: метаданные разработки и метаданные.
анализы.
Метаданные разработки используются для управления и автоматизации
процессы добычи, очистки, картирования и загрузки дать в
информационное хранилище.
Информация, содержащаяся в метаданных разработки, может содержать
сведения об операционных системах, сведения об элементах, которые необходимо извлечь,
модель дать из информационное хранилище и правила компании для
преобразование дать.
Второй тип метаданных, известный как аналитические метаданные.
позволяет конечному пользователю исследовать содержимое данных
склад, чтобы найти дать доступные и их значение с точки зрения
ясно и не технично.
Поэтому метаданные анализа работают как мост между данными
складские и пользовательские приложения. Эти метаданные могут
содержать бизнес-модель, описание дать соответствие
к бизнес-модели, заранее заданным запросам и отчетам,
информация о логинах пользователей и index.
Метаданные анализа и разработки должны быть объединены в один
интегрированное сдерживание метаданных для правильной работы.
К сожалению, многие из существующих инструментов имеют свои собственные
метаданные, и в настоящее время не существует стандартов,
они позволяют инструментам хранения данных интегрировать эти
метаданные. Чтобы исправить эту ситуацию, многие трейдеры
основные инструменты хранения данных сформировали метаданные
Совет, который позже стал Коалицией метаданных.
Целью этой коалиции является создание набора метаданных
стандарт, который позволяет различным инструментам хранения данных
конвертировать метаданные
Их усилия привели к рождению Meta
Спецификация обмена данными (MDIS), которая позволит обмениваться
информации между архивами Microsoft и соответствующими файлами MDIS.
Существование дать как в обобщенном/индексированном, так и в подробном виде дает
пользователю возможность выполнить DRILL DROWN
(бурение) давай дать индексируются в подробные и наоборот.
Существование дать подробная история позволяет реализовать
анализ тенденций во времени. Кроме того, метаданные анализа могут
использоваться как каталог del база данных из информационное хранилище для
помочь конечным пользователям найти меня дать нужно.
По сравнению с системами OLTP с их способностью поддерживать
анализ дать и отчетности, информационное хранилище это рассматривается как система
больше подходит для информационных процессов, таких как выполнение и
отвечать на запросы и составлять отчеты. Следующий раздел
подробно осветит различия этих двух систем.
ХРАНИЛИЩЕ ДАННЫХ ПРОТИВ OLTP-СИСТЕМ
Многие информационные системы в организациях
они предназначены для поддержки повседневных операций. Эти
системы, известные как OLTP SYSTEMS, захватывают транзакции
постоянно обновляется ежедневно.
I дать в этих системах часто изменяются, добавляются или
удален. Например, адрес клиента почти не меняется
он перемещается с места на место. В этом случае новый адрес
будут зарегистрированы путем изменения поля адреса база данных.
Основная цель этих систем – снижение затрат на
транзакций и в то же время сократить время обработки.
Примеры систем OLTP включают критические действия, такие как запись
бухгалтерский учет заказов, начисление заработной платы, счета, производство, ай услуги клиентов.
В отличие от OLTP-систем, которые создавались процессом
на основе транзакций и событий, я информационное хранилище они были созданы
обеспечивать поддержку процесса на основе анализа дать и
процессы принятия решений.
Обычно это достигается путем интегрирования i дать из различных систем
OLTP и внешний в одном «контейнере» дать,как обсуждалось
в предыдущем разделе.
Модель процесса хранилища данных Monash
Модель процесса для информационное хранилище Монаш был разработан
исследователи исследовательской группы Monash DSS Research Group, основаны на
литературы информационное хранилище, об опыте поддержки алло
развитие системных направлений, на обсуждениях с вендорами
приложения для использования на информационное хранилищена группу экспертов
в использовании информационное хранилище.
Этапы: инициация, планирование, разработка, эксплуатация и
Пояснения. Диаграмма объясняет итеративный характер o
эволюционное развитие информационное хранилище процесс с использованием
двусторонние стрелки, расположенные между разными фазами. В этом
«итеративный» и «эволюционный» контекст означают, что в каждом
этап процесса, деятельность по реализации может быть
всегда распространяются назад к предыдущему этапу. Это
в связи с характером проекта информационное хранилище , в котором
дополнительные запросы делаются в любое время
конечного пользователя. Например, на этапе разработки
процесс информационное хранилище, один запрашивается конечным пользователем
новое измерение или предметная область, которая не была частью
исходный план, это необходимо добавить в систему. Этот
вызывает изменения в проекте. В результате команда из
дизайн должен изменить требования документов, созданных до сих пор
на этапе проектирования. Во многих случаях текущее состояние
проект должен вернуться на стадию проектирования, где
новый запрос должен быть добавлен и задокументирован. Пользователь
final должен иметь возможность видеть конкретную пересмотренную документацию, т.е.
изменения, внесенные на этапе разработки. В конце
В этом цикле разработки проект должен получить отличную обратную связь от
обе команды, команда разработчиков и команда пользователей. НАШИ
обратная связь затем повторно используется для улучшения будущего проекта.
Планирование мощности
DW имеют тенденцию быть очень большими по размеру и расти
очень быстро (Бест 1995, Рудин 1997а) после
количество дать исторические, которые они сохраняют от своей длительности. Там
рост также может быть вызван дать дополнительные требования
пользователей, чтобы увеличить ценность дать что они уже есть. От
соответственно требования к хранению дать может
быть значительно улучшена (Eckerson 1997). Так что, это
важно обеспечить, осуществляя планирование
потенциал, что создаваемая система может расти вместе с
растущие потребности (Бест, 1995 г., ЛаПланте, 1996 г., Ланг, 1997 г.,
Экерсон 1997, Рудин 1997а, Фоли 1997а).
При планировании масштабируемости dw необходимо знать
ожидаемый рост размера склада, типы вопросов
которые могут быть сделаны, и количество поддерживаемых конечных пользователей (наилучшее
1995, Рудин 1997б, Фоли 1997а). Создавайте масштабируемые приложения
требуется сочетание технических и масштабируемых серверных технологий
масштабируемого дизайна приложений (Best 1995, Rudin 1997b.
Оба необходимы при создании приложения
чрезвычайно масштабируемый. Масштабируемые серверные технологии могут
позволяет легко и удобно добавлять хранилище, память и
Процессор без снижения производительности (Lang 1997, Telephony 1997).
Существует две основные масштабируемые серверные технологии:
симметричное мультиплексирование (SMP) и массовая обработка
параллельный (MPP)) (IDC 1997, Humphries et al. 1999). сервер
SMP обычно имеет несколько процессоров, совместно использующих память.
шинная система и другие ресурсы (IDC 1997, Humphries et al. 1999).
Дополнительные процессоры могут быть добавлены для увеличения
ее власть вычислительный. Еще один способ увеличить
власть вычислительной части SMP-сервера, заключается в объединении многочисленных
машины СМП. Этот метод известен как кластеризация (Humphries
и другие. 1999). Сервер MPP, с другой стороны, имеет несколько процессоров каждый.
собственной памятью, шинной системой и другими ресурсами (IDC 1997,
Хамфрис и др. 1999). Каждый процессор называется узлом. А
увеличение в власть вычисление может быть получено
добавление дополнительных узлов к серверам MPP (Хамфрис и др.
1999).
Слабость SMP-серверов в том, что слишком много операций ввода-вывода
(ввод-вывод) может перегрузить шинную систему (IDC 1997). Этот
проблема не возникает на серверах MPP, поскольку каждый
процессор имеет собственную шинную систему. Тем не менее, взаимосвязи
между каждым узлом, как правило, намного медленнее, чем шинная система
из СМП. Кроме того, серверы MPP могут добавлять слой
дополнительные сложности для разработчиков приложений (IDC
1997). Таким образом, на выбор между серверами SMP и MPP можно повлиять.
многими факторами, включая сложность вопросов, соотношение
цена/производительность, требуемая мощность обработки,
предотвращение приложений dw и увеличение размера база данных
dw и по количеству конечных пользователей.
Многочисленные масштабируемые методы разработки приложений
можно использовать при планировании мощностей. Один
использует различные отчетные периоды, такие как дни, недели, месяцы и годы.
Имея различные периоды уведомления, база данных можно разделить на
части легко группируются (Inmon et al. 1997). Другой
методика заключается в использовании сводных таблиц, построенных
подведение итогов дать da дать подробный. Таким образом, я дать резюме больше
компактный, чем подробный, который требует меньше места в памяти.
Таким образом, дать детали могут быть заархивированы в единице
менее дорогое хранилище, которое экономит еще больше депозита.
Хотя использование сводных таблиц может сэкономить место
памяти, они требуют больших усилий, чтобы поддерживать их в актуальном состоянии и в
в соответствии с коммерческими потребностями. Однако эта техника является
широко используется и часто используется в сочетании с техникой
предыдущий (Лучший 1995, Инмон 1996a, Чаудури и Даял
1997).
Определяющий Хранилище данных Технический
Архитектуры Определение методов
dw архитектуры
Первоначальные сторонники хранилищ данных в основном задумывались
централизованная реализация dw, где все дать, в том числе
i дать внешние, были объединены в единую,
физическое хранилище (Inmon 1996a, Bresnahan 1996, Peacock 1998).
Основным преимуществом этого подхода являются конечные пользователи.
они могут получить доступ к представлению предпринимательского масштаба
(общее представление предприятия) dei дать организационные (Овум, 1998). Другой
Преимущество заключается в том, что он предлагает стандартизацию дать через
организации, а это значит, что существует только одна версия или
определение для каждой терминологии, используемой в репозитории dw
(репозиторий) метаданные (Flanagan and Safdie 1997, Ovum 1998).
Недостатком этого подхода, с другой стороны, является его дороговизна и сложность.
будут построены (Flanagan and Safdie 1997, Ovum 1998, Inmon et al.
1998). Вскоре после архитектуры хранения дать
стала популярной централизованная, концепция извлечения развилась
из наименьших подмножеств дать поддерживать потребности
для конкретных приложений (Варни, 1996 г., IDC, 1997 г., Берсон и Смит).
1997, павлин 1998). Эти небольшие системы являются производными от более крупных
большой информационное хранилище централизованный. Их называют датой
зависимые склады отделов или зависимые витрины данных.
Зависимая архитектура витрины данных известна как
трехуровневая архитектура, где первый уровень состоит из данных
централизованный склад, второй состоит из складов дать
ведомственный, а третий состоит из доступа к дать и из инструментов
анализ (Демарест, 1994 г., Инмон и др., 1997 г.).
Витрины данных обычно строятся после информационное хранилище
централизованное построено для удовлетворения потребностей
конкретные единицы (White 1995, Varney 1996).
Витрины данных i дать очень актуально в отношении подробностей
единство (Инмон и др., 1997, Инмон и др., 1998, ИА, 1998).
Преимущество этого метода в том, что не будет дата нет
интегрированный и что я дать они будут менее избыточными в данных
рынки, так как все дать происходят из депозита дать интегрированный.
Другое преимущество состоит в том, что будет меньше связей между каждым
витрина данных и связанные с ней источники дать потому что каждая витрина данных имеет только
источник дать. Кроме того, с этой архитектурой пользователи
пользователи по-прежнему могут получить доступ к обзору дать
корпоративные организации. Этот метод известен как
нисходящий метод, при котором витрины данных строятся после того, как данные
склад (Павлин 1998, Гофф 1998).
Повышение потребности показывать результаты раньше, некоторые
организации начали создавать независимые витрины данных
(Фланаган и Сафди, 1997; Уайт, 2000). В этом случае витрины данных
они берут свое дать прямо из основ дать OLTP и не с тех пор
централизованное и интегрированное хранилище, что устраняет необходимость в
иметь центральный репозиторий на месте.
Для каждой витрины данных требуется хотя бы одна ссылка на ее источники.
di дать. Один недостаток наличия нескольких ссылок для каждой даты
mart заключается в том, что по сравнению с двумя предыдущими архитектурами,
переизбыток дать значительно увеличивается.
Каждая витрина данных должна хранить все дать требуется на месте для
не влияют на OLTP-системы. Это заставляет меня дать
они хранятся в разных витринах данных (Инмон и др., 1997).
Другим недостатком этой архитектуры является то, что она приводит к
создание сложных взаимосвязей между витринами данных и их
источники дать которые трудно выполнять и контролировать (Inmon ed
другие. 1997).
Другим недостатком является то, что конечные пользователи могут не включать
получить доступ к обзору информации о компании, потому что я дать
различные витрины данных не интегрированы (Ovum 1998).
Еще одним недостатком является то, что может быть более одного
определение для каждой терминологии, используемой в витринах данных, которые он генерирует
несоответствия дать в организации (Овум 1998).
Несмотря на рассмотренные выше недостатки, независимые витрины данных
по-прежнему вызывают интерес многих организаций (IDC 1997).
Одним из факторов, который делает их привлекательными, является то, что они быстрее развиваются.
и требуют меньше времени и ресурсов (Bresnahan 1996, Berson e.
Смит 1997, Овум 1998). Соответственно, они в основном служат
в качестве тестовых планов, которые можно использовать для выявления
быстро выявить преимущества и/или недостатки проекта (Parsaye
1995, Брали, 1995, Ньюинг, 1996). В этом случае часть из
реализация в пилотном проекте должна быть небольшой, но важной
для организации (Ньюинг 1996, Мэнселл-Льюис 1996).
Изучив прототип, конечные пользователи и администрация могут
решить, продолжать или остановить проект (Фланаган и Сафди
1997).
Если будет принято решение о продолжении, витрины данных для других отраслей
они должны быть построены по одному. Есть два варианта
конечные пользователи в зависимости от их потребностей в построении данных
независимые матры: интегрированные/объединенные и неинтегрированные (Ovum
1998)
В первом методе необходимо создавать каждую новую витрину данных.
на основе текущих витрин данных и модели дать используемый
фирмой (Варни, 1996; Берсон и Смит, 1997; Пикок, 1998).
Необходимость использования модели дать компании делает необходимым
убедитесь, что для каждой терминологии имеется только одно определение
используется через витрины данных, это также должно гарантировать, что данные
различные витрины могут быть объединены, чтобы дать обзор
корпоративная информация (Бреснахан, 1996). Этот метод
называется восходящей и лучше всего, когда есть ограничение на
времени и финансовых средств (Flanagan and Safdie 1997, Ovum 1998,
павлин 1998, Гофф 1998). Во втором методе витрины данных
построенный может только удовлетворить потребности конкретного подразделения.
Вариантом федеративной витрины данных является информационное хранилище распределенный
где база данных ПО промежуточного слоя хаб-сервера используется для объединения многих
витрины данных в едином репозитории дать распространены (Уайт, 1995). В
этот случай, я дать бизнес распределены по нескольким витринам данных.
Запросы конечных пользователей перенаправляются на база данных
ПО промежуточного слоя хаб-сервера, которое извлекает все дать запрошенные данные
витринах и передавать результаты обратно в приложения конечного пользователя. Этот
метод предоставляет бизнес-информацию конечным пользователям. Однако,
проблемы с витринами данных до сих пор не устранены
независимый. Существует еще одна архитектура, которую можно использовать.
позвони информационное хранилище виртуальный (Уайт, 1995). Однако это
архитектура, описанная на рис. 2.9, не является архитектурой
хранения дать реальный, так как он не перемещает нагрузку
от OLTP-систем до информационное хранилище (Демарест, 1994).
На самом деле запросы на дать конечными пользователями прошли через ИИ
OLTP-системы, которые возвращают результаты после обработки
запросы пользователей. Хотя эта архитектура позволяет пользователям
окончательный для создания отчетов и формулирования запросов, не может предоставить
дать история и обзор информации о компании с тех пор, как я дать
поскольку различные системы OLTP не интегрированы. Итак, это
архитектура не может удовлетворить анализ дать комплекс, такой как
примерные предсказания.
Выбор приложения доступа и
восстановление дать
Цель создания информационное хранилище заключается в том, чтобы передать
информации конечным пользователям (Inmon et al. 1997, Poe 1996,
Макфадден, 1996 г., Шанкс и др., 1997 г., Хаммергрен, 1998 г.); один или
несколько приложений доступа и восстановления дать должно быть предоставлено. К
сегодня существует большое разнообразие таких приложений, среди которых пользователь может
выбирать (Hammergren 1998, Humphries et al. 1999).
выбранные приложения определяют успех усилий
хранения дать в организации, потому что
приложения являются наиболее заметной частью информационное хранилище пользователю
окончательный (Инмон и др., 1997; По, 1996). Чтобы добиться успеха на свидании
склад, должен быть в состоянии поддерживать деятельность по анализу данных дать
конечного пользователя (По, 1996, Седдон и Бенджамин, 1998, Экерсон
1999). Таким образом, «уровень» того, что хочет конечный пользователь, должен быть
идентифицированы (Poe 1996, Mattison 1996, Inmon et al. 1997,
Хамфрис и др., 1999).
В целом, конечных пользователей можно разделить на три группы.
категории: исполнительные пользователи, бизнес-аналитики и опытные пользователи (Poe
1996, Хамфрис и др., 1999). Исполнительным пользователям необходимо
легкий доступ к предопределенным наборам отчетов (Humphries ed
другие 1999). Эти отчеты могут быть легко получены с помощью
навигация по меню (Poe 1996). Кроме того, отчеты должны
представить информацию, используя графическое представление
такие как таблицы и шаблоны для быстрой доставки
информации (Хамфрис и др., 1999). Бизнес-аналитики, которые не
у них могут быть технические возможности для построения отношений с
ноль сами по себе, нужно иметь возможность изменять текущие отчеты для
удовлетворения их конкретных потребностей (Poe 1996, Humphries et al.
1999). С другой стороны, опытные пользователи — это тип конечных пользователей, которые
иметь возможность генерировать и писать запросы и отчеты из
ноль (По, 1996; Хамфрис и др., 1999). Это те, кто
разрабатывать отчеты для других типов пользователей (Poe 1996, Humphries
и др., 1999).
После того, как требования конечного пользователя определены, это необходимо сделать.
выбор приложений для доступа и восстановления дать из всех
доступные (Poe 1996, Inmon et al. 1997).
Доступ к дать и поисковые инструменты могут быть
делятся на 4 типа: инструмент OLAP, инструмент EIS/DSS, инструмент запросов и
инструменты отчетности и интеллектуального анализа данных.
Инструменты OLAP позволяют пользователям создавать специальные запросы, а также
сделанные на база данных из информационное хранилище. Плюс эти продукты
разрешить пользователям переходить от дать общий для тех
подробный.
Инструменты EIS/DSS предоставляют исполнительную отчетность, такую ​​как анализ «что, если»
и доступ к организованным меню отчетам. Отчеты должны быть
предопределены и объединены с меню для облегчения навигации.
Инструменты запросов и отчетов позволяют пользователям создавать отчеты
предопределенное и конкретное.
Инструменты интеллектуального анализа данных используются для выявления взаимосвязей, которые
могли бы пролить новый свет на операции, забытые в дать из
хранилище данных.
Наряду с оптимизацией требований каждого типа пользователей, я
выбранные инструменты должны быть интуитивно понятными, эффективными и простыми в использовании.
Они также должны быть совместимы с другими частями архитектуры e.
возможность работать с существующими системами. Также предлагается
выбрать инструменты доступа и извлечения данных с ценами и производительностью
разумный. Другие критерии, которые следует учитывать, включают приверженность
поставщик инструмента в поддержку своего продукта и связанных с ним разработок
сам будет иметь в будущих выпусках. Чтобы обеспечить вовлечение пользователей
при использовании хранилища данных команда разработчиков привлекает
пользователей в процессе выбора инструмента. В этом случае
должна быть проведена практическая оценка пользователя.
Чтобы повысить ценность хранилища данных, команда разработчиков может
также предоставляют веб-доступ к своим хранилищам данных. А
Хранилище данных с поддержкой Интернета позволяет пользователям получать доступ к дать
из отдаленных мест или во время путешествия. Также информация может
предоставляться с меньшими затратами за счет снижения издержек
ди обучение.
2.4.3 Хранилище данных Этап эксплуатации
Эта фаза состоит из трех действий: определение стратегии свиданий
обновление, контроль деятельности хранилища данных и управление
безопасность хранилища данных.
Определение стратегий обновления данных
После первоначальной загрузки я дать в база данных хранилища данных
необходимо периодически обновлять, чтобы играть в i
изменения, внесенные в дать оригиналы. Итак, мы должны решить
когда обновлять, как часто следует
обновить и как обновить дать. Предлагается сделать
обновление дать когда система может быть переведена в автономный режим. Там
частота обновления определяется командой разработчиков на основе
на требования пользователя. Существует два подхода к обновлению
хранилище данных: полное обновление и непрерывная загрузка
изменения.
Первый подход, полное обновление, требует перезагрузки
все дать с нуля. Это означает, что все дать требуется должен
быть извлечены, очищены, преобразованы и интегрированы в каждое обновление. Этот
подхода следует по возможности избегать, поскольку
это требует много времени и ресурсов.
Альтернативный подход — постоянно загружать i
изменения. Это добавляет я дать которые были изменены
с момента последнего цикла обновления хранилища данных. Идентификация
новые или измененные записи значительно уменьшают количество
дать которые должны распространяться в хранилище данных в каждом
обновить, так как только эти дать будет добавлено к база данных
хранилища данных.
Есть как минимум 5 подходов, которые можно использовать для вывода
i дать новый или модифицированный. Чтобы получить эффективную стратегию
обновление дать сочетание этих подходов может быть полезным
получает все изменения в системе.
Первый подход, использующий временные метки, предполагает, что
присвоено всем дать изменена и обновлена ​​метка времени таким образом
чтобы можно было легко идентифицировать все дать модифицированные и новые.
Однако этот подход не нашел широкого применения в большинстве
частью современных операционных систем.
Второй подход заключается в использовании дельта-файла, созданного
приложение, которое содержит только изменения, внесенные в дать.
Использование этого файла также увеличивает цикл обновления.
Однако даже этот метод не применялся во многих
Приложения.
Третий подход заключается в сканировании файла журнала, который
в основном содержит информацию, аналогичную дельта-файлу. Единственный
разница в том, что файл журнала создается для процесса восстановления e
это может быть трудно понять.
Четвертый подход заключается в изменении кода приложения.
Однако большая часть кода приложения устарела и
хрупкий; поэтому этого метода следует избегать.
Последний подход заключается в сравнении i дать исходники с файлом
главный из дать.
Мониторинг деятельности хранилища данных
После того, как хранилище данных было предоставлено пользователям, оно
необходимо контролировать во времени. В этом случае администратор
хранилища данных может использовать один или несколько инструментов управления e
контроль за использованием хранилища данных. В частности
информация о людях и погоде может быть собрана в
которым они получают доступ к хранилищу данных. Ну давай же дать собранные могут быть созданы
профиль выполненной работы, который можно использовать в качестве входных данных
в реализации пользовательского чарджбэка. Возвратный платеж
позволяет пользователям получать информацию о стоимости обработки
хранилище данных.
Кроме того, управление хранилищем данных также можно использовать для
определять типы запросов, их размер, количество запросов в
день, время реакции на запрос, охваченные сектора и количество
di дать обработанный. Еще одна цель проверки
хранилище данных идентифицирует i дать которые не используются. Эти дать
их можно удалить из хранилища данных, чтобы улучшить время
ответа на запрос и контролировать рост
дать которые находятся внутри база данных хранилища данных.
Управление безопасностью хранилища данных
Хранилище данных содержит дать интегрированный, критический, чувствительный, который
можно легко добраться. По этой причине следует
быть защищены от неавторизованных пользователей. Способ
для реализации безопасности нужно использовать функцию del СУБД
для назначения различных привилегий разным типам пользователей. В этом
образом, профиль должен поддерживаться для каждого типа пользователя
доступ. Еще один способ защитить хранилище данных — зашифровать его.
как написано в база данных хранилища данных. Доступ к
дать и поисковые инструменты должны расшифровать дать перед отправкой я
результатов пользователям.
2.4.4 Хранилище данных Этап развертывания
Это последний этап цикла внедрения хранилища данных.
мероприятия, которые должны быть выполнены на этом этапе, включают в себя обучение
пользователям использовать хранилище данных и создавать обзоры
хранилища данных.
Обучение пользователей
Обучение пользователей должно быть проведено в первую очередь
доступа к дать хранилища данных и использования инструментов
поиск. Как правило, занятия следует начинать с
знакомство с концепцией хранения дать, Чтобы
содержимое хранилища данных, метаданные AI дать и основные черты
инструментов. Затем более продвинутые пользователи могли также изучить
физические таблицы и пользовательские функции доступа к данным и инструменты
поиск.
Существует множество подходов к обучению пользователей. Один из
это обеспечивает выбор многих пользователей или аналитиков, выбранных
набор пользователей, полагаясь на их лидерство и навыки
коммуникация. Они проходят обучение в личном качестве на
все, что им нужно знать, чтобы познакомиться с
система. После окончания обучения они возвращаются к своей работе.
они начинают учить других пользователей, как пользоваться системой. На
на основе того, что они узнали, другие пользователи могут запускать рекламу
исследовать хранилище данных.
Другой подход заключается в обучении многих пользователей одному и тому же
время, как если бы вы делали курс в классе. Этот метод
подходит, когда есть много пользователей, которых нужно обучить
в то же время. Еще один метод – тренировать
каждый пользователь индивидуально, один за другим. Этот метод
подходит, когда есть несколько пользователей.
Цель обучения пользователей – ознакомить их
с доступом к дать и поисковые инструменты, а также содержимое
хранилище данных. Тем не менее, некоторые пользователи могут быть перегружены
по количеству информации, предоставленной во время сеанса
обучение. Таким образом, ряд должен быть сделан
обновлять сеансы текущей помощи и реагировать
на конкретные вопросы. В некоторых случаях группа
пользователей для предоставления такого рода поддержки.
Сбор отзывов
После развертывания хранилища данных пользователи могут
использовать я дать находящихся в хранилище данных для различных целей.
В основном аналитики или пользователи используют i дать в
хранилище данных для:
1 Определите тенденции компании
2 Проанализируйте профили закупок клиентов
3 Сплит я клиентов и
4 Предоставлять лучшие услуги клиентов - настроить услуги
5 Сформулируйте стратегии маркетинга
6 Сделайте конкурентоспособные предложения для анализа затрат и помощи
контроль
7 Поддержка принятия стратегических решений
8 Определите возможности для появления
9 Улучшить качество текущих бизнес-процессов
10 Проверьте прибыль
Следуя направлению развития хранилища данных, они могли
провести серию обзоров системы для получения обратной связи
как от команды разработчиков, так и от сообщества пользователей
конечные пользователи.
Полученные результаты могут быть учтены при
следующий цикл разработки.
Поскольку хранилище данных имеет инкрементный подход,
важно учиться на успехах и ошибках предыдущих
разработки.
2.5 Резюме
В этой главе обсуждались подходы, присутствующие в
литература. В разделе 1 обсуждалась концепция
Хранилище данных и его роль в науке принятия решений. в
в разделе 2 были описаны основные различия между
хранилища данных и OLTP-системы. В разделе 3 мы обсуждали
модель хранилища данных по Монашу, которая использовалась
в разделе 4, чтобы описать действия, вовлеченные в процесс
разработки хранилища данных, эти тезисы не основывались на
тщательное исследование. То, что происходит на самом деле, может быть
сильно отличается от того, что сообщает литература, однако эти
результаты могут быть использованы для создания базового багажа, который
вы подчеркиваете концепцию хранилища данных для этого исследования.
Глава 3
Методы исследования и проектирования
В этой главе рассматриваются методы исследования и проектирования для
эта учеба. Первая часть показывает общий вид методов
поисковые системы, доступные для поиска информации, кроме
обсуждаются критерии выбора наилучшего метода для одного
конкретное исследование. В разделе 2 затем обсуждаются два метода.
отобраны по только что изложенным критериям; из них будут выбраны ред.
принят один с причинами, изложенными в разделе 3, где они
объясняются также причины исключения другого критерия. Там
в разделе 4 представлен исследовательский проект, а в разделе 5 le
выводы.
3.1 Исследования в области информационных систем
Исследования в области информационных систем не ограничиваются
в технологическую сферу, но также должны быть расширены, чтобы включить
поведенческие и организационные цели.
Мы обязаны этим тезисам различных дисциплин, начиная от
социальные науки к естественным; это приводит к необходимости
определенный спектр методов исследования с привлечением количественных методов
и качественные для использования в информационных системах.
Все доступные методы исследования важны, на самом деле несколько
такие исследователи, как Jenkins (1985), Nunamaker et al. (1991) и Гальерс
(1992) утверждают, что не существует универсального конкретного метода
проводить исследования в различных областях информационных систем; Действительно
метод может быть подходящим для конкретного исследования, но не
для других. Это приводит нас к необходимости выбрать метод, который
подходит для нашего конкретного исследовательского проекта: для этого
выбор Benbasat et al. (1987) заявляют, что их следует рассматривать
характер и цель исследования.
3.1.1 Характер исследования
В зависимости от характера исследования могут быть использованы различные методы.
классифицируется на три традиции, широко известные в науке
информации: позитивистское, интерпретативное и критическое исследование.
3.1.1.1 Позитивистское исследование
Позитивистское исследование также известно как научное исследование или
эмпирический. Он стремится: «объяснить и предсказать, что произойдет в
социального мира, рассматривая закономерности и причинно-следственные связи
среди составляющих его элементов» (Шэнкс и др., 1993).
Позитивистские исследования также характеризуются повторяемостью,
упрощения и опровержения. Кроме того, позитивистские исследования признают
наличие априорных связей между изучаемыми явлениями.
Согласно Galliers (1992), таксономия — это метод исследования
входит в позитивистскую парадигму, которая, однако, этим не ограничивается,
на самом деле есть лабораторные эксперименты, полевые эксперименты,
тематические исследования, доказательство теорем, предсказания и моделирование.
Используя эти методы, исследователи признают, что явления
изученное можно наблюдать объективно и строго.
3.1.1.2 Интерпретативное исследование
Интерпретативное исследование, которое часто называют феноменологией или
антипозитивизм описывается Нейманом (1994) как «анализ
систематизация социального смысла действия через непосредственное и
детальное наблюдение за людьми в естественных условиях с целью
прийти к пониманию и интерпретации того, как
люди создают и поддерживают свой социальный мир. Исследования
Интерпретативные теории отвергают предположение, что наблюдаемые явления
можно наблюдать объективно. Ведь они основаны
на субъективные толкования. Кроме того, интерпретирующие исследователи не
они налагают априорные значения на явления, которые изучают.
Этот метод включает в себя субъективно-аргументативные исследования, действия
исследования, описательные/интерпретационные исследования, будущие исследования и игры
роль. В дополнение к этим опросам и кейс-стади могут быть
включены в этот подход, поскольку они касаются изучения
лица или организации в сложных ситуациях
реального мира.
3.1.1.3 Критическое исследование
Критическое исследование — наименее известный подход в науке.
социальный, но в последнее время привлек внимание исследователей
в области информационных систем. Философское предположение о том, что
социальная реальность исторически производится и воспроизводится людьми,
а также социальные системы с их действиями и взаимодействиями. Их
способность, однако, опосредуется рядом соображений
социальные, культурные и политические.
Как и интерпретационное исследование, критическое исследование утверждает, что
позитивистские исследования не имеют ничего общего с социальным контекстом и игнорируют
его влияние на действия человека.
Критическое исследование, с другой стороны, критикует интерпретационное исследование за
быть слишком субъективным и почему это не помогает
людей для улучшения своей жизни. Самая большая разница между
критическое исследование и два других подхода составляют его оценочное измерение.
В то время как объективность позитивистских и интерпретативных традиций
предсказать или объяснить статус-кво или социальную реальность, критическое исследование
направлена ​​на критическую оценку и преобразование социальной реальности под
студия.
Критически настроенные исследователи обычно выступают против статус-кво, чтобы
устранить социальные различия и улучшить социальные условия. Там
критическое исследование имеет приверженность процессуальному взгляду на
явления, представляющие интерес, и, следовательно, обычно носит продольный характер.
Примерами методов исследования являются долгосрочные исторические исследования и
этнографические исследования. Однако критических исследований не проводилось.
широко используется в исследованиях информационных систем
3.1.2 Цель исследования
Наряду с характером поиска может быть использована его цель.
помочь исследователю в выборе того или иного метода
исследовать. Цель исследовательского проекта тесно связана
позиции поиска относительно цикла поиска, состоящего из
три этапа: построение теории, проверка теории и уточнение теории
теория. Таким образом, на основе импульса по сравнению с циклом поиска
исследовательский проект может иметь объяснительную, описательную, ди
исследовательский или предсказательный.
3.1.2.1 Поисковое исследование
Поисковое исследование направлено на изучение темы
совершенно новые и формулировать вопросы и гипотезы для исследования
будущее. Этот вид поиска используется при построении
теории, чтобы получить первые ссылки в новой области.
Как правило, используются качественные методы исследования, такие как тематические исследования.
исследований или феноменологических исследований.
Однако также можно использовать количественные методы, такие как
поисковые исследования или эксперименты.
3.1.3.3 Описательный поиск
Описательные исследования направлены на анализ и описание в основном
детализировать конкретную ситуацию или организационную практику. Этот
он подходит для построения теорий, а также может быть использован для
подтвердить или опровергнуть гипотезу. Описательный поиск обычно
включает использование измерений и образцов. Наиболее подходящие методы исследования
включают расследования и фоновые анализы.
3.1.2.3 Объяснительные исследования
Объяснительное исследование пытается объяснить, почему что-то происходит.
Он строится на уже изученных фактах и ​​стремится найти
причины этих фактов.
Таким образом, объяснительное исследование обычно строится на исследовании
исследовательский или описательный и является вспомогательным для проверки и уточнения
теории. Объяснительные исследования обычно используют тематические исследования
или методы исследования, основанные на опросах.
3.1.2.4 Упреждающее исследование
Упреждающие исследования направлены на предсказание событий и поведения
под наблюдением, которые изучаются (Маршалл и Россман
1995). Предсказание — это стандартная научная проверка истины.
Этот тип исследования обычно использует опросы или анализ данных.
дать историки. (Инь 1989 г.)
Приведенное выше обсуждение показывает, что существует ряд
возможные методы исследования, которые могут быть использованы в исследовании
особый. Тем не менее, должен быть конкретный метод, который более подходит
другие для определенного типа исследовательского проекта. (Галеры
1987, Инь 1989, Де Ваус 1991). Таким образом, у каждого исследователя есть
необходимо тщательно оценить сильные и слабые стороны
различные методы, чтобы прийти к принятию наиболее подходящего метода исследования e
совместим с исследовательским проектом. (Дженкинс 1985, Перван и Класс
1992 г., Бономия 1985 г., Инь 1989 г., Химилтон и Айвз 1992 г.).
3.2. Возможные методы поиска
Целью данного проекта было изучение опыта
Австралийские организации с i дать хранится с одним
Свилуппо ди информационное хранилище. Данный который, в настоящее время, есть один
отсутствие исследований в области хранилищ данных в Австралии,
этот исследовательский проект все еще находится в теоретической фазе цикла
исследования и имеет исследовательскую цель. Изучение опыта в
Австралийские организации внедряют хранилища данных
требует интерпретации реального общества. Следовательно,
философское предположение, лежащее в основе исследовательского проекта, следует
традиционная интерпретация.
После тщательного изучения доступных методов они были идентифицированы.
два возможных метода исследования: опросы и тематические исследования
(кейсы), которые можно использовать для исследований
исследовательский (Шэнкс и др., 1993). Galliers (1992) утверждает, что
пригодность этих двух методов для данного конкретного исследования в
его таксономия пересмотрена, заявив, что они подходят для строительства
теоретический. В следующих двух подразделах обсуждается каждый метод в
подробно.
3.2.1 Опросный метод исследования
Опросный метод исследования происходит от древнего метода
перепись. Перепись – это сбор информации из
целое население. Этот метод дорог и непрактичен
особенно если население большое. Так по сравнению с
переписи, обследование, как правило, сосредоточено на
собрать информацию для небольшого числа или выборки
представители населения (Фаулер 1988, Нейман 1994). А
выборка отражает совокупность, из которой она составлена, с разным
уровни точности, в зависимости от структуры образца,
размера и используемого метода отбора (Фаулер, 1988, Бэбби
1982, Нейман 1994).
Метод опроса определяется как «моментальные снимки практик,
ситуации или взгляды в определенный момент времени, предпринятые с использованием
анкеты или интервью, из которых можно сделать выводы
сделано» (Galliers 1992:153) [моментальные фотографии практик,
ситуации или взгляды в конкретный момент времени, предпринятые с использованием
анкеты или интервью, из которых можно сделать выводы].
опросы связаны со сбором информации по определенным аспектам
исследования, рядом участников, что делает
вопросы (Фаулер, 1988). Даже эти анкеты и интервью, которые
включают личные интервью по телефону и структурированные интервью,
методы сбора дать чаще всего используется в
исследования (Blalock 1970, Nachmias and Nachmias 1976, Fowler
1988), можно использовать наблюдения и анализ (Gable
1994). Из всех этих методов сбора богов дать, использование
Анкетирование — самый популярный метод, так как он гарантирует, что я дать
собранные, структурированы и отформатированы, что облегчает
классификация информации (Hwang 1987, de Vaus 1991).
Анализируя я дать, стратегия расследования часто использует
количественные методы, такие как статистический анализ, но могут
также используются качественные методы (Galliers 1992, Pervan
и Класс 1992, Гейбл 1994). Обычно я дать собраны
используется для анализа распределений и закономерностей ассоциаций
(Фаулер, 1988).
Хотя опросы обычно подходят для поиска
занимаясь вопросом «что?» (что) или от него
производные, такие как «сколько» (сколько) и «квант» (сколько), они
можно задать с помощью вопроса «почему» (Sonquist и
Дункельберг 1977, Инь 1989). Согласно Сонквисту и Дункельбергу
(1977), исследование указывает на трудные гипотезы, программа di
оценка, описание населения и разработка моделей
человеческое поведение. Также можно использовать опросы
изучить определенное мнение населения, условия,
мнения, характеристики, ожидания и даже поведение в прошлом
или настоящее время (Neuman 1994).
Исследования позволяют исследователю обнаружить взаимосвязь между
популяции, и результаты обычно более общие, чем для
другие методы (Sonquist and Dunkelberg 1977, Gable 1994).
опросы позволяют исследователям охватить географическую область
шире и охватить большое количество зарегистрированных пользователей (Blalock 1970,
Сонквист и Дункельберг, 1977 г., Хван и Лин, 1987 г., Гейбл, 1994 г.,
Нейманн 1994). Наконец, опросы могут предоставить информацию
которые не доступны в другом месте или в форме, необходимой для анализов
(Фаулер, 1988).
Однако существуют некоторые ограничения на проведение опроса. Один
недостатком является то, что исследователь не может получить много информации
об изучаемом объекте. Это связано с тем, что
исследования проводятся только в конкретный момент и, следовательно,
существует ограниченное количество переменных и людей, которых исследователь может
исследования (Инь, 1989 г., де Ваус, 1991 г., Гейбл, 1994 г., Денскомб, 1998 г.).
Другим недостатком является то, что проведение опроса может быть
очень дорого с точки зрения времени и ресурсов, особенно если
предполагает личные интервью (Fowler, 1988).
3.2.2. Метод исследования запросов
Исследовательский метод предполагает углубленное изучение
конкретной ситуации в ее реальном контексте в
определенный период времени без какого-либо вмешательства со стороны
исследователь (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
В основном этот метод используется для описания отношений между
переменные, которые изучаются в конкретной ситуации
(Галлерс, 1992). Расследования могут касаться отдельных дел или
кратно, в зависимости от анализируемого явления (Franz and Robey 1987,
Эйзенхардт 1989, Инь 1989).
Исследовательский метод запроса определяется как «запрос
эмпирическое исследование, изучающее современное явление в
его реальный контекст, используя несколько источников, отобранных из одного
множество объектов, таких как люди, группы или организации» (Инь, 1989).
Нет четкого разделения между явлением и его контекстом.
нет контроля или экспериментального манипулирования переменными (Инь
1989, Бенбасат и др., 1987).
Существует множество техник сбора богов. дать che possono
использоваться в методе расследования, которые включают в себя
непосредственные наблюдения, обзоры архивных записей, анкеты,
обзор документации и структурированные интервью. Имея
разнообразие техники сбора урожая дать, расследования
позволяют исследователям иметь дело как с дать качественное, что
количество одновременно (Бонома 1985, Эйзенхардт 1989, Инь
1989, Гейбл, 1994). Как и в случае с методом опроса,
Исследователь-исследователь выступает в роли наблюдателя или исследователя, а не
как активный участник учебной организации.
Бенбасат и др. (1987) утверждают, что метод исследования
особенно подходит для построения теории исследований, которая
начинается с исследовательского вопроса и продолжается обучением
теории в процессе сбора дать, бытие
также подходит для сцены
построения теории Франц и Роби (1987) предполагают, что
метод запроса также может быть использован для сложных
этап теории. В данном случае на основании собранных доказательств
данная теория или гипотеза подтверждается или опровергается. Плюс расследование
также подходит для исследований, связанных с вопросами «как» или «как»
«потому что» (Инь 1989).
По сравнению с другими методами опросы позволяют исследователю
фиксировать важную информацию более подробно (Galliers
1992, Шанкс и др., 1993). Кроме того, исследования позволяют
исследователю понять природу и сложность изучаемых процессов
(Бенбасат и др., 1987).
Метод имеет четыре основных недостатка.
расследование. Во-первых, это отсутствие контролируемых отчислений. Там
Субъективность исследователя может исказить результаты и выводы
исследования (Инь, 1989). Второй недостаток – отсутствие
контролируемое наблюдение. В отличие от экспериментальных методов,
исследователь-исследователь не может контролировать изучаемые явления
поскольку они рассматриваются в их естественном контексте (Gable 1994).
Третий недостаток - отсутствие воспроизводимости. Это связано с тем, что
что исследователь вряд ли наблюдает те же самые события, e
он не может проверить результаты конкретного исследования (Lee 1989).
Наконец, вследствие невоспроизводимости трудно
обобщить результаты, полученные в результате одного или нескольких опросов (Galliers
1992, Шанкс и др., 1993). Все эти проблемы, однако, не
непреодолимы и могут быть сведены к минимуму
исследователь, применяющий соответствующие действия (Lee 1989).
3.3. Обоснуйте методологию исследования
Adottata
Из двух возможных методов исследования для данного исследования метод
обследование считается наиболее подходящим. Это исследование
были отброшены после тщательного рассмотрения соответствующих
достоинства и недостатки. Удобство или неуместность каждого
метод для этого исследования обсуждается позже.
3.3.1. Неподходящий метод исследования
расследования
Метод опроса требует углубленного изучения
конкретной ситуации в одной или нескольких организациях для
период времени (Эйзенхардт, 1989). В этом случае период может
превышают сроки, отведенные для данного исследования. Другой
Причина, по которой не следует применять метод опроса, заключается в том, что результаты
они могут страдать от отсутствия строгости (Yin 1989). Субъективность
исследователя может повлиять на результаты и выводы. Другой
причина в том, что этот метод больше подходит для поиска вопросов
типа «как» или «почему» (Инь, 1989), тогда как исследовательский вопрос
для данного исследования это тип «что». Последний, но тем не менее важный
Важно отметить, что трудно обобщать результаты только одного исследования.
мало исследований (Galliers 1992, Shanks et al. 1993). На базе
это обоснование, исследовательский метод запроса не
был выбран как непригодный для данного исследования.
3.3.2. Удобство метода поиска
обзор
Когда проводилось это исследование, практика хранения данных
не получил широкого распространения
Австралийские организации. Так что информации было мало
относительно их реализации в рамках
Австралийские организации. Доступная информация поступила от
от организаций, которые внедрили или использовали данные
склад. В этом случае опросный метод исследования является наиболее
подходит, так как позволяет получить информацию, которая не
доступны в другом месте или в форме, необходимой для анализа (Fowler 1988).
Кроме того, метод опроса позволяет исследователю
получить хорошее представление о практиках, ситуациях или
виден в данный момент времени (Galliers 1992, Denscombe 1998).
Был запрошен обзор для увеличения
знание австралийского опыта работы с хранилищами данных.
Опять же, Sonquist и Dunkelberg (1977) заявляют, что результаты
Опросные исследования носят более общий характер, чем другие методы.
3.4. Дизайн исследования исследования
Исследование практики хранения данных было проведено в 1999 году.

Целевая группа состояла из организаций
интересовались исследованиями в области хранилищ данных, поскольку они
наверное уже про меня проинформировали дать которые хранят и
поэтому он может предоставить полезную информацию для этого исследования. Там
Целевая группа была определена с помощью первоначального опроса
все австралийские члены «Института хранилищ данных» (Tdwiaap).
В этом разделе обсуждается планирование фазы исследования.
эмпирика этого исследования.
3.4.1. Техника сбора дать
Из трех методов, обычно используемых в следственном исследовании
(т.е. анкета по почте, интервью по телефону и интервью
личное) (Nachmias 1976, Fowler 1988, de Vaus 1991), для
это исследование было принято вопросник по почте. Первый
Причина принятия последнего заключается в том, что он может обеспечить
географически рассредоточенное население (Blalock 1970, Nachmias e
Nachmias 1976, Hwang and Lin 1987, de Vaus 1991, Gable 1994).
Во-вторых, почтовая анкета подходит для участников
высокообразованный (Фаулер, 1988). Анкета по почте для этого
исследование было адресовано спонсорам проекта хранилища данных,
директоров и/или менеджеров проекта. В-третьих, анкеты
почты подходят, когда у вас есть безопасный список
адреса (Салант и Дилман, 1994). TDWI, в данном случае один
ассоциация надежных хранилищ данных предоставила список рассылки
его австралийских членов. Еще один плюс анкеты
по почте по сравнению с телефонным опросом или интервью
личным является то, что он позволяет зарегистрировавшимся ответить более
точность, особенно когда респондентам необходимо проконсультироваться
отмечает или обсуждает вопросы с другими людьми (Фаулер
1988).
Потенциальным недостатком может быть время, необходимое для
проводить анкетирование по почте. Как правило, анкета далеко
почта ведется в такой последовательности: отправляем письма, ждем
ответы и отправить подтверждение (Фаулер, 1988, Бейнбридж, 1989).
Таким образом, общее время может быть больше, чем время, необходимое для
личных интервью или для телефонных интервью. Однако
общее время может быть известно заранее (Fowler 1988,
Денскомб 1998). Время, потраченное на проведение интервью
личное не может быть известно заранее, так как оно варьируется от
одно интервью другому (Фаулер, 1988). Телефонные интервью
может быть быстрее, чем почтовые анкеты и электронные письма
личные интервью, но они могут иметь высокий процент промахов
реакция из-за недоступности некоторых людей (Fowler, 1988).
Кроме того, телефонные интервью, как правило, ограничиваются списками
относительно короткие вопросы (Bainbridge 1989).
Еще одним недостатком рассылаемых по почте вопросников является высокий уровень
отсутствие ответа (Фаулер, 1988, Бейнбридж, 1989, Нейман
1994). Однако были приняты контрмеры путем объединения
это исследование с доверенным учреждением данных
складирование (например, TDWI) (Bainbridge 1989, Neuman 1994),
который отправляет два письма-напоминания тем, кто не ответил
(Fowler 1988, Neuman 1994), а также письмо
дополнение, объясняющее цель исследования (Neuman 1994).
3.4.2. Блок анализа
Целью данного исследования является получение информации о
внедрение хранилищ данных и их использование
в австралийских организациях. Целевая группа
состоит из всех австралийских организаций,
реализованы или реализуются, я информационное хранилище. В
отдельные организации названы ниже. Анкета
оно было разослано организациям, заинтересованным в принятии
di информационное хранилище. Этот метод гарантирует, что информация
коллекции поступают из наиболее подходящих ресурсов каждой организации
участник.
3.4.3. Образец опроса
«Список рассылки» участников опроса был получен от
Расширение ТДВ. Из этого списка 3000 австралийских организаций
были выбраны в качестве основы для выборки. А
дополнительное письмо с объяснением проекта и цели расследования,
вместе с карточкой ответов и предоплаченным конвертом для
возврат заполненной анкеты, отправленной на пробу.
Из 3000 организаций 198 согласились участвовать
изучать. Ожидалось такое небольшое количество ответов дата il
большое количество австралийских организаций, которые у них тогда были
приняли или принимали стратегию свиданий
складирование в своих организациях. Итак
Целевая группа для этого исследования состоит только из 198 человек.
организации.
3.4.4. Содержание анкеты
Структура анкеты была основана на модели даты
складирование Монаша (обсуждалось ранее в части 2.3).
Содержание анкеты было основано на анализе
литература, представленная в главе 2. Копия анкеты
рассылаемых по почте участникам опроса можно найти
в Приложении B. Анкета состоит из шести разделов, которые
следить за фазами обработанной модели. Следующие шесть абзацев
кратко изложить содержание каждого раздела.
Раздел A: Основная информация об организации
Этот раздел содержит вопросы, связанные с профилем
участвующие организации. Кроме того, некоторые вопросы
относительно состояния проекта хранилища данных
участник. Конфиденциальная информация, такая как имя
организации не были раскрыты в анализе опроса.
Раздел Б: Начало
Вопросы в этом разделе связаны с началом работы
хранилище данных. Были заданы вопросы на сколько
это касается инициаторов проекта, спонсоров, навыков и знаний
запросы, цели развития хранилища данных и
ожидания конечного пользователя.
Раздел C: Дизайн
В этом разделе собраны вопросы, связанные с деятельностью
планирование информационное хранилище. В частности, вопросы
сообщить об объеме выполнения, продолжительности проекта, стоимости
проекта и анализ затрат/выгод.
Раздел D: Развитие
В разделе разработки есть вопросы, связанные с деятельностью
развитие информационное хранилище: сбор пользовательских требований
наконец, источники дать, логическая модель дать, прототипы,
планирование мощностей, технические архитектуры и выбор
средства разработки хранилищ данных.
Раздел E: Эксплуатация
Операционные вопросы, связанные с эксплуатацией ред.
к расширяемости информационное хранилище, по мере того, как он превращается в
следующий этап развития. Там Качество данных, стратегии
обновление дать, степень детализации датьмасштабируемость данных
склад и проблемы безопасности информационное хранилище они были между
типы задаваемых вопросов.
Раздел F: Развитие
Этот раздел содержит вопросы, связанные с использованием данных
склад конечными пользователями. Исследователь был заинтересован
по назначению и полезности информационное хранилище, обзор и стратегии
принятого обучения и стратегии управления данными
склад принят.
3.4.5. Скорость отклика
Хотя почтовые опросы критикуют за то, что они
низкая реакция, приняты меры по увеличению
норма прибыли (как обсуждалось ранее в части
3.4.1). Термин «частота ответов» относится к проценту
люди в конкретной выборке опроса, которые ответили на
анкета (Denscombe 1998). Было использовано следующее
формула для расчета процента ответов для этого исследования:
Количество людей, которые ответили
Скорость отклика =
—————————————————————————— X 100
Общее количество отправленных анкет
3.4.6. Летчик-испытатель
Перед тем, как анкета будет отправлена ​​в образец, вопросы
был проверен путем проведения пилотных испытаний, как предложил Лак
и Рубин (1987), Джексон (1988) и де Во (1991). Цель
пилотные тесты должны выявить все неуклюжие, двусмысленные выражения и
вопросы трудно интерпретировать, чтобы прояснить любой
используемых определений и терминов, а также для определения приблизительного времени
необходимо заполнить анкету (Warwick and Lininger 1975,
Джексон 1988, Салант и Дилман 1994). Пилотные испытания были
осуществляется путем отбора субъектов с характеристиками, сходными с теми,
из последних предметов, как предложил Дэвис e Козенца (1993). В
В этом исследовании участвовали шесть специалистов по хранению данных.
выбраны в качестве пилотных объектов. После каждого пилотного испытания они
внесены необходимые исправления. Из проведенных пилотных испытаний я
участники помогли изменить и перезагрузить
окончательный вариант анкеты.
3.4.7. Методы анализа Давать
I дать данные опроса, собранные из закрытых вопросников,
были проанализированы с помощью пакета статистических программ
называется SPSS. Многие ответы были проанализированы.
с помощью описательной статистики. Ряд анкет
они вернулись неполными. Их лечили старцем
внимание, чтобы убедиться, что я дать пропал без вести не один
следствие ошибок ввода данных, а почему нет вопросов
подходили для разыгрывающего, или разыгрывающий решил не
ответить на один или несколько конкретных вопросов. Эти ответы
отсутствующие игнорировались при анализе дать и они были
кодируется как «-9», чтобы гарантировать их исключение из процесса
анализы.
При подготовке анкеты были закрытые вопросы.
предварительно кодируется путем присвоения номера каждой опции. Номер
затем он был использован для подготовки я дать во время анализа
(Денскомб, 1998; Сапсфорд и Юпп, 1996). Например, были
шесть вариантов, перечисленных в вопросе 1 раздела B: совет
дирекция, старший исполнительный директор, ИТ-отдел, подразделение
бизнес, консультанты и многое другое. В файле дать ГПСС, это
была сгенерирована переменная для указания «инициатора проекта»,
с шестью тегами значений: «1» для «доски», «2»
для «старшего руководителя» и так далее. Использование шкалы Лайкертина
в некоторых закрытых вопросах также есть разрешение
идентификация, не требующая усилий при использовании значений
соответствующие номера, введенные в SPSS. По вопросам с
неисчерпывающие ответы, которые не были взаимоисключающими,
каждый вариант рассматривался как одна переменная с двумя
метки значений: «1» для «отмечено» и «2» для «неотмечено».
Открытые вопросы трактовались иначе, чем вопросы
закрыто. Ответы на эти вопросы не опубликованы в
СПСС. Вместо этого они были проанализированы вручную. Использование этого
тип вопроса позволяет получить информацию об идеях
свободно выраженный и личный опыт зарегистрированных
(Бейнбридж, 1989; Денскомб, 1998). По возможности это было сделано
классификация ответов.
Для анализа дать, используются методы простого статистического анализа,
такие как частота ответов, среднее значение, стандартное отклонение
среднее значение и медиана (Argyrous 1996, Denscombe 1998).
Гамма-тест был эффективен для получения количественных измерений
ассоциаций между дать порядковые номера (Норусис, 1983, Аргироус, 1996).
Эти тесты были подходящими, потому что используемые порядковые шкалы не были
у них было много категорий и их можно было показать в таблице
(Норусис, 1983).
3.5 Соммарио
В этой главе методология исследования и
конструкции, принятые для этого исследования.
Выбор наиболее подходящего метода поиска для
конкретное исследование принимает во внимание
рассмотреть ряд правил, в том числе характер и тип
исследования, а также достоинства и недостатки каждого возможного
методом (Дженкинс, 1985 г., Бенбасат и др., 1097 г., Гальерс и Лэнд, 1987 г.,
Инь, 1989 г., Гамильтон и Айвс, 1992 г., Гальер, 1992 г., Нойман, 1994 г.). Вид
отсутствие существующих знаний и теории об этом
внедрения хранилищ данных в Австралии, это исследование, проведенное
исследование требует истолковательного исследовательского метода с умением
исследовательский для изучения опыта организаций
австралийский. Ваш метод поиска был выбран для
собрать информацию о принятии концепции даты
складирование австралийскими организациями. А
в качестве метода сбора была выбрана почтовая анкета дать.
обоснование метода исследования и техники сбора дать
выбор будет предоставлен в этой главе. Плюс это было
представил дискуссию о единице анализа, образце
используемые, процент ответов, содержание анкеты,
предварительное тестирование анкеты и метод анализа дать.

Проектирование Хранилище данных:
Объединение отношений сущностей и пространственного моделирования
АБСТРАКТ НАЯ
Магазин я дать это актуальная проблема для многих
организации. Ключевая проблема в развитии
хранения дать это его дизайн.
Дизайн должен поддерживать обнаружение понятий в данных.
хранилище в унаследованную систему и другие источники дать а также один
простое понимание и эффективное использование данных
склад.
Большая часть литературы по складскому хозяйству дать рекомендуемый
использование моделирования отношений сущностей или многомерного моделирования для
представлять дизайн информационное хранилище.
В этом журнале мы показываем, как оба
представления могут быть объединены в подходе к
рисунок информационное хранилище. Используемый подход систематически
рассмотрены в тематическом исследовании и определены в ряде
важные последствия с профессионалами.
ХРАНИЛИЩЕ ДАННЫХ
Un информационное хранилище обычно определяется как «предметно-ориентированная,
интегрированный, изменяющийся во времени и энергонезависимый сбор данных для поддержки
управленческих решений» (Inmon and Hackathorn, 1994).
Предметно-ориентированный и интегрированный свидетельствует о том, что информационное хранилище è
предназначен для преодоления функциональных границ устаревших систем для
предлагают интегрированный взгляд на дать.
Временной вариант связан с историческим или временным характером видео. дать in
un информационное хранилище, что позволяет анализировать тенденции.
Энергонезависимый указывает, что информационное хранилище это не непрерывно
обновлен как база данных OLTP. Скорее он обновлен
периодически, с дать из внутренних и внешних источников.
информационное хранилище он специально разработан для исследований
а не для целостности и производительности обновления
операции.
Идея хранения я дать это не ново, это была одна из целей
управления дать с шестидесятых годов (Il Martin, 1982).
I информационное хранилище они предлагают инфраструктуру дать для управления
системы поддержки. Системы поддержки управления включают принятие
системы поддержки (СПС) и исполнительные информационные системы (ИСС).
DSS — это компьютерная информационная система,
предназначен для улучшения процесса и, следовательно, захвата
человеческое решение. EIS обычно представляет собой систему доставки
дать что позволяет бизнес-руководителям легко получить доступ к представлению
из дать.
Общая архитектура информационное хранилище подчеркивает роль
информационное хранилище в поддержке управления. В дополнение к предложению
инфраструктура дать для EIS и DSS, al информационное хранилище это возможно
доступ к нему напрямую через запросы. НАШИ дать включены в дату
склада основаны на анализе информационных потребностей
управления и поступают из трех источников: внутренних унаследованных систем,
системы сбора данных специального назначения и внешние источники данных. НАШИ
дать во внутренних унаследованных системах часто избыточны,
хлипкие, низкого качества и хранятся в нескольких форматах
поэтому их необходимо согласовать и очистить, прежде чем вы сможете загрузить их в
информационное хранилище (Инмон, 1992; Макфадден, 1996). НАШИ дать от
из систем хранения дать ad hoc и из источников дать
внешние часто используются для дополнения (обновления, замены) i
дать из устаревших систем.
Существует множество веских причин для разработки информационное хранилище,
которые включают в себя лучшее принятие решений за счет использования
эффективная дополнительная информация (Ives 1995), поддержка фокуса
на весь бизнес (Graham 1996) и снижение затрат на
обеспечение дать для EIS и DSS (Graham 1996, McFadden
1996).
Недавнее эмпирическое исследование показало, что в среднем возврат
инвестиции для меня информационное хранилище на 401% через три года (Грэм,
1996). Однако другие эмпирические исследования информационное хранилище иметь
обнаружил значительные проблемы, включая трудности в измерении ed
распределять преимущества, отсутствие четкой цели, недооценка ее
объем и сложность процесса хранения i дать и отправлять адресату
особенно в отношении источников и чистоты дать.
Магазин я дать можно рассматривать как решение
к проблеме управления дать между организациями. Там
манипулирование дать как социальный ресурс он остается одним из
основные проблемы в управлении информационными системами во всем мире.
мире в течение многих лет (Браншо и др., 1996 г., Гальер и др., 1994 г.,
Нидерман и др. 1990, Перван 1993).
Популярный подход к управлению активами дать это было в восьмидесятых
разработка модели дать Социальное. Модель дать социальное это было
разработан, чтобы предложить стабильную основу для разработки новых систем
приложения и база данных и устаревшее восстановление и интеграция
системы (Браншо и др.
1989, Гудхью и др. 1988:1992, Ким и Эверест, 1994).
Однако с этим подходом связано много проблем, т.
особенности, сложность и стоимость каждой задачи, а также длительное время
необходимо иметь ощутимые результаты (Бейнон-Дэвис, 1994, Эрл
1993, Гудхью и др. 1992, Периасами 1994, Шанкс 1997).
Il информационное хранилище это отдельная база данных, которая сосуществует с устаревшей
базы данных, а не заменять их. Поэтому он позволяет вам
руководить дать и избежать дорогостоящей реконструкции
унаследованных систем.
СУЩЕСТВУЮЩИЕ ПОДХОДЫ К ПРОЕКТИРОВАНИЮ ДАННЫХ
СКЛАД
Процесс создания и совершенствования информационное хранилище
следует понимать скорее как эволюционный процесс, чем
традиционный жизненный цикл разработки систем (Дезио, 1995, Шанкс,
О'Доннелл и Арнотт, 1997а). Есть много процессов, связанных с
проект информационное хранилище такие как инициализация, планирование;
информация, полученная из требований, запрашиваемых у менеджеров компании;
источники, преобразования, очистка дать и синхронизировать из устаревшего
системы и другие источники дать; разрабатываемые системы доставки;
мониторинг информационное хранилище; и бессмысленность процесса
эволюция и построение информационное хранилище (Шинс, О'Доннелл
и Арнотт, 1997b). В этом журнале мы сосредоточимся на том, как
нарисуй я дать хранится в контексте этих других процессов.
Существует ряд предлагаемых подходов к архитектуре данных.
склад в литературе (Inmon 1994, Ives 1995, Kimball 1994
Макфадден 1996). Каждая из этих методик имеет краткое
обзор с анализом их сильных и слабых сторон.
Подход Инмона (1994) к Хранилище данных
Проект
Инмон (1994) предложил четыре итерационных шага для разработки системы данных.
склад (см. рис. 2). Первым шагом является разработка шаблона
дать социальные, чтобы понять, как я дать может быть интегрирован
через функциональные области внутри организации
подразделение я дать хранить в районах. Модель дать это сделано для
хранить дать связанных с принятием решений, в том числе дать
исторический, в том числе дать вычитается и суммируется. Второй шаг
определить предметные области для реализации. Они основаны
на приоритетах, определенных конкретной организацией. Третий
шаг включает в себя рисование база данных для предметной области, позы
особое внимание, чтобы включить соответствующие уровни детализации.
Inmon рекомендует использовать модель сущности и отношений. Четвертый
шаг — определить исходные системы дать требуется и развивается
процессы преобразования для захвата, очистки и форматирования i дать.
Сильные стороны подхода Инмона заключаются в том, что модель дать социальный
предлагает основу для интеграции дать внутри организации
и планирование поддержки для итеративной разработки данных
склад. Его недостатки - сложность и стоимость рисования
модель дать социальные, трудности в понимании моделей сущностей e
отношения, используемые в обеих моделях, что дать социальный и тот из дать
хранится по предметной области, и уместность дать из
рисунок информационное хранилище для реализации база данных
относительно, но не для база данных многомерный.
Айвз (1995) Подход к Хранилище данных
Проект
Айвс (1995) предлагает четырехэтапный подход к разработке
информационная система, которую он считает применимой к дизайну даты
склад (см. рис. 3). Подход во многом основан на
Информационная инженерия для разработки информационных систем
(Мартин 1990). Первым шагом является определение целей, факторов
истории успеха и ключевые показатели эффективности. НАШИ
ключевые бизнес-процессы и необходимая информация
смоделированы, чтобы привести нас к модели дать Социальное. Второй шаг
включает в себя разработку архитектуры, которая определяет дать
хранится по площади, база данных di информационное хранилище, компоненты
необходимой техники, комплекс организационного обеспечения
необходимые для реализации и работы с информационное хранилище. Третий
шаг включает в себя выбор необходимых программных пакетов и инструментов.
Четвертый этап – детальное проектирование и строительство объекта.
информационное хранилище. Айвз отмечает, что магазин дать он облигация
итерационный процесс.
Сильной стороной подхода Айвза является использование технических спецификаций для
определить требования к информации, использование структурированного
процесс поддержки интеграции информационное хранилище,
правильный выбор аппаратного и программного обеспечения, а также использование нескольких
приемы представления информационное хранилище. Его недостатки
им присуща сложность. Другие включают трудности в
развить множество уровней база данных в пределах информационное хранилище in
приемлемые сроки и стоимость.
Подход Кимбалла (1994) к Хранилище данных
Проект
Кимбалл (1994) предложил пять итерационных шагов для разработки системы данных.
склад (см. рис. 4). Его подход особенно
посвящается рисунку только одного информационное хранилище и использование шаблонов
многомерными, а не моделями сущностей и отношений. Кимбалл
анализировать эти многомерные модели, потому что их легче понять для i
руководители предприятий, более эффективны при работе
комплексные консультации и оформление база данных физическое больше
эффективным (Кимбалл, 1994). Кимбалл признает, что разработка
информационное хранилище является итеративным, и это информационное хранилище отдельная банка
интегрироваться через разделение на таблицы размеров
общий.
Первым шагом является определение конкретной предметной области, которая будет
совершенный. Второй и третий этапы касаются формирования
размерный. На втором этапе меры определяют вещи
интерес к предметной области и сгруппированы в таблицу фактов.
Например, в предметной области продаж меры интереса
они могут включать количество проданных товаров и доллар
в качестве валюты продаж. Третий шаг предполагает выявление
измерения, которыми я могу быть сгруппирован
факты. В предметной области продаж соответствующие размеры
может включать предмет, местоположение и период времени. Там
таблица фактов имеет составной ключ для ссылки на каждый из них
таблиц измерений и обычно содержит очень большое количество
большой на фактах. Напротив, таблицы измерений содержат
описательная информация о размере и других атрибутах, которые
можно использовать для группировки фактов. Таблица фактов e
измерения, связанные с формой предложения, что называется одним
звездный узор из-за его формы. Четвертый шаг предполагает
строительство база данных многомерный, чтобы усовершенствовать его
звездный узор. Последним шагом является определение исходных систем. дать
необходимо и разработать процессы трансформации для приобретения, очистки
и отформатировать я дать.
Сильные стороны подхода Кимбалла включают использование шаблонов.
размерный для представления я дать хранится, что делает это
простой для понимания и приводит к эффективному физическому дизайну. А
размерная модель, которая также легко использует оба
системы база данных реляционные могут быть усовершенствованы или системы
база данных многомерный. К его недостаткам относится отсутствие
некоторых методов, облегчающих планирование или интеграцию
много звездных схем в одной информационное хранилище и
сложность проектирования из экстремально денормализованной структуры в
размерная модель а дать в устаревших системах.
Подход Макфаддена (1996) к данным
Проектирование складов
McFadden (1996) предлагает пятиэтапный подход к
Нарисовать информационное хранилище (см. рис. 5).
Его подход основан на синтезе идей из литературы
и сосредоточен на розыгрыше соло информационное хранилище, Это правильно
шаг включает в себя анализ требований. Даже если конкретика
техники не предписаны, в примечаниях Макфаддена указаны
организация дать спецификации и их атрибуты, а также относится к читателям Watson
и Frolick (1993) за определение требований.
На втором этапе строится модель отношений сущностей для
информационное хранилище а затем утверждается руководителями компании. Третий
шаг включает в себя определение сопоставления с устаревшей системой
и внешние источники информационное хранилище. Четвертый шаг предполагает
процессов разработки, развертывания и синхронизации дать в
информационное хранилище. На последнем этапе происходит поставка системы.
разработан с упором на пользовательский интерфейс.
Макфадден отмечает, что процесс рисования обычно
итеративный.
Сильные стороны подхода Макфаддена указывают на участие
руководителями предприятий при определении требований, а также
важность ресурсов датьих очистка и сбор. Ее
перегибы связаны с отсутствием процесса подразделения
большой проект информационное хранилище во многих интегрированных стадиях, и там
трудности с пониманием моделей сущностей и отношений, используемых при разработке
информационное хранилище.

    0/5 (0 отзывов)
    0/5 (0 отзывов)
    0/5 (0 отзывов)

    Узнайте больше в Интернет-агентстве

    Подпишитесь, чтобы получать последние статьи по электронной почте.

    автор аватар
    Администратор Генеральный директор
    👍Интернет-агентство | Эксперт веб-агентства в области цифрового маркетинга и SEO. Веб-агентство Online — это веб-агентство. Успех Agenzia Web Online в цифровой трансформации основан на основах Iron SEO версии 3. Специализации: системная интеграция, интеграция корпоративных приложений, сервис-ориентированная архитектура, облачные вычисления, хранилище данных, бизнес-аналитика, большие данные, порталы, интранет, веб-приложения. Проектирование и управление реляционными и многомерными базами данных. Проектирование интерфейсов для цифровых медиа: удобство использования и графика. Интернет-агентства предлагают компаниям следующие услуги: -SEO в Google, Amazon, Bing, Яндекс; -Веб-аналитика: Google Analytics, Google Tag Manager, Яндекс Метрика; -Конверсии пользователей: Google Analytics, Microsoft Clarity, Яндекс Метрика; -SEM в Google, Bing, Amazon Ads; -Маркетинг в социальных сетях (Facebook, Linkedin, Youtube, Instagram).
    Моя Agile-конфиденциальность
    Этот сайт использует технические и профилирующие файлы cookie. Нажимая «Принять», вы разрешаете использование всех профилирующих файлов cookie. При нажатии на кнопку «Отклонить» или «X» все профилирующие файлы cookie будут отклонены. Нажав «Настроить», вы можете выбрать, какие профилирующие файлы cookie активировать.
    Этот сайт соответствует Закону о защите данных (LPD), Федеральному закону Швейцарии от 25 сентября 2020 года, а также GDPR, Регламенту ЕС 2016/679, касающемуся защиты персональных данных, а также свободного перемещения таких данных.